爬虫和美丽的汤[1]

信息标记的三种方式:

XML 比较像html

JSON 有类型的键值对 key:value key:[value1,value2]

key:{key1: value1,

key2:value20

}(可嵌套)

YAML 无类型的键值对

key:

key1:value1

key2:value2(用缩进表示嵌套关系)

key:

-value1

-value2(用减号表示并列)

#表示注释

明天先看下面这个(信息的查找)

from bs4 import BeautifulSoup
import requests
r=requests.get('https://python123.io/ws/demo.html')
demo=r.text
soup= BeautifulSoup(demo, "html.parser")
for link in soup.find_all('a'):
    print(link.get('href'))

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注