美丽的汤 [0]

from bs4 import BeautifulSoup
import requests
r=requests.get('https://python123.io/ws/demo.html')
demo=r.text
soup =BeautifulSoup(demo,"html.parser")
print(soup.prettify())

beautiful soup类的基本元素:

1、Tag

<></>

2、Name

<tag>.name 如<p>...</p>中的p

3、Attribute

<tag>.attrs

4、Navigable string

<tag>.string <>...</>中的。。。

5、Comment

import requests
from bs4 import BeautifulSoup
url='https://ip.cn'
r=requests.get(url)
soup=BeautifulSoup(r.text,'html.parser')
tag1=soup.p.code.string
tag2=soup.p.next_sibling.code.string
print(tag1)
print(tag2)
#一段查看自己ip地址的代码

关于标签树

下行遍历

tag.contents

tag.children

tag.descendants(英语渣跪了)

上行遍历
tag.parent

tag.parents

平行遍历(必须在同一个父节点下)

tag.next_sibling

tag.previoius_sibling

tag.next_siblings

tag.previoius_siblings

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注