from bs4 import BeautifulSoup #导入库

html 是爬取的网页源代码, 将一段文档传入BeautifulSoup 的构造方法,就能得到一个文档的对象

soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')

查找所有的h4标签

links = soup.find_all("h4")

for link in links:
print link

一段json形式的字符串,它是str类型,转为可操作的数据结构,例如列表或者字典

最后修改:2020 年 10 月 11 日
如果觉得我的文章对你有用,请随意赞赏