from bs4 import BeautifulSoup #导入库
html 是爬取的网页源代码, 将一段文档传入BeautifulSoup 的构造方法,就能得到一个文档的对象
soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')
查找所有的h4标签
links = soup.find_all("h4")
for link in links:
print link
一段json形式的字符串,它是str类型,转为可操作的数据结构,例如列表或者字典