例子 访问豆瓣书评,获取书评内容,并用poen保存到本地txt

import requests
from lxml import etree
url = 'https://www.book.douban.com/subject/1084336/comments'
r = requests.get(url).text
s = etree.HTML(r)
file = s.xpath('//div[@class="comment"]/p/text()')

with open('duanping.txt','w',encoding='utf-8') as f:
    for i in file:
        f.write(i)
# r 只读。若不存在文件会报错
# w 只写,若不存在会创建
# a 附加到文章末尾
#rb,wb,ab,操作二进制
#r+ 读写模式打开

利用pandas保存为excel

import pandas as pd
#上面的例子,在保存时这样写
df = pd.DataFrame(file)
df.to_excel('duanpin.xlsx')
#或者df.to_csv 保存为csv文件
最后修改:2020 年 10 月 11 日
如果觉得我的文章对你有用,请随意赞赏