[Python] 纯文本查看 复制代码 # 定位文章标题
title = page_html.xpath("//td[@class='plc ptm pbn vwthd']//h1//span")[0].text
# 定位回帖用户姓名
send_usernames = [''.join(element.itertext()).strip() for element in page_html.xpath(
"//div[@id='postlist']//div//table//tr//td[@class='pls']//div//div[@class='pi']//a")]
# 定位回帖内容
send_contents = [''.join(element.itertext()).strip() for element in page_html.xpath(
"//div[@id='postlist']//div//table//tr//td[@class='plc']//div[@class='pct']//div//div//table//tr//td")]
# 定位回帖楼层
send_tags = [''.join(element.itertext()).strip() for element in page_html.xpath(
"//div[@id='postlist']//div//table//tr//td[@class='plc']//div[@class='pi']//strong")]
# 定位回帖时间
send_timesets = [''.join(element.itertext()).strip().replace("发表于 ", "") for element in page_html.xpath(
"//div[@id='postlist']//div//table//tr//td[@class='plc']//div[@class='pi']//div//div[@class='authi']//em")]
看代码 是不行的,代码硬写网站的html标签解析正则,换其他网站,或者网站的前端页做了更新,就不适用了 |