吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1663|回复: 1
收起左侧

[Python 转载] 今天又没学到什么之爬取星座运势

  [复制链接]
lyj0886 发表于 2020-3-12 23:59

思路:
1.确认要的东西:
图片.png

file:///C:/Users/FUTURE~1/AppData/Local/Temp/enhtmlclip/Image(5).png


也就是网站上的这个表格。对应到源代码里的位置(如下图):
file:///C:/Users/FUTURE~1/AppData/Local/Temp/enhtmlclip/Image(6).png
图片.png




2.利用requests库向星座网站发送请求
3.利用lxml库提取想要的数据




代码:
[Python] 纯文本查看 复制代码
import requests
from lxml import etree

def sspider(htext):
html = etree.HTML(htext)
html_data = html.xpath('//div[[url=home.php?mod=space&uid=341152]@Class[/url] ="content clearfix"]/table[@class = "tb"]/tr/td/text()')

for num in range(0,len(html_data),2):
print(html_data[num]+" : "+html_data[num+1])

if __name__ == '__main__':
result = requests.get('http://astro.sina.com.cn/fate_tomorrow_Scorpio/')
result.encoding = 'utf-8';#解决中文乱码
sspider(result.text)





效果图:
file:///C:/Users/FUTURE~1/AppData/Local/Temp/enhtmlclip/Image(7).png
图片.png





总结:
这次爬虫爬取的是网站表格,加深了对lxml库的熟悉程度。
慢慢进步呀少年!





发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

jidesheng6 发表于 2020-3-13 01:41
厉害👍🏻
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-17 02:49

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表