JIMaz 发表于 2020-6-3 20:30

Python爬虫求助

今天想爬取一下某网站的彩票开奖号码,网站地址:https://lottery.8oe.com/index/lottery.html

但是却发现
这里只有日期和开奖号码,并没有我们需要的开奖号码,请问论坛大佬有什么好办法没有,还望大佬不吝赐教。谢谢

陈家丶妖孽 发表于 2020-6-3 20:39

实际是这个就是数据,只是设置了字体显示成这样了。不懂编程,但逻辑上面应该相通,先返回数据,然后解码?

414269678 发表于 2020-6-3 20:53

搜搜字体反爬相关的文章看看吧,网上看到过、

Vvvvvoid 发表于 2020-6-3 21:01

肯定是有的 ,
只不过浏览器的编辑器 不识别这种编码格式, 所以显示正方形

小涩席 发表于 2020-6-3 21:03

可以看到json明文,但是暂时看不懂这一串代码是啥意思?但是有一个思路,把每个数字对应的代码收集起来,做成字典,然通过json的数据进行一个匹配操作。就可以实现了。

亿联网络 发表于 2020-6-3 21:06

都有网页接口的,加上协议头访问,&#xef798 html实体名称 网上都有对照表

JIMaz 发表于 2020-6-3 21:42

小涩席 发表于 2020-6-3 21:03
可以看到json明文,但是暂时看不懂这一串代码是啥意思?但是有一个思路,把每个数字对应的代码收集起来,做 ...

好像是动态的

Brain_ 发表于 2020-6-3 21:47

主要是就是后台返回的html内容里边包裹着字体,然后前端需要引入对应的WEB字体文件

JIMaz 发表于 2020-6-3 21:51

Brain_ 发表于 2020-6-3 21:47
主要是就是后台返回的html内容里边包裹着字体,然后前端需要引入对应的WEB字体文件

然后怎么把它们转化为数字楠,谢谢解答

909699633 发表于 2020-6-4 08:03

字体文件是这个 :https://lottery.8oe.com/fonts/woff/id/a6e5adace9c717c4b62d0d357490ca12
可以通过百度的 FontEditor 字体编辑器查看 字形与编码对应关系,如图:
通过对应关系,就知道编码对应的数字了。
页: [1] 2
查看完整版本: Python爬虫求助