Python爬虫求助

JIMaz 发表于 2020-6-3 20:30

今天想爬取一下某网站的彩票开奖号码，网站地址：https://lottery.8oe.com/index/lottery.html

但是却发现
这里只有日期和开奖号码，并没有我们需要的开奖号码，请问论坛大佬有什么好办法没有，还望大佬不吝赐教。谢谢

陈家丶妖孽 发表于 2020-6-3 20:39

实际是这个就是数据，只是设置了字体显示成这样了。不懂编程，但逻辑上面应该相通，先返回数据，然后解码？

414269678 发表于 2020-6-3 20:53

搜搜字体反爬相关的文章看看吧，网上看到过、

Vvvvvoid 发表于 2020-6-3 21:01

肯定是有的 ,
只不过浏览器的编辑器不识别这种编码格式, 所以显示正方形

小涩席 发表于 2020-6-3 21:03

可以看到json明文，但是暂时看不懂这一串代码是啥意思？但是有一个思路，把每个数字对应的代码收集起来，做成字典，然通过json的数据进行一个匹配操作。就可以实现了。

亿联网络 发表于 2020-6-3 21:06

都有网页接口的，加上协议头访问，&#xef798 html实体名称网上都有对照表

JIMaz 发表于 2020-6-3 21:42

小涩席发表于 2020-6-3 21:03
可以看到json明文，但是暂时看不懂这一串代码是啥意思？但是有一个思路，把每个数字对应的代码收集起来，做 ...

好像是动态的

Brain_ 发表于 2020-6-3 21:47

主要是就是后台返回的html内容里边包裹着字体，然后前端需要引入对应的WEB字体文件

JIMaz 发表于 2020-6-3 21:51

Brain_ 发表于 2020-6-3 21:47
主要是就是后台返回的html内容里边包裹着字体，然后前端需要引入对应的WEB字体文件

然后怎么把它们转化为数字楠，谢谢解答

909699633 发表于 2020-6-4 08:03

字体文件是这个：https://lottery.8oe.com/fonts/woff/id/a6e5adace9c717c4b62d0d357490ca12
可以通过百度的 FontEditor 字体编辑器查看字形与编码对应关系，如图：
通过对应关系，就知道编码对应的数字了。

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver