Python爬虫求助
今天想爬取一下某网站的彩票开奖号码,网站地址:https://lottery.8oe.com/index/lottery.html但是却发现
这里只有日期和开奖号码,并没有我们需要的开奖号码,请问论坛大佬有什么好办法没有,还望大佬不吝赐教。谢谢 实际是这个就是数据,只是设置了字体显示成这样了。不懂编程,但逻辑上面应该相通,先返回数据,然后解码? 搜搜字体反爬相关的文章看看吧,网上看到过、 肯定是有的 ,
只不过浏览器的编辑器 不识别这种编码格式, 所以显示正方形 可以看到json明文,但是暂时看不懂这一串代码是啥意思?但是有一个思路,把每个数字对应的代码收集起来,做成字典,然通过json的数据进行一个匹配操作。就可以实现了。 都有网页接口的,加上协议头访问,󯞘 html实体名称 网上都有对照表
小涩席 发表于 2020-6-3 21:03
可以看到json明文,但是暂时看不懂这一串代码是啥意思?但是有一个思路,把每个数字对应的代码收集起来,做 ...
好像是动态的 主要是就是后台返回的html内容里边包裹着字体,然后前端需要引入对应的WEB字体文件 Brain_ 发表于 2020-6-3 21:47
主要是就是后台返回的html内容里边包裹着字体,然后前端需要引入对应的WEB字体文件
然后怎么把它们转化为数字楠,谢谢解答 字体文件是这个 :https://lottery.8oe.com/fonts/woff/id/a6e5adace9c717c4b62d0d357490ca12
可以通过百度的 FontEditor 字体编辑器查看 字形与编码对应关系,如图:
通过对应关系,就知道编码对应的数字了。
页:
[1]
2