吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1656|回复: 12
收起左侧

[求助] Python爬虫求助

[复制链接]
JIMaz 发表于 2020-6-3 20:30
今天想爬取一下某网站的彩票开奖号码,网站地址:https://lottery.8oe.com/index/lottery.html
QQ图片20200603202726.png
但是却发现 QQ图片20200603202734.png
这里只有日期和开奖号码,并没有我们需要的开奖号码,请问论坛大佬有什么好办法没有,还望大佬不吝赐教。谢谢

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

陈家丶妖孽 发表于 2020-6-3 20:39
实际是这个就是数据,只是设置了字体显示成这样了。不懂编程,但逻辑上面应该相通,先返回数据,然后解码?
414269678 发表于 2020-6-3 20:53
搜搜字体反爬相关的文章看看吧,网上看到过、
Vvvvvoid 发表于 2020-6-3 21:01
肯定是有的 ,
只不过浏览器的编辑器 不识别这种编码格式, 所以显示正方形
小涩席 发表于 2020-6-3 21:03
可以看到json明文,但是暂时看不懂这一串代码是啥意思?但是有一个思路,把每个数字对应的代码收集起来,做成字典,然通过json的数据进行一个匹配操作。就可以实现了。
1.jpg
亿联网络 发表于 2020-6-3 21:06
都有网页接口的,加上协议头访问,&#xef798 html实体名称 网上都有对照表
QQ截图20200603210414.png
 楼主| JIMaz 发表于 2020-6-3 21:42
小涩席 发表于 2020-6-3 21:03
可以看到json明文,但是暂时看不懂这一串代码是啥意思?但是有一个思路,把每个数字对应的代码收集起来,做 ...

好像是动态的
Brain_ 发表于 2020-6-3 21:47
主要是就是后台返回的html内容里边包裹着字体,然后前端需要引入对应的WEB字体文件
WeChat883630bddb0b2c2cf16c79ff3d5a436d.png
WeChat1db8867d44f1cf848721d716d78b7d0f.png
WeChat27668e391b2f3be97e859e3112d36fb5.png
WeChat54c5ce5dfde9edbf137ac0fc0f2caddb.png
 楼主| JIMaz 发表于 2020-6-3 21:51
Brain_ 发表于 2020-6-3 21:47
主要是就是后台返回的html内容里边包裹着字体,然后前端需要引入对应的WEB字体文件

然后怎么把它们转化为数字楠,谢谢解答
909699633 发表于 2020-6-4 08:03
字体文件是这个 :https://lottery.8oe.com/fonts/woff/id/a6e5adace9c717c4b62d0d357490ca12
可以通过百度的 FontEditor 字体编辑器查看 字形与编码对应关系,如图:
通过对应关系,就知道编码对应的数字了。
QQ截图20200604080206.jpg
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 15:33

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表