Timelessyu 发表于 2021-7-13 00:19

python爬虫-最新破解百度翻译sign值

开门见山,直入主题:

可以通过不同的请求发现,只有sign是不断变化的,直接全局搜索;

全局搜索可能会出现许多结果,可以在关键词后面加上特殊符号,例如sign :或者sign=减少一些无效的结果,
直接进入文件查看源代码

进行局部搜索sign:,看到有多个结果,如果觉得这个结果可疑,针对性的给这些存在可惜的结果下断点
打完断点,重新请求下,看看代码停留在哪里

最后代码停留到了这里:

看到sign又函数L生成,且里面的参数就是我们需要翻译的内容,直接进入查看此函数

看到函数内容,直接把它放到js调试工具里面进行调试

看的有一个i没有定义,这种情况到源代码附件找找看

看到i是一个值,这种情况首先就查看i这个值是否可变的;
重新请求一下发现,i是不变的,直接把i定义到代码里面去,
再次调试发现,确实一个函数n,再到源代码附件找找:

把它放到代码里面,最后调试,成功:




--------------------------------------------------------------------------------------------------------------------------------------------------


最后说一下,本人爬虫小白,正努力寻找各大网站受虐;


在这个项目之中,有一个问题,最后被我强行解决了


在调试过程中,在没有加入r函数的情况下,调试会报一个错:

对于这种内置对象,我一般都会赋值this或者赋值成空字典,但是还有会报错



怎么都调试不好,最后都是我挨着代码读,把缺少的补全,才运行成功,但是这个问题也没有得到完美的答案;
希望大佬为我解惑,可以的话,分析一下个人的逆向思路
第一次个人写贴,如有不好的地方,请指正

shadow2020 发表于 2021-7-14 10:20

看到up写的正在找各大网站受虐,up能不能爬下股票数据,作为炒股的选股依据,减少找好股的时间,我觉得这个算是有一定的经济和实用价值
我自己网上搜过,那个代码是爬的东方财富的行情和基本数据,但是运行不通,我也是小白试着改了下,改不对,
主要需要爬取到A股的股票基本数据,包括行业、版块、流通市值、市盈率、市净率、财务的净利润 这些

SuperSpiderMan 发表于 2021-10-28 17:12

jjjzw 发表于 2021-10-27 17:00
还没有想出办法只是手动切割了文本

我这边解决了, 原因是超过30个字符之后 python自带的execjs生成的sign码与浏览器生成的不一样, 解决方法: 使用nodejs执行js,生成的sign就是正确的

woaicrack 发表于 2021-7-13 00:32

干货,收藏了

getserver 发表于 2021-7-13 04:06

不错,技巧还是GET共鸣了

fengjewel 发表于 2021-7-13 05:38

谢谢分享

加奈绘 发表于 2021-7-13 06:22

好东西,感谢分享

田笑笑 发表于 2021-7-13 06:24

学习了   辛苦辛苦

tl;dr 发表于 2021-7-13 06:37

三滑稽甲苯 发表于 2021-7-13 06:56

学习了,
感谢分享

tzlqjyx 发表于 2021-7-13 07:15


学习下,非常感谢分享

xuwen_1993 发表于 2021-7-13 07:23

满满的干货,既能分享技术,又能学习进步
页: [1] 2 3 4
查看完整版本: python爬虫-最新破解百度翻译sign值