python爬虫-最新破解百度翻译sign值
开门见山,直入主题:可以通过不同的请求发现,只有sign是不断变化的,直接全局搜索;
全局搜索可能会出现许多结果,可以在关键词后面加上特殊符号,例如sign :或者sign=减少一些无效的结果,
直接进入文件查看源代码
进行局部搜索sign:,看到有多个结果,如果觉得这个结果可疑,针对性的给这些存在可惜的结果下断点
打完断点,重新请求下,看看代码停留在哪里
最后代码停留到了这里:
看到sign又函数L生成,且里面的参数就是我们需要翻译的内容,直接进入查看此函数
看到函数内容,直接把它放到js调试工具里面进行调试
看的有一个i没有定义,这种情况到源代码附件找找看
看到i是一个值,这种情况首先就查看i这个值是否可变的;
重新请求一下发现,i是不变的,直接把i定义到代码里面去,
再次调试发现,确实一个函数n,再到源代码附件找找:
把它放到代码里面,最后调试,成功:
--------------------------------------------------------------------------------------------------------------------------------------------------
最后说一下,本人爬虫小白,正努力寻找各大网站受虐;
在这个项目之中,有一个问题,最后被我强行解决了
在调试过程中,在没有加入r函数的情况下,调试会报一个错:
对于这种内置对象,我一般都会赋值this或者赋值成空字典,但是还有会报错
怎么都调试不好,最后都是我挨着代码读,把缺少的补全,才运行成功,但是这个问题也没有得到完美的答案;
希望大佬为我解惑,可以的话,分析一下个人的逆向思路
第一次个人写贴,如有不好的地方,请指正 看到up写的正在找各大网站受虐,up能不能爬下股票数据,作为炒股的选股依据,减少找好股的时间,我觉得这个算是有一定的经济和实用价值
我自己网上搜过,那个代码是爬的东方财富的行情和基本数据,但是运行不通,我也是小白试着改了下,改不对,
主要需要爬取到A股的股票基本数据,包括行业、版块、流通市值、市盈率、市净率、财务的净利润 这些 jjjzw 发表于 2021-10-27 17:00
还没有想出办法只是手动切割了文本
我这边解决了, 原因是超过30个字符之后 python自带的execjs生成的sign码与浏览器生成的不一样, 解决方法: 使用nodejs执行js,生成的sign就是正确的 干货,收藏了 不错,技巧还是GET共鸣了 谢谢分享 好东西,感谢分享 学习了 辛苦辛苦 学习了,
感谢分享
学习下,非常感谢分享 满满的干货,既能分享技术,又能学习进步