关于遇到加密数据怎么提取的一些案例
首先 看到我们需要玩弄的网站数据是加密的,怎么抓?这个适合就用到了我们的JS逆向这个技术了
PS: 关于有人说可以用Selenium去抓,当然可以,It's entirely up to you, I can also copy and paste them.
遇见这种直接定位JSON.parse
它两个地方都有,都可打个断点看看
我们刷新网页,看见加密的data来了 可以判断这边可能是入口
我们可以看到真实数据了
我们看看这个函数
我们可以看到,进来之后发现右上角的名称是des,可以推测它是des加密 实质上就是des加密
这是经过特殊处理的,代码抠出来,处理一下 就可以用了
到此 教程完美结束
每日一个JS逆向小案例
可以用Python去做 execjs看我之前的帖子就懂怎么实现了
lihu5841314 发表于 2021-7-18 22:47
selenium 有些抓不到 selenium用好了效率也不差
抓一万条页面的差异就出来了。
o(n) 和 o(n2) 在10条数据上 差异不大 一千条 一万条 十万条差异就大了
o(1) 和 o(n3)就更加了 之前学爬虫就对JS逆向这一块模棱两可,非常感谢大佬的这些分享!请问你是在哪学习的,这一块我之前就跟着研究过腾讯漫画的JS逆向,教程太少了!还有,能否麻烦讲解下扒出来的网站数据原生js代码不用Python改写、而是搭配Python爬虫爬取数据的方法? 请问一下乱码,大佬是怎么处理替换的有相关的处理学习资料不,想学习一下 8782146 发表于 2021-7-18 15:29
请问一下乱码,大佬是怎么处理替换的有相关的处理学习资料不,想学习一下
这不是乱码 是混淆,可以自己网上搜索一下教程,JS逆向这一方面我是没看见有什么相关书籍出的哈 这个教程牛逼啊 QingYi. 发表于 2021-7-18 15:52
这不是乱码 是混淆,可以自己网上搜索一下教程,JS逆向这一方面我是没看见有什么相关书籍出的哈
好的,谢谢,准备去学习一下相关知识 每天学一点
目前只会爬未加密的数据,希望有一天能够像lz一样强大{:301_998:} {:301_997:}大佬要是玩博客或者发视频教程什么的也可以私戳分享下俺想去关注!铁粉! Hakutaku 发表于 2021-7-18 21:27
之前学爬虫就对JS逆向这一块模棱两可,非常感谢大佬的这些分享!请问你是在哪学习的,这一块我之前就跟着研 ...
可能我一激动没描述清楚,就是Python+Node.js调用js原生代码的方法,这一块俺也没见过什么教程{:301_999:} Hakutaku 发表于 2021-7-18 21:27
之前学爬虫就对JS逆向这一块模棱两可,非常感谢大佬的这些分享!请问你是在哪学习的,这一块我之前就跟着研 ...
不想折腾js就只能selenium 效率低了