好友
阅读权限10
听众
最后登录1970-1-1
|
近期学了爬虫,试着爬了很多网站的小说,一直很顺利,遇到问题都解决了。可是当爬到这篇小说这个章节时却遇到了问题:
https://www.sztjgold.com/chapter.html?1#mybookid=96803&bookid=108841&chapterid=48935289
通过抓包找到了真实的网址:https://www.sztjgold.com/files/article/html555/108/108841/48935289.html,但这个网址得到的却是这样的内容:
var _0x229e=['w4DCpcOLIsKZVMOo','MD7Di8Ktwoo=','YcObw69ZBh9b','QcOYdVhfw4rDnA==','JXnDv1HCrg==','JcKoCsKtLw==','Hy/CnWk2','w7EbwpTDnU8=','fUfDt8Knwp5cw7o=','w7FpLQ==','w6QGwqnDnW3DjlA=','XlnCkcOB','wpTDqiPDvnNpdg==','T8OQwoYBwqo=','wpIdd3IMGAA=','S8K1Qk4=','Lg3CknYQHSQ=','w4vDvlvDoMOV','wpvCgMOQHEZDUA==','Z8OMw6JPGQdXN8O4','w5LCnXdMKcObw4c=','MMKhVihj','w5HDsMKJw61ywotM','w6PCuyvCsMKBwqHClC7CgcKmZxdEYsK9wrpK','UcOHd0JE','woF9F8K7w5k=','UAUiPRDCvcOGM8KF','wpvDqio=','wqPDhsOXEA==','VcOWaUU=','......................................................................................................
经百度,这是js数据。显然,这段数据包含了小说内容,不过被加密了。而且,这段数据肯定也包含了解密的函数、及需要的参数。但奇怪的是,把这段代码弄到运行js的工具进行运行时候,老是提示缺少“;”,个人认为段数据故意设计了使用js数据运行出错的代码,浏览器在运行这段js数据之前先对这段代码作了修正,然后才运行。所以,要能运行这段js数据就必须对先修改这段代码,这可能要对js非常熟悉的人才办得到吧。看了很多的文章,有人说selenium可以做到,我试了,确实可以,但运行速度太慢了,不知道大牛们有没有更好的办法。
|
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|