吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 385|回复: 8
收起左侧

[讨论] 有没有方法使request请求链接后,拿到执行js后的响应体?

[复制链接]
mcsy 发表于 2024-11-20 16:14
最近写了一个爬取某条文章数据的小程序。但在爬取文章这一步却犯了难。

使用python进行爬取,get请求后,返回的响应体无法执行js,所以得到的页面是js需要执行的Html。

如图:
[20241120160240.jpg](https://postimg.cc/YhrGyLqf)

若是在浏览器中,则会在检查中得到正常的代码。

是不是需要学一下js逆向,去找真正放文章的请求呢?
第一次,发帖,若是有不对的对方,请大家指正。

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

wapjsx 发表于 2024-11-20 16:52
所以,你需要学习下python里的 Selenium,若有需要的,则 可 查看我 金山文档 总结的内容。

【金山文档 | WPS云文档】 Selenium 4.0_金山文档
https://kdocs.cn/l/cdiDl9MM1DaC

免费评分

参与人数 2吾爱币 +2 热心值 +2 收起 理由
Xiers0721 + 1 + 1 谢谢@Thanks!
bester + 1 + 1 我很赞同 Selenium!

查看全部评分

 楼主| mcsy 发表于 2024-11-20 16:55
wapjsx 发表于 2024-11-20 16:52
所以,你需要学习下python里的 Selenium,若有需要的,则 可 查看我 金山文档 总结的内容。

【金山文档  ...

感谢,这个我看了,的确能解决,C#的我也看了一下,也是类似的解决方案
狐白本白 发表于 2024-11-20 17:25
selenium配合browsermobproxy
单用selenium智能拿去页面,两者配合
可以抓取页面并且抓取页面请求返回的url
三滑稽甲苯 发表于 2024-11-20 18:15
最好还是研究一下它的代码,模拟执行的效率会比较低
icer233 发表于 2024-11-20 20:19
mcsy 发表于 2024-11-20 16:55
感谢,这个我看了,的确能解决,C#的我也看了一下,也是类似的解决方案

可以学一下和selenium很像的drissionpage,优点是drissionpage不用搞浏览器驱动。
hudengke 发表于 2024-11-20 21:02
可以用cef3框架
 楼主| mcsy 发表于 2024-11-20 22:09
icer233 发表于 2024-11-20 20:19
可以学一下和selenium很像的drissionpage,优点是drissionpage不用搞浏览器驱动。

好的,等会看看
hdws8 发表于 2024-11-20 22:29
cef3框架可以学一下
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-5 06:26

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表