吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1208|回复: 11
收起左侧

[求助] 怎样用Python爬取源码不显示网页内容的网站啊?

[复制链接]
csmy2012 发表于 2021-11-3 11:56
怎样用Python爬取源码没有内容的网站啊?比如《东方新闻》。网址是:http://www.kankanews.com/list/dragonList/dfxw
打开页面是这样的,想抓取新闻标题
001.JPG
而源码是这样的,没有标题内容
002.JPG
这个得用Scrapy才能抓取吗?
请大神指教,谢谢!

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

Geoffrey 发表于 2021-11-3 12:48
别抓这个了,直接去抓他的api,F12有一个newslist?act=……,然后伪装浏览器访问一下就有全部的新闻了,还有相关的新闻。编码是Unicode的,需要转一下utf8
青春丿易逝 发表于 2021-11-3 13:04
头像被屏蔽
diaozatian815 发表于 2021-11-3 13:41
jiujiukeji 发表于 2021-11-3 13:57
ynboyinkm 发表于 2021-11-3 14:33
有直接的接口的,从接口来
sky_flb 发表于 2021-11-3 16:04
https://api-app.kankanews.com/kankan/pc/newslist?act=dfxw&nonce=1wn34bq7&pid=1&platform=pc&size=20&timestamp=1635926547&version=1.0&sign=6a53167b516a5ce7f84f70676f7ae65c
狐白本白 发表于 2021-11-3 16:45
不要抓源码,这种东西一般都是动态加载,直接找借口进接口那信息
cyh1993 发表于 2021-11-3 17:11
直接抓API!  他这个都是JS获取内容并写到页面的指定位置的!      直接抓取页面任何语言都是抓不到的!
648474073 发表于 2021-11-4 09:33
https://api-app.kankanews.com/kankan/pc/newslist?act=dfxw&nonce=a49ep89a&pid=1&platform=pc&size=20&timestamp=1635989512&version=1.0&sign=560af91c797edacf69e8dc854e07572e
https://api-app.kankanews.com/kankan/pc/relatednews?nonce=adu4xawq&platform=pc&timestamp=1635989512&version=1.0&sign=8e1aef2b9a6340d83aece7dd1292ef63
有API直接API,JSON解析还方便
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 20:27

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表