吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2818|回复: 13
收起左侧

[求助] 爬虫数据 求助!

[复制链接]
山野村夫-陈墨 发表于 2019-8-6 17:24
今天我是来求助的,哈哈哈。本来要爬一个百度文档,但是发现它返回的数据类型是我没有见过的,不知如何下手。
这个是 url :https://wkbjcloudbos.bdimg.com/v1/docconvert1064/wk/af2c25c2831954ed2b50cbf01d1bffb9/0.json?responseContentType=application%2Fjavascript&responseCacheControl=max-age%3D3888000&responseExpires=Fri%2C%2020%20Sep%202019%2017%3A14%3A07%20%2B0800&authorization=bce-auth-v1%2Ffa1126e91489401fa7cc85045ce7179e%2F2019-08-06T09%3A14%3A07Z%2F3600%2Fhost%2F4131bb806fa9dab58c4a7ad69f1db535c621bc0a4bb89ca9534e95bafcf1f4c7&x-bce-range=32072-65731&token=eyJ0eXAiOiJKSVQiLCJ2ZXIiOiIxLjAiLCJhbGciOiJIUzI1NiIsImV4cCI6MTU2NTA4NjQ0NywidXJpIjp0cnVlLCJwYXJhbXMiOlsicmVzcG9uc2VDb250ZW50VHlwZSIsInJlc3BvbnNlQ2FjaGVDb250cm9sIiwicmVzcG9uc2VFeHBpcmVzIiwieC1iY2UtcmFuZ2UiXX0%3D.KTBMMhviPt%2Bvd0%2Fv1Ib5QS4AqbCdU7dSm5u74F%2B4prM%3D.1565086447


然后爬到的数据是这样:
QQ图片20190806171717.png
QQ图片20190806171723.png
QQ图片20190806171728.png

不知如何下手,求赐教。目前我知道的方法只有“json”和“Xpath”

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

黑龍 发表于 2019-8-6 17:54
这种它就是JSON  把 wenku_2(  和  ) 中间取出来就行了
iknew 发表于 2019-8-6 18:07
E飞翔 发表于 2019-8-6 18:22
楼主要懂得灵活运用,这个只是说是json成员中有json的对象而已。
 楼主| 山野村夫-陈墨 发表于 2019-8-6 20:30
iknew 发表于 2019-8-6 18:07
这就是json呀,嵌套一下就不认识啦?

真不认识了,能不能支一招,谢谢哈
 楼主| 山野村夫-陈墨 发表于 2019-8-6 20:32
黑龍 发表于 2019-8-6 17:54
这种它就是JSON  把 wenku_2(  和  ) 中间取出来就行了

具体,请赐教,哈哈哈,基础差
黑龍 发表于 2019-8-6 21:09
山野村夫-陈墨 发表于 2019-8-6 20:32
具体,请赐教,哈哈哈,基础差

已经告诉你了啊    把括号里的代码提出来解析就可以了
shellcode 发表于 2019-8-7 09:27
json  你了解一下
kxg2020 发表于 2019-8-14 10:11
返回的json是百度独有的解析方式才能解析的   wenk_2() 是一个函数 使用的jsonp的方式调用的  上面那群人 屁都不懂 乱回答
 楼主| 山野村夫-陈墨 发表于 2019-8-28 22:09
kxg2020 发表于 2019-8-14 10:11
返回的json是百度独有的解析方式才能解析的   wenk_2() 是一个函数 使用的jsonp的方式调用的  上面那群人 ...

我刚接触python,可否详解呢 ?
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-27 01:35

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表