山野村夫-陈墨 发表于 2019-8-6 17:24

爬虫数据 求助!

今天我是来求助的,哈哈哈。本来要爬一个百度文档,但是发现它返回的数据类型是我没有见过的,不知如何下手。
这个是 url :https://wkbjcloudbos.bdimg.com/v1/docconvert1064/wk/af2c25c2831954ed2b50cbf01d1bffb9/0.json?responseContentType=application%2Fjavascript&responseCacheControl=max-age%3D3888000&responseExpires=Fri%2C%2020%20Sep%202019%2017%3A14%3A07%20%2B0800&authorization=bce-auth-v1%2Ffa1126e91489401fa7cc85045ce7179e%2F2019-08-06T09%3A14%3A07Z%2F3600%2Fhost%2F4131bb806fa9dab58c4a7ad69f1db535c621bc0a4bb89ca9534e95bafcf1f4c7&x-bce-range=32072-65731&token=eyJ0eXAiOiJKSVQiLCJ2ZXIiOiIxLjAiLCJhbGciOiJIUzI1NiIsImV4cCI6MTU2NTA4NjQ0NywidXJpIjp0cnVlLCJwYXJhbXMiOlsicmVzcG9uc2VDb250ZW50VHlwZSIsInJlc3BvbnNlQ2FjaGVDb250cm9sIiwicmVzcG9uc2VFeHBpcmVzIiwieC1iY2UtcmFuZ2UiXX0%3D.KTBMMhviPt%2Bvd0%2Fv1Ib5QS4AqbCdU7dSm5u74F%2B4prM%3D.1565086447


然后爬到的数据是这样:




不知如何下手,求赐教。目前我知道的方法只有“json”和“Xpath”

黑龍 发表于 2019-8-6 17:54

这种它就是JSON把 wenku_2(和) 中间取出来就行了

iknew 发表于 2019-8-6 18:07

这就是json呀,嵌套一下就不认识啦?

E飞翔 发表于 2019-8-6 18:22

楼主要懂得灵活运用,这个只是说是json成员中有json的对象而已。

山野村夫-陈墨 发表于 2019-8-6 20:30

iknew 发表于 2019-8-6 18:07
这就是json呀,嵌套一下就不认识啦?

真不认识了,能不能支一招,谢谢哈

山野村夫-陈墨 发表于 2019-8-6 20:32

黑龍 发表于 2019-8-6 17:54
这种它就是JSON把 wenku_2(和) 中间取出来就行了

具体,请赐教,哈哈哈,基础差

黑龍 发表于 2019-8-6 21:09

山野村夫-陈墨 发表于 2019-8-6 20:32
具体,请赐教,哈哈哈,基础差

已经告诉你了啊    把括号里的代码提出来解析就可以了

shellcode 发表于 2019-8-7 09:27

json你了解一下

kxg2020 发表于 2019-8-14 10:11

返回的json是百度独有的解析方式才能解析的   wenk_2() 是一个函数 使用的jsonp的方式调用的上面那群人 屁都不懂 乱回答

山野村夫-陈墨 发表于 2019-8-28 22:09

kxg2020 发表于 2019-8-14 10:11
返回的json是百度独有的解析方式才能解析的   wenk_2() 是一个函数 使用的jsonp的方式调用的上面那群人 ...

我刚接触python,可否详解呢 ?
页: [1] 2
查看完整版本: 爬虫数据 求助!