吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1175|回复: 8
收起左侧

[求助] 爬虫问题求解

[复制链接]
Wxylkxy 发表于 2021-8-30 18:06
爬取京东商品的一个小问题 。之前用selenium写过一遍。想用requests再写一遍。  但是有一点卡住了。
我该如何获取某商品的总页数呢。  页面是动态加载的。requests这个页面无法得到页码 image.png 这个标签。
我看 滑轮滚动的时候发其他请求 也只有商品数据 没有这个页码。
迷了。

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

挑灯看花 发表于 2021-8-30 18:17
劝你算了,因为有个参数加密了
VB6LAM1E8NG{KIEFG63GM2J.png
Prozacs 发表于 2021-8-30 18:20
result_count就是你搜索商品所得到的商品数量。首先你得解密pvid
111.png
jjjzw 发表于 2021-8-30 18:20
可能是js动态加载的,得分析他发了什么请求再用requests写
qianshang666 发表于 2021-8-30 18:25
挑灯看花 发表于 2021-8-30 18:17
劝你算了,因为有个参数加密了

这个参数扣js就行了,就几行代码
 楼主| Wxylkxy 发表于 2021-8-30 19:39
Prozacs 发表于 2021-8-30 18:20
result_count就是你搜索商品所得到的商品数量。首先你得解密pvid

懂了好兄弟!。 我去调试下。
三滑稽甲苯 发表于 2021-8-30 22:12
断点调试,扒出pvid的加密方式
cflying 发表于 2021-8-30 22:42
本帖最后由 cflying 于 2021-8-30 22:58 编辑

pvid好像是根据时间再进行一定的随机后,和一个固定的码混合后而成的,所以猜测随机一个同样位数的字符串去提交应该也行(同样猜测如果去掉这个估计也没啥)。

如果用selenium,试试模拟鼠标下拉到最后底部估计就会显示页数了

如果用request的话,有个偷懒方法,在页面中上部选择京东物流等区域上方,有个共XX个商品,后面就是当前页码和总页码。
kiseyzed 发表于 2021-8-30 23:12
c.genPvid = function() {
            var a = (new Date).getTime();
            var b = "xxxxxxxxxxxx4xxxyxxxxxxxxxxxxxxx".replace(/[xy]/g, function(b) {
                var c = (a + 16 * Math.random()) % 16 | 0;
                return a = Math.floor(a / 16),
                ("x" == b ? c : 3 & c | 8).toString(16)
            });
            return b
        }
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 22:55

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表