百度发包参数解析
本帖最后由 苏紫方璇 于 2020-3-30 18:04 编辑不出意外的话,大家大概都是想搞seo 所以点击来看了。
所以我这边就解析一波网上没有的发包参数获取。
有的那些 我就不说了。如果你长期关注发包参数的话。自然就知道了。
那么我们从打开百度首页开始吧。
打开百度首页。需要在源代码里面取到几个参数值。
rsv_pq 搜索 <input type="hidden" name="rsv_pq"这个的value就是
rsv_t 搜索 <input type="hidden" name="rsv_t" 这个的value就是
sid 其实就是cookie里的H_PS_PSSID
我们现在说说搜索包的一些参数
rsv_sid和sid一样
isid其实就是cookie里的BAIDUID,但他有一个算法。
def isid(c):
te = re.findall(re.compile('BAIDUID=(.*?):'), c)
ce = te + te + str(int(99999 * random.random()))
while len(ce) < 16:
ce += str(0)
return parse.quote(ce)
由于搜索包并不是一个网站的html页面。大家可以仔细看看,他返回的其实只是你搜索的结果内容。然后填入到dom里面。
所以要关注这个的返回内容。
cqid 搜索 bds.comm.qid
eqid 搜索 bds.comm.eqid
ver 搜索 bds.comm.baiduis_verify
chk 搜索 <div id="__chk">
searchId 搜索 E.pl.searchId 如果没有 则这个值可以是cqid
queryEnc 搜索 bds.comm.queryEnc
rsv_t 这个时候要更新成为 bds.comm.encTn的值
queryId 也是cqid
那么搜索结果出来了,应该就是要进行目标网站点击了。
好吧。这个位置我测过了。但是点击不被统计到。还在找原因。有知道的或者在研究这方面的小伙伴可以一起交流吗。
如果还需要更多的参数获取,可以留言。我保持更新。
老是遇到百度验证,次数随机,怎么弄!
附加包头
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
Accept-Language: zh-CN,zh;q=0.9
User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.16 Safari/537.36
还有就是rsv_iqid:在哪里啊,找不到这个参数啊
发送内容:
返回数据 = 到文本 (网页_访问 (“https://www.baidu.com/s?ie=utf-8&newi=1&f=3&rsv_bp=1&rsv_idx=1&tn=baidu&wd=” + 编码后关键词 + “&fenlei=256&rsv_pq=” + 编辑框3.内容 + “&rsv_t=” + 编辑框4.内容 + “&rqlang=cn&rsv_enter=1&rsv_dl=ts_1&rsv_sug3=4&rsv_sug1=2&rsv_sug7=101&rsv_sug2=1&rsv_btype=i&rsp=1&inputT=1457&rsv_sug4=1571&et=” + 编辑框9.内容, 0, , , , #包头, , , , , , , , ))
本帖最后由 wyyanqy 于 2020-4-10 15:31 编辑
Small_Google 发表于 2020-4-9 10:23
还有一些包 你没发。所以点击量不被统计到。
就是方式不对而已早就换了! 现在就差两个加密参数 不知道有没有算法 rsv_pq rsv_t
在不断测试 。。。。。
MzgwMjU0Mjc3 :handshake互相交流一下心得!我这边也在开发 楼主高手啊。 刚入行不久, 有兴趣研究。 我也是做seo这行的,最近也在研究,谢谢楼主分享。 说一下通过结果你是怎么进站的?sselenium 模拟点击应该是正常的通过程序请求link?url 是不被统计的年前我测试过了!
ps:python 技术不行,测试过多种方式! 前几天弄过,失败告终 wyyanqy 发表于 2020-4-7 21:26
说一下通过结果你是怎么进站的?sselenium 模拟点击应该是正常的通过程序请求link?url 是不被统计的年 ...
还有一些包 你没发。所以点击量不被统计到。 现在我是用py+selen跑,直接跑多线程任务的,效率低,现在一天10W点击没问题,但好像效果没出来,能进资源统计 就是没效果,估计脚本有问题脑瓜疼