吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1802|回复: 0
收起左侧

[Python 转载] 补天SRC爬取

[复制链接]
Prims 发表于 2021-5-20 15:03

练手小项目,大佬勿喷(补天)

代码冗余地方请批评指正

import requests
import json
from lxml import etree

class Src(object):
    def __init__(self,page):
        self.url = "https://www.butian.net/Reward/pub"
        self.headers={
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36',
                'Cookie': ''
        }
        self.page=page
        self.data={
                's': '1',
                'p':self.page, 
                'token':'' 
        }

    def get_cid(self):
        r = requests.post(url=self.url,headers=self.headers,data=self.data).content.decode()
        s=json.loads(r)
        l=s['data']['list']
        for i in l:
            for k,v in i.items():
                if 'company_id' == k :
                    m=requests.get(url='https://www.butian.net/Loo/submit?cid='+v,headers=self.headers).content
                    n=etree.HTML(m)
                    value = n.xpath('//*[@id="tabs"]/form/div[1]/ul/li[3]/input/@value')[0]
                    print(value)
if __name__ == "__main__":
    for page in range(1,30):
        src=Src(page)
        src.get_cid()

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 16:22

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表