吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2057|回复: 14
收起左侧

[Python 转载] python 爬虫爬取歪歪会员CDK 【AI写的】

  [复制链接]
执_念 发表于 2023-7-24 08:51
# python 爬虫爬取歪歪会员CDK

import requests


# 获取网页源代码
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()  # 如果状态不是200,引发HTTPError异常
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"


# 解析网页源代码
def parsePage(ilt, html):
    try:
        plt = "{:4}\t{:8}\t{:16}"
        print(plt.format("序号", "会员等级", "CDK"))
        count = 0
        for i in range(1, 100):
            count = count + 1
            start = html.find('<div class="c-abstract">')
            end = html.find('</div>', start)
            if start == -1:
                break
            info = html[start + 24:end]
            html = html[end + 6:]
            print(plt.format(count, info[0:8], info[8:]))
            ilt.append([info[0:8], info[8:]])
    except:
        print("")


# 打印解析后的数据
def printGoodsList(ilt):
    plt = "{:4}\t{:8}\t{:16}"
    print(plt.format("序号", "会员等级", "CDK"))
    count = 0
    for g in ilt:
        count = count + 1
        print(plt.format(count, g[0], g[1]))


# 主函数
def main():
    goods = "歪歪会员CDK"
    depth = 2
    start_url = "https://www.baidu.com/s?wd=" + goods
    infoList = []
    for i in range(depth):
        try:
            url = start_url + "&pn=" + str(50 * i)
            html = getHTMLText(url)
            parsePage(infoList, html)
        except:
            continue
    printGoodsList(infoList)


main()

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
cairui + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

cheesepower 发表于 2023-7-24 10:09
压力能过吗?
szm1314521 发表于 2023-7-24 10:23
zjdjmc 发表于 2023-7-24 10:42
jie08 发表于 2023-7-24 10:45
歪歪会员是什么
niubg 发表于 2023-7-24 10:45
好用吗?
weiyanli 发表于 2023-7-24 10:47
感谢楼主分享精品
derong2006 发表于 2023-7-24 11:09
感谢楼主分享
llamb 发表于 2023-7-24 11:41
楼主发一下提示词好不好?谢谢
NjY2 发表于 2023-7-24 21:44
感谢楼主分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 15:52

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表