吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3389|回复: 19
收起左侧

[Python 原创] 小说小偷程序(根据chatgpt修改)

[复制链接]
wapys 发表于 2023-6-2 18:19
根据GPT提示修改的代码,没有添加协成,也没有多进程,多线程,下载一个小说运行速度也不慢,不容易出错!
[Python] 纯文本查看 复制代码
import requests
from bs4 import BeautifulSoup
# 设置请求头
headers = {    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# # 目标网站
ids = "15785"  #小说ID,可修改为你想下载的书
url = 'http://www.qiuyelou.net/'+ids+'/'
# 发送请求
response = requests.get(url, headers=headers)
response.encoding = "utf-8"
# 解析网页
soup = BeautifulSoup(response.text, 'html.parser')
# 获取小说标题
title = soup.find('div', class_='title').h1.text   #//*[@id="main"]/div[2]/div[1]/h1
print('正在下载小说:', title)
# 获取章节链接  //*[@id="novel15785"]/dl/dd[2]/a
chapter_urls = []
chapter_list = soup.find_all('dd')[0].find_all('a')
for chapter in chapter_list:   
    chapter_url = 'http://www.qiuyelou.net/'+ids+'/' + chapter['href']    
    chapter_urls.append(chapter_url)
# 下载每一章节的内容
print(chapter_urls)
for chap_url in chapter_urls:    
    # 发送请求    
    chapter_response = requests.get(chap_url, headers=headers)
    chapter_response.encoding = "utf-8"    
    # 解析网页    
    chapter_soup = BeautifulSoup(chapter_response.text, 'html.parser')    
    # 获取章节标题和内容
    chapter_title = chapter_soup.find('div', class_='title').h1.text 
    idclass = chap_url.split("/")[-1].replace(".html","")
    print(idclass)
    chapter_content = chapter_soup.find('div', id='content'+idclass+'').text
    # 写入文件
    with open("缓存/"+ title + '.txt', 'a', encoding='utf-8') as f:        
        f.write(chapter_title + '\n\n')        
        f.write(chapter_content + '\n\n')    
        print('已下载:', chapter_title)
print('小说下载完成!')

免费评分

参与人数 6吾爱币 +4 热心值 +5 收起 理由
leftime + 1 我很赞同!
taitailaile + 1 热心回复!
qianfangren + 1 + 1 热心回复!
Bob5230 + 1 + 1 热心回复!
Antakh + 1 + 1 我很赞同!
holen2024 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

林夕丶 发表于 2023-6-9 22:01
本帖最后由 林夕丶 于 2023-6-9 22:04 编辑

[Python] 纯文本查看 复制代码
import requests
from bs4 import BeautifulSoup
import time

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}

ids = "15785"
url = f'http://www.qiuyelou.net/{ids}/'

response = requests.get(url, headers=headers)
response.encoding = "utf-8"
soup = BeautifulSoup(response.text, 'html.parser')

title = soup.find('div', class_='title').h1.text
print('正在下载小说:', title)

chapter_urls = []
chapter_list = soup.select('dd a')
for chapter in chapter_list:
    chapter_url = f'http://www.qiuyelou.net/{ids}/{chapter["href"]}'
    chapter_urls.append(chapter_url)

print(chapter_urls)

for chap_url in chapter_urls:
    retries = 3
    while retries > 0:
        try:
            chapter_response = requests.get(chap_url, headers=headers)
            chapter_response.encoding = "utf-8"
            chapter_soup = BeautifulSoup(chapter_response.text, 'html.parser')
            chapter_title = chapter_soup.find('div', class_='title').h1.text
            idclass = chap_url.split("/")[-1].replace(".html", "")
            chapter_content = chapter_soup.find('div', id=f'content{idclass}').text

            with open(f"缓存/{title}.txt", 'a', encoding='utf-8') as f:
                f.write(chapter_title + '\n\n')
                f.write(chapter_content + '\n\n')
            print('已下载:', chapter_title)
            break
        except requests.exceptions.RequestException:
            print('请求失败,重试...')
            retries -= 1
            time.sleep(1)
    else:
        print('无法下载章节:', chap_url)

print('小说下载完成!')
holen2024 发表于 2023-6-3 00:44
龍謹 发表于 2023-6-3 07:06
ayo123a 发表于 2023-6-3 08:11
chatGPT开创了一个新时代
卡布 发表于 2023-6-3 08:26
感谢分享
ipkqywfi 发表于 2023-6-3 09:11
好东西,就是不会用是改为BAT后缀吗?
 楼主| wapys 发表于 2023-6-3 10:13
ipkqywfi 发表于 2023-6-3 09:11
好东西,就是不会用是改为BAT后缀吗?

有那个python编程软件去运行!
htxz2022 发表于 2023-6-3 13:05
chatgpt确实越来越强了
Z146459 发表于 2023-6-3 16:35
感谢楼主分享!
luffy365 发表于 2023-6-4 23:38
感谢分享~
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 22:48

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表