再也不用女朋友帮我找资源了

Oranger 发表于 2020-12-26 14:09

```
import os
from lxml import etree
import requests,re
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'}
def all_text(url_name):
res=requests.get(url_name,headers=headers)
xiaoshuoming = re.findall('<meta property="og:novel:book_name" content="(.*?)"/>',res.text)
if not os.path.exists(f'D:小说/{xiaoshuoming}'):
   os.makedirs(f'D:小说/{xiaoshuoming}')
urls=re.findall('<dd><a href="(.*?)" >.*?</a></dd>',res.text)
names=re.findall('<dd><a href=".*?" >(.*?)</a></dd>',res.text)
return urls,names,xiaoshuoming
def download(url_name):
url='http://www.dvdspring.com'
urls,names,xiaoshuoming=all_text(url_name)
for i,j in zip(urls,names):
   res_text=requests.get(url+i,headers=headers).text
   zj_html=etree.HTML(res_text)
   texts=zj_html.xpath('//*[@id="content"]/text()')#章节内容
   texts2=zj_html.xpath('//*[@id="content"]/*/text()')
   text='\n'.join(texts).strip()+'\n'.join(texts2).strip()
   try:
         with open(f'd:小说/{xiaoshuoming}/{j}.txt','a',encoding='utf8') as f:
            f.write(text)
            print(f'{xiaoshuoming}/{j}正在下载...')
   except:
         if j.startswith('?') or j.startswith('*') or '*' in j:
            zhangjie=''.join(re.findall('\d',j))
            with open(f'd:小说/{xiaoshuoming}/第{zhangjie}章.txt', 'a', encoding='utf8') as f:
               f.write(text)
               print(f'{xiaoshuoming}\t第{zhangjie}章 \t正在下载...')
if __name__ == '__main__':
url_name='http://www.dvdspring.com/html/7210/'#小说名地址
download(url_name)
```

#只需要更改代码末尾的url_name地址，在笔趣阁中任选一本小说，复制上面的网址

anxun1999 发表于 2020-12-26 16:27

我还以为女盆友跟人跑了呢~~~~~~😏

嫒小鹿 发表于 2020-12-26 16:11

我还以为女盆友跟人跑了呢~~~~~~

janny82 发表于 2020-12-26 16:01

我还以为女盆友跟人跑了呢~~~~~~:lol

Oranger 发表于 2020-12-26 14:11

这个是爬取这个网站上的http://www.dvdspring.com/paihangbang/小说

空空月 发表于 2020-12-26 16:32

我还以为女盆友跟人跑了呢~~~~~~{:301_1005:}

kdmq123 发表于 2020-12-26 16:35

不知道怎么用

物美电器 发表于 2020-12-26 17:15

喜欢看小说的可以了

Jacky168 发表于 2020-12-26 17:34

Oranger 发表于 2020-12-26 14:11
这个是爬取这个网站上的http://www.dvdspring.com/paihangbang/小说

用爬虫技术？

寒冰流火 发表于 2020-12-26 18:01

最近看看Python感觉要以楼主为榜样了就好好琢磨这些码码

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

再也不用女朋友帮我找资源了