qwq40404 发表于 2024-6-11 19:41

简单爬虫


在随便看的时候发现有个人在求助爬取电子书,看一下

进入后发现这里是按下一页一页传到本地


然后跟进发现原来就直接访问就可以,那直接遍历保存就行

import requests
start_num = 1
end_num =
for i in range(start_num, end_num + 1):
    url = 'https://haibei.qhywsm.cn/UploadFiles/PdfToImg/20201027/4C846748ADF3125B/img_{}.jpg'.format(i)
    response = requests.get(url)
    if response.status_code == 200:
      with open(r'路径\img_{}.jpg'.format(i), 'wb') as f:
            f.write(response.content)
    else:
      print(f"无法下载图片 {i}, 状态码: {response.status_code}")

直接访问保存在本地即可




wapj123888 发表于 2024-6-11 19:47

变异爬虫{:1_925:}

fkeuaii 发表于 2024-6-11 20:07

这个虫是怎么爬的啊

diweiyi123 发表于 2024-6-11 20:08

不太会这个

loveyao6688 发表于 2024-6-11 20:19

看不明白

Yifan2007 发表于 2024-6-11 20:41

咋没顺手写个合并

star0angel 发表于 2024-6-11 20:51

这个说实话有点牛逼了 加油

az12az 发表于 2024-6-11 21:18

怎么不是TXT?

ergouzib702 发表于 2024-6-12 03:53

:@感谢分享

JieRoud 发表于 2024-6-12 05:12

很简单,很不错
页: [1] 2 3
查看完整版本: 简单爬虫