heiyahua 发表于 2023-5-10 17:16

py代码保存图片不完整,请教该如何修改

代码保存图片不完整,其中链接用IDM下载后实际大小在400多K,但用py保存时始终只有4.4K。请教该如何修改,代码如下

import requests

url = "https://image.mangabz.com/1/139/287339/2_5673.jpg?cid=287339&key=3477511deeaec1600683ee42aeca2d0a&uk="
filename = "manga_image.jpg"

response = requests.get(url)

with open(filename, 'wb') as f:
    f.write(response.content)



import requests

url = "https://image.mangabz.com/1/139/287339/2_5673.jpg?cid=287339&key=3477511deeaec1600683ee42aeca2d0a&uk="
filename = "manga_image.jpg"

response = requests.get(url, stream=True)

with open(filename, 'wb') as f:
    for chunk in response.iter_content(chunk_size=8192):
      if chunk:
            f.write(chunk)

塞北的雪 发表于 2023-5-10 18:37

你下载的是一个html文件,不信你用记事本打开看看

源站设置了防采集

deffedyy 发表于 2023-5-10 21:08

直接访问是不行的

vethenc 发表于 2023-5-10 22:00

反扒机制吧,爬虫要进阶

无知灰灰 发表于 2023-5-11 07:11

requests的时候,带上协议头,一般带上user-agent,referer应该就可以了。。

T0T20230313 发表于 2023-5-11 07:31

值得执行一下瞅瞅

heiyahua 发表于 2023-5-11 08:50

塞北的雪 发表于 2023-5-10 18:37
你下载的是一个html文件,不信你用记事本打开看看

源站设置了防采集

确实是一个HTML文件{:1_907:}

heiyahua 发表于 2023-5-11 08:59

无知灰灰 发表于 2023-5-11 07:11
requests的时候,带上协议头,一般带上user-agent,referer应该就可以了。。

多谢,加上header和referer后解决。{:1_918:}
页: [1]
查看完整版本: py代码保存图片不完整,请教该如何修改