吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1471|回复: 6
收起左侧

[求助] 关于用python 保存 大文件操作

[复制链接]
笔墨纸砚 发表于 2021-3-14 10:53
本帖最后由 笔墨纸砚 于 2021-3-14 10:54 编辑

我在保存大的PDF 文件过程中 因为文件数据太大 保存过程较为缓慢。应该怎么修改呢 ?请大哥们赐教一下。
[Python] 纯文本查看 复制代码
with open(file_name + '.pdf', 'wb') as f:
    for data in res.iter_content(chunk_size=1024*10, decode_unicode=False):
        f.write(data)
        downl_size += len(data)
        if not tot_size == downl_size:
            print('正在下载')
        else:
            f.close()


实力文件:https://sci.bban.top/pdf/10.1515/pac-2015-0305.pdf

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

qianshang666 发表于 2021-3-14 11:08
一个文件的话.2_3M也不算太大,文件多的话,可以使用多线程下载
Hatsune_miku 发表于 2021-3-14 11:24
[Python] 纯文本查看 复制代码
with open(file_name + '.pdf', 'wb') as f:
    for data in res.iter_content(chunk_size=1024*10, decode_unicode=False):
        if data:
            f.write(data)
    f.close()


你写的没毛病
小小北辰 发表于 2021-3-14 11:30
你也再爬scihub的网站嘛,最近我工作也在爬这个,爬了几百万了,你这样写没问题,应该没有其他更快的方法了
 楼主| 笔墨纸砚 发表于 2021-3-14 13:58
小小北辰 发表于 2021-3-14 11:30
你也再爬scihub的网站嘛,最近我工作也在爬这个,爬了几百万了,你这样写没问题,应该没有其他更快的方法了

可是保存到桌面的速度很慢 有没有其他办法呀
小小北辰 发表于 2021-3-15 16:13
笔墨纸砚 发表于 2021-3-14 13:58
可是保存到桌面的速度很慢 有没有其他办法呀

我现在用异步,外国代{过}{滤}理的方式,还是挺快的,200并发一分钟可以爬取120个pdf文件
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-17 01:02

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表