吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2693|回复: 12
收起左侧

[其他原创] 关于文泉学堂下载的一些看法

[复制链接]
mliang 发表于 2020-2-12 21:24
本帖最后由 mliang 于 2020-2-12 21:25 编辑

先打开开发者工具,把需要下载的电子书快速看完,然后把所有的网络请求保存成har文件

然后解析出来图片的base64格式。

最后把base64还原成图片。

清晰度跟阅读的时候是一样的。

有两个问题

1.有什么好方法可以自动让浏览器翻页

2.怎么样保证图片的顺序不出错。

下面是解析har文件和还原图片的代码。
瞎写的,刚才下了一本书。

import re
import base64

re.compile('^iVB')

with open('123.har', 'r') as f:
    har_page = json.load(f)

entries=har_page['log']['entries']

for entr in entries:
    res = entr['response']['content']
    t = res.get('text','')
    if len(t)>0 and re.match('iVBORw0KGgo',t):
        image_data = base64.b64decode(t)
        with open(str(a)+'.jpeg', 'wb') as f:
            f.write(image_data)

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

sdieedu 发表于 2020-2-13 09:37
# -*- coding:utf8 -*-

import os
import cv2

class BatchRename():
    '''
    批量重命名文件夹中的图片文件
    '''
    def __init__(self):
        self.path = 'D:\Temp\gui'

    def rename(self):
        filelist = os.listdir(self.path)
        total_num = len(filelist)
        print(total_num)
     
        for item in filelist:
            if item.endswith('.png'):
                src = os.path.join(os.path.abspath(self.path), item)
                     
                try:
                    img = cv2.imread(src)
                    cv2.namedWindow("image",0) #创建窗口并显示的是图像类型
                    cv2.imshow("image",img)
                    k = cv2.waitKey(0) # waitkey代表读取键盘的输入,括号里的数字代表等待多长时间,单位ms。 0代表一直等待
                    if k ==27:     # 键盘上Esc键的键值
                        cv2.destroyAllWindows()

                    x=input('please input new name:')
                                       
                    dst = os.path.join(os.path.abspath(self.path), x + '.jpg')
                    os.rename(src, dst)
                    print ("converting %s to %s ..." % (src, dst))
                    
                except:
                    continue
        print ("total %d to rename & converted %d jpgs" % (total_num, i))

if __name__ == '__main__':
    demo = BatchRename()
    demo.rename()

python 重命名图片脚本 打开一张,esc关闭图片,主页面输入页码。自动下一页图片,虽然手动,但是速度还不错的
 楼主| mliang 发表于 2020-2-13 09:22
sdieedu 发表于 2020-2-13 09:05
先不考虑序号问题,先下载下来再说

我昨天页是这样考虑的。不过慢慢翻页,中间不往回翻页的话,最好下载下来的图片应该是按顺序的。我昨天出错了,是因为中间我往上翻页了。
头像被屏蔽
yaojing 发表于 2020-2-12 21:40
ajc2003 发表于 2020-2-12 21:43
支持,谢谢分享
a87399 发表于 2020-2-12 21:45
按照你的描述,
1、可以使用脚步,自动翻页。。。
2、可以使用ocr识别页码,这样就不怕乱序了。。。
ampie2008 发表于 2020-2-12 21:50
QQ截图20200212214628.jpg

怎么回事?今天打不开了??
Culaccino 发表于 2020-2-12 22:27
QQ图片20200212222622.png
request里面可以看到url

然后去对应的response里面找就好了

QQ截图20200212222555.png
csscn 发表于 2020-2-12 22:31
怎么进行读取pdf
xiaomingtt 发表于 2020-2-12 22:51
自动翻页,自动按序号下图。https://www.52pojie.cn/thread-1101157-1-1.html
w12419178256 发表于 2020-2-12 23:14
自动翻页可以用selenium,至于图片的顺序,看下这个吧,希望能帮到你
QQ图片20200212231117.png
sdieedu 发表于 2020-2-13 09:05
先不考虑序号问题,先下载下来再说
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-16 21:52

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表