吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 12701|回复: 151
收起左侧

[Windows] 批处理_PDF转图片,提取PDF的图片和文本(基于Xpdf4.04)230509

    [复制链接]
nide312 发表于 2023-4-3 21:28
本帖最后由 nide312 于 2023-5-9 14:11 编辑

提醒一下:此批处理命令程序没有ocr文字识别功能。

也可以使用 Adobe Acrobat Pro DC 实现这些功能。

拖拽一个文件前需注意:文件名和文件路径最好都不能含有“^”、“&”、“=”、“;”、“,”符号,不然可能会导致处理失败或一闪而过。


推荐使用最新版本!(“230413晚上再更新”之后的版本处理简体中文PDF不会乱码了。)

不必在意批处理界面中出现的“Config Error”、“Syntax Warning”提示。


首先、双击“!先运行我(只需运行1次).bat”批处理。

一、PDF转图片:把一个pdf文件或一个文件夹拖拽到“拖拽一个PDF文件[PDF目录]于此(PDF转图片).bat”批处理上,输入PDF密码(没有密码直接按回车键)。

二、提取PDF的图片和文本:把一个pdf文件或一个文件夹拖拽到“拖拽一个PDF文件[PDF目录]于此(提取图片和文本).bat”批处理上,输入PDF密码(没有密码直接按回车键)。
(其中文本保存为UTF-8编码)
生成的文件都保存在pdf文件夹下,依次为:A提取的文本、B提取的图片、C转换后的图片。

20230509 0先运行的.png

20230509 a1.png

20230509 a2.png

20230509 b.png



网盘下载:

https://pan.baidu.com/s/1HlgmOEunzwxsVrGPAvQoxg?pwd=s8qr
提取码:s8qr

https://down666.lanzoul.com/b01knsxef
密码:46rl

免费评分

参与人数 29吾爱币 +26 热心值 +26 收起 理由
sailboat + 1 + 1 谢谢@Thanks!
情非爱 + 1 + 1 我很赞同!
jasonwilliams + 1 + 1 鼓励转贴优秀软件安全工具和文档!
小皮新手学习 + 1 + 1 谢谢@Thanks!
ifish99 + 1 谢谢@Thanks!
苍白之白 + 1 + 1 谢谢@Thanks!
geyong319 + 1 + 1 谢谢分享,给你加分
DD_chang + 1 加油
七子是皇帝 + 1 我很赞同!
zhengss + 1 + 1 谢谢@Thanks!
吴鑫啥的 + 1 + 1 谢谢@Thanks!
zpzwz + 1 + 1 谢谢@Thanks!
经典柚子 + 1 + 1 我很赞同!
鑫星星 + 1 + 1 我很赞同!
46490050 + 1 用心讨论,共获提升!
抱薪风雪雾 + 1 + 1 谢谢@Thanks!
yanglinman + 1 谢谢@Thanks!
shenguoping + 1 + 1 热心回复!
luozi1653 + 1 + 1 热心回复!
xukj1981 + 1 + 1 谢谢@Thanks!
grrr_zhao + 1 + 1 谢谢@Thanks!
wwmusic + 2 + 1 我很赞同!
qfhyq + 1 + 1 不错不错
gaoming513 + 1 + 1 谢谢@Thanks!
lgh978 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
blindcat + 1 + 1 谢谢@Thanks!
dogox + 1 + 1 我很赞同!
我无聊路过1989 + 1 我很赞同!
wubaochong + 1 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

cnshy 发表于 2023-4-3 21:42
本帖最后由 cnshy 于 2023-4-13 12:07 编辑

感谢大神分享,辛苦了
不过提取图片成文本,文本里面好像是乱码
 楼主| nide312 发表于 2023-4-22 20:05
圣师 发表于 2023-4-22 18:05
体验下新版,觉得有个结果处理好像更麻烦了。
转图片后生成的一级文件夹是原文件名字,二级文件夹名字是 ...

嗯,重新弄了下,都保存在一个文件夹下。

230422更新
依次为:A提取的文本、B提取的图片、C转换后的图片。

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
圣师 + 1 + 1 谢谢@Thanks!

查看全部评分

 楼主| nide312 发表于 2023-4-3 21:51
本帖最后由 nide312 于 2023-4-13 17:36 编辑

cnshy 发表于 2023-4-3 21:42
感谢大神分享,辛苦了
不过提取图片成文本,文本里面好像是乱码
[贴图错误,请阅读“贴图帮助” ...


230413更新:
现在简体中文PDF的文本提取不乱码了。

另外,Adobe Acrobat Pro DC也不会乱码。

lee_qian 发表于 2023-4-3 21:33
这个有用,可以提取文本。谢谢!!
inthepeace 发表于 2023-4-3 21:47
厉害了,下载来看看。
huobingqilin 发表于 2023-4-3 21:48
感谢分享,这个有用,谢谢
lcg888 发表于 2023-4-3 21:51
cnshy 发表于 2023-4-3 21:42
感谢大神分享,辛苦了
不过提取图片成文本,文本里面好像是乱码
[贴图错误,请阅读“贴图帮助” ...

我去 你这图是贴了个寂寞
奠爱 发表于 2023-4-3 21:54

感谢分享,这个有用,谢谢
ok667 发表于 2023-4-3 21:54
这个有用,可以提取文本。谢谢!!
cnshy 发表于 2023-4-3 21:55
nide312 发表于 2023-4-3 21:51
我自己试的几个PDF没有出现乱码的情况

嗯嗯,可能是我PDF的问题,辛苦了~
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-28 02:19

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表