吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1278|回复: 31
上一主题 下一主题
收起左侧

[原创工具] doc/docx/wps 纯文本提取工具

[复制链接]
跳转到指定楼层
楼主
gltianya 发表于 2024-10-12 23:57 回帖奖励
本帖最后由 gltianya 于 2024-10-15 12:37 编辑

doc/docx/wps 纯文本提取工具 , [对于.wps格式,仅使用wps2016/2019生成的文件进行测试]

支持全文及非空首段文本提取.




https://wwst.lanzout.com/iXBF92cetatc
密码:fq17


2024-10-15 新的版本,效率提升约1倍.
16#  https://www.52pojie.cn/forum.php?mod=redirect&goto=findpost&ptid=1971938&pid=51492095

免费评分

参与人数 7吾爱币 +14 热心值 +6 收起 理由
AngIos + 1 厉害了
天地人2019 + 1 + 1 谢谢@Thanks!
schtg + 1 + 1 谢谢@Thanks!
viconly + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
北冥鱼 + 2 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
抱薪风雪雾 + 1 + 1 谢谢@Thanks!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

推荐
 楼主| gltianya 发表于 2024-10-14 23:18 |楼主
本帖最后由 gltianya 于 2024-10-15 15:34 编辑

谢谢各位朋友评分鼓励及回贴!如对您的工作若有帮助,那么,编写这个工具并在此处发布,就变得有意义。统一回复一下:
1. 不需要安装office或wps软件.
2.从文档直接提取纯文本
3.从PDF提取纯文本的功能,目前暂无推进计划.

2024-10-15
今天修改一下核心代码,因为之前是DLL导出函数形式(从正在开发中的另一套系统中

,将docxparser独立出来形成docx2txt),考虑到调用DLL的兼容性,分两次读取文档,效率不高.

既然剥离出来为单EXE文件版,故修改为一次直接读取.

docx2txt-20241015.7z

https://wwst.lanzout.com/izUUs2ckmj2d
密码:8zhy
推荐
lotty18 发表于 2024-10-15 09:16
昨天用工具把一个PDF转成Word,虽然打开是正常的,但是所有文本都被截为一段一段的,修改起来非常麻烦。正好看到这个工具,试试把文字提取出来再修改
沙发
tyy2020 发表于 2024-10-13 23:34
3#
fxd680126 发表于 2024-10-14 06:47
感谢分享!纯支持支持!
4#
znw16899 发表于 2024-10-14 08:28
感谢分享
5#
无敌小儿 发表于 2024-10-14 09:13
可以支持PDF吗,按行读取存储为文本
6#
迪克牛仔很忙 发表于 2024-10-14 09:21
感谢分享
7#
wenxue8612 发表于 2024-10-14 09:32
这个不错,感谢分享
8#
zbking1314 发表于 2024-10-14 09:40
谢谢分享,下载备用
9#
抱薪风雪雾 发表于 2024-10-14 09:48
这是指,不打开文档,提取出文字来吗
10#
Asd123456don 发表于 2024-10-14 09:55
很有用谢谢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-10-21 11:28

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表