吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 4238|回复: 38
收起左侧

[原创工具] 从 word 即扩展名为 DOC/DOCX文件中提取表格数据的小工具

[复制链接]
gltianya 发表于 2023-5-8 22:04
本帖最后由 gltianya 于 2023-6-12 16:34 编辑

最近因工作需要,制作了一个从DOC/DOCX文件中提取表格数据的小工具,因为水平有限,没有直接保存文件的功能. 只能使用  >> 重定向 保存新文件.

注意: 使用 "|"分割,不是通常使用的逗号","

不懂搞GUI界面, 命令提示符下运行.(其实,我更想它能体积小巧,又方便批量处理文件)
doc2csv.jpg
下载地址: doc2csv-pub.rar (1.04 MB, 下载次数: 95)

2023-06-12 之前的那个版本使用重定向生成的文本是ANSI的编码格式的.
今天上传一个直接生成UTF8编码格式的版本
用法 CMD>doc2csv 文件名.doc(x) 回车, 即可在源文件路径中生成同名的文件.csv
doc2csv-v0.5-pub.rar (1.05 MB, 下载次数: 39)

免费评分

参与人数 3吾爱币 +9 热心值 +3 收起 理由
hanfong1223 + 1 + 1 谢谢@Thanks!
eer123 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
Hmily + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| gltianya 发表于 2023-5-9 12:44
忘记提醒一下了,需要 .Net Framework2.0以上支持. 我的开发环境是WIN8.1,VS2019

为避免同一贴子 管理员/版主 要再次审核, 故没有在一楼修改原贴,还请见谅!
 楼主| gltianya 发表于 2023-5-10 10:18
本帖最后由 gltianya 于 2023-5-10 11:22 编辑
lizhipei78 发表于 2023-5-10 09:33
对不懂得代码的人很实用,这个结果要输出到哪里的?
我还是喜欢使用VBA来提取word文档的数据,导出到Excel ...

感谢你衷肯的回复, 结果,可使用重定向生成普通文本文件 doc2csv XX.DOCX >> xx.csv , xx.csv就是结果文件. 我具体工作中是将结果再接导入 诸如 DB Browser for SQLite 之类的数据库管理工具, 再进行加工.

我制作这个小工具的工作背景: 几十个DOC/DOCX文件中(记录(行)约20万条),都需要把表格数据提取出来,然后将数据清理(删除重复,并按特定的规则排序),最后再生成XLSX文件.

CMD 批处理 ,将全部数据提取出来,然后导入数据库,清理,导出,再生成新文件.[目前,我没有找到可以直接导入DOC/docx文档中表格的数据库管理软件,而可以直接导入纯文本格式的,如: .csv 数据库管理软件,免费都很容易找到]

当然了,能用VBA解决肯定也很方便 ,可惜我不懂VBA :( ,期待你分享VBA提取数据的操作办法或程序/软件 .  [人人为我,我为人人,曾经的WZ论坛的这个宗旨对我这样的一个老菜鸟影响不小 :) ]
coverme 发表于 2023-5-9 15:43
halou 发表于 2023-5-9 16:56
感谢楼主无私分享!
pb297110281 发表于 2023-5-9 18:05
感谢分享!!!!!!!!!!!!
只看楼主 发表于 2023-5-9 19:22
谢谢楼主
dora25 发表于 2023-5-9 21:13
感谢分享
头像被屏蔽
hwxq43 发表于 2023-5-10 04:39
提示: 作者被禁止或删除 内容自动屏蔽
fxd680126 发表于 2023-5-10 08:03
对我的工作有帮助。感谢分享!
头像被屏蔽
marvelci 发表于 2023-5-10 08:20
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 07:15

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表