williamipod 发表于 2024-1-22 19:39

筛选文章中重复段落的内容

需要把你自己的内容把代码替换掉、请确保你的Python环境中已经安装了scikit-learn库、datasketch库、jieba 库。

图片上传不了,代码放在文档里了,有需要可以自己下载





xkh5823 发表于 2024-1-22 22:13

williamipod 发表于 2024-1-26 21:51

weilai8023 发表于 2024-1-23 09:42
如果能封装成成品使用,就完美了

可以做成EXE的,PyInstaller Documentation,用这个就可以弄成
安装PyInstaller:
在命令行中运行以下命令来安装PyInstaller:
pip install pyinstaller
转换Python脚本:
在命令行中,使用以下命令将Python脚本转换成EXE文件:
pyinstaller 1.py
默认情况下,PyInstaller会在当前目录下创建一个名为“dist”的文件夹,并在其中生成EXE文件。
可选参数:

如果你想要EXE文件在运行时不显示命令行窗口,可以添加--noconsole参数:
pyinstaller --noconsole 1.py

sai609 发表于 2024-1-22 23:39

复制粘贴到Excel,把重复项ko掉,在合并

390660860 发表于 2024-1-23 06:56

收藏研究一下,

dell2000 发表于 2024-1-23 07:29

要成品啊!预先谢过!

weilai8023 发表于 2024-1-23 09:42

如果能封装成成品使用,就完美了

d199212 发表于 2024-1-23 10:19

正好有一个需求是做对比分析两份文档不重复的地方,学习了!

bdcpc 发表于 2024-1-23 10:26

成品exe会更好一点

dell2000 发表于 2024-1-24 10:38

还在等待成品中

JokerDa 发表于 2024-1-25 16:59

坐等大佬完成成品!!!
页: [1] 2
查看完整版本: 筛选文章中重复段落的内容