吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 27142|回复: 283
收起左侧

[原创工具] 简单重复文件处理工具

    [复制链接]
hope910 发表于 2020-3-21 14:41
自己本子上一T的硬盘快满了,加盘也不好加,因为储存的大多数是一些产品的图片和视频之类的文件,很多文件之前都被复制重复使用了,占了很大的空间。所以便做了这个工具,给硬盘瘦了下身。
开始写得很粗造,就几段代码,几个循环。后面想想,应该其他人也用得着,所以便整理了一下,发了出来。

为了提高效率,对于大文件的指纹获取方式,采用的截取部份数据识别的方式,这样的好处是可以加快软件的执行效率,
缺点是可能会有少量相似度很高的文件无法被别,所以删除10M以上的文件的时候,请手动辨别之后再进行批量删除。切记!切记!

去重原理采用的是最原始的暴力对比方法,所有软件的整体执行效率不高,如果文件太多的话,你点开始之后,把软件最少化,让它自己在那里慢慢跑就可以了。
如果用得着的人多的话,后期再优化一下算法。

易语言写的,UPX的简单外壳,杀软报毒很正常,怕毒的慎用,我人格担保,自己不会放毒在上面。

1.jpg
2.jpg
3.jpg
简单重复文件处理工具.rar (767.14 KB, 下载次数: 3148)

免费评分

参与人数 52吾爱币 +50 热心值 +47 收起 理由
semeen + 1 + 1 谢谢@Thanks!
祁之衍呐 + 1 谢谢@Thanks!
jnzj4811 + 1 + 1 谢谢@Thanks!
tu2630 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
rover2005 + 1 谢谢@Thanks!
shi丶 + 1 谢谢@Thanks!
tgdq5 + 1 + 1 谢谢@Thanks!
死月 + 1 + 1 热心回复!
mayuyu_yuriki + 1 + 1 非常需要这种软件,希望能用在我4T的硬盘上
没想好叫啥 + 1 + 1 我很赞同!
888668 + 1 + 1 谢谢@Thanks!
mikecai + 1 + 1 谢谢@Thanks!
yc32323 + 1 + 1 我很赞同!
amyrectab + 1 + 1 这个太需要了!拯救反复备份手机照片占用多余空间的神器
ful366 + 1 + 1 热心回复!
mdjyueqiang + 1 我很赞同!
也蛮先生 + 1 + 1 谢谢@Thanks!
netgiant + 1 + 1 谢谢@Thanks!
lyqjqly + 1 + 1 热心回复!
夜依神 + 1 + 1 我很赞同!
dongxichen + 1 谢谢@Thanks!
wo累了 + 1 谢谢@Thanks!
jigegejiji + 1 我很赞同!
樂青影 + 1 谢谢@Thanks!
520_snow + 1 鼓励转贴优秀软件安全工具和文档!
北海岁月 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
鸭店总裁 + 1 + 1 非常好用,很多用哈希识别不出来的这个可以
afdurhza + 1 希望可以直接批量校验md5
asdwer440453 + 1 谢谢@Thanks!
qdxxglb3 + 1 + 1 我很赞同!
bamboo35 + 1 + 1 牛逼,分给你
Cin_Ata + 1 + 1 热心回复!
吾爱破天 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
tense + 1 + 1 我很赞同!
lengyan668 + 1 + 1 建议直接MD5对比,应该会提高效率
hhp3175358 + 1 热心回复!
qq3245598 + 1 + 1 热心回复!
ɑ_淘_氣_゛ + 1 + 1 我很赞同!
十三月的风 + 3 + 1 谢谢@Thanks!
大道若水 + 1 非常需要这种软件,希望能用在我4T的硬盘上
jingmiku + 1 + 1 我很赞同!
ArcTime + 1 + 1 用心讨论,共获提升!
魅夜 + 1 + 1 用心讨论,共获提升!
SSMNXXX + 1 + 1 我很赞同!
香山红叶mm + 1 + 1 热心回复!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
zhu086 + 1 + 1 我很赞同!
zzs33 + 1 + 1 谢谢@Thanks!
20082010 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
lzf001 + 1 我很赞同!
xiaomin86 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
zzs_70 + 1 + 1 支持原创

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| hope910 发表于 2020-3-21 22:10
20082010 发表于 2020-3-21 16:12
这个思路挺棒的,是不是可以考虑所有文件都用固定长度的随机取样来判定重复性呢?一方面可能还能提升效率, ...

其实我还有一个思路,就是第一次处理完成之后,再对已经找出来的可能会误杀的大文件再进行一次完整的对比,这样效率和误杀都解决了。因为毕竟可能会误判的文件不会太多,第一次过滤之后剩下的也就没有那么多了,整体执行一次,应该也用不了多长时间。只是我个人觉得这个工具可能要很久才用得上一次,所以就没有做那么详细了,先看下,用得着的朋友多的话,再更新上去就好了。
看,六眼飞鱼 发表于 2020-3-21 14:50
有啥好担保的,我们吾爱论坛上怎么会有不开眼的放毒呢,分分钟揪出来吊打。
谢谢楼主的劳动成果
20082010 发表于 2020-3-21 16:12
这个思路挺棒的,是不是可以考虑所有文件都用固定长度的随机取样来判定重复性呢?一方面可能还能提升效率,大文件小文件一视同仁。不过还不完美,无法做到只是几个字节上的变动。

有没有可能,一般文件是头部或尾部变动,这两个部分截取,中间随机再找几个截取。

现在能想到的只是类似,同一个文件,保存了jpg,png的格式,这样就无法识别了。。
miqi1314 发表于 2020-3-21 14:42
试一试,挺需要
头像被屏蔽
袁煜914 发表于 2020-3-21 14:51
提示: 作者被禁止或删除 内容自动屏蔽
chong 发表于 2020-3-21 14:52
下载试试 本来就想上论坛找 一上来就看到你发了
Crazy开发仔 发表于 2020-3-21 14:58
编程思路可以,不过指纹的获取容易出现误差,比如说两个应用程序,只是有部分的字节集内容不同,但这两个程序是不同的,就会被误杀。
不过依旧支持楼主。
zzs_70 发表于 2020-3-21 14:59
不错,支持一下原创
1wang 发表于 2020-3-21 15:34
试试給硬盘瘦瘦身
Z温柔夏天 发表于 2020-3-21 15:47
谢谢楼主的劳动成果
美想成真 发表于 2020-3-21 16:01
下载试一试。。。。。。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 02:04

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表