本帖最后由 DLWangSan 于 2020-4-25 15:54 编辑
2020 04 25
停止更新
由于有人在高价售卖本软件,我已停止更新。因此网盘加了密码。我从未在任何平台对此软件进行收费。此帖终结
2020-04-09 15:00更新
- 由于我的两百万字符一下子用光,所以部分用户出现了闪退等异常。我就临时删除了资源。现在更新了
- 新增了自定义appid和密钥功能。请大家在百度翻译开放平台申请账号,实名认证即可获取高级版。将高级版appid和密钥填入小工具即可!
- 不输入自己的appid和密钥,可能会出现异常!因为调用我的appid的人太多了!
- 谢谢大家的耐心等待!
更新日志
- 按照论坛规定,已去除邮箱。反馈请在此帖内回复。谢谢管理员提醒。
去重原理
原理很简单:
通过不断地在多种语言之间翻译,最终翻回中文。
由于各国语言习惯不同,最终翻译出来的文字,在进行简单调整之后,就达到去重的效果。
后文有效果对比。
具体地:
去重等级 |
去重原理 |
初级 |
中->英->德->中 |
中级 |
中->英->德->日->葡萄牙->中 |
高级 |
中->英->德->日->葡萄牙->意大利->波兰->保加利亚->爱沙尼亚->中 |
-
本工具完全免费。
-
请勿用于商业用途,转载请注明出处。谢谢!
实现代码
由于代码中包含个人appid(使用的是百度翻译api),不便开源。只将translate()方法实现代码贴出。软件安全无毒,请放心使用。
def translate(words, from_lang, to_lang):
salt = random.randint(32768, 65536)
sign = appid + words + str(salt) + appseceret
sign = hashlib.md5(sign.encode()).hexdigest()
# 这里是为了支持换行
q = {'q': words}
q = urlencode(q)
words = q.split('q=')[1]
myUrl = base_url + '?q=%s&from=%s&to=%s&appid=%s&salt=%s&sign=%s' % \
(words, from_lang, to_lang, appid, salt, sign)
content = parse(myUrl)
return content
去重效果测试
复制某论文中的一段文字:
随着信息技术的普及和推广,计算机网络已经成为生活和工作必不可少的有力工具。对于学校而言,实现办公自动化将大大提高学校管理的工作效率。学生成绩管理系统对于学校实现办公自动化将起到重要作用。本学生成绩管理系统是基于web开发完成的,采用了SSM作为网络编程框架,选择MySQL5.1设计数据库,使用MyEclipse进行开发,能良好的支持数据库应用。本系统主要实现对学生成绩的管理,包括用户管理,学生成绩查询,学生成绩的录入、删除、统计等方面。系统开发主要包括建立和维护后台数据库以及前端应用两个方面。本文主要介绍学生成绩管理系统的可行性分析、需求分析、系统设计和系统实现等。
- 将上述段落存入“版本1.docx”。使用查重工具(论坛中有免费的查重工具,这里用的就是)
可以看到,重复率为100%
- 使用小工具对这段文字进行去重。将智能去重后的文字存入“版本2.docx”。再使用之前的工具,对版本2进行查重。
直接降到了14.34%,而且用的只是“中级去重”!
结论
可以看到,版本2的重复率为14.34%,原来的文字重复率为100%。经过中级去重,重复率整整降低了85.66%!两款工具配合使用,针对重复率高的段落,进行智能去重,丝毫不担心重复率了。
下载地址
屌丝土豪一视同仁通道:https://www.lanzouj.com/ib5pcsb
|