吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2192|回复: 18
收起左侧

[Mac] [Linux|Win32]集成多个 OCR 识别接口 划词版 GoldenDict 3E2B 专业词典管理软件 发布

  [复制链接]
nulptr 发表于 2025-1-22 15:09
本帖最后由 nulptr 于 2025-3-12 08:40 编辑

续接:https://www.52pojie.cn/thread-1999177-1-1.html

2025.3.11 3E2B(v3.2.11):修正双击查询结果导航面板中的当前活动词典时不能滑动到当前文章的问题;修正自动会话启动时出现多个欢迎页面的问题(欢迎页面不参与会话加载);查询时url中的word词组不再使用base64编解码;自动会话功能添加对辞书信息、全文检索和文章内当前词典的上下文支持;优化(拓展)同义词查询以提高查得率;全文FTS服务: 优化索引和查询处理逻辑,支持正在索引的词典的全程提示,切换词典分组时不再停止正在进行的搜索,修正StartDict、GLS格式词典的词头内容不参与索引的问题,修正查询结果的文章顺序与当前群组的辞书顺序不一致的问题;修正文章内的base64编码图片在双击时无响应的问题;修正文章视图内通过右键菜单打开链接时不能跳转到目标词典的问题;支持导出候选词列表;优化辞书信息一览,支持标点链接击打开辞书文件和索引文件夹;在辞书列表和工具栏添加打开索引文件夹功能;苹果OSX格式词典: 对Apple Dictionary类词典添加词条语言和文章语言支持,优化Entry ID映射表以压减词典体积、内存使用和提高查得率;优化全文搜索面板的辞书管理机制;修正32位和64位平台生成的OpenCC词典文件不兼容的问题;当按下Esc按键时Popup窗体的行为与主窗口一致;针对辞书id的内存使用优化;修正当使用查询面板时按住Ctrl或Shift的同时点击候选词不在新建tab页查询的问题;将群组切换时不刷新查询内容功能入口从查询面板移动到搜索菜单;优化候选词查询逻辑当从剪贴板输入或划词时保留输入框内容的完整性...
划词版的绝大多数操作习惯与 源版 GoldenDict 保持一致,划词和额外的发音插件是其区别于源版的最大亮点。
为兼顾精简、稳定性和运行效率,与源版 GoldenDict 一样仍坚持使用 WebKit 作为其内容的渲染核心。

WeChatOcr 对简体中文、繁体中文、日语、英文的支持很好,使用的是本地 OCR 模型,识别速度很快,
如系统已安装微信且日常划词局限于中英日语种,推荐选择 WeChat 划词引擎。
当前已受支持的 OCR 接口有十余种,如需更多的 OCR 识别场景,可以在 首选项 设置中选择其它的划词插件。

Linux 版说明:
开发环境为 Debian 12 x64,使用最古老的 Qt-4.8.7 版本,故在其它 Debian 系的 Linux 中运行应该不是问题。
没有任何安装选项也不会在桌面创建快捷方式,解压后运行其中的 goldendict.sh 即可。
如系统已经安装了 WeChat 4.0,则可以删除解压目录中的 WeChatOcr 文件夹。
完整的演示视频:【Linux 系统 WeChat 4.0 (微信4) GoldenDict 专业版 划词识别】
https://www.bilibili.com/video/BV1eFcheMEiR/?share_source=copy_web&vd_source=1f8bb4f075a48414a935e9435e7a5b1a

macOS 版说明:
开发环境为 macOS 13 最新版本,使用 Qt-5.15.16 稳定版 - 其中的 WebKit 核心较 Qt4 版本的要先进一些。
划词前需要在系统设置中使能 GoldenDict APP 的截图权限。
在未安装 微信4.0 的环境中没有成功启动 WeChatOcr 插件(macOS 微信带有额外的安全校验,具体待深究)。
高版本 macOS 可以使用 Apple Vision 或其它 OCR 划词插件,低版本的可以使用 tesseract 或其它 OCR 插件。
完整的演示视频:【「推荐」超好用!免费!离线!实现本地OCR功能的词典】
https://www.bilibili.com/video/BV1e341197CN/?share_source=copy_web&vd_source=1f8bb4f075a48414a935e9435e7a5b1a

Windows 版说明:
使用 mingw 或 msvc2019 编译,发布有 32位 和 64位 版本,压缩包,解压点击 GoldenDict.exe 运行。
完整的演示视频:【GoldenDict++合合/讯飞/有道/腾讯/百度 OCR 划词演示】 https://www.bilibili.com/video/BV1ZzSbYkEj3/?share_source=copy_web&vd_source=1f8bb4f075a48414a935e9435e7a5b1a

下载地址
Linux:   https://github.com/nonwill/GoldenDict-OCR/releases/download/v3.2.11/GoldenDict++OCR-3E2B-20250311-Debian12_Qt-4.8.7-p5-x64.tar.gz
macOS:https://github.com/nonwill/GoldenDict-OCR/releases/download/v3.2.11/GoldenDict++OCR-3E2B-20250311-macOS-10.10-15.2_Qt-5.15.16-universal.dmg
Win32:    https://github.com/nonwill/GoldenDict-OCR/releases/tag/v3.2.11
2025-01-22_140748.png
2025-01-22_140509.png

免费评分

参与人数 6吾爱币 +6 热心值 +6 收起 理由
popo9699 + 1 + 1 谢谢@Thanks!
banzhiyi + 1 + 1 我很赞同!
nobody2023 + 1 + 1 我很赞同!
darklure + 1 + 1 热心回复!
tx444219233 + 1 + 1 热心回复!
XH2020D11 + 1 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| nulptr 发表于 2025-3-9 09:22
WhyNotCallMeSky 发表于 2025-3-8 22:51
windows有调用umi-OCR接口的方案吗?申请接口api有点麻烦

我没有用过 umi-OCR,仅是查看了其使用或说明文档,理解如下:
1. 支持离线 PaddleOCR:GoldenDict++同样支持,通过对 PaddleOCR.api 文件的修改,用户可以自己扩展 OCR 模型 或 自定义 Paddle 运行时参数。另外 GoldenDict++ 还支持多个高质量或流行的离线 OCR 引擎,同样支持对这些引擎的扩展。
2. 在线 OCR:需要 api 接口参数,而且大部分接口在试用后需要付费,区别可能在于是否默认内置 API 接口参数或是否可在线更新 API 参数。GoldenDict++ 默认不内置接口参数更不会联网更新接口参数,接口参数和识别方法均存储在 OCR.api 文件中,这个需要用户自己添加和维护。

在 GoldenDict++ 中,OCR 功能是作为小片段文字(非文档或大批量文字识别)场合使用的,是词典功能的辅助,其自带的离线 OCR 功能应该足以满足这一特定需求。如果需要接入用户自定义的 OCR 引擎,可以参照演示:
【GoldenDict 对剪贴板划词 (OCR剪贴板中的图像数据 或 从剪贴板取词)】https://www.bilibili.com/video/BV1f1HveyECp/?share_source=copy_web&vd_source=1f8bb4f075a48414a935e9435e7a5b1a
在 GoldenDict++ 中设置外部划屏命令,在命令中调用 第三方 OCR 软件 功能,第三方 OCR 软件进行划屏并将 OCR 结果写入到 剪切板中,最后命令返回 0 值即可成功将结果传递到 GoldenDict++ 中进行查词。
vincida 发表于 2025-1-24 10:56
谢谢,试了arm版的,不用rosetta也打不开
Translated Report (Full Report Below)
-------------------------------------

Incident Identifier: 8EB7793E-FBD8-4046-A9D4-7C7734F0A779
CrashReporter Key:   C29E439F-E49F-9B6A-FD9B-C406AB9580C2
Hardware Model:      MacBookPro17,1
Process:             GoldenDict [51108]
Path:                /Users/USER/Downloads/GoldenDict.app/Contents/MacOS/GoldenDict
Identifier:          org.goldendict.pro
Version:             3.2 (3.2.8)
Code Type:           ARM-64 (Native)
Role:                Default
Parent Process:      launchd [1]
Coalition:           org.goldendict.pro [75983]

Date/Time:           2025-01-24 10:56:11.8382 +0800
Launch Time:         2025-01-24 10:56:11.8200 +0800
OS Version:          macOS 14.5 (23F79)
Release Type:        User
Report Version:      104

Exception Type:  EXC_BAD_ACCESS (SIGKILL (Code Signature Invalid))
Exception Subtype: UNKNOWN_0x32 at 0x0000000102278000
Exception Codes: 0x0000000000000032, 0x0000000102278000
VM Region Info: 0x102278000 is in 0x102278000-0x102610000;  bytes after start: 0  bytes before end: 3768319
      REGION TYPE                    START - END         [ VSIZE] PRT/MAX SHRMOD  REGION DETAIL
      UNUSED SPACE AT START
--->  __TEXT                      102278000-102610000    [ 3680K] r-x/r-x SM=COW  
      __DATA_CONST                102610000-102628000    [   96K] rw-/rw- SM=COW  
Termination Reason: CODESIGNING 2 Invalid Page

但是用rosetta到是没有用着用着关闭,只是手动关闭时还是报错
vincida 发表于 2025-1-23 16:41
我的在mac下打不开呀 OS 14.5 (23F79)

ranslated Report (Full Report Below)
-------------------------------------

Process:               GoldenDict [41342]
Path:                  /Volumes/*/GoldenDict.app/Contents/MacOS/GoldenDict
Identifier:            org.goldendict.pro
Version:               3.2 (3.2.10)
Code Type:             X86-64 (Translated)
Parent Process:        launchd [1]
User ID:               501

Date/Time:             2025-01-23 16:40:15.3982 +0800
OS Version:            macOS 14.5 (23F79)
Report Version:        12
Anonymous UUID:        C29E439F-E49F-9B6A-FD9B-C406AB9580C2

Sleep/Wake UUID:       BE06D95B-BCD3-4181-88CA-668E917532FF

Time Awake Since Boot: 480000 seconds
Time Since Wake:       27188 seconds

System Integrity Protection: enabled

Notes:
PC register does not match crashing frame (0x0 vs 0x104B2D8A8)

Crashed Thread:        0  Dispatch queue: com.apple.main-thread

Exception Type:        EXC_BAD_ACCESS (SIGSEGV)
Exception Codes:       KERN_INVALID_ADDRESS at 0x0000af6194c194f8 -> 0x00002f6194c194f8 (possible pointer authentication failure)
Exception Codes:       0x0000000000000001, 0x0000af6194c194f8
wendao_lx 发表于 2025-1-23 09:39
这个有点厉害呢,下载收藏了先
tianwenmingce 发表于 2025-1-23 10:09
现在OCR软件确实越来越多了
vincida 发表于 2025-1-23 12:03
这个真的太需要了,mac版下下了好几个了,对比一下
darklure 发表于 2025-1-23 14:20
收藏收藏,感谢分享
vincida 发表于 2025-1-23 16:48
用Rosetta模式能打开,但是也加载不了词典,然后用一下也就自动关闭了
 楼主| nulptr 发表于 2025-1-23 17:34
vincida 发表于 2025-1-23 16:48
用Rosetta模式能打开,但是也加载不了词典,然后用一下也就自动关闭了

[Asm] 纯文本查看 复制代码
1
Code Type:             X86-64 (Translated)


怎么不是 Native 方式运行?
 楼主| nulptr 发表于 2025-1-23 17:43
本帖最后由 nulptr 于 2025-1-23 17:45 编辑
vincida 发表于 2025-1-23 16:48
用Rosetta模式能打开,但是也加载不了词典,然后用一下也就自动关闭了

等清理下开发环境再更新一次 macos 3E2A。临时可下载 3E28 版本,3E29 版本也可以,这两个版本在 Arm64 Native 下运行没发现问题:
https://github.com/nonwill/GoldenDict-OCR/releases/download/v3.2.8/GoldenDict++OCR-3E28-20241127_macOS-10.10-15.1_Qt-5.15.16-universal.dmg
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-4-17 10:56

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表