【卡卡字幕助手】LLM 智能视频字幕助手，支持生成、断句、优化、翻译、视频合成全流程

fengoto · 发表于 2024-11-13 22:44

本帖最后由 fengoto 于 2024-11-15 00:19 编辑

📖 介绍

卡卡字幕助手（VideoCaptioner）是一款功能强大的视频字幕配制软件。操作简单且无需高配置，利用大语言模型进行字幕智能断句、校正、优化、翻译，一键为视频配上效果惊艳的字幕。

🎯 可使用强大的语音识别引擎，核显也可以使用，自动生成精准字幕
✂️ 基于 LLM 的智能分割与断句，字幕阅读更自然流畅
🔄 AI字幕多线程优化调整字幕格式；吴恩达三步反思法翻译，表达更地道专业
🎬 支持批量视频字幕合成，提升处理效率
📝 直观的字幕编辑查看界面，支持实时预览和快捷编辑
🤖 消耗模型 Token 少，且内置基础 LLM 模型，保证开箱即用

📸 界面预览

软件界面预览

页面预览1

页面预览2

🚀 快速开始

软件较为轻量，打包大小 50M,已集成所有必要环境，下载后可直接运行。

1. 下载软件

从 Release 页面下载最新版本
蓝奏盘下载

2. 解压后直接运行 `VideoCaptioner.exe`

3. （可选）相关配置

配置自己的大模型 API 以获得更好的优化和翻译效果；选择是否启用字幕优化或者字幕翻译以及翻译的语言。

4. 拖拽视频文件到软件窗口

可全自动处音频识别、字幕生成、字幕优化翻译、视频合成。（提示：每一个步骤均支持单独处理，均支持文件拖拽。）

✨ 主要功能

软件充分利用大语言模型(LLM)在理解上下文方面的优势，对语音识别生成的字幕进一步处理。有效修正错别字、统一专业术语，让字幕内容更加准确连贯，为用户带来出色的观看体验！

1. 多平台视频下载与处理

支持国内外主流视频平台（B站、Youtube等）
自动提取视频原有字幕处理

2. 专业的语音识别引擎

提供多种接口在线识别，效果媲美剪映（免费、高速）
支持本地Whisper模型（保护隐私、可离线）

3. 智能字幕优化

基于LLM的智能纠错，提升字幕准确度
自动优化专业术语、代码片段和数学公式格式
上下文进行断句优化，提升阅读体验

4. 高质量字幕翻译

结合上下文的智能翻译，确保译文准确自然
通过Prompt指导大模型反思翻译，提升翻译质量
使用序列模糊匹配算法、保证时间轴完全一致

5. 字幕样式调整

丰富的字幕样式模板（科普风、新闻风、番剧风等等）
支持导出多种格式字幕视频（SRT、ASS、VTT、TXT）

基本配置

1. LLM API 配置说明（可选）

软件内置基础大语言模型（gpt-4o-mini），无需配置即可使用。但为获得更好的效果，建议在设置中配置个人 API。支持国内Deepseek、阿里通义、智普GLM等厂商。
追求高质量可选用 Claude-3.5-sonnet 或 gpt-4o

2. 本地 Whisper 语音识别配置（可选，隐私性强可使用）

下载模型：Tiny, Base, Small, Medium, Large-v1, Large-v2 需软件内下载
中文识别推荐使用 Medium 及以上版本，以确保识别质量

3. 字幕样式自定义

主副字幕设置：字体、大小、颜色、边框样式、行距、位置等
排版方式：原文在上、译文在上、仅原文、仅译文

开源网址

https://github.com/WEIFENG2333/VideoCaptioner

项目还在不断完善中，如果在使用过程遇到的Bug，欢迎提交 Issue 或者评论区说明。会积极改善的

fengoto · 发表于 2024-11-17 00:21

已经实现优化翻译的提示，通过提供正确的文稿或者部分的参考内容，翻译或者优化质量都能进一步有所改善。

下个版本推送将更新。

pigone · 发表于 2024-12-2 00:47

下载b站的视频下不来，看日志的意思是ytp-DL的问题
  File "C:\Program Files\VideoCaptioner\runtime\Lib\site-packages\yt_dlp\YoutubeDL.py", line 1643, in wrapper
self.report_error(str(e), e.format_traceback())
  File "C:\Program Files\VideoCaptioner\runtime\Lib\site-packages\yt_dlp\YoutubeDL.py", line 1091, in report_error
self.trouble(f'{self._format_err("ERROR:", self.Styles.ERROR)} {message}', *args, **kwargs)
  File "C:\Program Files\VideoCaptioner\runtime\Lib\site-packages\yt_dlp\YoutubeDL.py", line 1030, in trouble
raise DownloadError(message, exc_info)
yt_dlp.utils.DownloadError: ERROR: [BiliBili] 1kx4y177fj: Failed to extract play info; please report this issue on  https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using  yt-dlp -U

Jhin · 发表于 2024-11-15 17:25

牛哇大哥谢谢分享

LGP2 · 发表于 2024-11-15 17:33

喜欢，真是好软件下载试一试

10830 · 发表于 2024-11-15 17:45

哇哇哇！大神可以啊

天天上天庭 · 发表于 2024-11-15 17:53

比较感兴趣，谢谢分享

zpwz · 发表于 2024-11-15 18:30

感谢分享，试试效果看

zpwz · 发表于 2024-11-15 18:50

找到翻译的了模块了

muzixin520 · 发表于 2024-11-15 18:59

真是自媒体的好东西

fsaac · 发表于 2024-11-15 19:26

感谢原创分享，这是好工具！

curtainTang · 发表于 2024-11-15 19:44

感谢大佬分享原创

帐号		自动登录	找回密码
密码			注册[Register]

[原创工具] 【卡卡字幕助手】LLM 智能视频字幕助手，支持生成、断句、优化、翻译、视频合成全流程

📖 介绍

📸 界面预览

🚀 快速开始

1. 下载软件

2. 解压后直接运行 `VideoCaptioner.exe`

3. （可选）相关配置

4. 拖拽视频文件到软件窗口

✨ 主要功能

1. 多平台视频下载与处理

2. 专业的语音识别引擎

3. 智能字幕优化

4. 高质量字幕翻译

5. 字幕样式调整

基本配置

1. LLM API 配置说明（可选）

2. 本地 Whisper 语音识别配置（可选，隐私性强可使用）

3. 字幕样式自定义

开源网址

免费评分

本帖被以下淘专辑推荐:

[原创工具] 【卡卡字幕助手】LLM 智能视频字幕助手，支持生成、断句、优化、翻译、视频合成全流程

📖 介绍

📸 界面预览

🚀 快速开始

1. 下载软件

2. 解压后直接运行 VideoCaptioner.exe

3. （可选）相关配置

4. 拖拽视频文件到软件窗口

✨ 主要功能

1. 多平台视频下载与处理

2. 专业的语音识别引擎

3. 智能字幕优化

4. 高质量字幕翻译

5. 字幕样式调整

基本配置

1. LLM API 配置说明 （可选）

2. 本地 Whisper 语音识别配置（可选，隐私性强可使用）

3. 字幕样式自定义

开源网址

免费评分

本帖被以下淘专辑推荐:

2. 解压后直接运行 `VideoCaptioner.exe`

1. LLM API 配置说明（可选）