本帖最后由 fengoto 于 2024-11-15 00:19 编辑
📖 介绍
卡卡字幕助手(VideoCaptioner)是一款功能强大的视频字幕配制软件。操作简单且无需高配置,利用大语言模型进行字幕智能断句、校正、优化、翻译,一键为视频配上效果惊艳的字幕。
-
🎯 可使用强大的语音识别引擎,核显也可以使用,自动生成精准字幕
-
✂️ 基于 LLM 的智能分割与断句,字幕阅读更自然流畅
-
🔄 AI字幕多线程优化调整字幕格式;吴恩达三步反思法翻译,表达更地道专业
-
🎬 支持批量视频字幕合成,提升处理效率
-
📝 直观的字幕编辑查看界面,支持实时预览和快捷编辑
-
🤖 消耗模型 Token 少,且内置基础 LLM 模型,保证开箱即用
📸 界面预览
🚀 快速开始
软件较为轻量,打包大小 50M,已集成所有必要环境,下载后可直接运行。
1. 下载软件
2. 解压后直接运行 VideoCaptioner.exe
3. (可选)相关配置
配置自己的大模型 API 以获得更好的优化和翻译效果 ;选择是否启用字幕优化或者字幕翻译以及翻译的语言。
4. 拖拽视频文件到软件窗口
可全自动处音频识别、字幕生成、字幕优化翻译、视频合成。(提示:每一个步骤均支持单独处理,均支持文件拖拽。)
✨ 主要功能
软件充分利用大语言模型(LLM)在理解上下文方面的优势,对语音识别生成的字幕进一步处理。有效修正错别字、统一专业术语,让字幕内容更加准确连贯,为用户带来出色的观看体验!
1. 多平台视频下载与处理
-
支持国内外主流视频平台(B站、Youtube等)
-
自动提取视频原有字幕处理
2. 专业的语音识别引擎
-
提供多种接口在线识别,效果媲美剪映(免费、高速)
-
支持本地Whisper模型(保护隐私、可离线)
3. 智能字幕优化
-
基于LLM的智能纠错,提升字幕准确度
-
自动优化专业术语、代码片段和数学公式格式
-
上下文进行断句优化,提升阅读体验
4. 高质量字幕翻译
-
结合上下文的智能翻译,确保译文准确自然
-
通过Prompt指导大模型反思翻译,提升翻译质量
-
使用序列模糊匹配算法、保证时间轴完全一致
5. 字幕样式调整
基本配置
1. LLM API 配置说明 (可选)
2. 本地 Whisper 语音识别配置(可选,隐私性强可使用)
-
下载模型:Tiny , Base , Small , Medium , Large-v1 , Large-v2 需软件内下载
-
中文识别推荐使用 Medium 及以上版本,以确保识别质量
3. 字幕样式自定义
开源网址
https://github.com/WEIFENG2333/VideoCaptioner
项目还在不断完善中,如果在使用过程遇到的Bug,欢迎提交 Issue 或者评论区说明。会积极改善的
|