whisper-实现自动生成字幕

5698741236ls · 发表于 2023-10-19 14:39

本帖最后由 5698741236ls 于 2023-10-19 15:13 编辑

作用：为没有字幕的视频生成字幕，无需联网，本地运行

基本步骤：

安装python

安装最新版就好
安装ffmepg

下载自己系统对应的版本，windows是win64那个,将下载的压缩包解压后得到的ffmpeg.exe ffplay.exe ffprobe.exe放到一个你想放的目录，然后将这个目录的路径加入环境变量的Path里，不知道添加就百度一下
安装cuda

安装最新的就好；在下载页面选自己的对应配置就可以下载了
安装PyTouch

安装最新的就好; 在下载页面选最新的cuda版本，然后会有一个Run this Command，在cmd运行即可安装；例如:pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
安装whisper (附：whisper源页面)

打开cmd，运行 pip install git+https://github.com/openai/whisper.git就可以安装好了

使用方法：打开cmd -> 输入 whisper 视频路径 --output_format=srt --model=模型名称 就可以开始运行了

视频路径直接把视频拖进来就可以

模型根据自己的配置选，模型越大，显存要求越高，越精确，速度越慢

模型名称	模型大小	English-only model	Multilingual model	显存需求	速度
tiny	39 M	`tiny.en`	`tiny`	~1 GB	~32x
base	74 M	`base.en`	`base`	~1 GB	~16x
small	244 M	`small.en`	`small`	~2 GB	~6x
medium	769 M	`medium.en`	`medium`	~5 GB	~2x
large	1550 M	N/A	`large`	~10 GB	1x

为了不用每次都输入命令行，所以我写了个py程序，按照上面的步骤安装好后，每次就只要运行这个py程序，拖入视频然后选模型就可以了

import os

videoName = input("请拖入视频：")
model = input("请选择模型(1:tiny 2:base 3:small 4:medium 5:large):")
if(model == "1"):
    model = "tiny"
elif(model == "2"):
    model = "base"
elif(model == "3"):
    model = "small"
elif(model == "4"):
    model = "medium"
elif(model == "5"):
    model = "large"
else:
    model = "small"

print(f"模型：{model}\t转换视频：{videoName}\n现在开始转换...")
cmd = f"whisper {videoName} --output_format=srt --model={model}"

try:
    os.system(cmd)
    input("转换完成！")
except Exception as e:
    print(f"发生错误：{e}")
    input("转换失败！")

效果图：
效果图.png

另外，因为不能生成中文字幕，默认是英文，所以一般是配合potplayer的实时字幕翻译使用。

5698741236ls · 发表于 2023-10-23 11:52

补充一下，这个步骤只支持N卡用户，如果是A卡那只能用CPU跑，步骤会略有不同，需要自己去摸索一下

powerwht · 发表于 2023-10-20 11:03

能适用于日本的动作片吗

fengmodel · 发表于 2023-11-7 08:28

可以去github上看看两个CPU、GPU模式的傻瓜式软件，buzz、whisperdestop，windows版本的。我是A卡笔记本，只能用CPU模式的buzz

52菜鸟 · 发表于 2023-10-19 16:56

win7能运行么？

ysjd22 · 发表于 2023-10-19 17:01

这个看起来很厉害啊

TiCo · 发表于 2023-10-19 17:18

GitHub上有关于faster-whisper的项目，这个项目试了一下，相比原版快了不少。你可以试试用它优化一下。

tintin981 · 发表于 2023-10-20 09:33

前期工作看着可不简单呢，试试。

wohushan · 发表于 2023-10-20 09:38

感谢楼主提供

li1love09 · 发表于 2023-10-20 12:23

5个步骤的安装看起来好复杂个人猜想生成字母和potplay翻译能看明白2个人的动作电影

bianquenet · 发表于 2023-10-20 16:11

用过几次，可以用。

QaQ355 · 发表于 2023-10-22 21:49

感谢楼主，帮朋友大忙了

帐号		自动登录	找回密码
密码			注册[Register]

[Windows] whisper-实现自动生成字幕

作用：为没有字幕的视频生成字幕，无需联网，本地运行

免费评分

本帖被以下淘专辑推荐: