吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5593|回复: 21
收起左侧

[Windows] whisper-实现自动生成字幕

  [复制链接]
5698741236ls 发表于 2023-10-19 14:39
本帖最后由 5698741236ls 于 2023-10-19 15:13 编辑

作用:为没有字幕的视频生成字幕,无需联网,本地运行

基本步骤:

  1. 安装python

    安装最新版就好

  2. 安装ffmepg

    下载自己系统对应的版本,windows是win64那个,将下载的压缩包解压后得到的ffmpeg.exe ffplay.exe ffprobe.exe放到一个你想放的目录,然后将这个目录的路径加入环境变量的Path里,不知道添加就百度一下

  3. 安装cuda

    安装最新的就好;在下载页面选自己的对应配置就可以下载了

  4. 安装PyTouch

    安装最新的就好; 在下载页面选最新的cuda版本,然后会有一个Run this Command,在cmd运行即可安装;例如:pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

  5. 安装whisper (附:whisper源页面)

    打开cmd,运行 pip install git+https://github.com/openai/whisper.git就可以安装好了


使用方法:打开cmd -> 输入 whisper 视频路径 --output_format=srt --model=模型名称 就可以开始运行了

  • 视频路径直接把视频拖进来就可以
  • 模型根据自己的配置选,模型越大,显存要求越高,越精确,速度越慢
模型名称 模型大小 English-only model Multilingual model 显存需求 速度
tiny 39 M tiny.en tiny ~1 GB ~32x
base 74 M base.en base ~1 GB ~16x
small 244 M small.en small ~2 GB ~6x
medium 769 M medium.en medium ~5 GB ~2x
large 1550 M N/A large ~10 GB 1x

为了不用每次都输入命令行,所以我写了个py程序,按照上面的步骤安装好后,每次就只要运行这个py程序,拖入视频然后选模型就可以了

import os

videoName = input("请拖入视频:")
model = input("请选择模型(1:tiny 2:base 3:small 4:medium 5:large):")
if(model == "1"):
    model = "tiny"
elif(model == "2"):
    model = "base"
elif(model == "3"):
    model = "small"
elif(model == "4"):
    model = "medium"
elif(model == "5"):
    model = "large"
else:
    model = "small"

print(f"模型:{model}\t转换视频:{videoName}\n现在开始转换...")
cmd = f"whisper {videoName} --output_format=srt --model={model}"

try:
    os.system(cmd)
    input("转换完成!")
except Exception as e:
    print(f"发生错误:{e}")
    input("转换失败!")

效果图:
效果图.png



另外,因为不能生成中文字幕,默认是英文,所以一般是配合potplayer的实时字幕翻译使用。

免费评分

参与人数 3吾爱币 +3 热心值 +3 收起 理由
fssq121 + 1 + 1 谢谢@Thanks!
kengtianxia + 1 + 1 我很赞同!
gaoming513 + 1 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 5698741236ls 发表于 2023-10-23 11:52
补充一下,这个步骤只支持N卡用户,如果是A卡那只能用CPU跑,步骤会略有不同,需要自己去摸索一下
powerwht 发表于 2023-10-20 11:03
fengmodel 发表于 2023-11-7 08:28
可以去github上看看两个CPU、GPU模式的傻瓜式软件,buzz、whisperdestop,windows版本的。我是A卡笔记本,只能用CPU模式的buzz
52菜鸟 发表于 2023-10-19 16:56
win7能运行么?
ysjd22 发表于 2023-10-19 17:01
这个看起来很厉害啊
TiCo 发表于 2023-10-19 17:18
GitHub上有关于faster-whisper的项目,这个项目试了一下,相比原版快了不少。你可以试试用它优化一下。
tintin981 发表于 2023-10-20 09:33
前期工作看着可不简单呢,试试。
wohushan 发表于 2023-10-20 09:38
感谢楼主提供
li1love09 发表于 2023-10-20 12:23
5个步骤的安装 看起来好复杂  个人猜想生成字母和potplay翻译 能看明白2个人的动作电影
bianquenet 发表于 2023-10-20 16:11
用过几次,可以用。
QaQ355 发表于 2023-10-22 21:49
感谢楼主,帮朋友大忙了
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 00:47

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表