基于 whisper 做的视频转字幕翻译服务

2023-08-14 00:44:16 +08:00
 hqwuzhaoyi
https://github.com/hqwuzhaoyi/gpt-subtitle

基于 whisper 做的视频转字幕翻译服务

我现在用来翻译 nas 上的影片,翻译结果还不错,现在支持 pm2 和 docker 部署

可以预览 jellyfin 上的图片,下一步准备加入 jellyfin 的卡片预览模式
2431 次点击
所在节点    分享创造
11 条回复
gccdchen
2023-08-15 15:28:23 +08:00
哈哈,还需要 windows 版本
hqwuzhaoyi
2023-08-15 16:43:20 +08:00
@gccdchen 我现在 win 上开发是基于 wsl 的,win 上应该也可以运行,不过安装的脚本我要改下👍
gccdchen
2023-08-17 15:05:58 +08:00
太好了, 问下 shisper 是不是用 blas 就是显卡来跑的了?
gccdchen
2023-08-17 15:06:59 +08:00
whisper-blas-bin-x64.zip 这个
hqwuzhaoyi
2023-08-18 09:27:48 +08:00
@gccdchen cuda openblas 都是 gpu 开启翻译的,在 whipser cpp 文档里面会有对应的操作步骤,对应编译的 main 会不一样

比如 cuda

make clean
WHISPER_CUBLAS=1 make -j

或者 openblas

make clean
WHISPER_OPENBLAS=1 make -j
hqwuzhaoyi
2023-08-18 09:29:43 +08:00
@gccdchen whisper cpp release 的那个 zip 我确认下
hqwuzhaoyi
2023-08-18 09:57:18 +08:00
@gccdchen 可以的,里面就是 main ,接下来下载 Models 就可以了
gccdchen
2023-08-18 16:56:58 +08:00
嗯 , 这样 vs 都不用安装了..
有点奇怪是 .. large 模型有点慢 ,3050, 10 多秒的语音要跑 40 秒..
hqwuzhaoyi
2023-08-18 20:30:25 +08:00
@gccdchen😁 启动也比较耗时,可以直接 medium 试试看效果
yann123
2023-09-26 12:32:16 +08:00
发现 bug 了
hqwuzhaoyi
2023-09-26 20:51:17 +08:00
@yann123 哈哈哈😆,感谢🙏

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/964979

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX