求推荐一个应用可以将音频文件转成文本

48 天前
Amose2024  Amose2024

本人业余时间修了个管理方向的硕士学位,经常需要看视频课程或者听音频课程,有的时候一堂课甚至超过 4 个小时。不想听,觉得看起来快多了。求一个应用,可以让我快速上传大文件,并且很快转成文本内容。

感谢

1069 次点击
所在节点   问与答  问与答
11 条回复
tpxcer
tpxcer
48 天前
达芬奇
loading
loading
48 天前
通义可以转,还会总结。很多 AI 应用都具备这种功能了。
Amose2024
Amose2024
48 天前
@loading @tpxcer 谢谢。请问对于两个 G 大小的文件也可以处理吗?其实这种要上传就是比较麻烦的事情了
loading
loading
48 天前
建议通过其他软件,单独将音频剥离出来。如果是在线看的视频,甚至有机器人帮你完成,像通义,我只要给播客的地址,它就能做完,不用我上传。
404neko
404neko
48 天前
那肯定是 Whisper 了
paopjian
paopjian
48 天前
直接 pip 安装 buzz,启动 buzz 就可以用 whisper 模型做提取声音识别字幕了,安装 pytorch 还可以调 gpu 加速
Amose2024
Amose2024
48 天前
@loading 音视频都是需要登录验证的,给链接,通义怕是访问不了。
@404neko @paopjian 我是有办法把音视频文件下载下来。没搞过 Whisper ,可以试试本地跑跑。谢谢
iaiuse
iaiuse
48 天前
飞书妙计。跑不了的
Amose2024
Amose2024
48 天前
@paopjian @404neko 果然可行,准确度异常的高,十分感谢~
lneoi
lneoi
48 天前
围观看看, 本地有好多音频, 也想整理成文字, 有的还是方言, 以前找的很多识别软件都是太长音频不支持, 要不然就是收费非常贵
tpxcer
tpxcer
46 天前
@Amose2024 可以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1109451

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX