请问 V 友,语音转文字的事情。

344 天前
 mylastfire
工作需要,经常要把语音讲话转为文字。想请教大家,一是自己搭建个语音转文字的服务,是用 Whisper 模型搭建吗,准确率能达到多少?二是和使用录音笔自带的转文字功能相比,哪个准确度更高一点?三是因为讲话人也就是固定的三五个人,能否进行模型训练,用什么来训练?四是成本大概是多少呢?谢谢。
1218 次点击
所在节点    问与答
7 条回复
charlestang
344 天前
如果是中文的话,尤其夹杂方言的话,可以用科大讯飞的录音笔。自带终身免费的转文字方案(成本就是个录音笔的钱)。如果涉及到外语,可能只能选 Whisper 之类的东西了
mylastfire
344 天前
@charlestang 感谢。不想为了工作花自己的钱,哈哈。如果自己搭建,还能干点别的事。
xmuli
344 天前
阿里开源的 FunASR 实测效果也很棒,中英识别也很准确。

采用本地 whisper 不要部署 docker 那一个版本,表现比较拉胯,且间隔短了会返回 error
mylastfire
344 天前
@xmuli 收到,多谢,晚上研究一下。
fydss
344 天前
PLAY 上面有一个语音转文字的 APP 要求科学上网
fydss
344 天前
找到了 叫实时转写 可以试试
mylastfire
344 天前
@fydss 收到,感谢,去看看。虽然我目前是倾向于自己搭建一个 哈哈

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/998563

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX