不懂就问:垂直领域小词汇量(纯数字)离线语音识别用什么技术

2020-07-23 22:10:38 +08:00
 maitiantuzi

主要是整数和小数的识别,用什么开源框架训练,如何训练,准确率相对较高? 用过各大平台的离线识别,纯数字的识别率较低。

1679 次点击
所在节点    问与答
8 条回复
NullPoint
2020-07-23 23:31:08 +08:00
同问文字方面的,中文书写,例如十一点三,这种,如何识别
ooh
2020-07-23 23:42:03 +08:00
离线识别估计有点难,刚刚试了试三爽录音机里面的语音转写,它有动态修正我试了下正常语速识别率 100%
ooh
2020-07-23 23:56:28 +08:00
@ooh 看了看离线识别里面的命令词好像也不适合你,查了下有个叫 https://github.com/kaldi-asr/kaldi 的项目可以看看,感觉可以满足你的需求
gargar
2020-07-24 00:18:15 +08:00
什么是“垂直领域”?
fishCatcher
2020-07-24 00:33:35 +08:00
各大云平台的自学习模型服务可以自己训练?
Coast
2020-07-24 08:49:55 +08:00
在第一家公司就负责纯数字串的识别,因为是纯数字识别,语言模型可以固定,相对很小。识别准确率很高。通用的模型识别结果当然不如定制的
maitiantuzi
2020-07-24 13:08:10 +08:00
@Coast 请问主要用的什么框架呢
Coast
2020-07-26 08:42:17 +08:00
@maitiantuzi 基于 Kaldi 做的。不过其他的也都可以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/692640

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX