请问有简单的办法可以做到识别发音吗?(拼音)

2015-02-22 01:03:39 +08:00
 aheadlead

用户说出一个发音,比如:

用户的声音 返回值
阿(ā) a
b
阿(ē) e
i
chi
he
tie

感谢。

2030 次点击
所在节点    问与答
10 条回复
icedx
2015-02-22 01:14:16 +08:00
aheadlead
2015-02-22 01:17:43 +08:00
@icedx 我就念一个字能识别吗?谢
icedx
2015-02-22 01:19:26 +08:00
@aheadlead 能啊
aheadlead
2015-02-22 01:30:08 +08:00
@icedx 请详细说说。我想要离线识别,比如说做个选择题,我希望能语音念ABCD来做题,节奏要比较快。
qiayue
2015-02-22 01:52:37 +08:00
@aheadlead 我觉得直接按 ABCD 更快吧,都是一个键
icedx
2015-02-22 01:58:38 +08:00
@aheadlead
貌似离线识别只有讯飞有 具体到识别 应该就是开始录音 然后提交刚刚的录音 SDK 会返回一个串 串里包含可能的结果 所以要多找几个人 给语音识别做微调 这点很重要
Mutoo
2015-02-22 01:59:52 +08:00
感觉一个音太短了,节奏快了的话连续两个相同的音不好识别。why not try this:
Apple
Ball
Cat
Dog
aheadlead
2015-02-22 10:02:56 +08:00
@qiayue 只是举个例子嘛…总会有不适合按的情况
@icedx 他们不仅要钱 linux试用sdk还不让下QAQ
@Mutoo - - 正因为不好识别才提这个问题啊
icedx
2015-02-22 11:23:57 +08:00
你可以把讯飞放在安卓里然后写个Web API 最后把网卡桥接出来

我还找到这个 http://blog.csdn.net/songgeabc/article/details/8570026
akfish
2015-02-22 17:32:13 +08:00
这需求很简单,只需要识别有限的语言命令。
自己做的话,用HMM(Hidden Markov Model,隐马尔科夫模型)做,源码很多,自己实现也不难。
Windows上的话,M$直接就给你提供了语音识别的API System.Speech.Recognition:
https://msdn.microsoft.com/en-us/library/system.speech.recognition(v=vs.110).aspx

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/172120

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX