录音转文字 APP ,应该怎么做,有什么现成方案吗? 如果用阿里云这些,成本太高了,有没有什么开源好用的,请教大家。
1
xuAN111 2023-09-12 23:52:44 +08:00
DeepSpeech
|
2
rsy 2023-09-13 00:11:31 +08:00
|
3
AppJun 2023-09-13 00:17:03 +08:00
iOS SDK 有 SFSpeechRecognizer ,如果想用 Whisper 有 whisper.cpp 。
Whisper 的模型大小对中文识别有一定影响,但是影响也有限,新的 iPhone 可以跑得动一些比较大的模型,老的 iPhone 就不一定有足够内存了。 另外但是因为训练集是字幕,导致中文容易出现一些预期外的文字,比如“字幕制作:某某”“谢谢观看”之类的幻想结果。 |
10
EatIce 2023-09-13 16:40:46 +08:00
得和科大讯飞的产品对比一下,有自己的市场竞争力再做
|
11
iorilu 2023-09-13 17:27:49 +08:00
你想实时识别本地性能可能不够把
|