公司想开发个录音笔产品，配套语音转文字，请教解决方案。

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 1021 days ago, the information mentioned may be changed or developed.

录音转文字 APP ，应该怎么做，有什么现成方案吗？如果用阿里云这些，成本太高了，有没有什么开源好用的，请教大家。

请教

录音

文字

现成

11 replies • 2023-09-13 17:27:49 +08:00

qiqi669

Sep 12, 2023

DeepSpeech

rsy

Sep 13, 2023

Whisper
https://github.com/openai/whisper

AppJun

Sep 13, 2023

iOS SDK 有 SFSpeechRecognizer ，如果想用 Whisper 有 whisper.cpp 。

Whisper 的模型大小对中文识别有一定影响，但是影响也有限，新的 iPhone 可以跑得动一些比较大的模型，老的 iPhone 就不一定有足够内存了。

另外但是因为训练集是字幕，导致中文容易出现一些预期外的文字，比如“字幕制作：某某”“谢谢观看”之类的幻想结果。

Zorro825

Sep 13, 2023

@AppJun 谢谢

Zorro825

Sep 13, 2023

@rsy 谢谢

Zorro825

Sep 13, 2023

@xuAN111 谢谢

Zorro825

Sep 13, 2023

@AppJun 安卓不能用吗

Zorro825

Sep 13, 2023

@rsy 这个是云端解决方案吗，用户上传文件，服务器翻译，然后返回结果

rsy

Sep 13, 2023

@Zorro825 Whisper 可以直接下载到自己电脑上使用，无需联网，也不需要调 API 花钱

EatIce

Sep 13, 2023

得和科大讯飞的产品对比一下，有自己的市场竞争力再做

iorilu

Sep 13, 2023

你想实时识别本地性能可能不够把