V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
RichardY
V2EX  ›  问与答

有什么开源的语音识别工具

  •  
  •   RichardY · 1 天前 via Android · 739 次点击
    whisper 试了很多次,准确性很差。基本上每句话都是错的。一句很短且标准的语音,都能识别错。也不知道是不是我用的不对。

    有没有对中文比较友好的开源语音识别工具?
    6 条回复    2025-09-02 09:21:08 +08:00
    TimePPT
        1
    TimePPT  
    PRO
       1 天前 via Android
    拥抱脸上很多呀,找几个支持中文的试试应该能找到
    https://huggingface.co/models?pipeline_tag=automatic-speech-recognition&sort=trending
    wangxiaodong
        2
    wangxiaodong  
       1 天前
    离线工具的受制于 AI 大模型体量,估计都不怎么样,还得是 Google Gemini 的普通话云端 STT 效果比较好,网上甚至有免费识别声音并直接生成字幕的,你可以试试看:
    https://passed.app/main/more/online/speech-to-text/
    ejin
        3
    ejin  
       1 天前
    说到这个来个题外话,腾讯混元(元宝) app 识别率还行,虽然识别中英文混合的容易出错,但是它总是瞎编最后一句话。。。。我每次都眼睁睁看着他瞎编的最后一句话。。。。
    woshizhuwow
        4
    woshizhuwow  
       1 天前   ❤️ 1
    我一直用这个当输入法,用起来感觉效果还蛮不错,可以试试
    https://github.com/HaujetZhao/CapsWriter-Offline
    avrillavigne
        5
    avrillavigne  
       1 天前
    用的 faster whisper 吗
    Alexf4
        6
    Alexf4  
       1 天前
    阿里的几个开源的模型识别的效果还行。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5260 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 18ms · UTC 08:51 · PVG 16:51 · LAX 01:51 · JFK 04:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.