106npo
V2EX  ›  OpenAI

有支持中文的语音转文字的模型么

  •  
  •   106npo · Dec 18, 2025 · 1298 views
    This topic created in 154 days ago, the information mentioned may be changed or developed.

    试过 openAI 的 whisper ,不管是 medium 还是 large V1~V3 ,中文都被污染的非常严重.不是无法识别,就是输出中有不少广告内容.

    不知道是否有针对中文训练好的模型或者权重呢,如果能支持 Whisper-faster Whisper.cpp 就更好了

    5 replies    2025-12-19 10:07:28 +08:00
    haiku
        1
    haiku  
       Dec 18, 2025 via Android
    阿里记得有类似的
    Auston
        2
    Auston  
       Dec 18, 2025
    funasr ,里面很多
    ModerRAS
        3
    ModerRAS  
       Dec 18, 2025
    广告那个,有没有可能是因为静音的部分出幻觉了?那种一般做个 vad 都能破掉大部分的。其他的你可以打开硅基流动看看,那边还有一些免费的 asr 模型的,我主要用个阿里那个 sensevoice 。
    106npo
        4
    106npo  
    OP
       Dec 18, 2025 via Android
    @ModerRAS 是在有背景音乐时做语音转文字的。vad 也有点误差。不过日语和英文都能很准确的转文字,只有中文没有任何有效的输出,不是空白就是幻觉广告😂
    ModerRAS
        5
    ModerRAS  
       Dec 19, 2025
    @106npo 那就不知道了,我一般不太容易出这些问题,没加 vad 都还算准确,不知道你的是啥情况。我用的是 ggml 的 whisper-large-v3-turbo 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1187 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 100ms · UTC 17:43 · PVG 01:43 · LAX 10:43 · JFK 13:43
    ♥ Do have faith in what you're doing.