V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Cormic
V2EX  ›  问与答

求推荐一个中文语音克隆项目?

  •  
  •   Cormic · 355 天前 · 1370 次点击
    这是一个创建于 355 天前的主题,其中的信息可能已经有所发展或是发生改变。
    之前买过一个科大讯飞的玩具,就是父母按照指定文本录制一些语音,就可以合成一个克隆的语音,用这个语音给小孩子读书讲故事。

    看了下比较火的 coqui.ai ,好像这个不支持中文,他们开发团队里也没人懂中文,而且他们官方的 demo 里似乎也没有支持中文语音克隆。

    大家有什么推荐的项目吗?最好是可以完全本地化搭建和训练的,谢谢!
    4 条回复    2024-03-24 19:56:13 +08:00
    findex
        1
    findex  
       355 天前 via iPhone
    同求
    wkla
        2
    wkla  
       354 天前   ❤️ 1
    百度飞桨的项目,TTS+音色克隆。开源,应该可以本地部署。中文支持。
    https://aistudio.baidu.com/aistudio/projectdetail/5003396?channelType=0&channel=0

    VITS 音色克隆,TTS+音色克隆,开源,应该可以本地部署。中日都行。可以在下面的网站里试试效果。
    https://huggingface.co/spaces/zomehwh/vits-models

    so-vits-svc 音色克隆,将一段音频转化为另一种音色,非实时。开源,可以本地部署。用来做歌声音色克隆的效果不错。下面是 Github 链接。b 站可以搜到大量的效果展示和教程。
    https://github.com/svc-develop-team/so-vits-svc

    RVC ,实时变声器,开源,可本地部署。下面分别是 github 链接和 b 站介绍视频。
    https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
    https://www.bilibili.com/video/BV1pm4y1z7Gm/
    buyno1
        3
    buyno1  
       45 天前
    @wkla github 那些开源的 能不能直接免费在飞浆里部署,colab 实在不行,分分钟就断掉,根本不实用
    wkla
        4
    wkla  
       45 天前
    @buyno1 现在 TTS 推荐 GPT-SoVITS ,只用比较少的样本 TTS 音色还原就不错了。本地 4G 以上显存应该就能跑。https://github.com/RVC-Boss/GPT-SoVITS
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1002 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 20:50 · PVG 04:50 · LAX 13:50 · JFK 16:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.