玩了 N 小时的 sovits 变声器，结论，目前无法替代 TTS

原本做内容是正在使用 TTS 的，但要人工打字，对时间轴

看最近很多的 AI 歌手，就尝试了 so-vits-svc （现在是 4.1 了），想着用它替换掉自己说话的口音，变成一个咬字清晰的普通男中音

最后发现只是浪费了 N 个小时！

浪费了 N 个小时之后的结论

网上别人分享的模型很多都是萝莉女音（又懒得自己训练）

唱歌训练出来的模型也不适合讲话，会由普通话变成四川话或河南话

使用那个最普遍的 AI 孙某著名女歌手也不行

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.