玩了 N 小时的 sovits 变声器,结论,目前无法替代 TTS

2023-06-09 11:38:31 +08:00
 garywill

原本做内容是正在使用 TTS 的,但要人工打字,对时间轴

看最近很多的 AI 歌手,就尝试了 so-vits-svc (现在是 4.1 了),想着用它替换掉自己说话的口音,变成一个咬字清晰的普通男中音

最后发现只是浪费了 N 个小时!

浪费了 N 个小时之后的结论

网上别人分享的模型很多都是萝莉女音(又懒得自己训练)

唱歌训练出来的模型也不适合讲话,会由普通话变成四川话或河南话

使用那个最普遍的 AI 孙某著名女歌手也不行

1757 次点击
所在节点    随想
3 条回复
optional
2023-06-09 11:56:53 +08:00
试试 bark
evemoo
2023-06-09 16:27:09 +08:00
vits 和 sovits 是两个东西
garywill
2023-06-11 12:02:26 +08:00
@optional bark 是 tts 吧,虽然也号称能克隆音色,好像没查到用 bark 作变声的例子。玩 rvc 了,感觉比 sovits 好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/947245

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX