开发了个能模拟唱歌的 AI 模型，用罗翔的音色唱了《水星记》

2023-04-17 21:12:27 +08:00

netpi

最近开发了几个小 AI 模型，合起来参数不到 4000W 。组合起来之后，可以实现用任意人说话的音色合成任意一首歌

这是用罗翔的音色合成的《水星记》，听听看像不像，哈哈。

https://soundcloud.com/saceqirepner/aisinging-voice-synthesis?si=d17b0e65538d4ecd9e196b29c105257c&utm_source=clipboard&utm_medium=text&utm_campaign=social_sharing

2304 次点击

所在节点

分享创造

17 条回复

SAINTING4

2023-04-17 23:06:40 +08:00

可以考虑去鬼畜区当 up 哈哈哈哈

netpi

2023-04-17 23:20:11 +08:00

@SAINTING4 自己做内容太累了，我倒是考虑做个工具给 up 用

Mac

2023-04-18 00:25:45 +08:00

最近 B 站 AI 孙燕姿很火

netpi

2023-04-18 00:30:26 +08:00

@Mac 我也看到了用本身就是歌手的音色合成比较简单，用普通人说话的声音合会困难很多

yunpengtai

2023-04-18 08:35:19 +08:00

技术方面楼主方便分享一些嘛

fenglingyu

2023-04-18 09:00:42 +08:00

唱歌这个音频的机械音蛮重的，b 站有个搞相声的，拿已经故去的相声大师的音频训练了几个模型，然后用来表演没说过的相声。几乎没有机械音

Drumming

2023-04-18 11:23:59 +08:00

...换个角度，罗老师真实唱歌可能就是这样

netpi

2023-04-18 11:49:58 +08:00

@fenglingyu 这是模型直出效果，一些背景噪音可以用后期处理掉，我留着是想展现下模型最真实的效果

netpi

2023-04-18 11:50:26 +08:00

@yunpengtai 在准备论文中，快要可以分享了

netpi

2023-04-18 11:51:49 +08:00

@Drumming 我觉得也是！

Bssn

2023-04-18 12:19:18 +08:00

声音识别技术还靠谱吗？🧐

netpi

2023-04-18 12:26:10 +08:00

@Bssn 视频都不靠谱了

Bssn

2023-04-18 12:31:11 +08:00

@netpi 那人脸呢？

netpi

2023-04-18 12:37:45 +08:00

@Bssn 需要实时性的可能还相对安全一点，实时 fake 的门槛还是比较高

podel

2023-04-18 15:34:34 +08:00

收藏。楼主分享了记得再发个贴提醒一下。

fromdark

2023-04-18 20:36:19 +08:00

@netpi 这种用自己声音合成的 ai 声音的产品已经有几个了，效果感觉挺不错的，我看喜马拉雅上有声播试过，真的以假乱真

netpi

2023-04-19 13:32:28 +08:00

@fromdark 音色也是身份 id 的一部分了

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/933269

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

开发了个能模拟唱歌的 AI 模型， 用罗翔的音色唱了《水星记》

开发了个能模拟唱歌的 AI 模型，用罗翔的音色唱了《水星记》