现在的语音合成已经到这种水平了吗? Azure TTS 合成的 Voice 也太自然了

2021-12-10 09:59:50 +08:00
 cairnechen

语言选简体中文 Yunxi 这个发音人几乎要以假乱真了,害怕.jpg

https://azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/#features

可以对比下讯飞的:

https://www.xfyun.cn/services/online_tts

14761 次点击
所在节点    分享发现
107 条回复
86091566
2021-12-10 16:08:11 +08:00
感觉还是听得出来是机器人,不过播音员的确有点危险了
xiaocongcong
2021-12-10 16:09:41 +08:00
听不得短视频里面那种机器人播报。。。
starrys
2021-12-10 16:11:38 +08:00
@whatalittleboy 加空格就有了明显的停顿,你在前面多加几个空格感受下?
hahastudio
2021-12-10 16:14:29 +08:00
@32 从来没读错过,但你说了我才发现率是多音字。。。
yuhangch
2021-12-10 16:15:57 +08:00
我也能当 up 主了?哈哈😃
s127
2021-12-10 16:20:16 +08:00
xiaoxiao + gentle ,播放出来的声音跟“正念冥想 app”的发音一模一样
starrys
2021-12-10 16:27:50 +08:00
现在 B 站上已经有很多视频都使用 TTS 生成了。带来的问题是同质化严重、没有特色,不同的 UP 都一个声音就有点腻。

不要对技术太自信了。虽然比以前好很多,还是有明显的机器味。而且,如果用得人多了的话,会出现同质化严重的问题。现在网上的很多视频就是使用 TTS 生成的,听着有点腻。
shakoon
2021-12-10 16:28:19 +08:00
不错不错,还有这么丰富的调节选项。 突然想起了张亚勤,m$的 tts 应该有很多他的贡献
crab
2021-12-10 16:29:18 +08:00
@starrys 那些短视频的电影解说估计也有用这个。
hronro
2021-12-10 16:30:12 +08:00
确实厉害啊
luojianxhlxt
2021-12-10 16:35:10 +08:00
@maplerecall 大佬,怎么更换啊
Unclev21x
2021-12-10 16:49:05 +08:00
@AllenHua 昨天有网友发帖了。今天看评论,谷歌在 17 年就有这个水平了,还吐槽阮一峰平时都不上网的么。
DCELL
2021-12-10 17:21:11 +08:00
我有一个大胆的想法,TTS 翻译某个主角为“白洁”的作品,请问犯法么。
hronro
2021-12-10 17:37:25 +08:00
@Unclev21x
Google 的有在线演示吗?想看看现在什么水平了
yadiman
2021-12-10 17:42:25 +08:00
云希的语音听到想吐。短视频都是这音调的配音。
starrys
2021-12-10 17:43:22 +08:00
@DCELL 只想是不犯法的。
peanutgao
2021-12-10 17:47:17 +08:00
真的太牛逼了
kiotech
2021-12-10 17:51:03 +08:00
有人试过读小说吗?比如:“少 X 白洁”
www5070504
2021-12-10 17:51:31 +08:00
卧槽 我刚把自己写的文档粘贴进去, 这语音几乎完美

提俩小瑕疵 1.念数字的时候有时候音调有问题 2.汉语中带英语的时候停顿稍微有点不对
bug123
2021-12-10 17:55:49 +08:00
用来听小黄文应该很棒

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/821254

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX