ChatTTS 合成的语音,听听效果如何

171 天前
 jianchang512
利用 ChatTTS 合成的 春江花月夜

<amp-youtube data-videoid="G4ch0sE0vq4" layout="responsive" width="480" height="270"></amp-youtube>
除了有几个错别字,其他整体很不错,没有机械生硬感

----



耗了一把它的东风,额的网页 UI 项目 star 升的也挺快

ChatTTS UI: https://github.com/jianchang512/ChatTTS-ui

ChatTTS 开源地址: https://github.com/2noise/ChatTTS
3911 次点击
所在节点    分享创造
24 条回复
Ccf
171 天前
毫无情感
mlhorizon
171 天前
看来机器人还是冇得感情,欣赏不了诗词。
sammy520
171 天前
要展示东西,最好把他最显著的特性用一般大众能感受的方式展现出来,但凡你用正常语速朗读一篇小王子,也不会像读诗词这么尬。。。
kebamt
171 天前
能不能停顿一下,听着难受
icyalala
171 天前
这是 ChatTTS 又不是 梁逸峰 TTS 。。。
jianchang512
171 天前
感觉这个 tts 还行,没那么大的机械味。
cxtrinityy
171 天前
读诗不行,读网 2-3 倍速网络小说可以,微信读书那个就完全不行,要钱的声音咬字糊糊的不行,还不如机械音
PrinceofInj
171 天前
估计训练的材料过于口语化,有几句感觉要笑场的样子。不会是访谈资料给多了吧?可能拿去读剧本之类的不错。但是读书面文字就不行了。
xuanjiangsara
171 天前
官方自己的英文,那是相当难听。不知道这个怎么会吹捧,难道大家光听中文得了?
jianchang512
171 天前
@xuanjiangsara 英文的国外模型效果更好呀,只是国外模型对中文支持不好,所以这个才收追捧,绝大多数应该都是将这个用于中文。

只是官方说了不可商用,只可学术研究,貌似用途不大
xuanjiangsara
171 天前
@jianchang512 所以果然是中国专供了,擦汗。
除了英文长句语调怪外,还发现刻意断句加喘息。听得我都要过度换气了。
没听中文是不是有这个“特色”,但是这种感觉添加的很机械。估计是因为矬子里拔将军,中文最高个了。
jianchang512
171 天前
@xuanjiangsara 主要没有好的中文 tts 项目
官方说是故意加了些干扰,防止可能的用于犯罪,中文也会出现噪声和奇怪笑声
hfJ433
171 天前
语速太快了
ZzzzRyan
171 天前
@xuanjiangsara #11 训练的数据中文偏多,中文更好不是很正常吗?国外的也没谁听说成是英文特供啊?
gdfsjunjun
170 天前
这标点没识别啊,遇到标点没停顿?
而且毫无感情,似乎并没有理解诗句的意思,只是一个无情的朗读机器。
现在 AI 这么发达,理解意思应该不成问题吧?
click
170 天前
本地使用对硬件有要求吗?
xuanjiangsara
170 天前
@ZzzzRyan 我指的是我以为是中国专供,不是中文专供。中国专供是给无法科学上网的人提供跟其他国家一样多语言 AI 的均等机会。
yolee599
170 天前
看看这个?甚至连说话时候吸气的声音都能生成:
[来感受一下 ChatTTS 这个语音合成( TTS )模型-哔哩哔哩] https://b23.tv/YD7I50D
cheese
170 天前
你这个 demo 听得我尿急。一点断句停顿都没。还不如白嫖微软的在线接口
jianchang512
170 天前
@cheese 可以加入停顿的,使用[uv_break],不过简单起见没加,听着有点快

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1046111

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX