语音合成项目需要做新闻播报,如何获取到高质量的音频数据?

2023-06-05 15:25:13 +08:00
 kang773371222

现成可用的,几百小时左右; 央视新闻一般混杂着采访,这部分不可用,需要去除

948 次点击
所在节点    问与答
7 条回复
tisswb
2023-06-05 15:46:27 +08:00
我用 python ,edge-tts 这个库直接走微软 edge 的接口,xiaoxiao 用来读电子书我觉得 OK 的一批。
AMZsowhat
2023-06-05 15:55:55 +08:00
微软 Azure text to speech 直接生成 免费字数不少
数据的话 还是人工截取吧
woctordho
2023-06-05 19:40:53 +08:00
kang773371222
2023-06-19 19:22:43 +08:00
@tisswb 谢谢指导,用 tts 合成数据?另外,xiaoxiao 是啥?
kang773371222
2023-06-19 19:23:19 +08:00
@AMZsowhat 谢谢指导,不过用 tts 合成数据训练 tts ,不太合理吧
kang773371222
2023-06-19 19:24:01 +08:00
@woctordho 谢谢指导,感觉可以试试
tisswb
2023-06-20 10:09:34 +08:00
@kang773371222 xiaoxiao 是 edge 的一个语音角色 语音这块 微软真的强

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/945949

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX