如果用 AI 做有声阅读,有没有搞头?

5 天前
 Shawn5
就是根据文本内容,分角色,分场景,分感情的进行朗读,类似真人朗读的那种,这种目前 AI 的技术能够支持吗???有没有搞头??
1326 次点击
所在节点    商业模式
32 条回复
z7356995
5 天前
目的是什么,再有感情也比不过电影
julyclyde
5 天前
不就 TTS 么,咋就 AI 了?
SantinoSong
5 天前
晚了, 豆包已经在做了
Shawn5
5 天前
@z7356995 就是有声小说,提高用户体验,现在的有声小说都是平白直叙的
Shawn5
5 天前
@julyclyde 的确需要用到 TTS ,但是 TTS ,貌似没感情啊,读出来的小说,太直白了,没有波动,现在还好,能分出男女了,以前连男女都不分
Shawn5
5 天前
@SantinoSong 啊,这样的吗,我去看看,哈哈哈哈,之前有搜到,火山语音在做,但是搜了下,貌似没有这个应用,不知道是不是合并到番茄里面进去了
odirus
5 天前
这块字节做得很好了吧,有声小说重点还是落在 “小说” 上面,内容吸引人才行
chairuosen
5 天前
最好是外挂,一个录屏软件 OCR+TTS ,可以不依赖文字内容的版权
love060701
5 天前
技术是支持的,看我用 GPT-4o 实现的效果

1 、模仿老友记的珍妮丝和武林外传的佟掌柜: https://x.com/Gorden_Sun/status/1838895315514204375

2 、唱生日歌: https://x.com/Gorden_Sun/status/1839170329262047682

3 、说情话: https://x.com/Gorden_Sun/status/1839252597687071212
poplar50
5 天前
@Shawn5 试过番茄小说阅读吗? 微软 edge tts 也行,都是多角色朗读的。
SylarQAQ
5 天前
可以了解一下 mutliTTS 然后引入 TTS 源后就可以了,我前段时间折腾了一下,虽然抑扬顿挫都有了,但是缺乏了一点儿场景对应的语气,不如真人说书的那种感觉
Shawn5
5 天前
@poplar50 昨晚上试了一下,能分角色,但是语气不会变化,不会根据情节或者文字改变,比如愤怒,高兴等等,都是平白直叙的,跟真人说书差距还是有的
Shawn5
5 天前
@SylarQAQ 谢谢,我也去试试,我刚百度了下,只有一个下载地址,但感觉又不像,github 上也没搜到,能告知下,是在哪里下载吗?
xz410236056
5 天前
@Shawn5 #5 你抖音搜小说,做得很好了
z7356995
5 天前
如果要我为多模态语音付费的话,我觉得应该是练习口语中的语音纠正,你这样发音不对,正确的这个发音是
clemente
5 天前
套一个模型的事 ....
Shawn5
5 天前
@clemente 有没有介绍的模型,感谢!!!
pkoukk
5 天前
没搞头,微信阅读、喜马拉雅、起点 等已经大规模开始搞了。
这个事情最重要的不是 AI ,而是这些内容的版权,没内容你找个 AI 读 1 2 3 4 5 6 7 啊?
liu731
5 天前
https://speech.microsoft.com

没搞头啊,兄弟。这网站是个文员都能玩。
Shawn5
5 天前
@pkoukk 哈哈哈,的确,就是不知道有没有其他 AI 能落地的应用,三四个人小团队能够搞定的那种

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1097211

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX