如果用 AI 做有声阅读,有没有搞头?

107 天前
Shawn5  Shawn5
就是根据文本内容,分角色,分场景,分感情的进行朗读,类似真人朗读的那种,这种目前 AI 的技术能够支持吗???有没有搞头??
2193 次点击
所在节点   商业模式  商业模式
32 条回复
z7356995
z7356995
107 天前
目的是什么,再有感情也比不过电影
julyclyde
julyclyde
107 天前
不就 TTS 么,咋就 AI 了?
SantinoSong
SantinoSong
107 天前
晚了, 豆包已经在做了
Shawn5
Shawn5
107 天前
@z7356995 就是有声小说,提高用户体验,现在的有声小说都是平白直叙的
Shawn5
Shawn5
107 天前
@julyclyde 的确需要用到 TTS ,但是 TTS ,貌似没感情啊,读出来的小说,太直白了,没有波动,现在还好,能分出男女了,以前连男女都不分
Shawn5
Shawn5
107 天前
@SantinoSong 啊,这样的吗,我去看看,哈哈哈哈,之前有搜到,火山语音在做,但是搜了下,貌似没有这个应用,不知道是不是合并到番茄里面进去了
odirus
odirus
107 天前
这块字节做得很好了吧,有声小说重点还是落在 “小说” 上面,内容吸引人才行
chairuosen
chairuosen
107 天前
最好是外挂,一个录屏软件 OCR+TTS ,可以不依赖文字内容的版权
love060701
love060701
107 天前
技术是支持的,看我用 GPT-4o 实现的效果

1 、模仿老友记的珍妮丝和武林外传的佟掌柜: https://x.com/Gorden_Sun/status/1838895315514204375

2 、唱生日歌: https://x.com/Gorden_Sun/status/1839170329262047682

3 、说情话: https://x.com/Gorden_Sun/status/1839252597687071212
poplar50
poplar50
106 天前
@Shawn5 试过番茄小说阅读吗? 微软 edge tts 也行,都是多角色朗读的。
SylarQAQ
SylarQAQ
106 天前
可以了解一下 mutliTTS 然后引入 TTS 源后就可以了,我前段时间折腾了一下,虽然抑扬顿挫都有了,但是缺乏了一点儿场景对应的语气,不如真人说书的那种感觉
Shawn5
Shawn5
106 天前
@poplar50 昨晚上试了一下,能分角色,但是语气不会变化,不会根据情节或者文字改变,比如愤怒,高兴等等,都是平白直叙的,跟真人说书差距还是有的
Shawn5
Shawn5
106 天前
@SylarQAQ 谢谢,我也去试试,我刚百度了下,只有一个下载地址,但感觉又不像,github 上也没搜到,能告知下,是在哪里下载吗?
xz410236056
xz410236056
106 天前
@Shawn5 #5 你抖音搜小说,做得很好了
z7356995
z7356995
106 天前
如果要我为多模态语音付费的话,我觉得应该是练习口语中的语音纠正,你这样发音不对,正确的这个发音是
clemente
clemente
106 天前
套一个模型的事 ....
Shawn5
Shawn5
106 天前
@clemente 有没有介绍的模型,感谢!!!
pkoukk
pkoukk
106 天前
没搞头,微信阅读、喜马拉雅、起点 等已经大规模开始搞了。
这个事情最重要的不是 AI ,而是这些内容的版权,没内容你找个 AI 读 1 2 3 4 5 6 7 啊?
liu731
liu731
106 天前
https://speech.microsoft.com

没搞头啊,兄弟。这网站是个文员都能玩。
Shawn5
Shawn5
106 天前
@pkoukk 哈哈哈,的确,就是不知道有没有其他 AI 能落地的应用,三四个人小团队能够搞定的那种

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1097211

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX