如果用 AI 做有声阅读,有没有搞头?

6 天前
 Shawn5
就是根据文本内容,分角色,分场景,分感情的进行朗读,类似真人朗读的那种,这种目前 AI 的技术能够支持吗???有没有搞头??
1347 次点击
所在节点    商业模式
32 条回复
zoharSoul
5 天前
成本很高吧
wyd011011daniel
5 天前
https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/speech-synthesis-markup-voice#use-speaking-styles-and-roles

你说的就是用大语言模型生成 SSML 标记过后的文本内容

看你是要实时还是预先训练好
实时的话,可以做个阅读器让用户自己导入小说。
起步等待要久一点 然后上下文联系可能会出错。
预训练的话版权问题基本只能大公司做

我自己用阅读/爱阅记 azure tts 听书很久了,也挺听喜马拉雅的有声书。

喜马拉雅真人配的有声书(哈利波特系列/三体系列)除了情感以外 还会模仿角色音色,配音功夫下的很多,而且还有环境配乐和各种实时动作的配乐。

现在 ai 配环境声不知道做的怎么样。感觉可以朝着对标这种有声剧想想办法。
lance07
5 天前
番茄, 讯飞, 微信读书一堆应用都有, 目前我听着最舒服的是微信
wyd011011daniel
5 天前
@wyd011011daniel 不过我是不太报希望,因为这种听的东西,人对错误的容忍程度应该不是那么高的。譬如男女声音,不同情感。如果配错了,人会很敏感的察觉到,对主要受众来说会很出戏。 不像图片那么好糊弄人
Shawn5
5 天前
@wyd011011daniel 受教了!!!
PaulSamuelson
5 天前
除非,除非,这个 AI 能把某些小说里的:呕,呕,阿,阿,读出感情,读出力量来。
否则,你这个 AI 没有壁垒,同质化严重。
Libby520
5 天前
步非烟
murmur
5 天前
你都入场晚了,现在 b 站营销号 抖音大部分都是 AI 配音
a67793581
5 天前
@Libby520 靠 出戏了
Shawn5
5 天前
@PaulSamuelson 我好像悟了
yufeng0681
5 天前
以后应该是起步 AI 语音做有声阅读。
如果内容有火的趋势(某些指标达标了),马上就会上真人来重新录制。 把这个作品做到最佳体验。

或者是优质内容,起步就是真人录制,达到最佳效果。
bigjie910
5 天前
可以参考卢卡故事机得方案。 摄像头识别书本内容,需要手动翻页。 不过他这个目前都是录制好的内容, 很多新书或者杂志都识别不到。 可以尝试下这方面得

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1097211

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX