求问有什么字幕输出语音方案(发音时间须对准字幕时间戳)?

2022-04-15 10:32:55 +08:00
 znwindy

有个需求是从字幕文件转真人语音,我看微软百度 Amazon 都有这种服务,但是有个痛点是字幕是有时间线的,需要时间对齐,不然会出现音画不同步的情况,求问下有没有做过的朋友。

2 00:00:06,144 --> 00:00:08,448 Seven module one we covered

3 00:00:08,960 --> 00:00:11,520 The overview of the whole strategy

1055 次点击
所在节点    程序员
4 条回复
msg7086
2022-04-15 10:58:50 +08:00
点不算很痛吧,拿到语音以后取出长度,然后 pad 到时间轴长度,再拼起来就行了呗。
znwindy
2022-04-15 11:00:00 +08:00
@msg7086 #1 是的,我后来想了想的确就是如此,按照字幕长度把每条语音输出再粘合起来,感谢
hgert
2022-04-15 14:48:04 +08:00
有个基本没用的方案 闲着蛋疼可以一试:字幕文件——音频文件,然后扔进视频编辑软件自动生成字幕打上去 不过这样一来就是硬字幕了 成品修改有点麻烦而且任务嘴型很难对的上 还是 1L 的方案好点
znwindy
2022-04-15 15:38:31 +08:00
@hgert #3 了解,因为是大规模的,必须用代码做了,感谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/847091

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX