短视频时代,内容创作领域产生了旺盛的需求,其中一个就是 tts 人工合成音。而 edge 自带了一个非常自然流畅的 tts ,大家可以了解一下
本人基于 ms-tts 的 api 实现了一个简洁实用的小工具ms-tts-web,在网页上输入文案然后自动生成 mp4 字幕视频以及对应的 mp3 音源。用户可以在线预览生成结果,下载其中任何一个使用,比如说在剪映中就可以提取字幕视频的音轨,而在 PC 上用 pr 可以直接导入 mp3 ,使用方法非常简单
同时为了防止坏人恶意生成不合规内容然后举报你,所有链接都是 15 分钟过期的(生成的文件体积都很小,秒下)
部署上则提供了 dockerfile ,大家有 docker 就可以轻松部署属于自己的晓晓配音服务,这是一个成品 demo,部署教程可以参考这篇文章
此外晓晓配音还提供了WinUI 版,方便桌面用户快速保存生成的音视频文件,不用每次都点链接下载了
技术方面很简单,前端 react+后端 flask
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.