我主要用两个功能。
一是 视频转文字 ,生成一些视频教程的字幕(看教程一般是 2.5 倍播放,听声音听不清)。用过剪映、openai 的 whisper ,感觉很一般。whisper 的英文非常强,中文不太行。
二是 实时语音转文字 ,记录一些实时的感悟。以前用科大讯飞输入法,发现识别率不太行。
这俩功能在阿里云都是要钱的,但在通义听悟免费,而且效果非常好。
以下是我的邀请链接,有兴趣的可以看看:
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.