🎉 [Audio Podium ] 个人独立开发的一款无需联网的支持将音视频转录成文字或者字幕的软件 🎉 免费 🚀

2023-05-15 21:25:01 +08:00
 tf2017
🚀 个人开发的免费音视频转录文字工具 Audio Podium 上架! 🚀

🎙️ 希望能在字幕生成,ShowNotes 编辑,播客笔记等方面,帮到 Youtuber 和播客主播!

🌟 基于 OpenAI 的 Whisper ,支持近 100 中语言。
🌟 内置 Small 模型,开箱即用,支持下载使用准确率更高的 Medium 和 Large 模型。
🌟 导出 SRT 字幕文件和纯文本文件。
🌟 对转录结果进行修改。

🎉 这是首个版本,功能还在不断完善中,欢迎大家多提意见。

📱 目前已上架苹果 App Store ,更多平台( Windows ,iOS ,Android )敬请期待!

🔗 安装体验: https://apps.apple.com/app/audio-podium/id6449008295

如有任何问题,欢迎联系我:

- 微信:leobaba88
- Twitter: https://twitter.com/Farmer00317558
- Telegram: https://telegram.me/farmer00317558
2785 次点击
所在节点    分享创造
22 条回复
AstroNot
2023-05-15 21:37:52 +08:00
正好在找这样的产品,期待 Windows 版本
tf2017
2023-05-15 21:42:59 +08:00
@AstroNot 应该不会太久
imicksoft
2023-05-15 22:45:57 +08:00
请支持 win7
zqhong
2023-05-15 23:03:45 +08:00
点击 [添加音频文件] ,没有反应。


音频的格式如下:


AI 模型选择小型:


macOS 版本:
版本 13.3.1 (22E261)
zqhong
2023-05-15 23:13:55 +08:00
音频文件是下载的 B 站视频,通过 ffmpeg 转换的 mp3 文件。

测试文件如下:
https://t.wss.ink/f/b7tf79csszj
zqhong
2023-05-15 23:15:30 +08:00
建议:模型下载是否能支持断点续传。
点了两次,都没下载成功

1611499758wuhao
2023-05-16 02:11:08 +08:00
tf2017
2023-05-16 08:36:03 +08:00
@1611499758wuhao 第一次遇到这么傻逼的,我认真回复一下:

1. 不管是 OpenAI 的 Whisper 模型还是 whisper.cpp 都是 MIT 协议的,我拿来做成商业软件盈利都是合理的,更不用说我花费了大量的业余时间开发了一个免费的软件给大家用了。你有了解过 MIT 协议的约束范围吗?
2. 我明确说明了我是基于 OpenAI 的 Whisper 模型来开发的,你有认真看吗?基于第 1 点,我即便是不声明也是可以的。
3. 你觉得一个普通的不懂技术的人,能用明白那些命令行工具吗?
4. 这个 B 站视频的发布时间可能还没有我这个 APP 第一次提交谷歌商店审核的时间早,你要是需要的话我截图给你。

最后,我想说的是,你也是个程序员,看你最近工作也不太顺心,但是别无脑到处喷,把自己所处的行业搞得乌烟瘴气的,最终吃亏的可能是自己。
tf2017
2023-05-16 08:38:35 +08:00
@zqhong 点击 “添加音频文件” 后稍微等一下,好像确实有点慢,后面版本会优化下。
tf2017
2023-05-16 08:38:59 +08:00
@zqhong 好的,感谢建议,记下了。
jiager
2023-05-16 08:49:50 +08:00
@AstroNot
@imicksoft
windows 版本上已经有相关的软件了,比如之前 v 友发的:
- https://www.v2ex.com/t/928031#reply17
或者是只能用 cpu 的 buzz:
- https://github.com/chidiwilliams/buzz
或者是另一种对 whisper 的封装(软件本体不大,几百 kb ,支持 gpu ,需要在 huggingface 上额外下载模型):
- https://github.com/Const-me/Whisper

另外我记得之前有个 v 友发布过一个 ios 端 whisper 的封装:
- https://www.v2ex.com/t/930143#reply16
tf2017
2023-05-16 09:06:41 +08:00
@jiager Cool !感谢分享。只是做一个转录工具确实没啥竞争力,我期望能围绕音视频转录这个事情,做一个个人的音视频管理工具。
weid
2023-05-16 11:09:42 +08:00
帮你推广了。附上链接 https://t.me/mac_app_store/167
milukun
2023-05-16 11:48:58 +08:00
@weid 请教一下这种只能群主发信息,且每个信息都可以点进去讨论的群组是什么形式呀?应该怎么创建呢?
我创建了群组,但是只能群聊,没有找到这个功能
1611499758wuhao
2023-05-16 17:20:15 +08:00
@tf2017 道歉,不好意思。没了解过 MIT 协议
AstroNot
2023-05-16 21:10:50 +08:00
@jiager 谢谢!
nativeBoy
2023-05-17 08:46:16 +08:00
看着挺好,之前少数派也有人发过别的基于 whisper 的软件(那个是只识别语音)
我尝试把基于 c++的 whisper 部署在安卓上,k50u 是骁龙 8+,5 秒的音频需要 11 秒才能得到结果😱
tf2017
2023-05-17 09:04:45 +08:00
@nativeBoy 嗯,所以我暂时没支持移动端,现在确实对机器配置有一定要求,不然会比较慢。不过以目前 AI 的发展速度,不久应该能看到比较大的改善。
FFFMML
2023-05-17 13:38:32 +08:00
buzz 刚出来的时候用过,m1max,两小时电影测试日语,第一非常慢,第二翻译结果垃圾到不可用,用的最大的模型。想问一下这款软件 m1 芯片的机器上效果如何。
weid
2023-05-18 08:01:33 +08:00
@milukun 只有群主发的是频道,你要建频道,再在群组的设置关联你建的频道,就可以了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/940238

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX