寻找飞书妙记(语音转文本)平替?

78 天前
 jiaqiliu

飞书妙记的免费版开始限制 ASR 的时长了(每月 300 分钟)。有没有其他免费的替代品?或者本地部署的也可以。

https://imgur.com/a/AzL3e7i

2157 次点击
所在节点    云计算
16 条回复
wkla
78 天前
openai whisper.
阿里达摩院 funasr.
jiaqiliu
78 天前
自己简单研究了下,有几个工具,都是离线方案:

https://github.com/CheshireCC/faster-whisper-GUI
faster-whisper 的 GUI ,bug 有点多,任务经常卡死,弃

https://github.com/chidiwilliams/buzz
也是一些 asr 引擎的 GUI ,比 faster-whisper 稳定,但是在我电脑上无法正常调用 GPU ,弃

https://github.com/SubtitleEdit/subtitleedit
主要是一个字母编辑软件,但是其中可以调用自选的底层引擎进行 ASR ,可以正常使用 GPU ,缺点是 ASR 没有进度条,其他还不错目前用的这个。笔记本 4060 ,用 largev3 模型处理一个 90 分钟的视频耗时 15 分钟。
cyp0633
78 天前
实现随便你,但是搭配的模型可以试试 belle-large-v3-punct ,在 whisper 基础上微调过效果好多了
simonsww
78 天前
同找,妙记日常用的还挺多
janpun
78 天前
我也在找,妙记用的很多,企业级应用就是这点不好,我可以接受付款,但绑定了整个大平台的付费我就不想买了,因为我只用这个功能
pozhenzi998
78 天前
JensenQian
78 天前
有黄老板显卡的话我用的这个 https://github.com/chidiwilliams/buzz
JensenQian
78 天前
@JensenQian https://github.com/chidiwilliams/buzz/blob/main/CONTRIBUTING.md#gpu-support
默认用的 cpu ,gpu 的话自己看他文档设置,不过得有 cuda

https://github.com/Const-me/Whisper
这个支持 amd 的 gpu ,我的 6800H 的核显也能跑,但是好久没更新了
steelshadow39
77 天前
最近看了阿里云的通义听悟,可以试试
wulv
77 天前
通义听悟、钉钉闪记
Xi
77 天前
通义听悟
linxi7
77 天前
600 块一年,还有 1500 GB 云存储,平时再用用云文档之类的,感觉能回本。
juicy
77 天前
iorilu
77 天前
太多了, 自己折腾可以用 whisper

或者我开发得 ai 字幕机 (www.aizimuji.com)
ladeo
77 天前
通义听悟
s4d
77 天前
我用三星手机自带的录音,AI 转录能识别音色,体验很棒。

这个叫 Galaxy AI 。

没有使用限制,但是貌似不能上传录音,必须用手机录。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1089019

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX