Whisper Notes - 免费的语音转文本工具(iOS)

2023-04-06 09:31:31 +08:00
 wseani

简介

产品名: Whisper Notes

它是一个离线的OpenAI Whisper模型,可以将你的语音输入以极高的准确率转成文字、支持多语言夹杂。

它是免费的:无内购、无广告、不联网。 (如果不缺钱,在未来很长一段时间我会维持它免费)

动机

市场上已经有一些 Whisper 工具了,为什么我还要做一个呢?需求主要是:

  1. 记录梦境:有时我做了个奇特的梦,醒来想记录,但睡眼朦胧很难打字,希望有个工具能快速录入语音并文本化。

  2. 回微信消息:有时我需要回复很长的微信,但此时我在街上或在吃饭,在不回复语音消息的情况下,快速回信息。

  3. 捕捉灵感:和 2 类似,有时不方便打字的场合突然有了新念头,想记录下来。

市场上的工具,要么太大(速度慢)、要么太小(准确率低)、要么会上传你的音频。

Whisper Notes 在准确率和速度之间做了折衷:尽可能使用最大的模型,但速度不至于慢到等几分钟才完成转录。正常情况下,你录入一段语音,等待几秒钟就可以完成。

因为目的是「速记」,所以 Whisper Notes 的"日记"属性很弱。转录完,文字就会自动复制到剪贴板,你可以粘贴到微信、或真正的日记 /Memo 软件来整理。

截图

欢迎下载体验 & 反馈👏

App Store: Whisper Notes

4764 次点击
所在节点    分享创造
45 条回复
wwqgtxx
2023-04-06 10:14:04 +08:00
已经下载,支持楼主
wwqgtxx
2023-04-06 10:39:22 +08:00
试用了一下,当长录音的时候能否考虑到一定长度就开始计算了呢(并显示部分结果),现在仿佛是等到 stop 之后才会开始计算,这是否有点浪费时间
Zeco41
2023-04-06 10:44:00 +08:00
想支持一波,但手里的备用机还是 14.7.1 ,给你点个感谢吧。
wseani
2023-04-06 10:53:24 +08:00
@wwqgtxx 的确,实时计算体验会好一些,之后有空会试试~
DjvuLee
2023-04-06 12:29:49 +08:00
不错!不过和苹果自带的语音转文字效果比较起来如何
wseani
2023-04-06 13:13:21 +08:00
@DjvuLee 你可以试试看!我的感觉是碾压。
DjvuLee
2023-04-06 13:27:31 +08:00
@wseani whisper 的中文识别不是不太行吗?
cest
2023-04-06 13:36:29 +08:00
@wwqgtxx #2 没法实时吧
whisper 比其他语音输入猜得准就是靠用超大的 30s sliding window 做上下文解析的
wseani
2023-04-06 13:57:15 +08:00
@DjvuLee 应该是相比它对其他语言的支持准确率不太行,相比系统自带的强很多。
@cest 他说的应该是,例如 5 分钟的音频,不需要等到录制完再 Transcribe
OliverDD
2023-04-06 14:28:08 +08:00
赞!好用
johannhuang
2023-04-06 16:58:36 +08:00
有趣的应用,虽然安装包有些大。还有一个遗憾,whisper 对硬件的要求低到移动设备就够了么?或者用起来有些“烧硬件”(用起来就卡一会儿)?
johannhuang
2023-04-06 16:59:20 +08:00
(“遗憾”实为“疑惑”)
wankedKing
2023-04-06 17:08:00 +08:00
如果可以记录梦话就好玩了,让它在睡觉时检测声音,如果有音频就写入。
wseani
2023-04-06 17:10:29 +08:00
@johannhuang
Whisper small 的参数量是 2 亿,不算很大,手机上应该是没问题的。不过发热会降低 Core ML 性能,所以长时间可能会卡,内存也会缓慢上升。
wseani
2023-04-06 17:11:38 +08:00
@wankedKing
我用过 SleepCycle 就支持记录梦话和打鼾,那个开一整晚挺耗电的,满电睡一晚第二天就剩 20%了。
hackpro
2023-04-06 17:26:24 +08:00
可能的话可以支持下 iOS 15 吗😂
ShinomiyaKaguya
2023-04-06 19:09:45 +08:00
可以考虑做一个 mac 应用,然后允许上传音频或视频文件,语音转文字
Zchary
2023-04-06 20:35:49 +08:00
这个 app 体积主要是被 model 占用了吗?
wseani
2023-04-06 21:01:42 +08:00
@Zchary 没错! 99.9%都是模型。
wseani
2023-04-06 21:04:40 +08:00
@ShinomiyaKaguya 因为是服务于我「不想在微信框打字」的需求,所以优先手机。Mac 端你可以搜 Aiko ,那个模型最大,最准确。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/930143

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX