有了 iText:你截图,腾讯、Google OCR 帮你识别文字 [送码]

2017-11-30 07:32:21 +08:00
 quietjosen

比如,在看类似上面的扫描版 PDF 时,想要复制其中的文字,怎么办?手打?太累。试试我新开发的工具 iText 吧。

iText 是 macOS 平台的 OCR 工具,自带截图功能,选择屏幕任意区域,即可识别其中的文字,又爽又酷。

识别后的文字已经复制到系统剪贴板,直接粘贴即可。

配合 ⇧⌘1 快捷键,使用体验更佳。当然,你也可以选择图片文件,或者将图片拖拽至 iText 的菜单栏图标进行识别。

文字识别精准

你有没有这种印象:OCR 识别出来的文字有很多问题,还不如自己打字来得快。可见,识别的准确性非常重要,也是我非常在意的一点。

2.1. 腾讯、Google 双引擎

首先,我排除了离线的识别库,因为离线注定了这些库的识别能力是死的,不会自己增强。接下来,在一票在线 OCR 服务中,我对比了百度、腾讯、微软、Google 等大厂的产品,最后选择了国内使用腾讯、国外使用 Google 的组合。判断依据是什么?少量测试 + 主观倾向,比如不测我就觉得 Google 比微软牛。

那么,到底识别准不准呢?这么说吧:

到底准不准?你不妨一试。

2.2. 独创算法,进一步优化识别结果

OCR 服务还有一些欠缺,iText 针对性地做了这些优化:

如果你发现识别不好的地方,欢迎把图发给我,我会相应地优化算法,毕竟算法是需要数据喂养的,先谢。

2.2. 预览原图,方便校对

在目前 OCR 技术不能始终达到 100% 的情况下,预览原图、并进行修正,还是有必要的。在 iText 中,你可以这样:

这样,就可以很方便地对照原图进行手动优化识别后的文字。

3. 下载与付费

其实,很多场景都会用到 iText,比如 识别快递单上的号码、图片中的联系人信息、需要登录才能复制的网页 等等,欢迎下载 iText 试试。

每月可免费识别 20 次,订阅 iText 高级版即可无限次识别。首发期间,高级版限时 6 折优惠:¥ 3/月、¥ 30/年。关于收费模式,我很是纠结了一番。如果你准备吐槽,请先看下这篇文章再次纠结付费模式,这次是 iText

V 友专属福利:iText Pro 一年期兑换码:

JAY9T73KR4TP
TFA6KWKTRW4E
KY639HYMWMPH
T6LRJ77HR7JT
HFJMKT39J6F7

手慢无;兑换后,最好在这里留言说明哪个已经用了,节约其他 V 友时间。


如果你觉得 iText 还不错,还请帮忙 在 App Store 评论;如果你觉得 iText 还可以改进,欢迎:

16763 次点击
所在节点    分享创造
82 条回复
quietjosen
2017-11-30 09:18:40 +08:00
@douglas1997 谢谢肯定,我一直在坚持,iText 已经是第 7 款 macOS App 了😀
zjia8765
2017-11-30 09:24:27 +08:00
试用了下,不错,赞一个
quietjosen
2017-11-30 09:26:24 +08:00
@zjia8765 谢谢,努力得到肯定,开心 😀
WhiteSJ
2017-11-30 09:31:03 +08:00
很不错, 赞一个
newbieo0O
2017-11-30 09:31:59 +08:00
挺方便的。
seasstyle
2017-11-30 09:33:01 +08:00
谷歌大法好!
上次用谷歌的翻译 api 翻译了一个 5400 行 9 列的表格,那速度和质量灰常好!
January
2017-11-30 09:46:39 +08:00
赞,试用一段时间看看。
isCyan
2017-11-30 09:53:13 +08:00
能对比下 Google 和微软的识别效果吗。微软必应的翻译 API 质量是显然高于谷歌的。不知道 OCR 是否也是如此。
Humorce
2017-11-30 10:08:10 +08:00
建议是可以采用多种付费方式,
一天用 100 次,包月不亏,
装上去留着备用,一个月都不见得能用几次。
chinajik
2017-11-30 10:13:23 +08:00
KY639HYMWMPH 已用
quietjosen
2017-11-30 10:17:30 +08:00
quietjosen
2017-11-30 10:17:49 +08:00
@WhiteSJ
@newbieo0O
@January 谢谢支持。
joe1213
2017-11-30 10:19:01 +08:00
iText 跟那个处理 pdf 的软件不是重名了吗
quietjosen
2017-11-30 10:19:51 +08:00
@isCyan 并不能。因为如果提供客观公正的结论,要做大量的测试,我做不到,不能随便下结论;并且,云服务是在不断变化的。

不过,你提供一张具体的图,我是可以给出二者的识别结果的。
LarryDev
2017-11-30 10:20:17 +08:00
已设为开机启动
quietjosen
2017-11-30 10:20:32 +08:00
@humorce 「装上去留着备用,一个月都不见得能用几次。」 iText 默认每月可免费识别 20 次,像你说的够用了。
quietjosen
2017-11-30 10:21:12 +08:00
@joe1213 不管,我就喜欢 😂 主要是跟我 i 系列的名字一致。要起个好的、又全球唯一的名字,几乎不可能。
quietjosen
2017-11-30 10:21:30 +08:00
@LarryDev 最实在的支持 👍
rexer
2017-11-30 10:24:19 +08:00
想入手 可惜没有 mac
newbieo0O
2017-11-30 11:12:07 +08:00
wri t e

wh i 1 e

a, b=0,1

-----------

逗号会识别成中文全角的情况

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/410689

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX