用 mac 来做个人的 OCR 和翻译服务器可行吗

2022-07-18 00:29:34 +08:00
 Jackhuang

最近想要搞个 Mac Mini M1 来作为自己的个人服务器。 日常有一些 OCR 和文本翻译的需求。本人会一些 Pytorch, 考察了一下大概的可能性

  1. Github 找 OCR 的 torch/tensorflow 的预训练好的模型,然后自己 load 进来,然后起一个 server 。(水平参差不齐,灌水文比较多,而且普遍都是学术数据训练出来的,换场景和数据很难有效)
  2. 调用云服务 (由于涉及收费和数据隐私,否定 X )
  3. 直接用 API 调用实况文本,或者苹果的翻译服务

由于之前没有开发过 ios 或者 mac 的应用,但是感觉苹果的 OCR 效果很不错,所以想要问问 3 的可行性,麻烦有经验的朋友分享一下。

2546 次点击
所在节点    Apple
9 条回复
ecnelises
2022-07-18 00:31:39 +08:00
Jackhuang
2022-07-18 00:35:43 +08:00
@ecnelises 感谢你的回复,正如我提到的,没有开发过 ios ,请问这个 swift 的 api(我没理解错的话)可以封装成一个 binary 的可执行文件吗?
ecnelises
2022-07-18 00:38:41 +08:00
@Jackhuang
可以的,在命令行程序里 Import 这个系统框架就可以了。理论上甚至可以封装成 Python/JavaScript 等语言的 API
Jackhuang
2022-07-18 01:05:57 +08:00
@ecnelises 如果有相关的 github 的链接教程就更好了,感觉似乎可行。
找到一个类似的 https://gist.github.com/RhetTbull/1c34fc07c95733642cffcd1ac587fc4c
ericFork
2022-07-18 02:31:30 +08:00
@Jackhuang https://github.com/schappim/macOCR 这里有个带选区截图的样例
justin2018
2022-07-18 09:07:39 +08:00
smartdone
2022-07-18 10:49:49 +08:00
苹果的 ocr 是挺不错的,而且也就几行代码
LeeeSe
2022-07-18 12:39:33 +08:00
文本翻译可以参考软件 Bob 的思路,通过创建“快捷指令”,来实现本地翻译。
具体实现方法参考 Bob 官网
rming
2022-08-09 18:31:54 +08:00
根据你的需求,做了个类似的功能 https://github.com/baimiaoapp/baimiao-desktop

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/866867

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX