macOS 技术栈下有什么可以高效的获取屏幕上内容的方法吗?

184 天前
 halowang1991

我在做一款 App ,我希望能截取整个屏幕后进行 OCR 功能。也就是说包括其他任意 App (进程)

我之前的做法是:

  1. 在光标周围置顶范围内截取屏幕
  2. 将截取的图片进行 OCR
  3. 每秒重复若干次上述操作

但是,总是截取鼠标附近的区域,获取的信息量太少。如果截取整个屏幕,电脑性能又吃不消

有什么开箱即用的,实时性高的 framework 可以解决这个问题吗?

在我看来,这个似乎有点像是实时语义分割?

562 次点击
所在节点    问与答
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1044815

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX