我想实现一个监听电脑软件使用活动的工具,实时地获取屏幕上的信息。比如浏览器上当前的网页地址栏、浏览的文章、视频相关信息,其他软件诸如 vscode 当前的项目地址等等
这些需要一个通用的手段从画面中匹配、提取
文本提取可以用 ocr ,除此之外,我完全不懂 ai ,问问大家的看法🤔
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.