AI 驱动浏览器操作实现原理？

18 小时 13 分钟前

molvqingtai

最近看到 google 的一个 AI 插件，可以让 AI 操作浏览器收集信息，对 AI prompt 了解甚少，对它的实现原理很感兴趣

1318 次点击

所在节点

7 条回复

clhcowboy

17 小时 54 分钟前

浏览器插件可以获取到你需要的信息

herich

17 小时 1 分钟前

比较关注的是 AI 驱动的浏览器能否高正确率的通过各种网站的 anti bot 机制

hongjic93

13 小时 24 分钟前

AI （文本加视觉模型）+ 浏览器自动化工具。

工具比如 browserbase： https://github.com/browserbase/stagehand
有用是有用，但可靠度要看不同厂商在对自家内容平台保护的力度。道高一尺魔高一丈

kulove

13 小时 20 分钟前

之前做过类似的 Demo ，读取 HTML 网页+截图来做的（单一的不准确），因为插件不能注入代码，所以封装了诸如点击、滚动、输入的各种事件，效果么还行，就是成本爆炸，所以没有上线。

lizhenda

11 小时 30 分钟前

一般是基于视觉，感觉成本很高啊。并且获得的数据准确性存疑。

YuanJiwei

10 小时 22 分钟前

哈哈，巧了，我现在正在探索利用 pupputeer 实现 Google Mariner 的各种方案

macaodoll

2 小时 59 分钟前

程序驱动浏览器有成熟的方案，只是难的是让模型读懂页面

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.