AI 驱动浏览器操作实现原理?

18 小时 13 分钟前
 molvqingtai

最近看到 google 的一个 AI 插件,可以让 AI 操作浏览器收集信息,对 AI prompt 了解甚少,对它的实现原理很感兴趣

插件视频: https://www.youtube.com/watch?v=2XJqLPqHtyo

1318 次点击
所在节点    程序员
7 条回复
clhcowboy
17 小时 54 分钟前
浏览器插件可以获取到你需要的信息
herich
17 小时 1 分钟前
比较关注的是 AI 驱动的浏览器能否高正确率的通过各种网站的 anti bot 机制
hongjic93
13 小时 24 分钟前
AI (文本加视觉模型)+ 浏览器自动化工具。

工具比如 browserbase: https://github.com/browserbase/stagehand
有用是有用,但可靠度要看不同厂商在对自家内容平台保护的力度。道高一尺魔高一丈
kulove
13 小时 20 分钟前
之前做过类似的 Demo ,读取 HTML 网页+截图来做的(单一的不准确),因为插件不能注入代码,所以封装了诸如点击、滚动、输入的各种事件,效果么还行,就是成本爆炸,所以没有上线。
lizhenda
11 小时 30 分钟前
一般是基于视觉,感觉成本很高啊。并且获得的数据准确性存疑。
YuanJiwei
10 小时 22 分钟前
哈哈,巧了,我现在正在探索利用 pupputeer 实现 Google Mariner 的各种方案
macaodoll
2 小时 59 分钟前
程序驱动浏览器有成熟的方案,只是难的是让模型读懂页面

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1099418

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX