一个新的 AI in system 的概念,听听大家的想法

2023-10-10 10:09:31 +08:00
 dabingbing

这几个月都在接触 AI 的开发,就算自己用 AI 也是各种找,各种尝试。之前开发过一个 AI 机器人客服,是嵌入到任意网页中的那种。 突然冒出一个新想法了,就是 AI in system ,大致意思如下:

1.将 AI 触发融到各类 web 产品中,可能是个按钮,可能是个 icon 2.使用的时候,绑定 dom 即可,AI 按钮或者 icon 就可以出现 3.点击 AI 按钮或者 icon 的时候,就会弹出 AI 工具了 4.弹出的工具可能只干一件事,比如翻译,重写,也可能是一个工具面板,里面集成了一些功能可以选择 5.其实见过类似的面板,大多以浏览器插件的形式出现 6.我的想法是,将 AI 按钮或者 ICon 可以集成是任意 web 系统,只要懂前端开发,就可以将 AI 集成到自己的或者企业中的 web 中。 7.实际的开发过程,类似开发 jquery 插件,使用时,引入 JS ,之后配置一些参数,比如绑定的 dom ,样式,功能等

总之,理念就是 将 AI 这个功能,可以任意的,无限的集成到任何一个 web 系统中。

想听听 V 友们的想法

2293 次点击
所在节点    奇思妙想
15 条回复
ddosakurax
2023-10-10 11:00:12 +08:00
dabingbing
2023-10-10 11:09:15 +08:00
@ddosakurax 不是这个意思,你发的这种扩展挺多的了
sujin190
2023-10-10 11:22:29 +08:00
不是你说的什么翻译啥的要么读屏,要么网页通过 api 提供结构化数据,读屏这种高权限的显然不行吧,网页通过 api 提供结构化数据那和你一键引入相悖了吧,AI 的成本在数据和算力,不是在开发成本,你想的这个不是没人做确实意义不大,否则就是你看到的那种各手机厂商直接集成在操作系统里的
mmdsun
2023-10-10 12:53:14 +08:00
想法不错,可以做做看。

唯一缺点就是网页版功能有限。
像新版 Windows Copilot 集成系统里,能各种交互( https://b23.tv/9uj3FyD ),我倾向于做软件这种。
maolon
2023-10-10 13:12:30 +08:00
现在这种 llm ai 的关键不是怎么开发,开发已经很简便了 基本都是 no code/ low code 拖拽可以生成一个 app, 关键是怎么获取和处理数据然后 RAG ,如果是前端 sdk 那基本就只能读 dom 和 css 这局限性太大。
musi
2023-10-10 13:41:40 +08:00
首先你得先去备案
LavaC
2023-10-10 14:04:45 +08:00
让我想起 arc 最近新出的浏览器层级 ai 功能
8355
2023-10-10 14:28:54 +08:00
我理解你的意思,假设电脑有专用的 ai 算力芯片同时 AI 本身私有化部署是可行的,不然的话不是相当于把电脑的全部隐私发给对方同时还让对方学习以后长期应用在模型中,这是合理的吗肯定不是吧。
如果 ai 足够只能可以给她一定的权限让她优化电脑帮你查找/整理文件等等,甚至更高级的操作,可以通过 python 操作电脑达到你的目的,甚至可以 ai 代练帮你打游戏。
xiaoding
2023-10-10 15:18:21 +08:00
dabingbing
2023-10-10 17:51:23 +08:00
@musi 已经算法备案中。。。
dabingbing
2023-10-11 09:56:37 +08:00
@8355 你这个想法更牛逼了,我说的只是 web 端,说白了还是 http 方式的调用,不会用本机资源
cc666
2023-10-12 15:25:53 +08:00
我觉得你的想法可以理解为:为每一个 DOM 元素加一个 AI ENABLED 属性,和相关配置
想法:4.弹出的工具可能只干一件事,比如翻译,重写,也可能是一个工具面板,里面集成了一些功能可以选择。 这句话本身就是自相矛盾的,既然只做一件事,又怎样给选择?给我的感觉是既要简洁,又要可配置。既然如此,肯定是要用到你的框架和配置,这个工作量相比与直接定位自己的功能需求然后请求响应的后端接口相比工作量能小到哪儿去呢。
dabingbing
2023-10-12 17:22:07 +08:00
@cc666 4 的意思是,第一种情况比如说翻译,大概的 dom 结构应该是一个输入框,一个按钮,一个输出框,这个时候,配置这个按钮的功能为['翻译'],绑定输入、输出的 dom ,这个功能就是翻译了。 第二种情况,可能不是绑定到具体的某一个业务上,可能只是开启 AI 工具的一个按钮,这个按钮大概应该在一级或者二级的导航中的某个按钮上,在不绑定具体功能的情况下,弹出可能是一个面板,面板中包含了比如['翻译','对话','重写'] 这些功能。能想到的一些配置可能如下:config{
list:['翻译']
sourceDom:'#aa',
targetDom:'#bb',
}
或者不指定具体功能的面板
config{
list:[]
sourceDom:'#aa',
}
cc666
2023-10-13 09:23:23 +08:00
@dabingbing 好的,get 了,那就继续下一个问题,你的这个配置可能只解决了在哪个位置,启用了哪些功能这个问题,哪还有一个问题,除非你只允许使用自己的后端(这样往往发展不起来),用户肯定需要配置 AI 的 soruce ,然后用户肯定还要配置这个 AI 的 source 和你的框架的适配器,或者你的框架里需要提供开箱可用的适配器,我觉得前者的可行性更高一点,但是这个工作量比用户自己只专于自己的业务使用 AI 的 source 开发块多少呢?我不是 diss 你,我只是在问可能的问题,如果我是使用者我关心的问题
tikazyq
2023-10-13 14:17:13 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/980511

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX