V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
qm
V2EX  ›  程序员

AI Agent 是不是新瓶装旧酒的一个概念

  •  
  •   qm · 1 天前 · 1614 次点击

    按照我个人理解,AI Agent 干的事情就是把一个复杂的任务拆分成多个步骤,然后串起来,只是这些步骤里某一些步骤需要调用大模型来做输出。

    然而,其实我们任何一个程序都是在干这个事情,比如你打开淘宝,淘宝后台的入口服务(或者叫 Agent 吧)在获取到你的请求信息之后,可能去数据库里查询你的注册信息,然后调用商品推荐服务拉取到商品 ID 列表,接着根据这些 ID 列表调用商品详情服务获取的商品的各种数据,最后给客户端回包。

    所以 这个 AI Agent 是不是就一个概念?

    当然还有另外一种理解,上面举例的 Agent 是死板固定的 Agent 、没有任何智能;理想态的 Agent 是真正有思考规划能力的,只需要给它一个一句话的任务,它能真正地分解任务、而不是靠预先设置好的逻辑( if else 等)分解任务。但是这种 Agent 目前真的出现了么?哪怕有一个真正初具智能的呢?

    18 条回复    2025-11-20 18:56:09 +08:00
    Rickkkkkkk
        1
    Rickkkkkkk  
       1 天前
    你感觉 LLM 是 if-else 吗?
    Eins
        2
    Eins  
       1 天前
    看来没理解 LLM 最基本的逻辑和能力,用硬编码的逻辑看 agent ,似乎是成立的,但这只是 agent 的一种表象的执行逻辑,背后的运行逻辑已经不是硬编码了,而是一种决策能力。我猜提这个问题没有问过 ai 吧
    bwnjnOEI
        3
    bwnjnOEI  
       1 天前 via iPhone
    上面那个不叫事件驱动吗?现在的 agent 固定的 workflow 模式比较成熟了没什么难度。你说的后者属于 orchestrator 模式本质也算 workflow 但是 rl 训练可以规划推理检索,比较成熟的应用的是 deepresearch 。以上都是需要你主动提问,目前自主的 agent ,比如实时运行的个人助力,应该还不存在。
    liyafe1997
        4
    liyafe1997  
       1 天前
    你理解得基本没错,所谓 Agent/MCP 就是一套提供给 LLM 调用的 API ,它生成请求来调用,调用的结果说白了就是生成一堆 prompt 喂回给它。
    说白了抽象理解大概就是 AI 生成一堆函数调用的代码,然后执行,然后把执行结果在下一次 prompt 中喂回去,如此循环。
    lscho
        5
    lscho  
       1 天前
    “理想态的 Agent 是真正有思考规划能力的,只需要给它一个一句话的任务,它能真正地分解任务”

    现在各大 ai 编辑器的 plan 模式不就是这样吗?比如 cursor 的 plan 模式,trae 的 solo 模式,都可以分解任务了
    maolon
        6
    maolon  
       1 天前   ❤️ 2
    你这个理解是 workflow 而不是 agent ,建议看看 anthrophic 的 agent 定义 https://www.anthropic.com/engineering/building-effective-agents
    crocoBaby
        7
    crocoBaby  
       1 天前 via iPhone
    我个人理解是对比传统写的请求信息,多了根据向量数据判断权重,比如根据当前客户的画像调整请求返回的数据
    archxm
        8
    archxm  
       20 小时 16 分钟前 via Android
    一切都是为了麻痹你,让你有辛福感
    vikim
        9
    vikim  
       18 小时 38 分钟前
    废话不多说, 是
    用了这久, 相当于就是给 AI 一个 api 接口而已, 其余的功能上有多牛掰 纯属胡扯 当然胡扯出新高度了 也是牛
    yh7gdiaYW
        10
    yh7gdiaYW  
       17 小时 48 分钟前
    不算旧瓶装新酒,是真有新东西的,解决了"允许用户用任何喜欢的描述方式提问"的实现。在 Agent 之前,这种功能只能按某种解析规则 if else 匹配到预设的工作流上
    w0017
        11
    w0017  
       16 小时 53 分钟前
    整个世界都是分类任务
    xyooyx
        12
    xyooyx  
       16 小时 46 分钟前
    这里面有一个核心是把“下一步做什么”交由给 AI ,这一步如果没有做,那就是“新瓶装旧酒”
    visper
        13
    visper  
       16 小时 34 分钟前
    agent 不就是把大模型和调用工具的能力合起来当成一个概念吗? 最开始技术上叫 function calling 好像。
    tamshy
        14
    tamshy  
       16 小时 32 分钟前
    一个是让你直接给妙瓦底转 30 万。另一个是编排一堆自动化脚本+剧本 最后你心甘情愿转了 30 万
    goodboy95
        15
    goodboy95  
       15 小时 12 分钟前 via Android
    真做 agent 的肯定都是做你那个“理想态”,比如 roo code 的 orchestrator 模式,或者 manus 、openai agent 那些。
    qm
        16
    qm  
    OP
       10 小时 53 分钟前
    @liyafe1997 LLM 和 Agent 的调用关系:是 LLM 调用 Agent 还是 Agent 调用 LLM 呢?
    liyafe1997
        17
    liyafe1997  
       10 小时 9 分钟前
    @qm 更多是 LLM 调用 Agent ,但理解成互相调用也没错,Agent 生成 prompt ,这不也是调用 LLM 吗
    qm
        18
    qm  
    OP
       9 小时 22 分钟前
    @liyafe1997 如果把 LLM 理解成纯粹的模型,这个模型 infer 过程中,本身其实没有办法去做外部网络的调用事情,那如果要做这个事情,得是 LLM 周边的系统,那么这个周边的系统其实就是 Agent 的一部分了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   910 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 20:18 · PVG 04:18 · LAX 12:18 · JFK 15:18
    ♥ Do have faith in what you're doing.