V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  KaiWuBOSS  ›  全部回复第 1 页 / 共 5 页
回复总数  95
1  2  3  4  5  
@stone981023655 嗯 说到底 我还是认为这是个技术交流区,可是说实话,交流的少,关注这些的会比较多。我其实更想聊聊 这类产品有人做过没,坑有没有 ,怎么解决,比如我现在难点就是机制都测试通过了,但 swe 通过很低。没人能沟通交流,虽然已经 500 星了 ,但没人能帮我,只能自己和 ai 慢慢一个个 eval 去跑,找问题
@COW 其实这也是没办法的事情,坦白说 我对代码细节不了解,我用了两个月 vibe 我对大框架和一些专有名词能理解,但是具体用什么理论实现什么工程 只能依赖 ai 。所以 readme 你让我自己写 真的有点为难。
嗯 我持续学习,尽量后面能让读者都能读懂。
@AlexaZhou TSP 最有价值的场景是:多个 Agent 共享同一套工具、需要跨机器远程工具调用、工具层需要严格沙箱隔离(比如云端多租户环境)。kwcode 是本地单用户工具,这些场景都不适用。
什么时候 TSP 有价值
如果未来 kwcode 做云端多用户部署,多个用户的 agent 跑在同一台服务器上,需要严格隔离每个用户的文件系统——那时候 TSP 的沙箱机制就很有价值,值得引入。
我持续关注项目 谢谢提醒
@KingGaruda 对的 现在只针对 vibe code 。python 一个语言。
另外你的观察很准确,ground truth 的问题确实存在,
但飞轮的验证标准不是人工标注,而是 pytest——
代码跑绿就是客观的 ground truth ,这是工程上
可以自动化的。

关于元专家的问题,你说得对,任务划分和合并
不应该让 LLM 做,KWCode 里这些都是确定性代码
( Locator/TaskCompiler/Orchestrator ),
LLM 只做 Gate 分类和代码生成这两件工程做不到的事。

你的直觉是对的:能工程化的就工程化,
LLM 是最后的手段,不是第一个选择。
这正是这个架构的核心思路
@beiyanpiki 是的你提醒我了 不能为了做 swe 来做项目
@beiyanpiki 嗯 怪我 我太懒 让 ai 写帖子。下次一定好好审视。现在可以谈实现方面吗?你觉得哪些可能有机会能帮到这个项目吗?
@KingGaruda 谢谢提醒 我说下我的理解 你的理解建立在 react 框架下 框架调用大模型全流程实现任务。这个模式下小模型确实拉跨。但是我们换个框架呢?如果有套元专家组,他们把代码做了,llm 只做调用校正和测试。这个对 llm 要求就不那么高了。这个理论现阶段实现的项目很多了
@mowentian 哈哈 感谢大厂关注 已经有老师加我了
@repus911 我思路是 有一批能完成代码的专家 小 llm 只做分配工作 写路由的事 这样小模型就够了 难的就是专家和这套机制怎么能协调起来
@cxe2v 之前有过这个思路 但本地模型变成辅助项 简单任务自己做 难任务 api 做 好像有人这么做了 tok 省了 50%
@jukanntenn 嗯 我把所有原理的原文晚点加一下
@jukanntenn 我刚接触的时候 我还幻想搭建一个框架让 deepseek 跑出 opus 能力哈哈 还做了好久。
@CFM880 非常感谢,这个对我很有帮助: 仓库的 bugfix 流水线正好缺这个环节。 现在是 locator → generator → verifier ,verifier 失败后只有 Reflection ( LLM 猜根因)。加一个 Debug Subagent 就能在 verifier 失败后拿到真实运行时信息(变量值、异常堆栈、执行路径),而不是让 LLM 猜。
@kda1578888 这个 ui 好酷 在哪里可以看到?
@gbin 我现在难点是想问下有没有办法让他能像 cc 一样使用网络工具搜索、fetch 和归纳总结。现在搜索引擎是自己搭的臃肿不好用。
@cwcc 这个还是 react 框架吧,这个框架对开源模型最大的挑战是 llm 要完成所有工作。我希望设学习和效仿的是 moe 框架,就是 llm 做少量工作,让专家完成。所以我看这个项目我借鉴的太少了
@maix27 我真用,我指望他能替代我 5000 一个月的 opus 费用呢。
@maix27 嗯 是 mvp 专门说了 测试是少。我年纪大了 还有本职工作,确实没精力学。只能当兴趣玩玩了。
@maix27 我何止是差呀 我是压根不会呀 除了吐吐槽 哪有什么文字能力 。好的我去学习,不过我真的觉得懒,我觉得 ai 写得蛮好的 我学到头可能也写不出他那样水平 所以直接用了。另外你说的 readme 中文为啥写两遍,是我没删干净。待会去删。另外请问怎么参会 有报名链接吗?我就是觉得自己缺少圈子,做什么都只能自己干。
1  2  3  4  5  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2987 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 14:54 · PVG 22:54 · LAX 07:54 · JFK 10:54
♥ Do have faith in what you're doing.