陆陆续续花了上万 RMB ,攒了点心得,也攒了一堆困惑。
1 、MAX 和 HIGH 之间的边界,一直摸不太清。
不知道什么场景下用 HIGH 就够了。让它帮我调个版式,HIGH 确实 OK ,但聊着聊着就会延伸到架构、流程优化——那这时候我是不是得立马切 MAX ?大家遇到这种"任务中途升级"的情况,是怎么处理的?
2 、MAX 也并不是万能的。
大大小小的问题照样会出,尤其是面对复杂工程,或者它对别人写的引擎理解不到位的时候,反复出错,找不到根因,而且确实绕不过一些弯子,也找不到那些非常有"灵感"、比较 Hack 向的手法。
3 、可能之前对"Agent 全自动化流程"有个误解。
后来才意识到:Agent 参与的全自动化流程,本质上约等于人工参与的流程,它一样会犯错,一样需要兜底。所以我认为 Agent 更应该帮我沉淀出连 Agent 都不必介入的稳定 flow 。
4 、上下文( context )的重要性,远比我想象的更关键。
钱花到一定程度才愈发觉得 context 很混乱(我总是让 OPUS 自动帮我考虑 context 该如何优化)。尤其是 4.6 切到 4.7 这段时间,把之前的错误全部纠正了一遍,才意识到——也许我多花了 50% 的经费?
5 、多设备 / 多 Agent / 多 Session 协作方案,大家是怎么搭的?
我目前的配置是:Air 作为移动工作平台,办公室里 2 台 PC + 1 台 Mac mini ,4 台机器协同作业。想听听大家的架构和经验,有没有什么值得借鉴的玩法?
顺便,OPUS 真的太贵了,想转战性价比了,因为 context 、skill 都铺了个大概,现在也对 OPUS 顶配祛魅了。大家给点推荐!
模型像员工,我真不一定要溢价用最高级的。好的流程和规范,还是能让具备基本水平的 Agent 做出有价值的项目;而真正需要突破性能力的环节,当下所谓"顶配"模型其实也不见得比次一档高出多少。
(可能略显愚笨,望轻喷)
1
maocat 10 小时 55 分钟前
我只有 2 个经验:
1. 善用/compact xxx, 为接下来的工作做准备 2. 总结成功的动作,如获取 token 过程,项目运行重启方式等等 |
2
sddyzm PRO 我的使用经验:
1.想要更好的效果,等 2.没了 |
3
0x0x 10 小时 48 分钟前
陆陆续续花了上万 RMB ? 这是一直在用 api ?
大部分人没你玩的这么 6 ,只是单一设备通过 ai 来提效而已。 目前使用 opus 的主要一个比较好的体验是:通过 plan 指定好计划后,基本上能够正常跑完整个流程,同时最终的代码是可以直接编译的(不是没有 bug ,bug 还要 review 然后让 ai 继续修或者自己修) 其他的模型可能会偷懒,没有编译过就放弃了,然后继续修改代码。 最终的成品是无法编译的 |
4
jjymup1 10 小时 44 分钟前
我们都捡路边的垃圾吃,大佬是真大佬啊!!
|
5
sampeng 10 小时 16 分钟前 via iPhone
你要用 4.6 的关闭自动推断思考程度才有效,4.7 的 max 是路边一条。你试试 4.6 关闭了强制 max 和最大思考 token 。除了慢,还是我们熟悉的那个 opus
|
6
alexfu 1 小时 14 分钟前
最近 200 刀的 plan 4.7 都不够用 5 天就爆周限额 而且天天搁那 check malware 感觉是越来越拉了
同求便宜的替代 |