V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  maolon  ›  全部回复第 1 页 / 共 12 页
回复总数  236
1  2  3  4  5  6  7  8  9  10 ... 12  
6 小时 54 分钟前
回复了 jolly336 创建的主题 人工智能 AI-关于移动端自验证能力的疑问?
@jolly336 你说的很有道理,如果要考虑泛化和可维护确实是一个挺难的问题,不过我觉得 runbook 的方法可能还是可行的(可以针对每个 app 一个 runbook ),从人维护变为使用 agent 来维护这个 runbook 里的路径,你只需要启发式的告诉这个维护 agent 需要检查哪些东西,甚至可以让他自行检查代码库和意图来写维护这个文档,人只做最终审核。
6 小时 58 分钟前
回复了 jolly336 创建的主题 人工智能 AI-关于移动端自验证能力的疑问?
@Dabney 对不起,没有啥最佳实践,只能算是在摸索这方面
12 小时 0 分钟前
回复了 287854442 创建的主题 Joe's Talk 🪐 一个大胆的预言:语音输入将成为绝对主流
这不是一个场景,我打字的时候我其实在脑子里在思考和调整思路和逻辑,并且很方便的来回修改,语音你再依赖 ai 语义理解,你在思路都没想好就说也说不出个什么所以然来,这不是准确度的问题而是使用习惯的问题
1 天前
回复了 jolly336 创建的主题 人工智能 AI-关于移动端自验证能力的疑问?
我最近在开发 app ,感觉最简单朴素也是最实用的方法,直接写一个 e2e run book 的 md 让他读这个 file 然后按照固定行为检查(调用模拟器的 mcp )。
另外 token 消耗这个问题基本无解,就算是现在配置过的 mcp 只返回文字 layout 和按钮 id ,在关键步骤他还是要截图然后 agent 这边读图,依然是很烧 token 的行为(不如说自动化测试就没有不烧 token 的),好消息是未来 token 会越来越便宜,变成随便烧也没事的状态
gemini 现在比别家遥遥领先的就一个能力:他多模态可以原生读视频,甚至可以通过 url 直接读 youtube 视频,如果有这方面需求他就是无可替代的
3 天前
回复了 levin56 创建的主题 Vibe Coding 现在 Agent 的写代码的成本不低啊
而且你这个计算的方法也有问题,用 agent 哪有直接算 api 价格的不都是用包月套餐/api 转发的?,要你这么算的话五个月用了五千多刀,我用的起么
https://i.imgur.com/LbzE5B2.png
another claude code wrapper ui/app?
所以 stackoverflow 就是这么被干死的:
一边是各种规矩一言不合 downvote/duplicate topic 的 toxic 人类,
一边是不论你问多小白多愚蠢都耐心解答的 ai

于是 stackoverflow 成功回到了他 2008 年的发帖量
7 天前
回复了 iso223 创建的主题 职场话题 刚出社会的学生能不能珍惜一下工作啊
我觉得还是要区分什么是卷和怠工的区别,这位老弟明显是在正常工作时间,正常的工作安排下故意拖时间不完成,拖慢团队进度而不是所谓的什么“不卷”。
我的提问就是难道你们团队不设置什么 kpi 或者 okr 的么?他这么弄一次不完成,两次不完成,你直接向上报告喜提 PIP 而不是观察半年才做艰难决定。
7 天前
回复了 yukinotech 创建的主题 程序员 请教一个 openspec 问题
1. 文档即代码,是的你的理解没错

2. spec 主要是充当计划的文件化索引。
你的 agent 开始工作的时候一般都会启动一个 planner 然后开始计划并拆分的任务,当前 agent 驱动的大模型上下文太短,所以我们会在工程化里大量使用 compact 系统(包含 tool compact, history summrization 这些功能),这些 compact 系统会压缩上下文,导致信息丢失,(比如一开始 planner 详细的规划了要实现哪些细节需求,而在多次 compact 后这些细节丢失了),然后 agent 就会开始自由发挥。
如果我们了解 compact 的工作原理就会发现,比如 tool compact 是将 tool 返回的结果存在一个文件里(比如 xxx.log )然后将上下文里 tool 调用的那一条 message 改为 {is_compacted:true, file_path:"xxx.log"},那么如果 agent 需要重新查看之前的结果,他就能通过读取 file 无损的调用回 tool 的返回内容。
spec 也是同理,它充分利用了 agent 的 compact 系统会最大程度保留文件 path 的特性,从一开始就文件化了 planner 输出的细节,在多次 compact 后虽然需求被多次压缩损失,但是只要这个文件索引地址还在,agent 就能在需要的时候重新读取细节,从而保证在多任务,很长的工作流程里,细节和讨论的一致性,这就是 spec 的目的

3. 这是自主性的问题,你希望 agent 拥有多少自主权利,比如你允许他部分 design 一些页面的组件吗,还是你一点自主性都不允许,这是你对项目的预期和控制问题,不是 spec 的问题
8 天前
回复了 MiHwAppleTslFan 创建的主题 咖啡 想买个全自动咖啡机,有没有推荐的
德龙的没毛病,我现在就在用,而且全自动出品全靠豆子,选对豆子比调参数重要多了,另外比起飞利浦的机芯德龙的机芯清理起来简单的多
11 天前
回复了 greentim 创建的主题 分享创造 AI 投资预测的将来
{
"detail": "用户名或密码错误"
}
@deeswoo 而且看这人说话怎么一股子 ai 味 连是不是人都不知道
a2ui,谷歌提出的新范式 https://a2ui.org/ ,然后可以搭配 copilot kit 使用 https://www.copilotkit.ai/
15 天前
回复了 c9792536451 创建的主题 Apple 没有人讨论苹果 AI 将和 Gemini 合作吗
其实苹果跟 google 合作然后使用 gemini 确实比较稳,
一是 gemini 目前是多模态能力最强的模型,特别是能原生读视频,和苹果的场景配合更好,
二是 gemini 还有个优势就是他的推理速度够快,flash 这个等级的模型能去到 > 200t/s 的速度,0.3s 的 ttft ,lite 这个等级的就更快了,能去到 > 500t/s 的速度,也是 0.3 ttft, 苹果这个相机键长按启动,快问快答的多摸态场景明显是更加合适的,我觉得苹果应该会主力使用 lite 这个级别的模型以取得最佳的 cost efficiency
现在都说是搭配好用,很多人方案都是 opus 4.5 写,gpt5.2 high/xhigh review ,我是喜欢开一堆窗口让他自己搞,搞完跟我报告结果就行了,争取一次性过关所以还是 codex 在我这好用些, 前端搭配 gemini cli 和 gemini 3 pro (只做单文件/单任务修改)
skill 分不分享和你说的事有一毛钱关系?
skill 是你自己的知识和流程沉淀, 你这话说的就像是
“我写代码有套自己独门方法可千万别给我老板知道了,不然传给公司里其他人他们会卷死我”
18 天前
回复了 guotie 创建的主题 程序员 大模型写的代码几乎一摸一样
反正国产这些开源的模型训练的数据一部分是御三家蒸馏来,比如让 sonnet 或者 opus 模拟思维链或者直接交给他一个工程任务然后将他的解决步骤输出作为训练集,那学生像老师不是很正常么
@lkk #24 我记得之前有个不怎么严谨的词法分析 deepseek 是 r1 还是啥的吐词和 gemini 2.5 pro 非常像的,这几家闭源的烧几十上百亿美金,你这边花个几万美金 api 的钱轻轻松松蒸馏,转头说我们训练只用了几千万人民币,换我是谷歌我也恶心
1  2  3  4  5  6  7  8  9  10 ... 12  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4714 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 36ms · UTC 09:58 · PVG 17:58 · LAX 01:58 · JFK 04:58
♥ Do have faith in what you're doing.