V2EX › maolon 的所有回复 › 第 5 页 / 共 15 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6 7 8 9 10 ... 15

❮

❯

1 月 6 日

回复了 NakanoAzure 创建的主题 › Google › NotebookLM 怎么解析没有字幕的视频链接啊？

用 gemini app/ai studio 总结，notebook lm 暂时还不支持原生读视频但是 gemini app 支持

1 月 1 日

回复了 BearCookie 创建的主题 › Claude › 请问使用 Claude Code 的话，是不是直接上 Open Spec 用就好了哇？

openspec 适合改现有大项目以及和别人合作同一个项目，
然后 cc 上下文太短（加上最近疑似 opus 也 quant 了），codex 的 5.2 xhigh/high 会好很多
另外我现在就跟楼上提到一样是将 openspec skill 化，由 codex 自己决定什么时候执行他，效果就挺好

2025 年 12 月 24 日

回复了 Zhipuai 创建的主题 › 程序员 › GLM-4.7 上线并开源：更强的编码

先不说别的了，你们在 V2 的 AMA 一言不发搞了个寂寞？你们之前说的抽奖抽了吗？结果是什么？
就纯搞宣发把 v 友当傻子耍？

2025 年 12 月 21 日

回复了 Msxx 创建的主题 › 程序员 › 是我的错觉吗？感觉 Gemini 是个患有健忘症的玩意儿

@neteroster 2.5 pro 也经历过大砍，最开始的 0325 有效注意力可以到 200k 左右，然后被永久下架之后，后续的 0506 甚至连 50k 都做不到,0605 稍稍好一些也是 100k 左右的注意力。谷歌是老惯犯了，所以 gemini 系列模型的 coding agent 能力我一直是质疑的

2025 年 12 月 17 日

回复了 asd999cxcx 创建的主题 › 程序员 › 你们 codex 一般都开啥等级？

5.2 xhigih/high 这次是真的从懒惰的 5.1 里解脱了，一次能跑 3 个小时不带停的

2025 年 12 月 3 日

回复了 weixind 创建的主题 › 程序员 › 讨论下 AI 时代的软件架构与协作关系的几个可能的变化

基本同意
细粒度的 ddd 带来的主要是 context control 的好处，
生成工具我认为他们依然能提供生成 ground truth 的能力，交互化和添加 context 控制功能也是一种方向，
自动化测试现在 e2e 方向的能力依然有限（受限于多模态和 context 长度限制）但是未来肯定会变得非常可用，
我觉得“语义知识库”是个很好的概念，现在基于文档的 SDD 应该是很早期的语义库的版本，应该会过渡到基于语义知识库的版本控制，协同编辑，和开发，以及围绕这个的一系列工程化的经验和方法。应该很快就是文档即代码的时代了。
以及随着人-AI 的合作进一步加深，目前的管理体系肯定会随着变化，现在的人和人的交流拟定方案再到人翻译给 ai ，等待 ai 执行，评估结果再交由人类审核，然后重新规划的模式并没有充分利用 ai 的能动性

2025 年 12 月 3 日

回复了 YanSeven 创建的主题 › 程序员 › DeepSeek-V3.2 好像热度不高啊

因为他还叫 v3.2 ，而 3.2 exp （预览版）实际九月底就发了，另外他虽然宣传里 benchmaxxxx ，也不是每个 bench 都非常好
https://i.imgur.com/4rDZmLb.png

2025 年 12 月 3 日

回复了 liuliuliuliu 创建的主题 › 程序员 › 时至今日，似乎还办法从 figma 设计图像素级的生成代码？这不应该是 AI 擅长领域吗？

我现在跟我们 ui 合作就是让她直接出 gemini 的 prototype ，绕过 figma 那步，人还觉得比让她做 figma 更省时间

2025 年 12 月 3 日

回复了 wilddog 创建的主题 › 程序员 › github copilot 提供的免费模型里面，哪个模型的代码能力更好一点？

都不怎么样，用这些还不如直接用国产模型（自己接 api ），现在国产这些不是在搞活动 coding plan 20 块一个月？

2025 年 12 月 1 日

回复了 Saunak 创建的主题 › 程序员 › gemini3 pro 对比 ChatGPT plus

@sunzhuo 那影响非常大了，免费版和付费版不是一个东西，付费版不强制 thinking 模式和强制 thinking 模式也不是一个东西

2025 年 12 月 1 日

回复了 Saunak 创建的主题 › 程序员 › gemini3 pro 对比 ChatGPT plus

我可能跟你的感觉刚好相反，最近在写综述，gemini 给出的东西不论是是不是 deep research 模式都依然没法用，跟 5.1 pro 出来的结果差很远。
他可能在理解单篇文章方面做的更好，但是一旦你需要的是深入调查一个领域，gemini 给出的准度和信源都不行

2025 年 11 月 29 日

回复了 LittleYe233 创建的主题 › 程序员 › 感谢华为，又打钱 1 万，美滋滋

怪不得现在华为在拒绝同类应用上架，原来是这么玩坏的

2025 年 11 月 28 日

回复了 Zhipuai 创建的主题 › 推广 › [黑五特惠] GLM Coding 年付季付 7 折，邀人返利高达 40%！🎁 盖楼送 MAX 会员

确实是国产里 agent 能力做的最好的（目前），主要还是足够便宜，和最前沿的 opus 4.5, codex max 这些有距离，但是和次一档的上一代模型比如 sonnet 4.1 没有什么太大的距离

zai id: 25861764282185516

2025 年 11 月 26 日

回复了 JustinL 创建的主题 › OpenAI › 如果只能选一个 AI 订阅，现在这个时间点（2025-11-26）选哪一个最好？

谷歌可以学生白嫖一年，最近给 c 端用的产品 app/网页版改进不少，特别是 canvas 非常实用，可以考虑试试
毛病就还是老毛病，gemini 模型指令遵循有问题而且懒，搜索随便搜两个就给结果，deep research 也是完全不跟着要求来做，这点还是 gpt 做得好所以现在我都是双持用

2025 年 11 月 25 日

回复了 edg 创建的主题 › 程序员 › Java 端怎么弄大模型的长期记忆

长期记忆一般分为几种做法
1. 个人 profile ，这种提取信息结构化存 json ，一个用户有且只有一个，读的时候固定读取，用 rdb 就行了
2. 知识库/摘要信息，这种就是你现在用 es 在做的事，但是更常见的做法是存 vector db(然后走 rag 那一套),或者走 graph db 那一套（知识提取为三元组，具体看是哪种类型的知识),这两种市面上都有很多开源库的实现
3. 行为记忆/日程，也就是最近有什么 events/日程之类的，一般用于 recall 用户最近行为（而且需要准确 recall ），很多人会把这个功能合并到知识库里（但是这种一般是 time sensitive ，所以直接合并知识库其实不是特别好管理）

然后在此之上，就是记忆的读取/业务层，比如语义检索，关键字检索，retreive ，trim, summary function 之类的东西，这个看你们业务怎么做了，都是自由发挥

记忆读取出来都是拼接回当前的 context 内（你可以简单理解为 prompt ，但是我更愿意叫他 context ），然后调用模型 api

2025 年 11 月 25 日

回复了 kianwww 创建的主题 › 分享创造 › 用 Gemini 3 做了个小玩具：用模拟相机在 Google 街景中练习摄影

要不干脆改成 retro 相机或者 lowfi 风格算了？
这样也不用你费时费力再接一个高清化模型，风格化也挺酷的

2025 年 11 月 25 日

回复了 shylockhg 创建的主题 › 随想 › 最近看了所谓的太空数据中心训练 AI 有点想法

最大问题难道不是散热么
你太空中散热只能靠真空热辐射，你要搞多大的散热板才能撑得起你这个服务器？

2025 年 11 月 20 日

回复了 raw0xff 创建的主题 › 程序员 › gemini3 做推广了？

蹭热点不是么，要说推广现在主流社交平台上 ai 相关都是 gemini3 刷屏，reddit 上也是狂呼 "前端已死""openai 已死", 这玩意儿是自带流量的

2025 年 11 月 20 日

回复了 BigChengzi 创建的主题 › Claude › Claude 真的好用吗？

你如果觉得国产模型已经很好用了，尤其是用 deepseek 都没问题，
那说明你现在的工作内容根本不需要用到 claude 也不需要 cli coding agent

2025 年 11 月 20 日

回复了 Kelly00 创建的主题 › Google › gemini3 真有那么神吗

3.0 preview 现在模型本身肯定有点问题，指令遵循在 9w tokens 之后就开始失效了，他会开始自由发挥，
大多数的评测和自己的测试都是短 context 测试，一个 case 一个 context 所以这种效应不明显，一旦进入大代码库的实际场景这种问题就会开始凸显，
这也可以解释为什么现在各种评测显示 gemini3 最好的就是前端场景，因为就算他自由发挥了你也看不出大的问题（而且大部分这种测试都是从头构建的前端）

1 2 3 4 5 6 7 8 9 10 ... 15

❮

❯