V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  maolon  ›  全部回复第 5 页 / 共 15 页
回复总数  294
1  2  3  4  5  6  7  8  9  10 ... 15  
1 月 6 日
回复了 NakanoAzure 创建的主题 Google NotebookLM 怎么解析没有字幕的视频链接啊?
用 gemini app/ai studio 总结,notebook lm 暂时还不支持原生读视频但是 gemini app 支持
openspec 适合改现有大项目以及和别人合作同一个项目,
然后 cc 上下文太短(加上最近疑似 opus 也 quant 了),codex 的 5.2 xhigh/high 会好很多
另外我现在就跟楼上提到一样是将 openspec skill 化,由 codex 自己决定什么时候执行他,效果就挺好
2025 年 12 月 24 日
回复了 Zhipuai 创建的主题 程序员 GLM-4.7 上线并开源:更强的编码
先不说别的了,你们在 V2 的 AMA 一言不发搞了个寂寞?你们之前说的抽奖抽了吗?结果是什么?
就纯搞宣发把 v 友当傻子耍?
2025 年 12 月 21 日
回复了 Msxx 创建的主题 程序员 是我的错觉吗?感觉 Gemini 是个患有健忘症的玩意儿
@neteroster 2.5 pro 也经历过大砍,最开始的 0325 有效注意力可以到 200k 左右,然后被永久下架之后,后续的 0506 甚至连 50k 都做不到,0605 稍稍好一些也是 100k 左右的注意力。谷歌是老惯犯了,所以 gemini 系列模型的 coding agent 能力我一直是质疑的
2025 年 12 月 17 日
回复了 asd999cxcx 创建的主题 程序员 你们 codex 一般都开啥等级?
5.2 xhigih/high 这次是真的从懒惰的 5.1 里解脱了,一次能跑 3 个小时不带停的
基本同意
细粒度的 ddd 带来的主要是 context control 的好处,
生成工具我认为他们依然能提供生成 ground truth 的能力,交互化和添加 context 控制功能也是一种方向,
自动化测试现在 e2e 方向的能力依然有限(受限于多模态和 context 长度限制)但是未来肯定会变得非常可用,
我觉得“语义知识库”是个很好的概念,现在基于文档的 SDD 应该是很早期的语义库的版本,应该会过渡到基于语义知识库的版本控制,协同编辑,和开发,以及围绕这个的一系列工程化的经验和方法。应该很快就是文档即代码的时代了。
以及随着 人-AI 的合作进一步加深,目前的管理体系肯定会随着变化,现在的人和人的交流拟定方案再到人翻译给 ai ,等待 ai 执行,评估结果再交由人类审核,然后重新规划的模式并没有充分利用 ai 的能动性
2025 年 12 月 3 日
回复了 YanSeven 创建的主题 程序员 DeepSeek-V3.2 好像热度不高啊
因为他还叫 v3.2 ,而 3.2 exp (预览版)实际九月底就发了,另外他虽然宣传里 benchmaxxxx ,也不是每个 bench 都非常好
https://i.imgur.com/4rDZmLb.png
我现在跟我们 ui 合作就是让她直接出 gemini 的 prototype ,绕过 figma 那步,人还觉得比让她做 figma 更省时间
都不怎么样,用这些还不如直接用国产模型(自己接 api ),现在国产这些不是在搞活动 coding plan 20 块一个月?
2025 年 12 月 1 日
回复了 Saunak 创建的主题 程序员 gemini3 pro 对比 ChatGPT plus
@sunzhuo 那影响非常大了,免费版和付费版不是一个东西,付费版不强制 thinking 模式和强制 thinking 模式也不是一个东西
2025 年 12 月 1 日
回复了 Saunak 创建的主题 程序员 gemini3 pro 对比 ChatGPT plus
我可能跟你的感觉刚好相反,最近在写综述,gemini 给出的东西不论是是不是 deep research 模式都依然没法用,跟 5.1 pro 出来的结果差很远。
他可能在理解单篇文章方面做的更好,但是一旦你需要的是深入调查一个领域,gemini 给出的准度和信源都不行
2025 年 11 月 29 日
回复了 LittleYe233 创建的主题 程序员 感谢华为,又打钱 1 万,美滋滋
怪不得现在华为在拒绝同类应用上架,原来是这么玩坏的
确实是国产里 agent 能力做的最好的(目前),主要还是足够便宜,和最前沿的 opus 4.5, codex max 这些有距离,但是和次一档的上一代模型比如 sonnet 4.1 没有什么太大的距离

zai id: 25861764282185516
谷歌可以学生白嫖一年,最近给 c 端用的产品 app/网页版改进不少,特别是 canvas 非常实用,可以考虑试试
毛病就还是老毛病,gemini 模型指令遵循有问题而且懒,搜索随便搜两个就给结果,deep research 也是完全不跟着要求来做,这点还是 gpt 做得好所以现在我都是双持用
2025 年 11 月 25 日
回复了 edg 创建的主题 程序员 Java 端怎么弄大模型的长期记忆
长期记忆一般分为几种做法
1. 个人 profile ,这种提取信息结构化存 json ,一个用户有且只有一个,读的时候固定读取,用 rdb 就行了
2. 知识库/摘要信息,这种就是你现在用 es 在做的事,但是更常见的做法是存 vector db(然后走 rag 那一套),或者走 graph db 那一套(知识提取为三元组,具体看是哪种类型的知识),这两种市面上都有很多开源库的实现
3. 行为记忆/日程,也就是最近有什么 events/日程之类的,一般用于 recall 用户最近行为(而且需要准确 recall ),很多人会把这个功能合并到知识库里(但是这种一般是 time sensitive ,所以直接合并知识库其实不是特别好管理)

然后在此之上,就是记忆的读取/业务层,比如语义检索,关键字检索,retreive ,trim, summary function 之类的东西,这个看你们业务怎么做了,都是自由发挥

记忆读取出来都是拼接回当前的 context 内(你可以简单理解为 prompt ,但是我更愿意叫他 context ),然后调用模型 api
要不干脆改成 retro 相机或者 lowfi 风格算了?
这样也不用你费时费力再接一个高清化模型,风格化也挺酷的
2025 年 11 月 25 日
回复了 shylockhg 创建的主题 随想 最近看了所谓的太空数据中心训练 AI 有点想法
最大问题难道不是散热么
你太空中散热只能靠真空热辐射, 你要搞多大的散热板才能撑得起你这个服务器?
2025 年 11 月 20 日
回复了 raw0xff 创建的主题 程序员 gemini3 做推广了?
蹭热点不是么,要说推广现在主流社交平台上 ai 相关都是 gemini3 刷屏,reddit 上也是狂呼 "前端已死""openai 已死", 这玩意儿是自带流量的
2025 年 11 月 20 日
回复了 BigChengzi 创建的主题 Claude Claude 真的好用吗?
你如果觉得国产模型已经很好用了,尤其是用 deepseek 都没问题,
那说明你现在的工作内容根本不需要用到 claude 也不需要 cli coding agent
2025 年 11 月 20 日
回复了 Kelly00 创建的主题 Google gemini3 真有那么神吗
3.0 preview 现在模型本身肯定有点问题,指令遵循在 9w tokens 之后就开始失效了,他会开始自由发挥,
大多数的评测和自己的测试都是短 context 测试,一个 case 一个 context 所以这种效应不明显,一旦进入大代码库的实际场景这种问题就会开始凸显,
这也可以解释为什么现在各种评测显示 gemini3 最好的就是前端场景,因为就算他自由发挥了你也看不出大的问题(而且大部分这种测试都是从头构建的前端)
1  2  3  4  5  6  7  8  9  10 ... 15  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5943 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 03:05 · PVG 11:05 · LAX 20:05 · JFK 23:05
♥ Do have faith in what you're doing.