maolon 最近的时间轴更新

maolon

V2EX 第 442547 号会员，加入于 2019-09-22 10:16:39 +08:00

今日活跃度排名 7514

maolon 提问技术话题好玩工作信息交易信息城市相关

maolon 最近回复了

1 天前

回复了 teli 创建的主题 › 分享创造 › 如何设计提示词，让 ai 不给非处方药建议？

你需要这种要求就不要选 kimi, kimi 跟随人类指令的能力很差。以及楼上说的对，你真要做这种就前置一个意图识别，识别完再调用回答

1 天前

回复了 teli 创建的主题 › 程序员 › 瞎扯大模型，文心一言和 kimi，应该押注哪一个？

kimi 跟随人类指令的能力相当差，优势只在超长上下文。文心没怎么用不评价。
国内外一起算的话 qwen 应该是国产最强模型。yi 就一魔改 llama ，没啥前景。
deepseek 还有待进一步观察他那个 MHL 是否在回答质量上优于 MHA

2 天前

回复了 Hamao 创建的主题 › 程序员 › 咨询一个意图识别(向量检索)方面的问题

这场景不是更适合 sqlretriever 么，你的问题转化 sql 然后查询数据库。vector db 更适合搞知识库(比如问答 qa)查询。
当然你硬要这么搞也行，调整存到数据库的 a 的字段，尽量把信息搞的精简比如类似 json 的那种格式 “商品名: acd, 价格: xxx, 生产公司: xxx,” 然后多余信息一点都不要给。
我之前做过一个查询工作的也是上面类似的思路

2 天前

回复了 KepaThings 创建的主题 › Apple › 怎么 vision pro 没啥讨论度了

本来就是苹果在公开卖开发机，怎么可能很火

9 天前

回复了 idblife 创建的主题 › MacBook Pro › 想整台 macbook pro 跑 llama3 70b，请问用啥配置合适？ M3 max 128G？

接近是接近，推理和跟随用户指令上来说还是差点意思，中文能力更差点意思，另外用 groq 就可以了，个人用直接免费那一档不会超限制。

9 天前

回复了 dilidilid 创建的主题 › Apple › 为啥这么多人都觉得苹果会很快上马可用度很高的本地 LLM？

苹果的模型倾向就跟现在主流模型不同，
第一特别小 0.27b 0.35b 1b 和 3b 可以跑哪怕 4g 的内存里，其次他有自己的推理框架和压缩算法，这点上比安卓这边是个优势。
第二他估计是要搞 large action model ，也就是说只要能识别用户意图并操作用户手机执行操作就行了，不是我们一般意义上 all purpose 的 llm 大模型。传统功能的大模型应该他会放云端，也就是跟百度和谷歌合作那个

10 天前

回复了 devzhaoyou 创建的主题 › React › React 中添加、删除、变更子组件疑问

对你这个要求直接拿 ref 搞是正确做法，实际上 react 对上 canvas 场景基本都是各种 anti-pattern 的 ref 乱飞搞定的

11 天前

回复了 serafin 创建的主题 › Apple › 买 M4 iPad 1TB 以下建议等 6 月 WWDC 后再决定

你要是关注过的话就会发现苹果的模型是超小型模型，之前开源的模型是 0.27b 0.45b 1b 和 3b ，不量化都能在 8g 里跑, 更何况还有量化+llm in a flash 技术，把 cache 存到储存里。
苹果的目标显然是连 4g 设备都能一并支持的模型。

» maolon 创建的更多回复