maolon 最近的时间轴更新
maolon

maolon

V2EX 第 442547 号会员,加入于 2019-09-22 10:16:39 +08:00
今日活跃度排名 7514
maolon 最近回复了
你需要这种要求就不要选 kimi, kimi 跟随人类指令的能力很差。以及楼上说的对,你真要做这种就前置一个意图识别,识别完再调用回答
kimi 跟随人类指令的能力相当差,优势只在超长上下文。 文心没怎么用不评价。
国内外一起算的话 qwen 应该是国产最强模型。yi 就一魔改 llama ,没啥前景。
deepseek 还有待进一步观察他那个 MHL 是否在回答质量上优于 MHA
2 天前
回复了 Hamao 创建的主题 程序员 咨询一个意图识别(向量检索)方面的问题
这场景不是更适合 sqlretriever 么,你的问题转化 sql 然后查询数据库。vector db 更适合搞知识库(比如问答 qa)查询。
当然你硬要这么搞也行,调整存到数据库的 a 的字段,尽量把信息搞的精简 比如类似 json 的那种格式 “商品名: acd, 价格: xxx, 生产公司: xxx,” 然后多余信息一点都不要给。
我之前做过一个查询工作的也是上面类似的思路
2 天前
回复了 KepaThings 创建的主题 Apple 怎么 vision pro 没啥讨论度了
本来就是苹果在公开卖开发机,怎么可能很火
接近是接近,推理和跟随用户指令上来说还是差点意思,中文能力更差点意思,另外用 groq 就可以了,个人用直接免费那一档不会超限制。
苹果的模型倾向就跟现在主流模型不同,
第一特别小 0.27b 0.35b 1b 和 3b 可以跑哪怕 4g 的内存里,其次他有自己的推理框架和压缩算法,这点上比安卓这边是个优势。
第二他估计是要搞 large action model ,也就是说只要能识别用户意图并操作用户手机执行操作就行了,不是我们一般意义上 all purpose 的 llm 大模型。传统功能的大模型应该他会放云端,也就是跟百度和谷歌合作那个
10 天前
回复了 devzhaoyou 创建的主题 React React 中添加、删除、变更子组件疑问
对 你这个要求直接拿 ref 搞是正确做法,实际上 react 对上 canvas 场景基本都是各种 anti-pattern 的 ref 乱飞搞定的
11 天前
回复了 serafin 创建的主题 Apple 买 M4 iPad 1TB 以下 建议等 6 月 WWDC 后再决定
你要是关注过的话就会发现苹果的模型是超小型模型,之前开源的模型是 0.27b 0.45b 1b 和 3b ,不量化都能在 8g 里跑, 更何况还有量化+llm in a flash 技术,把 cache 存到储存里。
苹果的目标显然是连 4g 设备都能一并支持的模型。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1186 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 23:45 · PVG 07:45 · LAX 16:45 · JFK 19:45
Developed with CodeLauncher
♥ Do have faith in what you're doing.