marquina 最近的时间轴更新
marquina

marquina

V2EX 第 460333 号会员,加入于 2019-12-20 11:41:56 +08:00
今日活跃度排名 11834
根据 marquina 的设置,主题列表只有在你登录之后才可查看
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
marquina 最近回复了
支持,祝未来找到满意的工作
4 天前
回复了 huiwancode 创建的主题 分享创造 开源版 Manus 项目代码拆解系列教程
简单看了下,感觉亮点主要是 ReAct 模式的落地 + 相对清晰的 Agent 代码模板。我感觉最大的瓶颈还是在 LLM 本身和人类发生的指令上。
平均每天 1-2 小时的阅读时间?
11 天前
回复了 klo424 创建的主题 Local LLM 求 DeepSeekR1 性价比硬件推荐
@terrysnake #46 笑死,非常真实
11 天前
回复了 klo424 创建的主题 Local LLM 求 DeepSeekR1 性价比硬件推荐
@klo424 #4 “查了一下 ktransformers 是框架?我需要硬件推荐。”
deepseek 和常规 llm 在架构上有较大差别(非常稀疏),而 llm 对硬件的要求相比常规应用又有较大区别。所以部署 deepseek 有多种推理方案:纯 CPU 、CPU/GPU 混合( ktransformers )、纯 GPU ,每种方案的硬件配置有很大差别。
但 OP 这种问法的话,我建议老老实实调 API 得了
23 天前
回复了 sumarker 创建的主题 北京 终于下定决心要结束北漂生活了
@chuugoku #112 公司操作就行,自己不用管
23 天前
回复了 sumarker 创建的主题 北京 终于下定决心要结束北漂生活了
@chuugoku #110 离职后公司会办理停缴手续,然后账户就是封存状态了
@marquina #9 说得不够准确,我举个例子。
现有的数据库,存放的都是结构化的数据,比如{"name": "xxx", "age": 25},而大模型的输出是人类对齐的自然语言,将这种结构化的数据作为大模型的训练语,就会极大干扰大模型的输出:比如日常聊天场景突然给你蹦出来半段 json 。

当然你也可以说,将所有的数据都按照非结构化的自然语言处理,直接扔给大模型。如果是这样的话,就算不考虑大模型的幻觉问题,光自然语言和结构化数据之间的信息差就足够头疼了。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4689 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 10:06 · PVG 18:06 · LAX 03:06 · JFK 06:06
Developed with CodeLauncher
♥ Do have faith in what you're doing.