MidCoder 最近的时间轴更新

MidCoder

V2EX 第 551315 号会员，加入于 2021-07-20 11:45:33 +08:00

今日活跃度排名 21390

MidCoder 提问技术话题好玩工作信息交易信息城市相关

vibe coding 可能忘记了代码是需要持续维护的

程序员 • MidCoder • 51 天前 • 最后回复来自 gorira

大模型发展到当前，让我对事物的发展有一些体会

职场话题 • MidCoder • 80 天前 • 最后回复来自 littleW2B

» MidCoder 创建的更多主题

MidCoder 最近回复了

73 天前

回复了 song3286791241 创建的主题 › 分享创造 › 浙大学生创业，求各位大佬指点

是有基于垂类数据做了模型的 finetune 吗？我前段时间也有一个类似的想法，今年在视觉类的生成大模型方向各个厂商都有比较多的发力，不管是国内、还是国外都有比较不错的模型公布出来，但是作为非视觉专业的用户，如何让模型生成效果、内容上更好的视频/图片内容，这里有一个空隙需要去填补，这个就是 PE ，如何提供不同垂类的 PE 能力，去优化更加符合视觉大模型理解的提示词。

73 天前

回复了 bmpidev2019 创建的主题 › 分享创造 › 业余开发一年多，我是如何给策引做一个 DSL 策略引擎的

支持独立开发

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@pkoukk 我觉得不管是 langchain 还是 MCP ，他目的是解决模型无法实时感知世界的问题，因为模型训练是离线的，训练完之后，他的知识储备和具备的推理思维范围，取决于训练时数据快照。而 function call 和 MCP 等这些架构工具，都是去将模型能力和现实业务场景结合起来，将实际场景的上下文实时给到模型，利用模型推理和理解去解决业务场景的问题

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@coefuqin 感谢，我学习一下

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@murmur 但是对于真正专业的来说，还是无法被替代的，因为如果不够专业，也就写不出专业的提示词，写不出专业的提示词，模型也就无法真正的能够创作出高质量的内容。那些专业性不强或者创造性的确实会被容易替代

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@coefuqin 我觉得这个随着模型的迭代，这个应该是可以实现的，问题就是需要多久时间，这个是不确定的。就这个场景，在确定性指令的情况下，模型都应该是可以实现的，如果指令对应的场景是在现实生活中发生过的，并且可以被记录下来，那么都有可能被模型所学习到，这就是模型迭代学习的过程，通过不断加强数据的获取，确实随着时间推移，容易拿到的数据基本所剩无几了（其实现在基本到了这个阶段），后面可能就是需要结合知识性的数据去构造数据，甚至让模型自我去基于自己的输出数据去学习（其实 RLHF 也是这个过程）。现在比较难的是，模型要解决的问题域明确定义，或者是没有量化定义，所以总能举出一些反例来说明模型还不够聪明，但是这些反例放在发展的视角看，其实就是模型需要进行新的迭代的输入

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@coefuqin 认同，我觉得要试下跨时代的产品，就是需要大家想要的 AGI 的到来。但是过程中确实需要慢慢去迭代，更主要是这个过程更多的是一个定性的问题，并不是一个定量的问题。所以在很多事情上都是摸索着推进，这里包括数据获取、法律法规的演进等。基于当前的视角看，AI 结合场景在未来三年内能够做的事情是相对比较确定的；等到三年之后，可能模型的上线再次没打破，又会进入下一个新的阶段，或许就是这样一步步迭代出一个大家想要的跨时代技术（纯属个人乐观猜想）

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@coefuqin 首先感谢你的指点，确实对于大模型内部的细节和模型能力本身的迭代演进方面了解不多，这方面确实受限于当前的视野所约束。这里想表达的是，作为一名非大模型领域的人员，当前的 AI 和之前有什么区别，以及站在当前我们应该要做什么，特别是作为一个互联网的工程同学。
我觉得去和专业的大模型算法去拼算法的网络结构和训练细节，并不是我们所擅长的，特别是从事互联网工程很多年的同学，所以作为这样一个角色，站在当前这个环境下，我们应该做什么是我想阐述的。

当然我觉得随着未来模型能够被规模化的应用，覆盖更多的场景。posttrain 会是比较关键的，包括前段时间 deepseek 的出现，也体现出了 RLHF 的重要性，包括采用什么策略进行 RLHF （是 REFL 还是 DPO ，还是 deepseek 提出的 GRPO ），怎么进行好的 SFT 或者 RLHF ，都和更加高质量的数据相关，或者说针对未来要进行垂类的精调，是要有更好的垂类行业数据，这样可以提升模型对垂类行业的理解和模型结果的准确率。而对比 pretrain ，可能会趋于收敛，受限于它本身的训练成本很大，对比 posttrain ，pretrain 更多的是让模型具备更大的上线去提供后续模型能力的无限可能。所以如果未来能够提供更加低成本和更加高效的 posttrain 基建，加上可以快速收集整理垂类行的高质量数据，可以加速模型在各行业的高质量落地。

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@NoOneNoBody 赞同，因为思考本身没有标准答案，这个就不太好定义，不管现在各类评测维度怎么评，其实都无法定义一个模型绝对的好坏，所以可能这本身就是一个不断演进的一个问题，就像不断去开发一个大脑

84 天前

回复了 MidCoder 创建的主题 › 职场话题 › 大模型发展到当前，让我对事物的发展有一些体会

@wyntalgeer 我觉得真的到这个时候，单纯从技术角度看，已经发展到了足够成熟，能够达到人类对 AI 的预期。这个时候，我推测，是需要一些政治手段干预的，而不是单纯的只靠技术趋势去发展，因为技术本身不具备人性，他在这个社会更多的还是工具，怎么用好，是需要配合政治手段进行约束的。这是我的猜测，仅供参考

» MidCoder 创建的更多回复