@
coefuqin 首先感谢你的指点,确实对于大模型内部的细节和模型能力本身的迭代演进方面了解不多,这方面确实受限于当前的视野所约束。这里想表达的是,作为一名非大模型领域的人员,当前的 AI 和之前有什么区别,以及站在当前我们应该要做什么,特别是作为一个互联网的工程同学。
我觉得去和专业的大模型算法去拼算法的网络结构和训练细节,并不是我们所擅长的,特别是从事互联网工程很多年的同学,所以作为这样一个角色,站在当前这个环境下,我们应该做什么是我想阐述的。
当然我觉得随着未来模型能够被规模化的应用,覆盖更多的场景。posttrain 会是比较关键的,包括前段时间 deepseek 的出现,也体现出了 RLHF 的重要性,包括采用什么策略进行 RLHF (是 REFL 还是 DPO ,还是 deepseek 提出的 GRPO ),怎么进行好的 SFT 或者 RLHF ,都和更加高质量的数据相关,或者说针对未来要进行垂类的精调,是要有更好的垂类行业数据,这样可以提升模型对垂类行业的理解和模型结果的准确率。而对比 pretrain ,可能会趋于收敛,受限于它本身的训练成本很大,对比 posttrain ,pretrain 更多的是让模型具备更大的上线去提供后续模型能力的无限可能。所以如果未来能够提供更加低成本和更加高效的 posttrain 基建,加上可以快速收集整理垂类行的高质量数据,可以加速模型在各行业的高质量落地。