岗位职责: 1.理解业务的场景问题并规划大模型技术解决方案,包括数据处理、模型优化、数据评测等: 2.使用 pre-train 、PEFT 、SFT 、RLHF 等大模型优化技术,深度优化场景问题中的大模型效果 3.使用数据去噪、知识增强、知识外挂等技术,缓解或消除业务应用中的大模型幻觉现象, 4.基于大模型技术构建医疗领域的应用服务,解决业务中的场景问题并提升业务价值 岗位要求: 1.计算机、数学或统计学相关专业的硕土及以上学历,精通 pytorch 、tensorflow 等至少 1 种深度学习框架,具有 3 年以上 NLP 相关工作经验 2.精通 attention 、transformer 及其变型,能熟练应用预训练、PEFT 、SFT 、RLHF 等各种优化技术 3.款悉业界领先的大模型系列,包括但不限于 GPT 、LLaMAGLM 、Bloom 等,对 DeepSpeed 、Megatron-LM 有一定了解和使用经验: 4 在大模型方有高质量 (ACL 、EMNLP 、AAAI 等)论文或开源项目产出者优先 5.自驱力强、结果导向,有良好的协同能力,富有想象力和创造力。
岗位要求:P6 、P7 、P8 都有需求,硕士及以上学历,关注 NLP 、大模型算法人选