独角兽

大模型数据科学家(数据清洗方向)

零一万物

北京数据分析社会招聘

岗位描述

负责设计和构建适用于大模型训练、SFT、RLHF、评测的数据合成体系,提升模型泛化能力与对齐质量;主导高质量指令、对话、多轮交互、代码、图文等数据的合成策略设计与落地;构建自动化数据生成框架,探索基于Prompt、模型自生成和知识引导的数据生成技术;基于实验数据进行分析评估,优化数据分布、难度层次与任务覆盖面,提高训练效率与效果;跟踪大模型数据合成前沿研究并推动落地创新;与模型研发、评估、安全等团队协同,保障数据合成链路的高质量、可控性与安全性。