独角兽

多模态大语言模型算法工程师(预训练方向)

月之暗面

地点待补充人工智能社会招聘

岗位描述

负责参与 Kimi VLM 的科学化 scaling 实验设计,构建经济高效的训练数据方案,探索数据配比与模型 scaling 相关前沿技术,深入参与多模态大语言模型基座模型训练;参与 Kimi VLM 数据清洗与优化,提升预训练和对齐阶段的数据质量,进行筛选、配比与优化,覆盖图片、视频、视觉常识、视觉推理及多语种多模态数据;构建可支撑 PB 级数据量的基础平台与工具,并具备较强的工程实现与数据处理能力。要求具备扎实编程基础,熟悉 Python/C++、PyTorch、TensorFlow、Hugging Face 等,有大模型预训练、对齐训练或数据筛选优化经验者优先,熟悉 Spark、Ray 等分布式计算框架者优先。