独角兽

后训练算法研究员/工程师

月之暗面

地点待补充算法社会招聘

岗位描述

深度参与 CodeLLM 的数据处理、清洗与优化,科学改进、筛选并平衡用于大模型预训练和对齐训练的数据质量,提升模型在预训练和 SFT 阶段的代码与智能体能力;通过 SFT、RL 以及工具、Docker 环境和任务的构建与扩展,持续提升 Coding/SWE Agent 能力,并沉淀高效训练智能体模型的方法;深入探索增强模型解题能力的方法,提升对简单和中等算法题的准确率,并尽可能提高高难度算法题(如 IOI/ICPC 级别)的求解率,推动模型智能上限;提升用户在代码与软件工程相关问题上的解决率和满意度,使模型更易用、更好用。要求本科及以上学历,计算机科学、人工智能、自动化、数学等相关专业优先;具备扎实的编程基础、数据结构与算法设计能力,熟悉 Python、C++ 等主流语言,以及 PyTorch、TensorFlow、Hugging Face 等深度学习框架;具备大模型预训练、对齐训练或 Code/SWE 优化经验者优先;在机器学习与人工智能领域有高水平成果、竞赛获奖经历者优先。