独角兽

研究科学家/工程师(Agentic 强化学习)

月之暗面

Moonshot AI · Kimi K2 及下一代模型人工智能社会招聘

岗位描述

负责在 Agentic 与多智能体强化学习方向推进算法、环境和基础设施的突破,提升 Kimi K2 及后续模型在真实世界中的自主能力。要求精通强化学习相关方法,包括策略梯度、Actor-Critic、Self-Play、Meta-RL、MARL;具备大规模训练与低延迟推理系统的落地经验;具备系统级编程与分布式架构设计能力(Python/C++/Rust);有 Agentic RL、工具调用智能体或多智能体系统的发表或上线记录。具备代码执行沙箱、程序合成或仿真器安全经验者更佳。欢迎在相关方向具备 SOTA 能力的人才加入,申请时需附 GitHub、论文或代表性 RL 项目简介。