当前在线岗位 708 个
职位列表
第 7 页,共 71 页
独角兽月之暗面
研究科学家/工程师(Agentic 强化学习)
Moonshot AI · Kimi K2 及下一代模型/人工智能/社会招聘
负责在 Agentic 与多智能体强化学习方向推进算法、环境和基础设施的突破,提升 Kimi K2 及后续模型在真实世界中的自主能力。要求精通强化学习相关方法,包括策略梯度、Actor-Critic、Self-Play、Meta-RL、MARL;具备大规模训练与低延迟推理系统的落地经验;具备系统级编程与分布式架构设计能力(Python/C++/Rust);有 Agentic RL、工具调用智能体或多智能体系统的发表或上线记录。具备代码执...