产品策略经理
从用户视角参与Kimi Code相关产品体验设计与优化,推进需求上线;协助梳理AI Coding使用流程中各环节的问题,包括Code Agent、模型以及不同Agent和模型之间的表现差异,发现问题并提出优化建议;具备商业化逻辑与数据分析能力,可独立策划活动;协同Agent团队、API团队、商业化团队推进Coding场景联动和方案支持;联动算法团队和Infra团队协作推进体验改进;能够基于数据洞察用户痛点,提出解决方案,并建立合适的be...
第 502 页,共 793 页
从用户视角参与Kimi Code相关产品体验设计与优化,推进需求上线;协助梳理AI Coding使用流程中各环节的问题,包括Code Agent、模型以及不同Agent和模型之间的表现差异,发现问题并提出优化建议;具备商业化逻辑与数据分析能力,可独立策划活动;协同Agent团队、API团队、商业化团队推进Coding场景联动和方案支持;联动算法团队和Infra团队协作推进体验改进;能够基于数据洞察用户痛点,提出解决方案,并建立合适的be...
负责在Agentic和多智能体强化学习方向推进算法、环境与基础设施创新,提升Kimi K2及后续模型的真实世界自主能力;需要精通强化学习核心方法,包括策略梯度、Actor-Critic、Self-Play、Meta-RL、MARL,具备大规模训练与低延迟推理系统落地经验,能够进行Python、C++、Rust等系统级编程及分布式基础设施设计;具备在Agentic RL、工具调用智能体或多智能体系统方向的项目上线或研究发表经历,有代码执行...
主要负责维护和开发公司内部强化学习后训练框架,支持万亿参数模型在 reasoning、agentic 等方向的文本与多模态 RL 后训练;与训练推理引擎团队协作,探索算法、框架、硬件的协同设计,提升大规模强化学习训练的稳定性和效率。要求具备扎实的工程算法基础和工程实现能力,熟悉 Python 等语言,熟练掌握 PyTorch 等深度学习框架及常见性能调试分析工具;深入了解 Megatron-LM、vLLM 等主流训练与推理引擎,并对大模...
负责打造支撑下一代大模型自我进化的强化学习基础设施,围绕大规模 Agentic RL 场景设计训练与采样的混合调度策略,优化 Policy、Reference、Reward、Value 等多模型的并行协同与显存共享;深度定制 vLLM,优化 Rollout 阶段的 KV Cache 复用、量化与投机方法,尽可能降低 Token 生成延迟;结合算法、框架与硬件进行协同优化,为不同强化学习算法负载和硬件设施制定最优并行策略,最大化训练效率。...
负责探索并落地大规模语言和多模态 Agent 模型,推进全链路系统优化;主导数据建设,包括采集、清洗、标注、质检,以及指令微调、偏好对齐、RLHF/RLAIF 与模型持续优化,提升模型效果与用户体验;与产品和标注团队深度协同,持续优化模型能力。要求计算机相关专业本科及以上学历,熟练掌握至少两种后端语言,如 Python、Go、Java、C++,具备优秀代码能力、工程能力、数据结构和算法基础;熟悉 NLP、CV、RL 相关算法与技术,有大...