独角兽阶跃星辰
大模型强化学习系统工程师
北京 / 上海 / 其他/运维/架构/安全/社会招聘
负责大模型 RL 训练与推理系统建设,持续提升训练效率、系统稳定性和工程迭代速度,工作内容覆盖分布式训练、推理链路、性能优化、稳定性治理,以及 Agent RL 相关能力建设。具体包括:负责 RL 训练与推理基础设施的设计、开发与优化;负责分布式训练、任务调度、权重同步、热更新等核心链路建设;持续优化系统性能,包括吞吐、时延、GPU 利用率、训练效率等指标;建设稳定性与可观测能力,定位并解决 OOM、超时、通信瓶颈、一致性问题等;参与...