岗位描述负责 Agent 训练与推理全链路框架的开发、优化与稳定性保障,支撑大规模模型训练实验高效运行;设计并维护 Agent 执行沙箱,保障代码执行、工具调用等复杂场景下的安全性、隔离性与可靠性;构建支撑 Post-Train 团队日常实验的基础平台,涵盖实验管理、数据流水线、评测对比等核心能力。要求具备独立思考能力,有真实工程项目维护经验,重视代码可维护性、接口合理性与系统可观测性;理解调度、容器、网络、存储等系统原理,并对分布式训练、推理优化和系统瓶颈有实际认知。