岗位描述基于SGLang进行大模型推理引擎与服务侧开发,提升吞吐、降低时延与成本并保障线上稳定性;支持RL训练相关的推理链路,包括rollout生成、打分与奖励模型推理等,优化训练闭环效率与资源利用;建设推理侧监控与性能分析能力,参与线上问题定位与故障处理;与算法和训练团队协作,将模型与训练需求落地为可运行、可维护的推理系统,并输出必要技术文档。