岗位描述负责强化学习训练框架的研发、优化和维护,根据业务需求持续改进训练框架和训练策略,提升模型训练效率;分析并定位训练过程中的性能瓶颈,实施针对性优化措施,提升训练效率与稳定性;持续跟进业界技术进展,同步并集成最新训练优化策略。要求对自然语言处理、计算机视觉和多模态算法有深入理解,熟悉主流LLM模型架构,具备分布式训练经验,了解常见RL训练算法;有vLLM或SGLang等开源推理框架经验者优先。