名企速投

岗位描述

负责强化学习训练框架的研发、优化和维护，根据业务需求持续改进训练框架和训练策略，提升模型训练效率；分析并定位训练过程中的性能瓶颈，实施针对性优化措施，提升训练效率与稳定性；持续跟进业界技术进展，同步并集成最新训练优化策略。要求对自然语言处理、计算机视觉和多模态算法有深入理解，熟悉主流LLM模型架构，具备分布式训练经验，了解常见RL训练算法；有vLLM或SGLang等开源推理框架经验者优先。

GLM-强化学习训练框架工程师（RL）

岗位描述