岗位描述参与分布式大模型推理框架的开发与优化,提升推理性能与吞吐量;针对不同场景的 LLM 请求特点优化 GPU 计算流程,打造高效的 LLM 推理引擎;调研并引入前沿机器学习系统技术,推动系统架构持续优化升级;与算法团队深度合作,探索算法与系统协同优化方案,提升整体推理效率。要求具备计算机体系结构、操作系统等基础知识,熟悉 SGLang、vLLM、Megatron、CUDA 及 GPU 性能优化者优先。