独角兽

软件工程师(端到端模型性能优化)

小马智行

北京人工智能社会招聘

岗位描述

负责 AI 端到端模型的性能分析与优化;负责 CUDA 算子开发与维护;负责 C++ 日常开发与维护。要求本科及以上学历,计算机或相关专业;具备扎实的软件工程能力和计算机基础;有 CUDA 编程经验,熟悉 TensorRT 或其他 AI 加速库;有 C++ 开发经验;熟悉至少一种深度学习框架,优先 PyTorch。具备 CUDA 优化、C++ 性能优化与内存优化、算法竞赛、基于 TensorRT 的模型优化,以及模型量化、蒸馏、剪枝等工程经验者优先。