独角兽Momenta
模型训练优化开发工程师
北京 / 上海 / 深圳 / 苏州/人工智能/社会招聘
1. 负责多种不同硬件平台的极致性能优化,结合编译优化、并行计算优化、图融合和高效CUDA算子开发,实现行业领先的车端推理性能;2. 针对特定NPU硬件计算平台,基于对硬件体系结构的深入理解,实现对硬件的高效利用;3. 针对PyTorch、CUDA相关GPU计算任务,进行算子和系统优化,提升训练与推理效率;4. 优化训练框架,尽可能高效发挥硬件和系统软件性能。任职要求:2年以上工作经验,计算机、数学、物理、电子工程、自动控制等相关专业本...