独角兽

SAI VLA SDK开发工程师

Momenta

上海人工智能社会招聘

岗位描述

负责嵌入式平台(如高通等)上大模型推理性能的深度优化;主导大模型量化方案设计与实现,确保板端部署后的精度对齐;开发和维护高性能VLA SDK,涵盖模型推理、前后处理及系统级调优;针对KV Cache等关键模块进行内存与计算效率优化,提升端侧推理吞吐与延迟表现。