外企

生成式AI算法工程师

高通

北京人工智能社会招聘

岗位描述

负责或参与LLM/LVM/LMM模型的端到端训练、微调与量化,重点包括低比特量化;设计并实现可扩展、稳健的模型训练、评估、量化(PTQ/QAT)工程系统与流程,并支持客户侧端部署;开展VLM、VLA等多模态模型、基于扩散的图文生成方法及高效计算方向的算法研究与开发;参与图像生成、3D、视频生成与编辑、ViT等模型的训练与推理;研究高效推理算法与先进量化技术,如batching、KV缓存、高效注意力、长上下文、投机解码、GPTQ、SpinQuant、自动混合精度;推动端侧与云侧模型效率优化;集成前沿生成式AI、量化、知识蒸馏、模型压缩与高效推理方案;构建并自动化测试套件及性能分析/调试工具,验证模型性能与部署效果;整理方法与结果并向相关方汇报。要求熟练掌握Python与PyTorch,具备PTQ/QAT、低比特量化、多模态训练或推理经验,有LoRA、模型压缩、vLLM、SGLANG等经验者优先。