岗位描述
岗位描述:负责为 AMD 硬件平台上的 AI 工作负载设计、实现并维护模型优化功能;开发面向 CNN、Transformer、LLM 和多模态模型的量化、低精度和压缩能力;构建可用于生产环境的 Python 工具、库、API 和框架组件;支持优化模型的训练与微调流程;分析并调试精度、时延、内存占用以及部署权衡;与框架、编译器、运行时、硬件和应用团队跨团队协作,构建面向真实 AI 工作负载的优化软件。 岗位要求:对 AI/ML 框架、模型优化和加速器硬件上的高效 AI 部署有热情;具备扎实的软件开发能力,拥有模型压缩与低精度优化的实操经验,并能有效使用 AI 辅助工具同时保持良好的技术判断和代码质量;具备以下一个或多个方向经验:AI/ML 框架、模型优化、量化、训练流程、运行时集成或面向加速器的部署;熟悉 PyTorch、ONNX/ONNX Runtime 或类似机器学习框架;具备较强的 Python 开发与调试能力;有构建生产级工具、库、API 或框架组件的经验;理解 CNN、LLM 或多模态模型架构;能够权衡精度、性能、时延、内存占用和部署约束;具备良好的软件工程基础,并能与分布式地域团队协作;计算机科学、计算机工程、电子工程、机器学习或相关技术领域本科、硕士或博士学历。