AI 框架工程师
岗位描述:作为团队核心成员,负责面向 AMD GPU 优化和开发深度学习框架;重点提升 GPU Kernel、深度学习模型以及多 GPU、多节点系统上的训练和推理性能;与内部 GPU 库团队及开源维护者协作,确保优化内容顺利集成,利用前沿编译器技术和先进工程方法持续改进;具体包括优化 TensorFlow、PyTorch 等深度学习框架在 AMD GPU 上的表现,在开源仓库中推进优化;开发并优化 GPU Kernel,以最大化特定 A...
第 366 页,共 644 页
岗位描述:作为团队核心成员,负责面向 AMD GPU 优化和开发深度学习框架;重点提升 GPU Kernel、深度学习模型以及多 GPU、多节点系统上的训练和推理性能;与内部 GPU 库团队及开源维护者协作,确保优化内容顺利集成,利用前沿编译器技术和先进工程方法持续改进;具体包括优化 TensorFlow、PyTorch 等深度学习框架在 AMD GPU 上的表现,在开源仓库中推进优化;开发并优化 GPU Kernel,以最大化特定 A...
岗位描述:与 MDC/OEM/ODM 合作伙伴紧密合作,通过应用说明文档、定制与调优用户指南、样品与参考设计资料、调试/性能分析工具等技术材料,支持 AMD 服务器平台的顺利部署。负责内部和外部参考设计及量产设计的 bring-up 支持与调试,并向客户提供解决方案;围绕关键技术主题、问题、架构讨论及性能优化,直接与客户及内部团队协作,推动多方讨论达成一致;具备分析技术问题并提出创新解决方案的能力;提供现场支持,加速问题关闭,保障整体项...
岗位描述:负责推动 AMD 服务器及专业图形产品销售,提升市场份额,围绕 AMD 全产品组合开展行业客户业务拓展,制定销售策略、合作伙伴策略和市场进入方式,以强化客户关系并达成收入目标。深入理解客户业务目标和需求,维护客户关系并管理客户预期,推动双方业务目标一致;向合作伙伴宣导 AMD 技术和解决方案,并协助合作伙伴向终端客户销售搭载 AMD 技术的 OEM 产品;制定并执行销售与市场活动,扩大渠道业务规模;管理合作伙伴与 AMD 之间...
岗位描述:加入高技术含量的芯片验证团队,负责 Memory/SSD 子系统相关工作,重点涵盖 DDR5/DDR4/LPDDR5 内存接口、存储/SSD 平台级验证,并与 ODM、DIMM 厂商及 SSD 生态合作伙伴紧密协作,确保端到端系统使能的稳定性。将带领深圳客户端与图形工程团队,联合中国生态厂商推进 Memory/SSD 使能并提供客户支持;使用硬件和软件验证工具、示波器、逻辑分析仪等,对 AMD 处理器执行电气与功能测试计划;负...
岗位描述:设计、开发和实现高效的大型模型推理系统,以提升计算性能和算力利用率;进行模型性能分析与调优,识别并解决瓶颈问题,提高模型推理速度;跟踪最新研究进展和技术趋势,提出改进与创新方案,推动团队技术发展。 岗位要求:深入理解大模型算法原理,熟悉常见模型结构,包括 GPT 系列、Llama 系列、DeepSeek 系列等;熟悉至少一种主流 LLM 推理引擎,如 vLLM、SGLang 等,掌握其底层技术原理,如 FlashAttenti...
岗位描述:负责为 AMD 硬件平台上的 AI 工作负载设计、实现并维护模型优化功能;开发面向 CNN、Transformer、LLM 和多模态模型的量化、低精度和压缩能力;构建可用于生产环境的 Python 工具、库、API 和框架组件;支持优化模型的训练与微调流程;分析并调试精度、时延、内存占用以及部署权衡;与框架、编译器、运行时、硬件和应用团队跨团队协作,构建面向真实 AI 工作负载的优化软件。 岗位要求:对 AI/ML 框架、模型...