GPU 内核开发工程师
岗位描述:负责优化和开发面向 AMD GPU 的深度学习框架,提升 GPU 内核、深度学习模型以及多 GPU、多节点系统上的训练与推理性能;在开源代码仓库中增强和优化 TensorFlow、PyTorch 等框架;开发并优化 GPU Kernel,以最大化特定 AI 算子的性能;面向 AMD GPU 设计并优化深度学习模型;与内部 GPU 库团队协作,分析并提升 AMD GPU 上的训练和推理表现;与开源框架维护者协作,确保代码修改符合...
第 367 页,共 644 页
岗位描述:负责优化和开发面向 AMD GPU 的深度学习框架,提升 GPU 内核、深度学习模型以及多 GPU、多节点系统上的训练与推理性能;在开源代码仓库中增强和优化 TensorFlow、PyTorch 等框架;开发并优化 GPU Kernel,以最大化特定 AI 算子的性能;面向 AMD GPU 设计并优化深度学习模型;与内部 GPU 库团队协作,分析并提升 AMD GPU 上的训练和推理表现;与开源框架维护者协作,确保代码修改符合...
岗位描述:负责优化和开发面向AMD GPU的深度学习框架,提升GPU内核、深度学习模型以及多GPU、多节点系统上的训练与推理性能;与内部GPU库团队及开源维护者协作,确保优化方案顺利集成,并利用前沿编译器技术和先进工程方法持续提升性能。具体包括:在开源代码库中优化TensorFlow、PyTorch等深度学习框架;开发并优化GPU内核,以最大化特定AI算子的性能;设计并优化适配AMD GPU性能的深度学习模型;与内部团队合作分析并改进A...
岗位描述:负责基于x86架构优化端到端技术解决方案,聚焦系统性能瓶颈分析、调优与优化;与跨职能团队协作,确保客户在AMD EPYC平台上的技术问题得到及时解决。工作内容包括技术售前支持、客户需求分析,以及推动x86架构与性能优化最佳实践落地。 岗位要求:具备5年以上解决方案架构、x86架构设计或性能调优经验;精通x86架构(如Intel Xeon、AMD EPYC系列),深入理解CPU架构(核心、缓存、频率)、内存管理(DDR4/DDR...
岗位描述:负责主导面向客户的质量相关工作,推动复杂产品问题和现场问题的跨职能闭环解决;作为客户与内部团队之间的主要技术接口,覆盖产品全生命周期,确保产品质量、可靠性和客户满意度。具体包括:作为客户质量问题、升级事件、审核及评分卡的主要联系人;管理客户关于不符合项、遏制措施、临时行动和纠正计划的沟通;负责从问题受理、分流、遏制、根因分析到效果验证的端到端合规流程;主导结构化问题解决,运用8D、5Why、鱼骨图、帕累托分析和DOE等方法;监...
岗位描述:负责面向 AMD 服务器 GPU 的机器学习软件定制开发、调试、优化和技术支持;面向重点客户提供技术方案与支持,推动客户 PoC 成功;推动 AI 软件定制需求落地,覆盖从 POC 需求到 POR 发布、从 GPU kernel 到框架及分布式解决方案;与不同团队协同分析并优化训练和推理负载及整体方案;分析竞品方案,识别优劣势并形成清晰价值主张;应用软件工程最佳实践开展研发工作。 岗位要求:需要在机器学习相关领域具备专家级能力...
岗位描述:负责带领软件开发团队,在 pre-silicon 与 post-silicon 环境中为跨业务单元产品交付 IP 诊断套件和调试支持;围绕新一代 IP 的测试规划、测试用例开发、预硅仿真、后硅 bring-up、完整特性使能以及跨 IP 库与问题调试支持开展团队管理与交付;制定团队优先级和执行计划,负责高质量 IP 诊断测试套件的里程碑交付,并与项目团队及组织目标保持一致;通过招聘、辅导、绩效管理和人才培养建设团队能力;及早识...
岗位描述:负责面向 AMD 服务器 GPU 的机器学习端到端定制软件方案的开发、调试、优化和技术支持;面向重点客户提供技术方案与支持,推动客户 PoC 成功;推动 AI 软件在性能与稳定性方面的定制需求落地,覆盖从 POC 需求到 POR 发布、从 GPU kernel 到框架及分布式解决方案;与不同团队协作,从 kernel、框架到整体方案层面对训练和推理负载进行分析与优化;分析竞品方案,识别优劣势并形成价值主张;应用软件工程最佳实践...