岗位描述:负责 AI 训练工作负载的性能分析与优化,深入挖掘 AI 训练在前沿硬件和软件平台上的极致性能。跨越从 GPU 架构到底层驱动再到深度学习框架的软硬件全栈,理解、分析、剖析并优化 AI 与深度学习训练任务。把握 GPU 训练性能全局,针对数十种先进神经网络确定优先级并解决关键性能问题。在 NVIDIA 深度学习平台栈的多个层面实现可用于生产的软件,从驱动到深度学习框架均有涉及。在 NVIDIA 专有处理器与系统模拟器中实现关键...
岗位描述:支持关键合作伙伴技术与运营项目的规划和执行,并维护稳固的客户关系。作为客户项目管理团队的核心成员,推动与大型企业客户、云服务提供商、一级合作伙伴及 OEM 的协同合作。定义并管理项目进度、交付物和关键里程碑,使其与云服务提供商及其 ODM/OEM 合作伙伴的路线图和需求保持一致,并确保 AI 基础设施和数据中心建设项目的协同推进。将客户及合作伙伴需求转化为可执行计划,整合 AI 工厂部署中的数据中心工具和运营流程,并推动工程、...