职位列表

201 页,共 645

按发布时间排序
外企英伟达

高级AI训练性能工程师

上海/人工智能/社会招聘

岗位描述:负责 AI 训练工作负载的性能分析与优化,深入挖掘 AI 训练在前沿硬件和软件平台上的极致性能。跨越从 GPU 架构到底层驱动再到深度学习框架的软硬件全栈,理解、分析、剖析并优化 AI 与深度学习训练任务。把握 GPU 训练性能全局,针对数十种先进神经网络确定优先级并解决关键性能问题。在 NVIDIA 深度学习平台栈的多个层面实现可用于生产的软件,从驱动到深度学习框架均有涉及。在 NVIDIA 专有处理器与系统模拟器中实现关键...

发布时间:2025/08/29
外企英伟达

基础设施软件工程师(深度学习库)

上海/后端开发/社会招聘

岗位描述:加入 NVIDIA 深度学习库团队,支撑下一代高性能深度学习库的基础设施建设,覆盖 TensorRT、TensorRT-LLM 等多个产品。岗位使命是设计并开发可扩展、模块化的基础设施,简化 NVIDIA 多平台环境下的开发、构建与测试流程,涵盖从自动驾驶 Drive AGX 到数据中心 DGX 服务器及大语言模型相关平台。具体包括:设计和开发用于代码库测试与分析的软件;为公开发布的深度学习库构建可扩展的构建、测试、集成与发布...

发布时间:2026/01/14
外企英伟达

HPC 与 AI 集群工程师

上海/运维/架构/安全/社会招聘

岗位描述:加入 Networking clusters solutions HPC/AI Infrastructure 团队,参与基于前沿技术构建超级计算机和 AI 集群,面向人工智能与 GPU 计算领域的最新突破,成为集群工程关键成员。你将使用最新的加速计算和深度学习软硬件平台,与科研人员、开发者和客户合作,打造更优工作流并开发新的差异化解决方案;与 HPC、操作系统、GPU 计算及系统专家协作,架构设计、开发并完成大规模高性能平台的...

发布时间:2026/02/14
外企英伟达

GPU 计算工程师(自动驾驶)

上海/人工智能/社会招聘

岗位描述:面向自动驾驶场景,分析深度学习模型,定位并研究客户或内部团队反馈的 TensorRT 稳定性和性能问题。与美国、亚太和印度等跨区域团队协作,参与 CUDA 和 TensorRT 相关开发工作。结合分析和开发过程提炼功能需求或常见问题,并形成相应文档。 岗位要求:具备计算机科学或电子工程相关专业本科及以上学历,硕士优先,或具备同等经验。具有 3-5 年以上相关工作经验。具备扎实的 C、C++ 和 Python 编程能力。了解主流...

发布时间:2026/02/05
外企英伟达

企业客户技术项目经理

北京/项目经理/社会招聘

岗位描述:支持关键合作伙伴技术与运营项目的规划和执行,并维护稳固的客户关系。作为客户项目管理团队的核心成员,推动与大型企业客户、云服务提供商、一级合作伙伴及 OEM 的协同合作。定义并管理项目进度、交付物和关键里程碑,使其与云服务提供商及其 ODM/OEM 合作伙伴的路线图和需求保持一致,并确保 AI 基础设施和数据中心建设项目的协同推进。将客户及合作伙伴需求转化为可执行计划,整合 AI 工厂部署中的数据中心工具和运营流程,并推动工程、...

发布时间:2026/01/30
外企英伟达

深度学习性能软件工程师

上海/人工智能/社会招聘

岗位描述:负责面向深度学习负载开发编译器和领域专用语言(DSL);设计并实现高性能深度学习内核;持续改进面向当前及下一代芯片的编译器架构;对新兴 AI 工作负载开展性能分析,并与 AI 框架进行集成。 岗位要求:相关专业硕士或博士学历,或具备同等经验,专业方向包括 CE、CS&E、CS、AI 等;具备优秀的 C/C++ 编程能力和软件设计能力;熟悉 XLA、TVM、MLIR、LLVM,以及深度学习模型和算法;具备3年以上相关工作经验。

发布时间:2026/02/10
外企英伟达

深度学习性能软件工程师

上海/人工智能/社会招聘

岗位描述:参与深度学习方向的研发工作,开发 TileGym、Triton CUDA TileIR 后端以及 CUDA Tile;通过基于 Tile 的 GPU 编程模型开发高性能深度学习内核;基于该编程模型开展端到端性能优化;负责性能优化、性能分析与调优工作。 岗位要求:相关专业硕士或博士学历,或具备同等经验,专业方向包括 CE、CS&E、CS、AI 等;具备优秀的 C/C++ 编程能力和软件设计能力;有 Python 经验者优先;具备...

发布时间:2026/01/09
外企英伟达

深度学习性能架构师

上海/人工智能/社会招聘

岗位描述:加入推理方向研发团队,负责开发 GPU 加速的深度学习软件,与深度学习社区合作,将最新算法实现并公开发布到 TensorRT 中。具体包括:开发面向推理的高性能深度学习内核;进行性能优化、性能分析与调优;与汽车、图像理解、语音理解等跨职能团队合作,开发创新解决方案;根据需要参加会议并为客户提供技术咨询与培训。 岗位要求:计算机工程、计算机科学、人工智能或相关专业硕士、博士或同等经验;具备软件敏捷开发相关能力者优先;优秀的 C/...

发布时间:2025/12/02
外企英伟达

深度学习内核软件性能架构师

上海/人工智能/社会招聘

岗位描述:负责面向先进数据中心平台优化 GPU 内核性能,构建自动化、数据驱动的工作流,用于发现、解释并防止关键深度学习工作负载中的性能回退,并与内核开发、编译器、基础设施、架构及性能团队紧密协作。具体包括:对 GPU 加速内核及关键深度学习基础模块进行性能验证、分析与调试;端到端定位性能问题,包括复现问题、隔离根因、提出修复或缓解方案,并推动相关团队闭环解决;基于基线、受控对比和回归归因构建结构化性能分析结论;开发和维护基于 Pyth...

发布时间:2026/02/07
外企英伟达

计算架构软件工程师

上海/人工智能/社会招聘

岗位描述:作为 LLM 推理软件工程师,参与前沿 AI 技术研发,围绕 TRTLLM 项目开发和优化基于 GPU 的大语言模型推理软件方案,推动从单机到大规模 GPU 集群的推理加速。具体包括:开发并优化利用 GPU 技术加速 LLM 推理的软件方案;与世界级工程师团队紧密合作,实现并改进基于 GPU 的算法;分析并确定提升性能的最佳方法,确保方案能在不同计算环境中稳定高效运行;参与个人及团队项目,为 NVIDIA 推动 AI 革命的使...

发布时间:2025/09/25