外企英伟达
深度学习编译器工程师(CUDA)
上海/人工智能/社会招聘
岗位描述:加入 NVIDIA 架构团队,参与 cuTile Core Compiler Architect 相关工作,面向新一代 GPU 架构设计并实现面向 tile 的 GPU 编程模型 DSL 与核心编译器,持续推动并行计算领域的编程模型、架构和基础设施创新。具体包括:设计并实现适用于新兴 GPU 架构的 tile-aware GPU 编程模型 DSL 及其核心编译器;持续创新并迭代编译器核心架构,以持续优化性能;研究下一代 GPU...