高性能异构计算高级工程师
参与壁仞 GPU 芯片高性能软件栈的开发、优化和文档编写;负责高性能算子算法的设计、分析、评估与优化;参与硬件关键功能、精度和性能的研讨与评估;关注芯片和大模型社区的最新动态,探索前沿技术方向在壁仞芯片上的落地。核心产出包括软件栈 Sutlass/SCCL 的迭代开发、优化和文档编写,完善生态软件栈;完成 TCore/CUB 相关算子算法的设计、分析和评估,并与编译器团队协作推进性能优化;在验证过程中挖掘硬件关键功能、精度和性能问题;探...
第 488 页,共 793 页
参与壁仞 GPU 芯片高性能软件栈的开发、优化和文档编写;负责高性能算子算法的设计、分析、评估与优化;参与硬件关键功能、精度和性能的研讨与评估;关注芯片和大模型社区的最新动态,探索前沿技术方向在壁仞芯片上的落地。核心产出包括软件栈 Sutlass/SCCL 的迭代开发、优化和文档编写,完善生态软件栈;完成 TCore/CUB 相关算子算法的设计、分析和评估,并与编译器团队协作推进性能优化;在验证过程中挖掘硬件关键功能、精度和性能问题;探...
负责 AI 模型算子的开发与优化;进行推理或训练模型的端到端调优;与软硬件架构师共同开展软件流程及架构探索;推动并解决跨团队性能问题。要求具备 CUDA、OpenCL 等高性能并行编程能力,熟悉 AI 模型算子开发优化及推理、训练场景的端到端优化,熟悉深度学习算法和主流 AI 模型,如 RN50、BERT、GPT、LLaMA 等;对计算机体系结构有深刻理解,熟悉 Nsight Compute 等性能分析工具,掌握 Pytorch、Pad...
研究和学习新的电源技术,调研有源VRM及无源器件供应商能力,选择合适的电源解决方案;与电源架构工程师协作,梳理系统电源需求并确定设计方案;与硬件设计工程师合作实现电源设计,优化性能、降低成本、提高质量;管理电源器件供应商,确保设计和制造质量;定义电源测试计划,验证电源稳定性和电源完整性;编写技术设计文档并为客户提供技术指导。要求硕士及以上学历,电子工程或计算机科学相关专业优先,具有三年及以上电源设计实践经验,具备开关电源理论基础、高功率...
加入研发团队,参与深度学习框架的开发与维护,负责大语言模型等深度学习算法在特定硬件上的实现、优化与交付。基于特定硬件与深度学习框架实现高效算法和模型,优化现有深度学习框架及分布式训练框架以提升计算效率和资源利用率;参与框架架构设计和代码审查;与算法工程师紧密合作,理解需求并提供技术支持;跟踪最新深度学习研究进展并应用到实际项目;编写设计说明、用户手册和API文档;为团队成员提供框架培训与指导;参与跨部门项目并提供深度学习解决方案。要求相...
基于壁仞GPU生态设计并实现深度学习训练/推理框架核心模块,分析并优化框架性能;研究框架前沿技术和发展方向,并将新技术应用到GPU软件生态中,推动生态成熟;解决日常测试中的框架相关问题,协同上下游团队分析定位软件栈问题。要求计算机、自动化、模式识别、人工智能、电子信息等相关专业,具备大型软件开发经验和良好的软件工程思想,熟练使用C/C++、Python等语言,掌握至少一种深度学习框架并有相关开发经验;有CUDA、OpenCL、OpenM...