独角兽壁仞科技
软件库性能优化工程师/架构师
北京 / 上海 / 杭州 / 其他/人工智能/社会招聘
负责 AI 模型算子的开发与优化;进行推理或训练模型的端到端调优;与软硬件架构师共同开展软件流程及架构探索;推动并解决跨团队性能问题。要求具备 CUDA、OpenCL 等高性能并行编程能力,熟悉 AI 模型算子开发优化及推理、训练场景的端到端优化,熟悉深度学习算法和主流 AI 模型,如 RN50、BERT、GPT、LLaMA 等;对计算机体系结构有深刻理解,熟悉 Nsight Compute 等性能分析工具,掌握 Pytorch、Pad...