当前在线岗位 708 个
职位列表
第 68 页,共 71 页
独角兽智谱AI
推理基础设施工程师(量化算法研究/推理框架优化/GPU优化)
北京 / 上海 / 其他/运维/架构/安全/社会招聘
围绕大语言模型及多模态模型的推理部署与性能优化开展工作,包括:研发和改进 PTQ、QAT、混合精度量化等核心算法,设计适配 LLM/VLM 的定制化量化方案;探索低比特量化、权重稀疏化、知识蒸馏等压缩技术,开发量化工具链并完成模型转换、量化校准及部署集成;负责 GPU 核心算子设计、开发与性能优化,分析并解决性能瓶颈,提升吞吐与降低延迟;研究并集成模型量化、算子融合、动态形状、FlashAttention 等优化技术到训练/推理引擎;结...