岗位描述负责大模型量化算法的研究与实现,包括 PTQ(训练后量化)和 QAT(量化感知训练)等方向;探索低比特量化(INT2、INT4、MxFP4 等)在大语言模型和多模态模型中的应用,平衡精度与效率;针对不同硬件平台(GPU、NPU、端侧芯片)设计并优化量化方案,提升量化模型的训练和推理性能;持续跟踪量化领域前沿技术,并推动技术落地应用。