岗位描述负责语音大模型评测体系建设,设计并实现多维度评测框架,使模型能力可衡量、可对比、可解释;结合业务与模型目标,构建并维护评测集与Benchmark,持续跟踪模型效果变化,推动模型能力优化;持续跟踪语音大模型及多模态领域的前沿论文与开源社区进展,将新的数据构建策略和评测方法快速落地到实际业务中;从产品化和结果导向视角发现问题,基于数据与评测结果推动算法与模型能力持续提升。