岗位描述设计、搭建并持续迭代语音大模型数据处理与生产管线,覆盖数据采集、清洗、标注、质检与版本管理,持续产出高质量训练数据;构建并维护大规模语音数据的自动化处理与质量控制流程,保障数据的稳定性、一致性和可追溯性;与算法团队紧密合作,理解模型训练需求,将模型问题转化为可执行的数据生产与优化方案;推动数据生产流程的工程化与平台化,提高数据处理效率与数据复用能力;跟踪语音大模型及多模态方向的最新数据构建方法,并快速落地到实际训练中。