岗位描述主导或深度参与语音多模态大模型的架构设计、训练、调优及迭代,提升模型整体性能,研究方向包括音频表征、音视频理解、语音生成、全双工语音对话、语音强化学习等;跟踪学术界与工业界前沿技术动态,复现最新成果,推进技术迭代与创新突破;系统性设计并执行实验方案,深入分析模型表现,定位核心问题并提出有效优化方案;参与团队协作,解决技术难题,推动技术进展。