岗位描述
负责面向自动驾驶场景的VLA/行为大模型设计与训练,融合感知、语言指令、地图/结构信息与历史时序状态,输出安全、稳定且具备驾驶风格的行为决策;探索模仿学习、强化学习与大模型训练范式结合,推动一段式/端到端能力落地。研发具备时空一致性的世界模型,用于环境建模、未来预测与策略评估;结合Diffusion、自回归等生成式模型,提升复杂交通场景下的多模态预测与不确定性建模能力,支撑端到端模型在长时序和复杂交互场景中的稳定性与泛化能力。要求具备深度学习、VLA/多模态大模型、生成式模型/世界模型或端到端决策控制相关研究与实践经验。