自监督或强化学习算法高级工程师
设计并实现面向自动驾驶的自监督训练框架,提升端到端大模型在稀疏标注场景下的泛化能力;研发适用于驾驶决策、路径规划与动态博弈的强化学习算法,包括 GRPO、PPO、Offline RL 等,解决高速、城区、泊车场景中的安全性与长尾交互问题。要求具备计算机、人工智能、自动化等相关专业背景,熟练掌握 Python/C++,具备良好的数据结构与算法基础;自监督方向需熟悉对比学习、MAE、可微分渲染等相关领域,强化学习方向需熟悉 PPO、GRPO...
第 23 页,共 64 页
设计并实现面向自动驾驶的自监督训练框架,提升端到端大模型在稀疏标注场景下的泛化能力;研发适用于驾驶决策、路径规划与动态博弈的强化学习算法,包括 GRPO、PPO、Offline RL 等,解决高速、城区、泊车场景中的安全性与长尾交互问题。要求具备计算机、人工智能、自动化等相关专业背景,熟练掌握 Python/C++,具备良好的数据结构与算法基础;自监督方向需熟悉对比学习、MAE、可微分渲染等相关领域,强化学习方向需熟悉 PPO、GRPO...