独角兽

多模态数据算法工程师

面壁智能

成都人工智能社会招聘

岗位描述

负责多模态大模型在预训练、指令微调、偏好对齐等阶段的数据建设工作,包括数据采集、数据入库、数据清洗、数据观测、数据挖掘等环节;负责多模态数据的闭环验证,建立从数据构造、模型训练到性能评测的全链路闭环体系,确保数据有效提升模型基础能力;参与训练数据全生命周期管理体系建设,支撑多模态大模型场景下海量训练数据的高效读取,提升模型训练工程效率;跟进业界最新技术与进展,结合实际场景落地,持续提升数据质量并挖掘数据价值。要求具备扎实编码能力,熟悉 Python、Shell 等脚本语言,熟悉多模态大模型基本原理和至少一种深度学习框架,如 PyTorch,具备模型开发、部署、微调经验,并掌握计算机视觉与自然语言处理相关基础知识。