独角兽

多模态数据算法工程师

生数科技

北京数据开发社会招聘

岗位描述

负责构建超大规模高质量多模态数据集,建立从原始视频抓取、清洗、质量评估到自动化标注的全链路工业化流水线;实施支持多模态参考与视频编辑的专项数据工程,通过自动化手段生产图生视频、视频指令编辑、动作/风格参考等任务所需的高对齐配对数据;研发高性能视频数据处理工具链,利用多模态大模型实现视频内容的精准描述、美学打磨及结构化解析,确保持续产出高质量训练样本;建立数据质量监控与闭环体系,通过量化指标驱动数据集迭代更新,支撑通用视频生成模型在真实工业场景下的效果落地。