独角兽

算法工程师(视频生成)

小马智行

北京 / 上海 / 广州人工智能社会招聘

岗位描述

负责视频生成基础模型的核心算法研发、架构探索与生成效果迭代,涵盖 Text-to-Video、Image-to-Video、Video Inpainting 等方向;深入参与生成模型全生命周期研发,包括大规模预训练、SFT、人类偏好对齐(RLHF/DPO 等);搭建并完善高质量视频数据工程流水线,主导基于多模态大模型(VLM)的海量视频数据自动化清洗、多维度标注、过滤与质量评估,构建高质量训练数据集;结合业务需求开展模型轻量化、显存优化及推理加速,提升云端推理吞吐效率与生成速度,保障算法高效落地。要求具备计算机、人工智能、数学等相关专业本科及以上学历;熟练掌握 Python 及常用数据结构,具备扎实的算法基础与优秀的工程实现能力;熟悉 PyTorch,具备大规模分布式训练如 DeepSpeed、Megatron、FSDP 的实操与调优经验;深刻理解 Diffusion Models、Transformer/DiT 架构原理,熟悉主流图像/视频生成算法;具备较强的数据敏感度,熟悉 Qwen-VL、GPT-4o 等多模态大模型应用,具备复杂场景数据清洗、规则设计和 Prompt 体系构建经验;关注生成内容真实感、时空连贯性和物理合理性,熟悉相关质量指标,能够独立分析和修改前沿开源代码。