名企速投

岗位描述

负责视频生成基础模型的核心算法研发、架构探索与生成效果迭代，涵盖 Text-to-Video、Image-to-Video、Video Inpainting 等方向；深入参与生成模型全生命周期研发，包括大规模预训练、SFT、人类偏好对齐（RLHF/DPO 等）；搭建并完善高质量视频数据工程流水线，主导基于多模态大模型（VLM）的海量视频数据自动化清洗、多维度标注、过滤与质量评估，构建高质量训练数据集；结合业务需求开展模型轻量化、显存优化及推理加速，提升云端推理吞吐效率与生成速度，保障算法高效落地。要求具备计算机、人工智能、数学等相关专业本科及以上学历；熟练掌握 Python 及常用数据结构，具备扎实的算法基础与优秀的工程实现能力；熟悉 PyTorch，具备大规模分布式训练如 DeepSpeed、Megatron、FSDP 的实操与调优经验；深刻理解 Diffusion Models、Transformer/DiT 架构原理，熟悉主流图像/视频生成算法；具备较强的数据敏感度，熟悉 Qwen-VL、GPT-4o 等多模态大模型应用，具备复杂场景数据清洗、规则设计和 Prompt 体系构建经验；关注生成内容真实感、时空连贯性和物理合理性，熟悉相关质量指标，能够独立分析和修改前沿开源代码。

算法工程师（视频生成）

岗位描述