独角兽Momenta
模型训练优化专家
北京 / 上海 / 深圳 / 苏州/人工智能/社会招聘
负责分析和优化大模型分布式训练的全链路过程,提升训练性能和效率。要求本科及以上学历,计算机、深度学习等相关专业,3年及以上工作经验;熟练掌握 Linux 环境下的 C/C++ 与 Python 语言;熟练使用至少一种训练框架(TensorFlow、PyTorch 或其他自研框架);熟练使用至少一种大规模训练优化框架(Megatron、DeepSpeed、LightSeq 或其他自研框架)。有百亿级以上 GPT 或 MoE 等大型预训练模...