独角兽

大模型预训练算法研究员/工程师

阶跃星辰

北京 / 上海 / 其他算法社会招聘

岗位描述

负责模型架构的研发、优化与创新,包括 Attention、MoE 等架构改进及全新架构探索;负责下一代预训练范式的研究与创新,推动相关技术规模化发展;从算法角度推动大模型训练和推理的低成本化,包括优化器改进、量化、投机采样等技术;研究通用智能的本质,设计和迭代通用智能的评估与观测方法,以指导下一代范式演进;负责提升大语言基座模型在代码、数学、推理等方面的能力,系统性增强模型能力并实现数据飞轮。要求具备独立研究能力,曾发表机器学习或相关领域一作论文;具备扎实的编程基础和优秀的工程能力,能够独立实现相关算法和实验;有大模型领域实习或科研经验者优先;具备良好的团队协作与沟通能力。