岗位描述负责大模型后训练方向的能力优化,覆盖通用聊天、写作、角色扮演、STEM、逻辑推理、多语言等方向,近期重点深耕 Agentic LLM,长期聚焦指令遵循、长上下文理解、长程交互、任务规划、自我反馈与改进、拟人化等核心能力建设;关注模型实际效果与工程落地,结合 Coding Agent、PPT Agent、Search Agent 等复杂场景推进优化;使用 PyTorch、Huggingface、Megatron 等框架开展算法开发,参与大模型训练、数据处理及相关研究工作。