岗位描述参与公司各类大模型(包括文本、代码与多模态等)的评测与优化;设计并运行评估以衡量模型能力;编写高效清晰的代码构建评估流程;搭建文本、多模态、推理、Agent、Coding等不同能力的评估环境;参与模型自动评测整体架构设计与规划;持续优化现有系统性能和稳定性,并进行学术研究与论文撰写。