岗位描述
岗位描述:支持 AI 系统评估工作,通过设计和执行基准测试及审计活动,评估模型质量、合规性、鲁棒性和公平性;协助规划并执行 AI 模型基准测试,包括制定测试方案、指标和验收标准,覆盖准确性、鲁棒性、偏差和可靠性等维度;通过审查数据集、模型输出和数据处理方式,支持内容准确性、相关性和隐私检查,并升级潜在监管风险;依据特定标注规范进行数据校验,确保采集信息的准确性和质量;编写清晰的审计与基准测试报告,包括错误评级、根因分析和改进建议,并支持面向高级利益相关方的汇报;维护有序的审计文档、证据和基准测试数据集,以支持内部审查;与团队成员和经理紧密合作,推动流程效率提升并探索自动化机会;通过持续完善 AI 审计方法、检查清单和测试框架,提升数据生成工作的产能与有效性,以适应不断变化的法规和最佳实践。