外企

数据标注实习生

SAP

上海 / 其他人工智能社会招聘

岗位描述

岗位描述:负责依据详细项目规范,对多种英文文本(如新闻文章、科学摘要、财务报告)进行高级、多层次的文本标注与数据标记。确保所有标注工作的高一致性和高准确性,参与迭代式评审与校准会议,协助团队持续优化标注规范。快速学习并熟练使用公司自研或行业通用的文本标注平台,如 Prodigy、Label Studio、Brat。主动识别并记录数据中的疑难或歧义案例,为标注体系和方案的持续改进提供支持。该岗位所在团队从事 SAP HANA Predictive Analysis Library 相关机器学习能力建设,实习期间可获得现代 NLP 和知识库构建基础任务的实战经验,提升对语言现象及其机器可读化挑战的理解,并与 NLP 科学家和工程师协作参与真实项目。 岗位要求:本科或硕士在读,专业为计算语言学、语言学、英语或相关领域。每周可线下实习 5 天,连续实习至少 6 个月。具备出色的英文阅读理解能力和对细节的高度关注,英语达到母语或接近母语水平。优先考虑 TEM8 成绩优秀者;掌握德语或法语等额外语言者优先;有文本标注、数据标注或语言分析经验(包括学术场景)者优先。了解命名实体识别、指代消解和语义关系等概念者更有优势;具备 Python 或脚本基础加分,但非必需。