岗位描述
岗位描述:根据详细项目规范,对各类英文文本(如新闻文章、科研摘要、财务报告等)执行高级、多层次文本标注与数据标记工作。确保所有标注结果在一致性和准确性方面达到高标准,并参与迭代式评审与校准,持续完善标注规范。快速学习并熟练使用公司自研或行业通用文本标注平台,如 Prodigy、Label Studio、Brat 等。主动识别并记录数据中的复杂或模糊案例,推动标注体系持续优化。岗位所在团队致力于 SAP HANA Predictive Analysis Library(PAL)及下一代数据平台建设,实习生将获得现代 NLP 与知识库构建基础任务的实战经验,并有机会在 NLP 科学家和工程师指导下参与真实项目。 岗位要求:需为计算语言学、语言学、英语或相关专业的本科或硕士在读学生;能够每周到岗 5 天并进行至少 6 个月的线下实习。要求具备出色的英文阅读理解能力和高度关注细节的工作习惯,英语达到母语或接近母语水平。优先考虑拥有英语专业八级(TEM8)、掌握德语或法语等额外语言能力的候选人;有文本标注、数据标记或语言学分析经验(包括学术场景)者优先。了解命名实体识别、指代消解和语义关系等概念是明显优势;具备基础 Python 或脚本知识更佳,但非必需。