岗位描述负责公司机器学习的大规模训练数据处理,包括数据处理、清洗、标注及相关工程建设;参与推荐系统、搜索、广告排序等项目开发并承担关键角色;使用 Python、Spark 或 Ray 构建大规模离线分布式数据处理系统,结合 TensorFlow 或 PyTorch 支撑模型训练;需要具备分布式系统设计与大规模存储经验,熟悉 NLP 或 CV,并有实际训练相关模型并上线的经验。