岗位描述负责优化超大规模线上推理集群的运行效率和稳定性;跟踪最新模型进展,设计技术架构并将模型应用到产品中;设计和优化工作流,通过自动化手段加速模型到产品的迭代效率;需要具备良好的代码开发习惯,熟练掌握至少一种编程语言,如 Python、Go、Rust;具备分布式系统、API 设计、模型部署或 DevOps 相关经验者优先;能够独立思考并解决生产系统中的实际性能问题,熟悉 Kubernetes、容器化技术及主流大模型推理框架者优先。