独角兽面壁智能
AI算力调度平台开发工程师
北京/后端开发/社会招聘
负责AI算力调度平台核心服务的设计、开发与持续演进,支撑模型训练、研发调试、镜像管理、数据流转等关键场景。基于Kubernetes、Volcano构建资源管理、项目配额、任务调度、队列治理、优先级与抢占等核心能力,持续提升GPU资源利用率与平台吞吐能力。参与平台控制面架构设计,推动领域模型统一、接口规范升级和系统架构演进,推进REST向gRPC、同步接口向异步任务、单体能力向平台化能力升级。负责平台稳定性与可运维性建设,包括任务状态流转...