当前在线岗位 7938 个
职位列表
第 575 页,共 794 页
独角兽独角兽企业面壁智能
大模型训练与分布式优化工程师
北京/运维/架构/安全/100-499人/互联网 / AI / 软件/社会招聘
负责公司大模型训练引擎研发,将算法逻辑高效转化为大规模分布式系统实现,重点聚焦训练底座的深度定制与性能优化。在千卡或万卡规模集群上,针对 NVIDIA H 系列或国产算力优化 NCCL/HCCL 通信策略,提升集群 MFU。深度调优 3D 并行(TP/PP/DP),并引入序列并行、上下文并行等技术,解决超长文本训练中的系统工程瓶颈。利用 Triton 或 CUDA 提升核心算子效率,推动 FP8 混合精度训练及 Transformer...
独角兽独角兽企业面壁智能
大模型解决方案与项目管理工程师
北京/项目经理/100-499人/互联网 / AI / 软件/社会招聘
负责端侧大模型在办公、具身智能、医疗、遥感、思维博弈、电磁信号等垂直领域的解决方案设计;具备大模型预训练、微调等基础知识,能够根据客户需求完成模型选型、数据策略制定及微调方案设计。熟练运用 Vibe Coding 等高效编码方式,快速生成、迭代和调试代码原型,缩短从需求到可运行方案的验证周期,支撑解决方案快速交付与演示。承担项目全流程管理职责,包括立项、需求分析、进度计划、资源协调、风险控制、交付验收等,确保项目按时、按质、按预算完成,...
独角兽独角兽企业面壁智能
大模型推理与部署优化工程师
北京/运维/架构/安全/100-499人/互联网 / AI / 软件/社会招聘
负责大语言模型、多模态模型的推理引擎搭建、优化与线上落地,支撑高并发、低延迟的模型服务;基于vLLM、TensorRT-LLM、SGLang、LightLLM等主流推理框架进行性能调优,并探索推测性解码、前缀缓存等前沿加速技术;负责大模型在NVIDIA A/H系列、昇腾等加速卡上的适配与算子优化,解决兼容性与性能瓶颈;设计与实现高性能模型Serving架构,包括PD分离架构、连续批处理、负载均衡、流式输出等;基于Docker、Kuber...