边端侧大模型推理框架部署优化高级工程师
负责将亿级至十亿级参数的大模型(LLM、VLM、Audio LM)部署到终端芯片平台,并进行极致性能与能效优化,确保模型在资源受限环境下仍能提供流畅稳定的智能服务。主导vLLM、Ollama等框架在ARM CPU、NPU、GPU等异构平台上的移植、适配与深度优化,重点攻克注意力机制、KV Cache管理、解码策略在内存受限场景下的高效实现;针对终端特性优化或自研高性能、低内存占用的推理运行时,方向包括算子融合、计算图优化、静态内存规划、...
第 188 页,共 220 页
负责将亿级至十亿级参数的大模型(LLM、VLM、Audio LM)部署到终端芯片平台,并进行极致性能与能效优化,确保模型在资源受限环境下仍能提供流畅稳定的智能服务。主导vLLM、Ollama等框架在ARM CPU、NPU、GPU等异构平台上的移植、适配与深度优化,重点攻克注意力机制、KV Cache管理、解码策略在内存受限场景下的高效实现;针对终端特性优化或自研高性能、低内存占用的推理运行时,方向包括算子融合、计算图优化、静态内存规划、...
牵头搭建与完善公司收入核算体系、成本核算体系,制定标准化核算流程与内控节点,确保核算真实、准确、可追溯;梳理并优化财务业务流程,主导财务规范整改与内控体系建设,提升整体财务治理水平;对接外部审计及专业机构,负责资料统筹、问题沟通与整改落地;主导ERP财务模块的需求梳理、流程设计与上线落地,推动财务核算系统化、标准化;开展预算管理、经营分析、成本管控与资金统筹,协同业务部门提升运营效率。要求本科及以上学历,财务、会计、审计相关专业,CPA...
与一流芯片架构和设计团队共同开展高端芯片架构研发,主导AI芯片集群系统构建。负责解析市场需求,形成高性能AI芯片需求包和技术规格;参与从应用场景分析、产品定义、芯片开发到AI芯片集群方案落地的全过程;负责芯片架构设计、性能分析、低功耗设计以及服务器芯片顶层架构和微架构设计;负责核心AI系统架构前瞻性需求调研、分析和设计,对系统前瞻性能力负责;负责核心AI系统分布式架构设计及相关模块研发,满足可扩展性、高可用性和高性能要求;主导重大技术难...