分布式训练工程师
1. 基于公司生态,面向 NLP、CV、音视频、多模态、推广搜索等场景,构建大规模分布式机器学习系统;2. 负责解决业务交付流程中单机多卡、多机多卡场景下的精度和性能问题;3. 基于公司生态,研究行业领先的超大规模分布式策略,解决大模型落地中的分布式工程挑战。任职要求:计算机、电子、数学及相关专业,2年以上相关工作经验;熟练使用 C++/Python 编程,有 CUDA 编程经验优先;熟悉 TensorFlow、PyTorch、Padd...
第 490 页,共 793 页
1. 基于公司生态,面向 NLP、CV、音视频、多模态、推广搜索等场景,构建大规模分布式机器学习系统;2. 负责解决业务交付流程中单机多卡、多机多卡场景下的精度和性能问题;3. 基于公司生态,研究行业领先的超大规模分布式策略,解决大模型落地中的分布式工程挑战。任职要求:计算机、电子、数学及相关专业,2年以上相关工作经验;熟练使用 C++/Python 编程,有 CUDA 编程经验优先;熟悉 TensorFlow、PyTorch、Padd...
1. 定义软件、硬件和固件接口,开发 GPU 内核驱动程序和网卡驱动程序;2. 与硬件工程师、固件工程师和软件工程师协同,解决平台中的网络通信问题及单机问题。任职要求:熟悉计算机体系结构,至少了解一种 GPU 架构,如 ARM MALI、AMD、NV、Intel;精通 C 编程,熟悉 Linux 内核架构,熟悉 PCIe 设备驱动开发或网卡驱动开发;具备内核驱动程序开发与验证经验;具备较强的问题分析与解决能力、沟通能力、独立工作能力和跨...
负责SoC芯片内部功能模块的MAS文档编写和设计交付,完成子系统级和芯片级系统集成;协助开展模块/系统的FPGA与EMU原型验证;配合SoC DV团队完成模块验证和SoC级验证;完成Lint、CDC等规则检查及SDC编写;负责IP技术评估、IP集成及应用支持;进行自动化流程脚本开发、更新与维护;配合验证团队定义SoC/IP验证计划并开发验证测试;与后端团队协作完成模块时序收敛和流片签核;参与芯片bring-up及系统联调,并按需输出方案...
负责模块级电路的逻辑综合与形式验证;负责模块级或全芯片级设计的时钟分析、SDC 定义、时序报告分析及 STA 签核;负责 RTL、Netlist、SDC 质量检查;负责实现流程中的 LEC 检查和 ECO 流程;负责逻辑综合、形式验证等流程的维护、更新与升级;负责芯片模块综合、网表等相关流片签核工作;负责顶层和模块级别的 UPF 生成与相关检查;负责中端相关流程的搭建与维护;与后端 PR 团队合作,支持后端版图和时序收敛。要求熟练使用...
主导 GPGPU 芯片的 FPGA 原型开发与硬件仿真(Emulation)平台搭建,基于 Palladium、Zebu 等平台开展工作;负责芯片 RTL 到 FPGA/仿真器的综合、时序优化与调试,支持软硬件协同验证;开发 Python/Tcl/Perl 自动化脚本,提升平台部署和测试效率;支持硅前系统验证、驱动开发及性能分析,加速芯片 bring-up;协同设计团队定位芯片架构与微架构问题并提供解决方案。要求具备 FPGA 原型验证...
负责芯片 all hard IP/IO(GPIO、PLL、PHY 等)的规划、摆放与实现,制定并实现 IO RDL 方案;负责芯片 ubump 或 C4 bump 方案的规划、摆放与实现;负责 2.5D/chiplet 设计中的 interposer ubump/C4 bump 的 pattern、pitch 规划与实现,以及 interposer 整体方案规划与实现;与封装及板卡团队合作,完成 ball map 实现可行性评估;负责...
负责高速接口(如 PCIe、BLINK、UCIE、ETH 等)的硅后测试计划制定与执行;参与芯片高速接口的 bring-up 工作并使能相关 IP 功能;负责相关高速 IP 的产品化验证与问题定位解决;支持客户在高速接口方面的问题讨论与排查。要求具备高速接口设计或验证经验,熟悉 PCIe、IEEE802.3ck/df、CMIS 等协议,理解 SI/PI 硬件原理,能够进行 PCB 布线设计评审;熟悉 CPU/GPU 架构、服务器硬件平台...