岗位描述
面向通用机器学习,尤其是深度学习、生成式AI、LLM和LVM开展算法研究与开发,参与构建先进机器学习技术、优化工具及高质量解决方案,支持模型在功耗、内存和算力受限设备上的高效运行。重点工作包括:开展LLM、LVM及其他前沿生成式模型架构的算法研发;研究复杂生成式模型的高级量化算法;进行LLM训练与微调实验,包括预训练、SFT、RL、损失函数设计优化及基于高级量化方法的量化感知训练;研发高效推理算法,如批处理、KV缓存、高效注意力、长上下文和投机解码;开展模型压缩、结构搜索与神经搜索,以及基于优化的学习和基于学习的优化;进行生成式AI系统原型开发,并将方案应用于端侧及云端系统创新以提升模型效率。岗位要求熟练使用Python、PyTorch,具备算法或系统工程经验。