岗位描述
负责面向大模型产品制定并执行成本优化策略,分析现有运行成本,识别优化空间,提出具体优化建议和实施方案;结合技术理解、用户洞察和系统化思维进行需求定义与功能改进,优化产品体验。分析请求队列,在不同负载情况下提出优化方案,提升系统吞吐量和响应时间,实现成本与性能平衡;基于用户特征和使用行为制定用户分群与流量分配策略,提升资源利用率和用户体验。与技术、运营、数据和业务团队协同,推动优化措施落地,并通过数据分析和 A/B 测试持续评估效果、迭代策略。要求本科及以上学历,计算机科学、人工智能、数据科学等相关专业优先;熟悉大模型及其应用,理解模型运行机制,了解 Transformer、Stable Diffusion 等主流模型原理,具备较强数据分析能力。