测试开发工程师(稳定性方向)
负责核心业务系统的稳定性与可靠性保障,围绕系统可用性、连续性和风险控制构建并持续演进稳定性保障体系;深度参与业务需求、技术方案和架构设计评审,从可靠性与稳定性视角提前识别系统性风险;建立并持续完善稳定性测试与保障机制,包括风险评估、关键链路识别、稳定性测试与回归策略;主导线上业务故障演练,设计贴近真实生产环境的故障场景,验证系统容灾与自愈能力;组织并推进红蓝军对抗式稳定性演练;参与并推动线上故障处理与应急响应,在关键事故中提供稳定性与质...
第 630 页,共 794 页
负责核心业务系统的稳定性与可靠性保障,围绕系统可用性、连续性和风险控制构建并持续演进稳定性保障体系;深度参与业务需求、技术方案和架构设计评审,从可靠性与稳定性视角提前识别系统性风险;建立并持续完善稳定性测试与保障机制,包括风险评估、关键链路识别、稳定性测试与回归策略;主导线上业务故障演练,设计贴近真实生产环境的故障场景,验证系统容灾与自愈能力;组织并推进红蓝军对抗式稳定性演练;参与并推动线上故障处理与应急响应,在关键事故中提供稳定性与质...
负责公司分布式数据库集群(如 TiDB、CockroachDB、OceanBase)的架构设计、部署、运维与调优;负责图数据库引擎的选型、搭建、性能调优及日常运维;制定数据库高可用、容灾备份、弹性扩缩容方案,保障全球多区域数据服务SLA;参与数字员工平台的数据架构设计与复杂业务建模,给出最优存储与查询方案;建立数据库监控与告警体系,定位并解决线上性能瓶颈;参与大模型工程化落地,探索LLM与数据库协同的智能化运维方案,并与大模型工程团队协...