职位描述

工作职责 - 负责系统日常监控和故障处理,保证业务系统的高并发和高可用性,遇到故障及时定位并找出解决办法; - 提供驻场运维支持服务,跟后端支持团队一起,积极推动产品和服务的持续提高; - 根据用户需求,部署测试及功能上线支持保障工作,跟进问题处理并及时有效跟客户沟通,提供快速有效的沟通和反馈。 - 负责现场各ai线上应用必要正样本、负样本的采集、汇总,支持算法的持续迭代 - 负责技术运维相关的文档、手册、流程编写整理 职位要求 - 3年以上中大型系统运维经验; - 对docker容器,镜像,网络,存储,持久化,监控,有一定的理解;有生产环境k8s/kubernetes等容器编排工具运维经验者优先,有大规模分布式集群运维经验者优先; - 熟悉文件存储、对象存储、云磁盘,有实际运维经验,swift,cinder,ceph有一定的了解; - 掌握常用业务监控方式,熟练使用prometheus监控工具使用 - 具备很强的ownership,故障排查能力,多线程工作能力,有很好的技术敏感度和风险识别能力。良好的客户服务意识,善于团队协作,能够承受较大的工作压力,以结果和行动为准则, 努力追求成功。
工作地点
地址:北京丰台区北京-丰台区


职位发布者
HR
百度在线网络技术(北京)有限公司


-
互联网·电子商务
-
1000人以上
-
私营·民营企业
-
北京海淀区上地十街10号百度大厦