职位描述
岗位描述:
1、负责公司平台的日常运维,包括环境部署、上线、监控、故障应急处理等保障平台稳定、高效运行。
2、负责产品的业务监控,容量规划,性能调优等
3、负责容器化平台的搭建和维护,使用Kubernetes进行容器编排和管理。
4、负责设计、搭建、维护、优化可观测性系统,包括监控、告警、日志等,提供高效的日志收集、存储、分析和查询能力,实现对平台运行状态的全面掌控。
5、负责自动化运维工具和平台的开发。
6、负责编写和维护基建文档,包括操作手册、故障处理指南等,处理平台故障,进行问题排查和解决,并总结经验教训。
7、熟练 Prometheus、Zabbix、Grafana 等监控工具对监控告警全链路闭环有丰富经验。
岗位要求
1、具备运维工作3年以上工作经验:,有云平台(华为云等)、微服务架构运维经验优先,
2、熟悉 Linux 操作系统,具备扎实的 Shell/Python脚本编写能力。
3、熟悉 Kubernetes 容器编排技术,具备丰富的实践经验。
4、熟练 Prometheus、Zabbix、Grafana 等监控工具,具备可观测性系统搭建和维护经验。
5、熟悉常用的运维工具和技术,例如 Ansible、Jenkins、Git 等。
6、具备良好的问题分析和解决能力,能够独立处理复杂问题。
7、具备良好的沟通能力和团队合作精神,责任心强。
8、有研发或运维的背景,掌握高并发系统的设计原则,对于高并发、分布式、缓存、微服务等一个或多个领域有深入研究,并有实际应用经验。
9、对分布式架构有深刻深刻理解,熟悉缓存技术,服务器优化、集群技术处理、负载均衡、系统性能调优等,熟悉常见的开源技术和前后端框架,对于常见的数据库有优化经验。9、对分布式架构有深刻深刻理解,熟悉缓存技术,服务器优化、集群技术处理、负载均衡、系统性能调优等,熟悉常见的开源技术和前后端框架,对于常见的数据库有优化经验。