职位描述
1. 负责公司业务系统运维工作,提升业务稳定性和工程效率,与业务方保持高效沟通,建立良好合作关系;
2. 负责应用上线评审、上线交付、配置变更、状态监控、容量管理、故障应急响应工作;
3. 负责线上重大问题排查,紧急事故处理,后续事故分析与优化;
4. 负责应用故障演练、应急预案、 SOP 手册编写工作,确保故障时业务能快速恢复
任职要求
1. 5 年以上互联网公司运维相关经验,熟悉 JVM 虚拟机的内存机制、 GC 机制,能进行 JAVA 进程异常的故障定位及排查
2. 熟悉 Nginx,Zookeeper, Kafka, RocketMQ 等常用 WEB 中间件的维护与使用;
3. 熟悉常见监控系统,如 Zabbix,Grafana,Prometheus 等
4. 熟悉 Memcache 、 Redis 、 Twemproxy 等开源缓存解决方案
5. 有丰富的系统故障排查和解决经验,突出的分析和解决问题的能力
6. 至少能掌握 Python/Shell/GO 等一至两种语言,有项目开发经验者优先
7. 熟悉高并发、高可用、微服务系统架构运维者优先;
你将收获
您将在一个多元化的环境中获得卓越的工作经验,同时获得一个新的稳定职业生涯和更大发展空间的绝佳机会。
你现在需要做的是
如果您对这个职位感兴趣的话,请通过邮件地址 Cassie Lin 或发送你的 CV 到 Cassie.Lin@hays.cn 或联系 2322 9727
如果这份工作不适合你,但你正在寻找一个新的职位,请与我们联系,我们会对你的职业生涯进行保密讨论。