岗位职责
1、系统部署与升级:负责新版本上线所需的资源调配、网络策略配置、环境部署及测试验证,保障版本迭代平稳推进。深入探索自动化运维方案,运用自动化框架(如Ansible、SaltStack)实现系统配置、部署及日常管理的自动化操作。
2、系统监控:依托监控系统(如Zabbix、Prometheus等)对服务器、网络设备、存储设备、数据库等核心基础设施进行全天候监控,确保各组件运行稳定可控。
3、系统维护:按周期开展系统巡检工作,核查资源使用情况与服务运行状态,提前识别风险并实施预防性处理措施。
4、故障排查与处理:快速响应系统异常,精准定位故障根源,执行有效恢复策略,最大限度降低系统中断对业务运作的影响。
5、安全防护与管理:定期组织安全检查和漏洞评估,及时修补系统薄弱环节,提升整体系统的安全防护能力。
6、制定并落实云管平台的数据备份与恢复机制,确保关键数据的可靠性与完整性。
7、提供全面的运维技术支持,涵盖客户对接、问题闭环跟踪、技术沟通以及重点项目中的技术支撑工作。
岗位技能要求:
1、掌握Linux操作系统,熟练使用常用命令与工具,具备Shell脚本编写能力。
2、精通云计算底层技术体系,包括虚拟化方案(如KVM、Xen)、容器化技术(如Docker、Kubernetes)、分布式存储(如Ceph、GlusterFS)、网络架构(如SDN、VPC)等。
3、理解DevOps方法论,熟悉主流DevOps工具链,如Jenkins、Ansible、Git、Docker、Kubernetes,可实现部署与监控流程的自动化。
4、熟悉主流监控平台的应用,如Zabbix、Prometheus、ELK等。
5、掌握至少一门编程语言,例如Python、Java或Go。
6、了解数据库基本原理与操作方式,熟悉MySQL、PostgreSQL、Redis等常见数据库。
7、熟悉Java微服务架构下的典型组件配置与性能调优,如Nginx/Kafka/ELK/MySQL等;
8、具备Linux/Unix系统、网络架构及硬件基础知识,拥有较强的故障诊断与处理能力;
9、具备良好的沟通表达能力和团队协作意识,能与跨部门人员高效协同作业。

新华三技术有限公司
相关推荐查看更多 >
海口
相同职位推荐
企业招聘
职位大全
相关搜索

