职位详情
微信扫码分享
投诉
【岗位职责】
1.负责公司现有监控系统(基于Prometheus/Zabbix/ELK等)的性能调优、功能增强及架构升级,提升平台稳定性与可观测能力。
2.主导新一代监控系统的规划与研发,覆盖运维监控、日志处理、告警控制、APM等功能模块,构建高吞吐、低延迟的数据处理体系。
3.结合AIOps与云原生监控发展方向,推进智能告警(如自适应阈值)、故障根因定位等功能实现,减少人工运维介入。
4.探索主流开源组件(如SkyWalking、Grafana)的深度整合方案,优化数据采集、存储效率及可视化展示流程。
5.与运维团队协同配合,保障监控系统兼容客户IT环境(服务器/网络/数据库等),建立标准化接入规范。
【任职要求】
1.精通Python及常用框架(Django/Flask/FastAPI),掌握异步编程与高性能服务开发技术。
2.深入掌握监控技术生态(Prometheus/ELK/Grafana等),具备数据采集、存储调优及告警策略设计实践经验。
3.熟练运用Docker/K8s部署监控服务,熟悉Linux系统性能优化与Shell脚本编写。
4.具备5年以上Python开发经历,3年以上运维类工具或监控平台开发管理经验,主导过中型规模项目落地。
5.了解IT基础组件(如Nginx/MySQL/Redis)的关键监控指标与故障诊断方法,有APM或日志分析系统开发背景者优先。
6.具备技术敏锐度,持续跟踪AIOps、系统可观测性等前沿领域进展。

郭女士IP:上海
昨日活跃|
上海大巧不工信息科技有限公司
相关推荐查看更多 >
闵行区
相同职位推荐
企业招聘
职位大全
相关搜索

