Keep AIOps 开源告警管理平台搭建指南
概述
Keep 是一个开源的告警管理和 AIOps 平台,专为现代分布式系统设计。它通过统一的控制面板聚合来自不同监控工具的告警信息,利用人工智能技术实现告警去重、关联分析和自动化响应。
核心功能
- 统一告警管理:集中处理所有监控系统的告警信息
- 智能降噪过滤:AI 算法自动识别并过滤重复告警
- 自动化工作流:可视化配置告警处理流程
- AI 辅助分析:智能根因分析和事件关联
快速开始
环境准备
克隆项目代码到本地:
git clone [项目仓库地址]
cd keep
一键启动
使用 Docker Compose 启动服务:
docker-compose up -d
访问控制台
打开浏览器访问 http://localhost:3000,即可开始配置你的告警管理系统。
集成能力
Keep 支持与 100+ 监控工具和平台集成。
监控系统集成:
- Prometheus、Datadog、New Relic
- CloudWatch、Grafana、Elasticsearch
- Zabbix、Nagios、VictoriaMetrics
通知渠道支持:
- Slack、Teams、Discord
- Email、SMS、Webhook
- PagerDuty、OpsGenie
智能工作流自动化
Keep 的工作流引擎允许像配置 GitHub Actions 一样定义告警处理逻辑:
- name: 处理数据库告警
triggers:
- provider: prometheus
condition: db_connections > 100
steps:
- action: query_database
params:
query: "SELECT * FROM connections"
- action:

