实战:分布式开源监控Zabbix

实战:分布式开源监控Zabbix

Zabbix作为一个分布式开源监控软件,在传统的监控领域有着先天的优势,具备灵活的数据采集、自定义的告警策略、丰富的图表展示以及高可用性和扩展性。本文简要介绍Zabbix的特性、整体架构和工作流程,以及安装部署的过程,并结合实战进行监控配置。

1、Zabbix介绍

Zabbix是一个企业级的分布式开源监控方案,能够监控各种网络参数以及服务器健康性和完整性。它由Alexei Vladishev创建,目前由Zabbix SIA在持续开发和支持。Zabbix基于Web页面,提供分布式系统监控及网络监控功能,提供多种监控方式,支持在复杂系统架构下的全栈监控。

1.1 Zabbix特性
1)监控数据采集的灵活性

Zabbix支持多种数据采集方式,包括自动发现、agent、snmp、JMX、telnet采集方式和主动、被动模式下的数据传输。同时,它还支持用户自定义插件和自定义间隔数据收集。

  • 采集数据源的广泛性:从基础设施、数据库、应用程序、传感器等终端采集数据
  • 数据采集的灵活性:数据采集的间隔、策略,采集数据的类型包括文本、二进制以及结构化JSON、CSV等数据格式
  • 支持代理和无代理监控:利用Zabbix Agent代理进行深度监控;无代理监控支持SNMP、IPMI、ODBC和Prometheus等监控协议
  • 支持采集数据的规范化和转换:对采集数据进行格式转换、验证数据的准确性等
在这里插入图片描述

2)告警信息自定义配置

Zabbix可以设置告警信息的周期、级别、恢复通知、时段阈值等,支持维护周期和单机停用。同时支持多条件告警、告警信息推送等。

  • 根据传入的数据流进行异常检测和趋势预测,自定义告警级别和分类
  • 将告警信息推送到不同的平台,支持告警平台、邮箱和通信平台等
  • 故障告警自动修复功能,针对部分场景实现故障自愈功能,如自动重启、自动伸缩资源
在这里插入图片描述

3)数据可视化展示

Zabbix可以自定义监控视图、网络拓扑、自定义面板和IT服务时间与可用性。

  • 支持采集数据的个性化展示,实现拖拽缩放、仪表盘、各种图表等功能
  • 支持地理环境和基础设施拓扑展示,展示整个集群的整体情况
  • 生成定制化报表定时发送
在这里插入图片描述

4)架构高可用性和扩展性

Zabbix的监控系统对设备的性能要求较低,支持proxy分布式监控、分布式集中管理、自动化监控和开放式接口,扩展性较强。

  • Zabbix高可用部署架构防止数据丢失,并且提高前端用户体验
  • 通过部署Zabbix Proxy支持分布式监控,支持无限的可扩展性
在这里插入图片描述

5)安全审计策略保证

Zabbix支持安全用户审计日志、权限认证和用户限制允许维护的列表。

  • Zabbix组件之间的通信通过加密传输,支持不同的加密算法
  • 用户权限定义不同的级别、用户分为不同的角色进行管理
  • 限制采集数据的敏感信息访问等
在这里插入图片描述

除了以上特性,Zabbix支持在本地或云平台快速部署和配置、无缝对接不同的软硬件平台、多租户管理等特性。

1.2 Zabbix监控采集方式
Zabbix支持监控各种系统平台,包括Linux和Windows等主流操作系统,也可以借助SNMP或者SSH协议监控路由交换设备。

  • 硬件监控:Zabbix IPMI Interface,通过IPMI接口进行监控,监控被监控对象的物理特征,比如电压、温度、风扇状态、电源状态等。
  • 系统监控:Zabbix Agent Interface,通过专用的代理程序进行监控,易于部署、性能消耗低,推荐首选监控方式。
  • Java监控:Zabbix JMX Interface ,通过JMX(java management extensions)java管理扩展)监控JVM虚拟机。
  • 网络设备监控:Zabbix SNMP Interface,通过SNMP协议与被监控对象进行通信,用于监控路由器、交换机这种网络设备。
  • 应用服务监控:Zabbix Agent UserParameter
  • MySQL数据库监控:percona-monitoring-plulgins
  • URL监控:Zabbix Web监控

1.3 Zabbix和Prometheus监控对比
Prometheus也是时下较为流行的分布式监控工具,Zabbix和其对比,如下表所示:

在这里插入图片描述

相比较而言,Prometheus对容器监控支持能力更为强大,是云原生和K8S等容器相关监控的首选解决方案;Zabbix作为传统的监控方式,系统稳定成熟度高,对服务器等基础设施监控上具有优势,缺点是随着架构复杂度增加,定制化的难度也更大了。

2、Zabbix架构原理

2.1 Zabbix整体架构

在这里插入图片描述

Zabbix的架构分为服务端、Proxy层和客户端部分,主要包括以下部分:

  • Zabbix Server:核心组件,负责收集和接收来自被监控设备的数据,并与Zabbix Agents、Zabbix proxy和Zabbix Database进行通信。
  • Zabbix Database:用于存储Zabbix的数据。
  • Zabbix Agents:安装在被监控服务器上,负责收集本地数据,并将其发送到Zabbix Server。
  • Zabbix Proxy:可选组件,常用于监控节点很多的分布式环境中,代理Server收集部分数据转发到Server,可以减轻Server的压力。
  • Zabbix GUI:Zabbix的Web前端管理界面,用户通过Web前端页面可以查看Zabbix Server收集的数据,也可以对Zabbix Server进行配置。

2.2 Zabbix主要工作进程
在Zabbix中,有以下几个主要的进程:

  • zabbix_agentd:Zabbix客户端守护进程,主要负责收集客户端监控项数据。
  • zabbix_server:Zabbix服务端守护进程,主要负责收集Zabbix客户端数据。
  • zabbix_proxy:Zabbix代理进程,其功能类似于Server,作用上类似与一个中转站,最终会把收集到的数据再次提交给zabbix_server。
  • zabbix_get:一个Zabbix工具,通常运行在zabbix server或者是zabbix proxy上,用于远程获取客户端信息,通常用于排错。
  • zabbix_sender:一个Zabbix工具,通常运行在zabbix客户端,用于耗时比较长的的检查,其作用是主动发送数据。
  • zabbix_java_gateway:Zabbix2.0之后引入的新功能,可以用于JAVA的设备,但是其只能主动获取数据,而不能被动获取数据。

此外,还有报警器(alerter)、配置同步器(configuration syncer)、数据发送器(data sender)、数据库watchdog等进程。不同的进程在Zabbix系统中担任不同的角色和任务,可以根据需要灵活配置和扩展。

2.3 Zabbix工作流程
Zabbix通过客户端定期收集监控设备上的数据,并将其发送给zabbix服务端;zabbix服务端将zabbix客户端发送的数据存储的数据库中,zabbix web根据数据在前端进行展示和绘图。Zabbix的数据采集模式主要包括两种:

  • Poller模式(主动轮询):Zabbix Server会主动轮询Zabbix Agent或Zabbix Proxy,获取监控数据。这种方式的好处是可以主动获取数据,数据采集的及时性相对较高,但是缺点是在大量服务器的环境中,Zabbix Server不能及时获取最新的数据。
  • Trapper模式(主动捕捉):Zabbix Agent或Zabbix Proxy主动向Zabbix Server发送数据,这种方式可以在Zabbix Server不主动轮询的情况下获取实时的监控数据,但是缺点是需要在被监控服务器上安装Agent或Proxy,增加了运维成本。

2.4 Zabbix监控框架
Zabbix的部署架构可以根据实际监控环境的需求进行选择和配置,主要有以下三种常见架构:

  • Server-Client架构:最简单的架构,监控设备和被监控设备之间直接相连,Zabbix Server和Zabbix Agent之间直接进行数据交互。适用于网络比较简单,设备比较少的监控环境。
  • Server-Proxy-Client架构:其中Proxy是Server、Client之间沟通的一个桥梁,Proxy本身不存放数据,只是将Agent发来的数据暂时存放,然后再提交给Server。这种架构经常和Master-Node-Client架构做比较,一般适用于跨机房、跨网络的中型网络架构的监控。
  • Master-Node-Client架构:最复杂的监控架构,适用于跨网络、跨机房、设备较多的大型环境。每个Node同时也是一个Server端,Node下面可以接Proxy,也可以直接接Client。
在这里插入图片描述

3、Zabbix部署实战

3.1 Zabbix源码安装及部署
3.1.1 部署架构

在这里插入图片描述

本次安装部署采用Server-client部署架构,如图所示Server端直接连到代理端。

3.1.2 安装Server端
由于Zabbix 6.0以上版本在Centos 7上不支持Server部署,本次以Zabbix 5.0版本测试。

在这里插入图片描述

1)系统环境配置

#1、关闭selinux 动态生效setenforce 0 配置/etc/selinux/config中SELINUX=设置为disabled #2、关闭防火墙 关闭防火墙# systemctl stop firewalld #systemctl disable firewalld #3、准备mysql环境 

2)下载安装包仓库

rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm Retrieving https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm warning:/var/tmp/rpm-tmp.eaB8GC:Header V4 RSA/SHA512 Signature, key ID a14fe591: NOKEY Preparing... ################################# [100%]Updating/ installing...1:zabbix-release-5.0-1.el7 ################################# [100%]

此时/etc/yum.repos.d/下会有一个zabbix.repo文件

3)安装Server端、mysql数据库和Web前端

#yum install zabbix-server-mysql zabbix-agent -y ResolvingDependencies-->Running transaction check --->Package zabbix-agent.x86_64 0:5.0.36-1.el7 will be installed --->Package zabbix-server-mysql.x86_64 0:5.0.36-1.el7 will be installed … Installed: zabbix-agent.x86_64 0:5.0.36-1.el7 zabbix-server-mysql.x86_64 0:5.0.36-1.el7 DependencyInstalled:OpenIPMI.x86_64 0:2.0.27-1.el7 OpenIPMI-libs.x86_64 0:2.0.27-1.el7 OpenIPMI-modalias.x86_64 0:2.0.27-1.el7 fping.x86_64 0:3.16-1.el7 libevent.x86_64 0:2.0.21-4.el7 net-snmp-libs.x86_64 1:5.7.2-49.el7_9.2 unixODBC.x86_64 0:2.3.1-14.el7 Complete!

4)安装前端软件包

# yum install centos-release-scl -y #编辑zabbix.repo [zabbix-frontend]... enabled=1... #安装前端软件包 yum install zabbix-web-mysql-scl zabbix-apache-conf-scl -y 

5)初始化数据库配置

#1、在mysql数据库中创建数据库用户并授权 # mysql -uroot -p -A mysql> create database zabbix character set utf8 collate utf8_bin; mysql> create user 'zabbix'@'%' identified withmysql_native_password by 'password'; mysql> grant all privileges on zabbix.* to'zabbix'@'%'; mysql> set global log_bin_trust_function_creators =1; mysql> quit; #2、导入初始架构和数据 # zcat /usr/share/doc/zabbix-server-mysql*/create.sql.gz | mysql -uzabbix -p zabbix 

6)为Zabbix server配置数据库

#编辑配置文件/etc/zabbix/zabbix_server.conf DBPassword=password 

7)为Zabbix配置正确的时区

#编辑配置文件/etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf php_value[date.timezone]=Asia/Shanghai #亚洲/上海 

8)启动Zabbix服务并查看

#启动Zabbix server和agent进程,并为它们设置开机自启: systemctl restart zabbix-server zabbix-agent httpd rh-php72-php-fpm systemctl enable zabbix-server zabbix-agent httpd rh-php72-php-fpm 查看zabbix服务启动情况 # netstat -nltp |grep zabbix tcp 000.0.0.0:100500.0.0.0:* LISTEN 1028/zabbix_agentd tcp 000.0.0.0:100510.0.0.0:* LISTEN 1623/zabbix_server tcp6 00:::10050:::* LISTEN 1028/zabbix_agentd tcp6 00:::10051:::* LISTEN 1623/zabbix_server 

9)异常处理

#1、连接数据库失败,指定的socket有误 #错误信息:connection todatabase'zabbix' failed:[2002]Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' #解决办法:由于mysql配置的socket和zabbix默认的socket路径不同,修改zabbix配置文件/etc/zabbix/zabbix_server.conf中的DBSocket选项 DBSocket=/tmp/mysql.sock #2、连接数据库失败,提示加密插件caching_sha2_password.so找不到 #错误信息:cannot be loaded:/usr/lib64/mysql/plugin/caching_sha2_password.so: cannot openshared object file:No such file or directory #解决办法:在创建用户时指定mysql的加密插件withmysql_native_password create user 'zabbix'@'%' identified withmysql_native_password by 'password';

3.1.3 配置Web端页面
1)登录Web访问页面http://192.168.112.121/zabbix

在这里插入图片描述

2)配置数据库连接

在这里插入图片描述

3)输入服务器详细信息

在这里插入图片描述

4)完成安装

在这里插入图片描述

5)Web界面登录,默认用户是Admin、密码是zabbix

在这里插入图片描述

6)修改界面语言为中文

在这里插入图片描述


在这里插入图片描述

3.1.4 被监控对象安装Agent代理
1)系统环境配置

#1、关闭selinux 动态生效setenforce 0 配置/etc/selinux/config中SELINUX=设置为disabled #2、关闭防火墙 关闭防火墙# systemctl stop firewalld #systemctl disable firewalld 

2)下载Agent安装包仓库

rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rp 

3)安装zabbix-agent

# yum install zabbix-agent -y 

4)修改agent配置文件,指定zabbix server地址

# vi /etc/zabbix/zabbix_agentd.conf Server=192.168.112.121

5)启动服务并设置开机启动

systemctl start zabbix-agent systemctl enable zabbix-agent 

6)检查zabbix-agent端口状态

# netstat -nltp |grep zabbix tcp 000.0.0.0:100500.0.0.0:* LISTEN 1814/zabbix_agentd tcp6 00:::10050:::* LISTEN 1814/zabbix_agentd 

3.2 Zabbix监控页面配置
3.2.1 添加主机
在“配置->主机”中添加需要监控的主机,并选择监控模板指标

在这里插入图片描述

添加完成后,看到主机信息

在这里插入图片描述

在监测->主机中,能看到监控数据。同时在仪表盘中能看到当前主机的数量

3.2.2 自定义拓扑图
在“监测->拓扑图”中编辑拓扑图信息,比如添加服务器节点、建立链接关系、网络流量等

在这里插入图片描述

链接信息中填上标签“{Zabbix server:net.if.out[“ens33”].last(0)}”,可以在“主机->配置->监控项”中获得监控信息。

Read more

Windows环境Git安装教程(下载Git安装包、安装Git、验证Git是否安装成功、设置名字和邮箱)

Windows环境Git安装教程(下载Git安装包、安装Git、验证Git是否安装成功、设置名字和邮箱)

文章目录 * 1. 下载Git安装包 * 1.1 通过清华大学开源软件镜像站下载(推荐) * 1.2 通过Git官网下载 * 1.3 通过联想电脑管家下载 * 2. 安装Git(一路点击Next即可) * 3. 验证Git是否安装成功 * 4. 设置个人信息(名字和邮箱) 1. 下载Git安装包 1.1 通过清华大学开源软件镜像站下载(推荐) 下载地址:https://mirrors.tuna.tsinghua.edu.cn/github-release/git-for-windows/git/ https://mirrors.tuna.tsinghua.edu.cn/github-release/git-for-windows/git/ 点击 LatestRelease/ 目录 下载

By Ne0inhk
GTC2026前瞻(二)Agentic AI 与开源模型篇+(三)Physical AI 与机器人篇

GTC2026前瞻(二)Agentic AI 与开源模型篇+(三)Physical AI 与机器人篇

(二)Agentic AI 与开源模型篇 Agentic AI与开源模型:英伟达想定义的,不只是“更聪明的模型”,而是“能持续工作的数字劳动力” 如果说过去两年的大模型竞赛,核心问题还是“谁能生成更像人的答案”,那么到了 GTC 2026,问题已经明显变了。英伟达把 Agentic AI 直接列为大会四大核心主题之一,官方对这一主题的定义也很明确:重点不再是单轮问答,而是让 AI agent 能够推理、规划、检索并执行动作,最终把企业数据转化为可投入生产的“数字劳动力”。这说明,Agentic AI 在英伟达的语境里,已经不是一个前沿概念,而是下一阶段 AI 商业化的主战场。(NVIDIA) 一、GTC 2026真正的变化,是 AI 开始从“会回答”走向“会做事”

By Ne0inhk
HarmonyOS ArkUI 表冠事件(Digital Crown Event)全面解析与实战演示

HarmonyOS ArkUI 表冠事件(Digital Crown Event)全面解析与实战演示

文章目录 * 一、数字表冠核心概念 * 1.1 什么是数字表冠? * 1.2 表冠事件与其他输入事件对比 * 二、核心 API 详解 * 2.1 onDigitalCrown 事件接口 * 2.2 CrownEvent 完整结构 * 2.3 两种灵敏度字段详解 * 三、基础用法:表冠数据实时显示 * 3.1 可运行完整示例 * 四、列表滚动控制 * 4.1 表冠驱动列表滚动 * 五、数值调节控制器 * 5.1 音量/亮度旋钮 * 六、图片缩放控制 * 6.1 表冠驱动图片缩放 * 七、进度与时间选择器 * 7.1

By Ne0inhk
使用 VS Code 将项目代码上传到 Gitee 的完整指南

使用 VS Code 将项目代码上传到 Gitee 的完整指南

在现代软件开发流程中,版本控制是不可或缺的一环。 Gitee(码云)作为国内领先的代码托管平台,为开发者提供了稳定、快速的 Git 服务。 本文将详细介绍如何使用 Visual Studio Code(VS Code)将本地项目代码上传至 Gitee 仓库,涵盖从环境配置、初始化仓库到推送代码的完整流程。 一、准备工作 1. 安装必要工具 * Git:确保你的系统已安装 Git。 可通过终端运行 git --version  或 git -v 验证是否安装成功。 * VS Code:下载并安装 Visual Studio Code。 * Gitee 账号:前往 Gitee 官网 注册账号(如尚未注册)。 2. 安装 VS

By Ne0inhk