最近整理了一圈原先的笔记,偶然间发现这篇我刚入行时写的监控文章。虽然迄今为止才过去两年,但是感觉这两年发生了好多事,第一眼看到这篇文章的时候甚至让我有一种恍惚感,我竟然还写过这样的文章,做过这样的项目。
zabbix监控校园交换机项目我一共用了两篇笔记来记录,分别是'监控校区交换机具体流程'和'zabbix自动发现校区交换机',下面我会将这两篇文章进行整合,由一个篇幅进行讲述。
项目背景
由于校区内交换机普遍没有设置监控,导致运维人员不能及时得到交换机的状态,只能等到网络中断一步步排查到交换机,这中间浪费了很多的时间。如果我们对交换机设置监控,在交换机出现CPU、端口等异常时能及时解决,甚至可以通过监控流量信息配置相应的限制。当网络中断时可以查看监控排除是交换机的故障,也可以省下很多时间。
zabbix我是部署在本机的虚机中的,而我本机能直接远程并控制交换机,交换机的型号是H3C S5560。
环境配置
我们需要对网卡、交换机做基本的探测和配置。先对环境进行一个说明:
- 10.0.0.71 虚机地址,也是zabbix服务器的地址
- 10.0.0.254 VMware配置的网关地址
- 192.168.140.39 交换机IP地址
网卡配置
先上网卡配置,需要将虚机配置到与交换机为同一网段,使虚机与交换机互联。
$ cat /etc/sysconfig/network-scripts/ifcfg-ens33 # 以下为网卡配置文件
IPADDR=10.0.0.71
NETMASK=255.255.255.0
GATEWAY=10.0.0.254
DNS1=10.0.0.254 # DNS设置为网关地址,因本机能通交换机,所以将虚机的DNS设置为VMware的网关地址后虚机也能连接到交换机
#DNS1=114.114.114.114 # 这是原本的DNS
$ systemcty restart network # 配置完成后重启网卡
$ ping 192.168.140.39 # 该地址为交换机IP地址
PING 192.168.140.39 (192.168.140.39) 56(84) bytes of data.
64 bytes from 192.168.140.39: icmp_seq=1 ttl=128 time=1.13 ms
64 bytes from 192.168.140.39: icmp_seq=2 ttl=128 time=0.826 ms
交换机配置
交换机需要开启SNMPv2协议,且需要获取团体号。
<500renmeetingroom>system-view #进入视图
[500renmeetingroom]snmp-agent sys-info version v2 #使用SNMP协议号v2版本,因为之前配置被配置过所以重新配置一下版本
[500renmeetingroom]display snmp-agent community #查看snmp团体
Community name: [团体号] #团体号类似于密码or认证
Group name: [团体号] #涉及到安全,团体名不显示
Storage-type: nonVolatile
网络探测
nmap是一个网络探测工具和安全/端口扫描器,通过yum install -y nmap
即可下载,使用nmap工具查看端口是否打开。
$ nmap -sU 192.168.140.39 -p 161 #查看192.168.140.39主机的161端口状态
Starting Nmap 6.40 ( http://nmap.org ) at 2020-07-03 12:25 CST
Nmap scan report for 192.168.140.39
Host is up (0.0084s latency).
PORT STATE SERVICE
161/udp open snmp #UDP161端口/SNMP协议开启
snmpwalk是SNMP的一个工具,它使用SNMP的GETNEXT请求查询指定OID(SNMP协议中的对象标识)入口的所有OID树信息,并显示给用户。
$ yum install net-snmp net-snmp-utils
$ snmpwalk -v 2c -c [团体名] 192.168.140.39 SNMPv2-MIB::sysDescr.0
Timeout: No Response from 192.168.140.39
#得到以上信息表示配置参数有误和网络SNMP不可达
$ snmpwalk -v 2c -c [团体名] 192.168.140.39 SNMPv2-MIB::sysDescr.0
SNMPv2-MIB::sysDescr.0 = STRING: H3C Comware Platform Software, Software Version 7.1.045, ESS 1106
H3C S5560-30S-EI
Copyright (c) 2004-2014 Hangzhou H3C Tech. Co., Ltd. All rights reserved.
#出现如上信息表示设备正常运行
zabbix配置
由于zabbix服务的IP地址为10.0.0.71,所以在浏览器内输入10.0.0.71就会自动跳转到http://10.0.0.71/zabbix/zabbix.php?action=dashboard.view/,依次点击【配置】>【主机】>【创建主机】
点击【宏】进行配置团体号,Snmpwalk中也需要配置团体号,跟此处是一样的原理
点击【模板】,选择合适的模板信息(就是交换机中要进行监控的项),点击【添加】后再点击【更新】。因为此时并不处于校区内,所以并没有连接到交换机,所以SNMP为红底;若正常连接为绿底
创建主机完成后,开启监控主机的状态,SNMP为绿底时表示正常连接
全部配置完成后,可以对主机进行监控,由于是内置的模板,所以对监控的项目不太清楚,但是已经接收到监控信息,表示已经能够正常监控交换机了。
由于之前配置过监控报警,所以当zabbix服务器发现无法监控交换机时,会给设定的邮箱发送邮件报警
自动发现
虽然配置监控交换机的步骤并不复杂,但是校区内的交换机实在是太多了,一个一个进行配置也显得不现实,这次的自动发现就可以直接设置监控交换机的IP地址的范围,我这里只监控192.168.140.30~50的交换机。
设置自动发现规则
依次点击【配置】,【自动发现】,【创建发现规则】,会出现如下的配置界面
设置自动发现动作
依次点击【配置】,【动作】,选项【配置源】中选择【自动发现】,然后点击【创建动作】
-
动作
-
操作
设置团体名
配置完所有操作我更新了一下,发现自动发现的交换机都处于断开连接的状态。根据之前的操作尝试修改了团体名。如果交换机团体名没更改过的话是不需要这步操作的,交换机团体名默认public,zabbix默认参数也是public
自动发现结果
由于时间原因并没有对所有交换机设置团体名,也从侧面证明了整个配置是正确可行的。
小结
“自动发现”是在能进行监控的主机的基础上进行配置的,所以最好是首先尝试一下第一个主机能否配置成功,若是手动都无法对设备进行监控,那自动发现排查起来排查到最后发现连连接都还没建立时很崩溃的。自动发现会让服务器的资源占用升高,如果zabbix服务器配置较高的话这点资源占用无关紧要;但是如果服务器配置较低,可以尝试用自动注册代替自动发现,就是在每个新加入的交换机上配置任务量可能会比自动发现大一点,但是资源占用较低