zoukankan      html  css  js  c++  java
  • (转)浅谈 Linux 系统中的 SNMP Trap

    原文:https://www.ibm.com/developerworks/cn/linux/l-cn-snmp/index.html

    简介

    本文讲解 SNMP Trap,在介绍 Trap 概念之前,首先认识一下 SNMP 吧。

    简单网络管理协议(Simple Network Management Protocol)是一种应用层协议,是TCP/IP协议族的一部分。它使网络设备之间能够方便地交换管理信息。能够让网络管理员管理网络的性能,发现和解决网络问题及进行网络的扩充。

    目前SNMP已成为网络管理领域中事实上的工业标准,并被广泛支持和应用,大多数网络管理系统和平台都是基于SNMP的。

    SNMP 管理控制框架

    简而言之,SNMP 协议是用来管理设备的协议,何谓管理呢?我斗胆将其归纳为两个基本点:监控(get)和配置(set)。也就是说:人们管理一个设备的基本手段可以归纳为 get 和 set 两种操作。如图 1 所示。

    图 1. SNMP 基本管理控制框架

    图 1. SNMP 基本管理控制框架

    如果 NMS( 网管系统 ) 需要查询被管理设备的状态,则需要通过 SNMP 的 get 操作获得设备的状态信息;同样,如果 NMS 需要修改或者配置被管理设备的参数,则需要通过 SNMP 的 set 操作来完成。

    什么是 MIB?

    MIB 是描述被管理设备上的参数的数据结构。如前所述,管理一个设备,就是利用 SNMP 协议,通过网络对被管理设备上的参数进行 get 和 set 操作。

    那么如何组织被管理设备上的参数呢?多数情况下,可以 get 和 set 的参数实在多得惊人,假如仅仅简单地线性罗列它们,操作会十分不便。想象一下把 1000 个参数列成一张表,需要使用的时候查询这样一张表会有多么困难啊?比如您打算在地球上找一个城市,”Ithaca”,如果没有归类和分级,则需要查找一张巨大的表格。但如果告诉您城市” Ithaca”是:南美洲国家圭亚那的北部城市"Ithaca",那么就容易些了吧?

    被管理的设备相当复杂,拥有很多可以被管理的参数,需要对它们进行归类,分级。管理信息库 (MIB) 是一个具有分层特性的信息的集合,我们可以通过 SNMP 去存取它。MIB 的成员是一些被管理的对象 (Managed Object),以对象标示符 (Object Identifiers) 来区分它们。被管理的对象由一个或多个对象实例 (Object Instances) 组成,本质上,这些对象实例就是变量。

    在 MIB 的层次结构中,一个对象标示符唯一标识了被管理对象。MIB 的层次结构可以被描述成无根名的树,树的级别被不同的组织所划分。如下图所示:

    图 2. MIB 树

    图 2. MIB 树

    很多能够被 SNMP 管理的对象都是由标准组织定义好的。比如系统磁盘的信息,用 OID ”1.3.6.1.4.1.2021.9” 表示。这串数字是国际标准化组织协商定义好的,大家都要去遵循它。当然,国际组织不可能预知未来,如果您要开发的设备有一些管理需求没有任何 RFC 定义过,那么您也可以编写自己的 MIB 文件来定义私有的 MIB 对象。

    什么是 SNMP Trap

    前面介绍的 get/set 操作都是从 NMS 发送到被管理设备的。但有时候,能够从被管理设备主动发送信息到 NMS 也是非常必要的。

    SNMP Trap 是 SNMP 的一部分,当被监控段出现特定事件,可能是性能问题,甚至是网络设备接口宕掉等,代理端会给管理站发告警事件。假如在特定事件出现的时刻,不是由 Agent 主动通知 NMS,那么 NMS 必须不断地对 Agent 进行轮询。这是非常浪费计算资源的方法,正如人们用中断通知 CPU 数据的到达,而不是让 CPU 进行轮询一样。Trap 通知是更加合理的选择。

    用一句话来说的话,SNMP Trap 就是被管理设备主动发送消息给 NMS 的一种机制。这是本文主要关注的话题。

    NET-SNMP 简介

    在 Linux 系统中,我们可以选择 net-snmp 来处理绝大多数和 SNMP 相关的工作。

    NET-SNMP 是一种开放源代码的 SNMP 协议实现。它支持 SNMP v1, SNMP v2c 与 SNMP v3,并可以使用 IPV4 及 IPV6 。也包含 SNMP Trap 的所有相关实现。Net-snmp 包含了 snmp 实用程序集和完整的 snmp 开发库。

    用户使用 net-snmp 提供的工具,可以完成很多关于 SNMP 的操作,具体说来,包括以下一些命令行应用程序:

    一些应用程序可以用来从支持 SNMP 的设备获得数据。其中 snmpget, snmpgetnext 可以支持独立请求,比如:

    1
    2
    % snmpget -v 1 -c demopublic test.net-snmp.org system.sysUpTime.0
    system.sysUpTime.0 = Timeticks: (586731977) 67 days, 21:48:39.77

    该命令获得单个独立的 MIB 对象 system.sysUpTime.0 的值。

    而 snmpwalk, snmptable, snmpdelta 则用来支持重复请求。

    1
    2
    3
    4
    5
    6
    % snmpwalk -v 2c -c demopublic test.net-snmp.org system
    SNMPv2-MIB::sysDescr.0 = HP-UX net-snmp B.10.20 A 9000/715
    SNMPv2-MIB::sysObjectID.0 = OID: enterprises.ucdavis.ucdSnmpAgent.hpux10
    SNMPv2-MIB::sysUpTime.0 = Timeticks: (586998396) 67 days, 22:33:03.96
    SNMPv2-MIB::sysContact.0 = Wes Hardaker wjhardaker@ucdavis.edu
    SNMPv2-MIB::sysName.0 = net-snmp

    上面的命令返回所有 system 节点以下的 MIB 对象的值。

    命令 snmpset 对支持 SNMP 的设备配置属性。如下例所示:

    1
    2
    3
    4
    5
    6
    $ snmpget -v 1 -c demopublic test.net-snmp.org ucdDemoPublicString.0
     UCD-DEMO-MIB::ucdDemoPublicString.0 = "hi there!"
    $ snmpset -v 1 -c demopublic test.net-snmp.org ucdDemoPublicString.0 s "Hello, world!"
     UCD-DEMO-MIB::ucdDemoPublicString.0 = "Hello, world!"
    $ snmpget -v 1 -c demopublic test.net-snmp.org ucdDemoPublicString.0
     UCD-DEMO-MIB::ucdDemoPublicString.0 = "Hello, world!"

    命令 snmpdf, snmpnetstat, snmpstatus 可以从支持 SNMP 的设备获取特定的信息。比如下面的命令从目标系统上获得类似 netstat 的信息:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    % snmpnetstat -v 2c -c public -a testhost
     
    Active Internet (tcp) Connections (including servers)
    Proto Local Address Foreign Address           (state)
    tcp   *.echo         *.*                      LISTEN
    tcp   *.discard      *.*                      LISTEN
    tcp   *.daytime      *.*                      LISTEN
    tcp   *.chargen      *.*                      LISTEN
    tcp   *.ftp          *.*                      LISTEN
    tcp   *.telnet       *.*                      LISTEN
    tcp   *.smtp         *.*                      LISTEN
    Active Internet (udp) Connections
    Proto Local Address
    udp    *.echo
    udp    *.discard
    udp    *.daytime
    udp    *.chargen
    udp    *.time

    snmptranslate 命令将 MIB OIDs 的两种表现形式 ( 数字及文字 ) 相互转换。并显示 MIB 的内容与结构,如下所示:

    1
    2
    3
    4
    % snmptranslate .1.3.6.1.2.1.1.3.0
        SNMPv2-MIB::sysUpTime.0
    % snmptranslate -On SNMPv2-MIB::sysUpTime.0
        .1.3.6.1.2.1.1.3.0

    Net-snmp 还提供了一个基于 Tk/perl 的,图形化的 MIB 浏览器 tkmib。

    图 2. Tkmib 界面

    图 2. Tkmib 界面

    Net-snmp 还提供了接收 SNMP traps 的守护程序 snmptrapd。可以将选定的 SNMP 消息记录到系统日志 syslog,NT 事件日志,或者文本文件中。或是转发到其它的 SNMP 管理程序 , 也可以传给外部的应用程序。本文的后面我们将用它来演示 SNMP Trap 的收发。

    Net-snmp 还提供了一个回应 SNMP 查询的客户端 snmpd. 它集成了大量 SNMP 的模块 . 并可通过动态链接库 , 外部脚本与命令 , 多路 SNMP 技术 (SMUX), 以及可扩客户端协议 (AgentX) 进行扩展 .

    此外,net-snmp 还包含了用来开发 SNMP 应用程序的程序库。支持 C 与 perl 的 APIs。因此您可以使用 net-snmp 的工具集完成一些关于 SNMP 的工作,也可以依赖 net-snmp 提供的开发包自己写程序开发您所需要的 snmp 应用。

    NET-SNMP 的安装

    不同的 Linux 发行版有不同的包管理机制,因此在这里,我打算写下从源代码安装 net-snmp 的过程,适用于各种 Linux 发行版。

    到 sourceforge网站下载适合的 net-snmp 版本,解压。

    执行文件目录下的 configure 可执行文件,如果想指定程序包的安装路径,那么您首先建立相应的文件夹来存放安装信息,您可以写成 ./configure --prefix= 您指定的路径名。参数 --prefix 用来告诉系统安装信息存放的路径,如果您没有指定路径,直接执行 ./configure,那么程序包都会安装在系统默认的目录下,通常为:/usr/local 下。例如:

    1
    ./configure --prefix=/usr/local/snmp // 配置指定安装目录,

    在配置过程中需要进行一些简单的选择:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    default version of-snmp-version: 2
     
    Systemcontact information(配置该设备的联系人): yourname
     
    System location ( 该设备的位置 ): china
     
    Location to write logfile ( 日志文件位置 ): /var/log/snmpd.log
     
    Location to Write persistent( 数据存储目录 ): /var/net-snmp

    之后编译并且安装:

    1
    #make && make install // 编译并且安装

    Snmp Trap 的发送和接收演示

    实验环境如图 4 所示。在测试机 M1 上启动 snmptrapd 进程,并且在 UDP 1162 端口上监听 SNMP Trap 信息,一旦收到 Trap,snmptrapd 将所接收到的 Trap 信息内容打印到一个本地的文本文件中。 机器 M2 模拟发送 SNMP Trap 的设备,将调用 net-snmp 的命令行程序 snmptrap 发送一个 Trap。

    图 4. SNMP Trap 实验环境

    图 4. SNMP Trap 实验环境

    设计一个 Trap 消息

    Trap 消息也是用 MIB 来定义的。在下面的例子中,我们定义了一个 Trap 消息:nodeDown

    清单 1. Trap nodeDown 的 MIB 定义
    1
    2
    3
    4
    nodeDown NOTIFICATION-TYPE
       STATUS          current
       DESCRIPTION     "node down notification"
    ::= { notification 1 }

    nodeDown 被定义为 Notification 类型,即 SNMPv2 类型的 Trap。

    受空间所限,这里无法贴出完整的 MIB 文件。感兴趣的读者可以参考本文的附件。图 5 给出了实验所用的完整 MIB 树:

    图 5. 包含 Trap nodedown 的完整 MIB 树

    图 5. 包含 Trap nodedown 的完整 MIB 树

    NodeDown 对象位于 notification 节点下,子 OID 为 1。该 Trap 消息中我们打算包含两个数据对象:Host 名字和 IP 地址。Host 和 ip 位于 enterprises.sampleTest.data 分支下。

    搭建接受 Trap 的 snmptrapd 进程

    可以利用 Net-snmp 提供的 snmptrapd 应用程序作为后台 SNMP Trap 服务器,负责接收被管理设备发送过来的 Trap 消息。

    在图 4 实验机 M1 的命令行窗口中输入以下命令:

    1
    snmptrapd – c mysnmptrad.conf udp:1622

    该命令启动了一个 snmptrapd 进程,守候在 UDP 端口 1622 上,侦听 SNMP Trap 消息。-c 命令行指定了名为 mysnmptrapd.conf 的配置文件。文件内容如下:

    1
    2
    3
    $cat mysnmptrapd.conf
    traphandle default lognotify IBM-DW-SAMPLE::nodeDown
    authCommunity log,execute,net public

    其中,以 traphandle 开头的一行定义了 snmptrapd 进程接收到 Trap 消息后应该执行的动作。在本例中,lognotify 是一个 shell 脚本,功能是将接收到的 Trap 信息写入文件 checkfile。

    以 authCommunity 开头的一行配置了 snmptrapd 的安全设置,表示可以接收 community 为”public”的 SNMP Trap,并且本进程可以有 log,net 和 execute 的权限。

    Log 权限表明收到 Trap 之后 snmptrapd 可以记录日志;execute 表明收到 Trap 之后可以执行 traphandle 中所指定的操作。Net 表示 snmptrapd 可以将接收到的 Trap 信息转发到其他的 Receiver 去。(假如需要转发,还需要对给定的 OID 指定以 forward 为开始的处理细节:forward OID|default DESTINATION)

    脚本 lognotify 代码如下:

    清单 2. Lognotify 脚本
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    $cat lognotify
    #!/bin/sh
     
    read host
    read ip
    vars=
     
    while read oid val
    do
      if [ "$vars" = "" ]
      then
        vars="$oid = $val"
      else
        vars="$vars, $oid = $val"
      fi
    done
     
    echo trap: $1 $host $ip $vars >checkfile

    使用 snmptrap 发送 SNMP Trap

    可以用命令 snmptrap 在测试机 M2 上发送一个 SNMP Trap。假定 Trap 定义在文件 sample-trap.mib 中。在测试机 M2 上输入以下命令:

    1
    2
    snmptrap -m ./sample- trap.mib  -v 2c -c public 16.157.76.227:1622
    "" IBM-DW-SAMPLE::nodeDown     IBM-DW-SAMPLE::nodeDown.1 s "M1"

    您在试验的时候,将 IP 地址替换为 M1 的真实 IP 地址即可。在上面的例子命令中我们只设置了 Trap nodeDown 消息中的 host 信息。其 OID 为 IBM-DW-SAMPLE::nodeDown.1。字母 s 表示该 OID 的类型为 string。“M1”为该 OID 变量的值。

    打开文件 checkfile,应该能够看到如下信息:

    1
    2
    3
    4
    5
    Trap: IBM-DW-SAMPLE::nodeDown <UNKNOWN> UDP: [16.157.76.221]:
     54329->[16.157.76.227]:1622 DISMAN-EVENT-MIB::sysUpTimeInstance=
     5:2:22:26.99, SNMPv2-MIB::snmpTrapOID.0 = SNMPv2-SMI::
     enterprises.10234.100.1 SNMPv2-SMI::enterprises.10234.100.1.1 =
    “M1”

    还不错,这表示我们已经能够用 snmptrap 发送 Trap;并且能够使用 snmptrapd 来接收 Trap 消息了。

    此例虽然简单,但却是 SNMP Trap 的典型应用。实际生产环境中的 SNMP Trap 应用的基本模型和本例是类似的。

    此外,有的时候,我们可能不仅需要 net-snmp 所提供的现成工具,还需要在自己开发的应用程序中编码发送 Trap。Net-snmp 不仅提供了现成的工具,也提供了开发库,下面我们来看看如何在 C 程序中调用 net-snmp 的库函数进行 SNMP Trap 的开发吧。

    C 语言直接调用 API 进行 SNMP Trap 处理

    C/C++ 依旧是很多系统必须的编程语言,当您的 C/C++ 程序需要发送 SNMP Trap 时,便可以考虑使用 net-snmp 提供的 SNMP 库函数来实现。

    所需要的头文件

    为了使用 netsnmp 的 API,必须 include 以下这些头文件:

    1
    2
    #include <net-snmp/net-snmp-config.h>
    #include <net-snmp/net-snmp-includes.h>

    初始化

    在使用 netsnmp 库之前,先要做一些必要的初始化工作。 函数 init_snmp 初始化 SNMP Library。 假如在调用 init_snmp 函数时指定了文件名,init_snmp 函数将读取配置文件,设置诸如 Access Control 等具体配置。否则会使用默认的 /etc 下面的配置文件。

    初始化 SNMP 库之后,我们就可以打开一个会话 session。此后所有和 NMS 的信息交互都在该 session 内进行,因为可能在同一台机器上运行多个 SNMP 进程,每个进程都需要自己独立的 session 来和 NMS 进行信息交互。

    调用函数 snmp_sess_init 成功后将返回一个 session 数据结构。我们用该数据结构来设置 session 的属性,比如 peer 的 IP 信息。

    这里 peer 就是图 2 中的 M2,在我本人的试验环境下,该机器的 IP 地址为 16.157.76.227。因此在下面的代码中,我将 peername 设置为 16.157.76.227。

    还可以设置其它的必要信息,比如 Community,即用于 SNMP 安全的社区设置,前面 snmptrapd 设置为 public,因此这里也设置为 public。这类似于通行密码,不过安全性的确比较弱。

    Session 属性设置好之后便可以使用函数 snmp_open 打开 session。示例代码如下。

    清单 3. 代码最大长度示例
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    init_snmp("myexample");
    struct snmp_session session;
    snmp_sess_init(&session);
    session.version = SNMP_VERSION_2c;
    strcpy(peername,"16.157.76.227:1622");
    strcpy(commu,"public");
    session.peername = peername;
    session.community = (unsigned char*)commu;
    session.community_len = strlen(commu);
    ss = snmp_open(&session);

    打开一个会话之后,程序可以通过该会话发送 Trap 给 NMS,也可以从 NMS 接受 SNMP get/set 操作。

    创建 pdu,发送 Trap

    每个 Trap 都由 PDU 承载,PDU 有固定的格式。 为了简化描述,本文只描述 SNMPv2 的 Trap 发送方法。SNMP v2c 和 v1 的 Trap 有所不同。请阅读参考文献了解这些不同的细节,此外本文的附件代码中也实现了 v1 的支持代码。SNMPv2 的 Trap PDU 定义如下:

    图 3. SNMP Trap PDU 格式

    图 3. SNMP Trap PDU 格式

    其中各个组成部分的解释如下: sysUpTime– 被管理设备上一次初始化网络到本 Trap 发送以来的累积时间。 snmpTrapOID– 表示本 PDU 是一个 Trap,有固定的值。对于一般的 Trap,RFC1907 给出了通用的定义。用户自定义的 Trap 通常是由以下几个部分连接而成:SNMPv1 Enterprise parameter + '0' + SNMPv1 Specific trap code。 VarBindList– 变量列表,所谓变量就是 Trap 消息中所携带的信息单元。

    下面的代码片断用来填充如图三所示的一个 PDU。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    oid objid_sysuptime[] = { 1, 3, 6, 1, 2, 1, 1, 3, 0 };
     oid objid_snmptrap[] = { 1, 3, 6, 1, 6, 3, 1, 1, 4, 1, 0 };
     netsnmp_pdu * pdu = NULL;
     oid tmpOID[MAX_OID_LEN];
     size_t tmpOID_len;
     in_addr_t addr;
     
     pdu = snmp_pdu_create(SNMP_MSG_TRAP2);
     long sysuptime;
     char tempbuf[128];
     memset(tempbuf,128,0);
     sprintf(tempbuf,"%ld",sysuptime);
     sysuptime = get_uptime();
     oid tmpOID[MAX_OID_LEN];
     size_t tmpOID_len;
     tmpOID_len = MAX_OID_LEN;
     if(!snmp_parse_oid(TRAP_NAME_1, tmpOID, &tmpOID_len))
    snmp_error(“snmp_parse_oid”);
     snmp_add_var(pdu, objid_sysuptime, sizeof(objid_sysuptime)/sizeof(oid), 't', tempbuf);
     snmp_add_var(pdu, objid_snmptrap, sizeof(objid_snmptrap)/sizeof(oid),'o',
                  “IBM-DW-SAMPLE::nodeDown”);

    首先调用函数 snmp_pdu_create 创建一个 SNMPv2 的 Trap PDU。然后调用 snmp_add_var 向该 PDU 中添加图三所示的三个部分。 sysUpTime 在 SNMPv2-MIB 中定义,其 OID 为”1.3.6.1.2.1.1.3.0”。我们只需要通过 get_uptime() 函数获得该值,然后调用 snmp_add_var 将该变量加入刚才创建的 PDU 中。

    同理,snmpTrapOID 也是固定的 :” 1.3.6.1.6.3.1.1.4.1.0”。同样利用 snmp_add_var 函数将我们定义的 OID 为“IBM-DW-SAMPLE::nodeDown”的 Trap 加入该 PDU。 稍稍留意一下,您应该可以发现,sysUpTime 的类型为't',即 timestamp;而 snmpTrapOID 的类型为’ o ’,即 OID 类型。PDU 内的每一个元素都拥有自己的类型。 在该 Trap 中,我们还打算携带两个变量:IBM-DW-SAMPLE::host 和 IBM-DW-SAMPLE::ip。表示一些真正有趣的信息。 添加这两个变量的代码如下所示:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    HP-DW-SAMPLE::ip",varId,&varIdLen))
        {
          snmp_perror("ip");
        }
        else
        {
           printf("Success snmp_parse_oid ");
           snmp_add_var(pdu, varId, sizeof(varId)/sizeof(oid),'s',"2.2.2.2");
        }
        if(!snmp_parse_oid("HP-DW-SAMPLE::host",varId,&varIdLen))
        {
          snmp_perror("host");
        }
        else
        {
           retv =  snmp_add_var(pdu, varId, sizeof(varId)/sizeof(oid),'s',”M1”);
     }

    用 snmp_parse_oid 解析相应变量的 OID,然后就可以调用 snmp_add_var 将您想设置的值加入 PDU 中了。假如您直接在代码中使用”HP-DW-SAMPLE::ip”的 OID,(即 1.3.6.1.4.1.10234.10.2),那么可以不需要调用 snmp_parse_oid。该函数只是把一个好记的字符串翻译为一串数字的 OID。不过这就好比用 16.157.1.2 而不使用 www.ibm.com 一样。

    至此,一个 SNMP Trap PDU 就创建成功了。将该 PDU 发送出去即可:

    1
    2
    3
    4
    if( !snmp_send(sptr, pdu) )
    {
      snmp_error("Send pdu error ");
    }

    结束清理

    程序结束之前需要做清理工作,代码如下:

    1
    2
    3
    snmp_close(sptr);
    snmp_shutdown( "myexample" );
    SOCK_CLEANUP;

    一个基本的 SNMP Trap 发送程序就这样完成了。我们在 M1 上编译运行它:

    1
    2
    -bash-3.2$ gcc -o t1 snmptrap.c – lnetsnmp
    -bash-3.2$ ./t1

    在 M2 上查看 checkfile,可以验证所收到的 Trap 消息的内容。假如您能看到该文件中正确的内容,那么恭喜您,您已经拥有了编程发送 SNMP Trap 的能力了。

    结束语

    虽然 SNMP 叫做简单网络管理协议,但似乎并不简单,甚至可以说十分复杂,本文只关注 Trap 的相关概念和编程方法,却也只能走马观花地说个皮毛,还是完全的实用主义。于我而言,这点儿皮毛便可以让我交代手头的工作任务了,但一个有理想的程序员或许会仅将本文当作一个起点,坚定不移地继续深入地了解更多 SNMP 的知识吧。

  • 相关阅读:
    解决PKIX:unable to find valid certification path to requested target 的问题
    Linux 上的常用文件传输方式介绍与比较
    用VNC远程图形化连接Linux桌面的配置方法
    红帽中出现”This system is not registered with RHN”的解决方案
    linux安装时出现your cpu does not support long mode的解决方法
    CentOS SSH配置
    es6扩展运算符及rest运算符总结
    es6解构赋值总结
    tortoisegit安装、clon、推送
    es6环境搭建
  • 原文地址:https://www.cnblogs.com/liujiacai/p/9033786.html
Copyright © 2011-2022 走看看