1、ICS29.240备案号 : CEC 204-2009国家电网公司企业标准Q/GDW 704 2012信息运维管理系统综合网管系统功能技术规范OperationmanagementsystemforinformationFounctionspecificationsforintegratednetworkmanagement2012-05-04发布 2012-05-04实施国家电网公司 发 布Q/GDWQ / GDW 704 2012I目 次前言 II1 范围 12 规范性引用文件 13 术语和定义 14 符号、 代号和缩略语 25 逻辑架构 25.1 逻辑层级及架构 25.2 管理架构 46
2、 物理架构 56.1 总体设计 56.2 物理架构 57 系统功能及技术要求 67.1 网络管理 67.2 系统及通用应用管理 107.3 IT 资源信息库 117.4 数据采集 127.5 统一告警管理功能模块 147.6 网管系统权限管理 167.7 系统自身管理 207.8 技术要求 217.9 接口要求 23附录 A(规范性附录) 命名规则及编码规范 28附录 B(规范性附录) 系统监测功能规范 40编制说明 43Q / GDW 704 2012II前 言为保障国家电网公司信息化业务应用系统运行状态具备全面的自动化监控手段,并实现监控、 告警和展现方式等功能分层分级及上线贯通的规范化和
3、标准化,特制定本标准。本标准的附录 A 和附录 B 为规范性附录。本标准由国家电网公司信息通信部提出并负责解释。本标准由国家电网公司科技部归口。本标准起草单位:国网电力科学研究院、 湖南省电力公司、 江苏省电力公司。本标准主要起草人:陈玉慧、 武卫东、 甘岚、 郭池、 王泉啸、 张灿、 蒋苏湘、 张敏。Q / GDW 704 20121信息运维管理系统综合网管系统功能技术规范1 范围本标准规定了国家电网公司信息运维管理系统中综合网管的技术原则与要求。本标准适用于今后新建或改造的综合网管的设计与建设。2 规范性引用文件下列文件对于本文件的应用是必不可少的。 凡是注日期的引用文件,仅注日期的版本适
4、用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T19715.2-2005 信息技术安全管理指南第 2 部分,管理和规划信息技术安全GB/T19716-2005 信息技术信息安全管理实用规则GB/T20001.3-2001 标准编写规则第 3 部分,信息分类编码ISO/IEC 17799-2000 信息安全管理实施细则ISO/IEC 20000-2005 信息技术服务管理ISO/IEC 27001-2005 信息安全管理体系规范3 术语和定义下列术语和定义适用于本标准。3.1综合网管系统 integratednetworkmanagementsystem在
5、标准网管系统的基础上,将监管范围拓展到主机、 数据库、 中间件、 应用以及存储、 桌面的综合运行维护监管系统。3.2关键网络设备 keyofnetworkequipment国网公司总部与所属分部、 省公司及直属单位实现信息广域互联的核心网络设备。3.3关键服务器 key server门户、 目录、 数据中心等一体化平台, ERP、 电力营销、 安全生产、 协同办公等核心业务应用及其数据库服务器。3.4关键数据库 key databaseERP、 电力营销、 安全生产、 协同办公等核心业务应用的数据库: Oracle、 DB2 等。3.5关键中间件 key middlewareERP、 电力营销
6、、 安全生产、 协同办公等核心业务应用系统中所使用的中间件: Weblogic、 Domino等。3.6信息运维管理系统 operationmanagementsystemforinformation信息部门采用相关的方法、 手段、 技术、 制度、 流程等等,对于信息运行环境、 信息业务系统和信息运维人员进行综合管理的系统。3.7物理架构 physical structureQ / GDW 704 20122规定了组成软件系统的物理元素、 这些物理元素之间的关系、 以及它们部署到硬件上的策略。 物理架构可以反映出软件系统动态运行时的组织情况。3.8逻辑架构 logical structure规
7、定了软件系统的逻辑层级与逻辑单元,定义了它们各自的功能与相互关系。4 符号、 代号和缩略语下列缩略语适用于本标准。DHCP Dynamic Host Configuration Protocol 动态主机设置协议DNS Domain Name System 域名系统FTP FileTransferProtocol 文件传输协议HA HighAviailability 高可用性HTTP HyperTextTransferProtocol 超文本传输协议ICMP Internet ControlMessage Protocol Internet 控制报文协议JMX JavaManagement E
8、xtensions Java 管理扩展MIB Management InformationBase 管理信息库PING Packet Internet Grope 因特网包探索器POP3 Post Office Protocol 3 邮局协议第 3 个版本SMTP Simple MailTransferProtocol 简单邮件传输协议SNMP Simple Network Management Protocol 简单网络管理协议SSH Secure Shell 安全外壳协议TCP Transmission ControlProtocol 传输控制协议UDP UserDatagramProto
9、col 用户数据包协议WMI Windows Management Instrumentation Windows 管理规范VLAN Virtual LocalArea Network 虚拟局域网5 逻辑架构综合网管系统的逻辑架构包括数据逻辑架构与功能逻辑架构。 数据逻辑架构对系统中的数据流向进行了分层级的描述,功能逻辑架构对系统提供的功能进行了分层级的描述。5.1 逻辑层级及架构5.1.1 数据逻辑层综合网管系统数据逻辑划分为三层:数据采集层、 数据处理层、 数据展现层。 如图 1 所示:数据采集层:采集主机、 网络、 数据库、 存储、 备份、 中间件、 应用软件等对象(数据源)的状态信息,
10、包含配置数据、 性能数据、 故障数据和准确性数据等;数据处理层:通过触发告警发生器,将收集到的各类状态信息与 KPI 阈值对比后进行分析、 配置或处理,形成资源分类的告警信息后,集中传送到告警服务器进行告警关联和自动化处理;数据展现层:针对分类管理信息进行统一汇总和多维展现,实现对网络、 系统硬件设备资源和软件运行状况的统一监控和管理。5.1.2 功能逻辑层系统的功能逻辑层级如图 2 所示:Q / GDW 704 20123图 1 综合网管系统数据逻辑层次图图 2 综合网管系统功能层次图自下而上,提供如下功能:a) 综合网络管理功能:为核心服务,实现数据采集和资源管理的功能。 针对被管理资源的
11、类别和采集数据类型的不同划分为不同的功能模块,负责实时监控和管理包括主机、 网络、 存储设备、备份设备、 数据库、 中间件在内的软硬件,采集的数据类型包括资产信息、 流量信息、 告警信息、 拓扑信息、 性能信息,采集方式包括 SSH, SNMP, TELNET, WMI, ODBC, SYSLOG, HTTP,FRP, NETBIOS,TCP, UDP,JMX,Script, Agent 等;Q / GDW 704 20124b) 统一告警管理功能:整合来自管理对象范围内各告警源的告警数据,负责告警机制的实现与告警数据的生成,转发与传递。 告警管理平台提供管理系统的信息交换总线,实现智能相关性
12、处理,可扩展的分布式告警处理结构,自动化任务执行体系和基于角色的多用户视图等功能;c) 流程管理功能:不在本标准范围之内,为服务的表述完整性列出;d) 统一管理门户功能:为用户直接操作的界面,负责信息发布,实现管理系统界面的集成。 包括的功能如下:1) 监控拓扑展现服务:包括网络拓扑和业务拓扑。 其中网络拓扑直观展示被监控资源及资源之间的连接关系。 可作为网管实时数据的访问入口,通过在拓扑图上选择各个被监控的资源可看到与之相关的性能、 告警和资产数据。 拓扑可根据监控策略定期刷新,并在下级和上级之间实现数据贯通。 业务拓扑展现业务服务与 IT 组件的关联关系,并根据告警展现业务服务与 IT 组
13、件的健康状态;2) 运行展现功能:以面向业务的方式组织展现,将底层实时运行数据分类展现给最终用户。支持层层点击进入,查看相关细节,也支持高级查询功能;3) 告警展现功能:对统一告警管理的输出数据进行展现。 提供基于 WEB 服务的告警自动刷新功能,作为一线维护人员的工作界面;提供多种查询手段,包括按时间段、 告警类别、地域、 告警状态等;支持可定制的告警列表,在 WEB 界面上面展现最终用户关心的告警信息;支持告警订阅、 短信订阅功能,用户可定制所关注的告警;支持导航树方式的告警分类展现;4) 运行报表展现服务:该服务提供系统报表与发布,系统性能趋势分析,管理信息数据分析与将来的数据挖掘功能。
14、e) 访问控制功能:通过基于身份的用户管理与访问控制,统一管理用户对管理系统的访问;f) 审计功能:通过对用户操作的记录和分析,提供访问运维系统的审计功能与事后监督机制。5.2 管理架构综合网管系统满足公司总部、 省公司和地市三级分层管理结构,如图 3 所示:图 3 管理结构三级分层图Q / GDW 704 20125第一级:国网总部综合网管平台,负责全面监控、 维护和管理公司信息业务系统运行状态,与省公司综合网管平台通过广域网相联,实现数据的上下贯通。第二级:省公司综合网管平台,负责全面监控、 维护和管理运维范围内信息业务系统运行状态。 网省公司综合网管平台与地市综合网管模块通过广域网相联,
15、以实现数据的集中汇总和处理。第三级:地市公司综合网管模块全面监控、 维护和管理运维范围内的网络系统,性能和告警信息在本地进行处理后将汇总至网省的综合网管平台。各级之间关系如下:a) 第三级综合网管模块向第二级综合网管系统提供告警管理、 性能管理、 拓扑管理和 IT 资源管理的功能,同时网管故障在本地处理后汇总到网省;b) 第三级综合网管模块对网省网管理中心提供实时数据查询的能力。 根据第二级综合网管系统的要求,可发送原始数据,也可根据设定的规则发送预处理后的数据;c) 第三级网管模块间无关联关系,地市的三级综合网管模块独立存在第二级综合网管平台与第三级综合网管模块之间采用松耦合模式,其中一方的
16、变化不会影响到另一方。6 物理架构6.1 总体设计根据综合网管系统逻辑架构和功能结构需求,在网省与地市级被监控资源与监控中心之间建立数据采集中心和集中监控中心。数据采集中心位于各地市的监控层,主要包括由系统监控引擎,网络监控引擎,资产采集引擎组成的数据采集引擎、 告警适配器和业务应用监控引擎。 同时,数据采集中心还实现了数据的初步整合(例如将网络配置数据和系统配置数据进行整合,将网络告警、 系统告警和资产告警数据进行整合)。通过网省系统的集中监控中心和数据采集中心,提供综合网络管理服务、 统一告警服务和统一管理门户服务。6.2 物理架构物理拓扑结构如图 4 所示:图 4 物理拓扑结构Q / G
17、DW 704 20126其中网省监控管理中心服务器通过 Cluster 实现高可用(分别部署网省的监控服务器和网省的统一告警管理服务器,两者构成集群)。地市采用 1 台服务器实现网管监控功能,如果被管理对象较多,或地市有高可用性的需求,也可通过增加 1 台服务器实现功能的拓展。在被管理对象与地市网管监控服务器之间,需要根据不同监控对象的对应采集方式开通相应的防火墙端口(例如通过 SNMP 协议管理的网络设备或服务器与地市网管监控服务器之间,需要开通防火墙UDP161、 162 端口)。在地市网管监控服务器与网省监控与告警服务器之间,需要为告警传输、 IE 访问以及报表数据传输等开通相应的防火墙
18、端口。7 系统功能及技术要求综合网管系统应能够采集来自信息网上所有网络设备、 主机、 通用软件及应用的配置、 运行、 性能及事件等数据,通过对采集数据的分析处理,为企业提供网络系统、 主机及通用应用系统的状态监测管理自动化手段。综合网管在监控信息系统方面的功能要求包括:网络系统管理、 主机及通用应用管理等,此外还提供 IT 资源信息库管理和统一事件管理功能。7.1 网络管理网络管理功能作为必备基本功能之一,应实现拓扑管理、 配置管理、 故障管理、 性能管理等管理功能。7.1.1 网络拓扑管理7.1.1.1 网络拓扑自动发现a) 能够采用多种算法,进行有条件的拓扑结构自动发现。 迅速搜索整个网络
19、内的所有节点、 自动发现并生成设备间的冗余连接、 备份连接、 均衡负载连接等;b) 进行拓扑发现的条件包括:特定网段条件,网元类型条件等;c) 支持物理拓扑发现和逻辑拓扑发现;d) 对于已经发现的某一个或某几个子网能够进行再次发现。7.1.1.2 网络浏览功能a) 拓扑图查看功能,包括:1) 拓扑图的背景地图应能定制,拓扑图应能放大和缩小,并能上下、 左右移动,在拓扑图上用不同的图标来标识不同类型的节点(网元、 网元组、 子网或其他);2) 拓扑图应正确反映网络的实际组网情况以及各级子网中各网元之间的连接关系;3) 拓扑图应通过多种方式(包括颜色、 下标、 提示框等)实时反映网元、 网元组或子
20、网、 连接线路的各种性能负载情况;4) 可配合使用导航树,查找网元、 网元组或子网;5) 通过相应的拓扑图,可查看网元、 网元组、 子网等的配置信息;6) 可根据需要选择是否显示或隐藏某些类型的网元、 网元组(网元显示过滤)。b) 拓扑图导航功能,包括:1) 可逐层进入各级子网,逐渐细化显示子网的信息,并提供返回前一视图与返回上层视图的功能;2) 可根据需要切换到不同的网络视图;3) 可拖动鼠标浏览不在当前视野范围的视图。c) 拓扑图缩放功能,包括:1) 可根据需要对拓扑图进行无损平滑放大、 缩小和平移;2) 可指定放缩区域、 指定放缩比例进行刷新;Q / GDW 704 201273) 可根
21、据需要将多个网元合并为图标显示。d) 拓扑图定位功能,包括:1) 可通过当前窗口,在拓扑图上定位指定的网元;2) 可根据需要使用不同的方式选择网元,如单个网元选择和区域选择。7.1.1.3 拓扑监视功能网络拓扑应能够动态、 实时显示被管网络的运行状态,包括:a) 实时反映网络设备配置的变更情况;b) 能将管理范围内网元设备的增删情况、 网元配置信息的改变情况通过特定方式在拓扑图中提示用户;c) 可直接了解各线路流量和设备状况和属性,拓扑图中的节点能够显示该图标是否有子图;d) 实时反映网络设备及逻辑功能的性能越限事件;e) 当网络资源(如网元)出现性能越限时,系统应以可视、 可闻的方式显示此越
22、限告警;f) 实时反映被管系统的告警事件;g) 系统对实时的业务告警事件作出及时反应,并可深入显示告警相关的业务通道,在拓扑图中以相应链路变色、 节点闪烁等形式提示;告警信息未确认则应以特定方式保持对用户的提示;系统应能提供告警信息的语音提示;h) 提供各类性能告警门限默认值,具有性能告警门限设置功能。7.1.1.4 拓扑编辑功能可通过拓扑编辑手工生成部分拓扑图,包括如下功能:a) 手工添加虚拟网元到拓扑图;b) 手工添加、 修改、 删除网元之间的连线;c) 手工定义、 修改、 移动网元位置、 名称等;d) 可增加、 修改、 删除网元组节点;e) 保存当前视图;f) 拓扑图可备份与导入,并支持
23、打印功能和将拓扑图发布到 WEB 信息系统中。7.1.1.5 拓扑网元管理拓扑网元管理应具有以下功能:a) 增量备份网元的系统运行配置参数,说明支持配置备份的网络设备种类;b) 自动识别堆叠式设备及显示;c) 支持发现网元中的 vlan 划分设置;d) 自动辨识端口所在 vlan 及打开和关闭网元物理端口;e) 提供真实网元面版图显示和管理,能直观展现各端口运行状态;f) 可以根据需要显示或隐藏特定 vlan 的端口;7.1.1.6 图例管理功能可对图例进行管理,包括:a) 查询各种图例及其颜色的意义;b) 定制图例,包括重新选择或修改图例的形状、 大小和颜色等。7.1.2 性能管理性能管理功
24、能主要面向各类网络设备的性能综合监测和分析,应具有性能监测管理、 性能数据上报管理、 性能数据管理、 性能门限管理、 性能分析等子功能。a) 应支持分布式数据采集,可以将不同网段范围内设备的性能数据交由不同服务器上的数据采集系统进行采集,并集中提供网管系统处理和访问;b) 应能适应不同取数间隔,自动重用已获得的性能数据,避免大量重复取数造成的网络资源Q / GDW 704 20128浪费。7.1.2.1 性能监测管理应提供被管理对象性能参数的外部查询接口,支持不同间隔的查询,查询条件包括:a) 被管对象(指定的设备,如网络设备可具体到设备端口);b) 监测周期;c) 要监测的性能参数如 CPU
25、 利用率、 内存占用率等。应支持随时启动、 停止对被管对象的性能参数监测,提供阻塞式和非阻塞式查询接口,以便上级系统可灵活、 主动查询。7.1.2.2 性能数据管理在每次性能报告周期到达后,应能够获取到相应的性能数据,并将性能数据保存到数据库中,性能数据包括如下内容:a) 测量对象;b) 具体测量属性及其值;c) 测量周期;d) 本次测量间隔的结束时间。性能上报到后,需对各类性能数据进行相应的处理并提供以下数据管理功能:a) 性能数据查询:可查询所有采集的各类性能数据。 应提供性能数据的历史记录,支持通过逻辑名称进行查询和统计,保证历史记录数据的连续性;b) 性能数据备份:数据库中存储的性能数
26、据定期或按照要求导出备份到指定的外围存储介质中,备份的性能数据应可用来制作反映性能变化的统计报表,或用于系统历史性能数据的恢复;c) 性能数据删除:可对已备份的或不再需要的性能数据进行删除,可以指定要删除的数据条件。7.1.2.3 性能门限管理a) 设置性能门限设置性能门限是指管理员可设置相关性能数据的门限。 当收集到性能数据后,应自动根据当前性能指标值或其运算值与预先定义的性能门限进行比较,当超越定义的门限时,会发出相应的越限告警;一旦恢复到正常值范围,告警会自动清除。b) 查询 /修改性能门限可查询 /修改性能门限参数。c) 越限告警的上报当收集到的性能数据值超越定义的门限时,会向指定人员
27、发出相应的越限告警,告警参数包括:告警源、 告警时间、 告警级别、 告警原因、 逾值信息。7.1.2.4 性能分析管理应能对定期收集到的数据进行统计、 分析和处理,结合信息网中管理资源的构成情况,将收集到的性能数据通过特定算法进行分析和处理,以此来反映信息网的性能质量。应能根据收集到的性能数据和告警情况对网络运行的性能质量或运行的性能趋势进行分析,并以适当方式显示,包括表格,直方图,曲线图(折线图),饼图等。7.1.2.5 性能 TopN 分析提供对指定管理对象范围内的性能参数,包括 cpu、 内存、 流量等参数,按照天、 周、 月等时间间隔进行统计并排序,并可获得符合检索条件的 TopN 排
28、序数据。7.1.3 告警管理应具有告警监视与分析、 收集与显示、 告警确认与清除、 告警过滤、 告警级别管理等功能。7.1.3.1 告警收集与显示Q / GDW 704 20129应能对信息网中的告警(包括标准告警和厂商自定义告警)进行实时监视,并能在网络拓扑图上将相应的告警信息直观显示出来,在拓扑图上显示告警发生的位置和告警的级别等信息。 同时,应支持将告警信息发送到指定运维人员的 E-mail 信箱或手机短信。在图形界面方式下,系统对告警的显示应支持以下功能:a) 在拓扑图上使用不同的颜色表示不同级别的告警,采用多层图形,逐层激活的方式,实时显示当前告警位置;b) 对同一资源,当有多个告警
29、发生时,图标的颜色应与当前最高级别的告警相对应;当较高级别告警清除后,再顺序显示次等级告警的对应颜色;c) 对于当前告警和历史告警,用户可以指定查询条件进行查询,查询条件包括告警对象、 时间范围、 告警原因、 告警级别、 告警类型、 告警是否确认,告警是否清除等;d) 告警信息应能以有声方式提醒用户,声音音量可进行调节或开关 ;e) 应能根据需求以列表方式显示详细告警信息,对于设备告警,内容应至少包括以下几方面:1) 告警源;2) 告警类型;3) 告警级别;4) 告警发生时间;5) 告警原因;6) 告警信息描述;7) 告警确认状态;8) 告警确认时间;9) 告警清除状态;10)告警清除时间。7
30、.1.3.2 告警确认与清除a) 告警确认应提供告警确认功能。 支持对所有告警进行单条或批量确认。 未经确认的告警应保持对用户的提示,直到用户进行确认。b) 告警清除应提供告警清除功能。 清除手段包括人工和自动清除两种方式,当收到报警设备自动上报的告警清除后,应将当前告警中相应的记录转移至历史告警中。 对由网络通信故障造成告警清除信息丢失,用户可手动清除指定告警。处于清除状态的未确认告警,称为锁定告警。 锁定告警保留在历史告警列表中,并应有相应图标显示。7.1.3.3 告警过滤功能a) 告警上报过滤可设置告警上报条件,即告警抑制,根据设定上报符合条件的告警。b) 告警显示过滤告警显示过滤是指根
31、据设定的显示过滤条件,有选择地显示当前告警事件。 告警显示过滤仅是告警信息的屏幕显示过滤,在拓扑图上不再显示屏蔽后的当前告警事件,不应影响任何告警事件的上报及其存储,也不影响对告警事件的查询和统计。c) 告警相关性分析与定位应能对各个告警信息进行相关性分析,可基于告警源、 告警类型、 告警时间、 告警级别等过滤条件对告警进行相关性分析,以减少告警信息的冗余度,尽可能缩小故障根本原因的范围,以便在网络层对故障进行准确定位。Q / GDW 704 201210d) 告警查询与统计应提供对当前告警或者历史告警的查询和统计功能,并能够以表格或图形(直方图、 曲线图、 饼图等)方式显示。 提供对当前告警
32、的实时统计功能,即按照某种条件(如告警级别、 告警源、 告警厂商等)实时统计当前告警的数目,在需要时可查看具体的当前告警信息。7.1.3.4 告警级别管理告警级别管理功能可用来对上报的告警级别进行重新设置,通过该功能,可根据实际情况灵活地改变告警的级别。7.1.3.5 告警通知与动作a) 系统应支持多种告警通知方式,包括合成语音、 email、 短信、 屏幕输出、 Syslog、 SNMP Trap等,支持向多个用户及用户组发送告警通知 ;b) 网络管理的各类故障和预警事件,要求通过统一数据接口将告警收集到统一事件平台,通过统计事件平台进行进一步的事件分析处理,并进入运维服务流程。7.2 系统
33、及通用应用管理系统管理对服务器、 数据库、 中间件、 存储、 通用应用系统进行全面的监控和分析,并提供故障的事前预警机制,帮助系统管理人员进行自动巡检。7.2.1 系统监测7.2.1.1 服务器管理对 CPU、 内存、 磁盘空间、 操作系统等指标进行实时监测。7.2.1.2 数据库监测对数据库的状态、 各类命中率、 表空间使用情况、 碎片率等指标进行实时监测。7.2.1.3 JAVA 中间件监测对中间件的运行状态、 servlet、 EJB、 JDBC 等指标进行实时监测。7.2.1.4 Domino 监测对 Domino 服务状态、 数据库状态、 邮件情况进行实时监测。7.2.1.5 WEB
34、 服务器对 IIS、 Apache 等主流 WEB 服务器的监视,监测功能要求包括:a) Web 站点的响应时间以及请求数的变化趋势;b) 当前匿名连接用户数、 找不到文件的错误数;c) 网站访问分布和访问量统计。7.2.1.6 标准应用监测对标准应用如 FTP、 HTTP、 POP3、 DNS 等进行实时监测。7.2.1.7 业务应用监测应用监测数据采集实现业务应用的可用性和性能状态,与底层 IT 平台部件和业务部件关联起来。通过 syslog 协议,运行日志文件解析,业务应用 API 调用等方式获取业务系统数据。需采集的业务数据主要包括:a) 业务系统的 KPI 数据:包括业务可用性、 业
35、务性能指标;b) 业务系统的关键质量指标 KQI 数据:包括业务系统的服务质量评价指标。7.2.2 性能管理性能管理要求如下:a) 性能数据可通过定时方式、 周期方式等进行采集;b) 性能数据计算与汇总:提供的基于趋势、 比较、 TopN 的各类性能分析报表,可将采集到的性能数据转换成有价值的管理信息;c) 性能数据展现:对性能数据进行准实时的监控(采集频率、 图形展现),并能灵活配置展现界Q / GDW 704 201211面;d) 性能数据门限分析:按照日、 周、 月等对性能数据进行统计,计算最大、 最小、 平均值,描述具体发生时间,分析关键指标的趋势。7.2.3 告警管理性能报警的配置支
36、持如下:a) 固定门限告警:对任意一种性能指标,任意一个节点或接口设置相应指标值上下行告警门限,并可分别设置告警压制时间与级别;b) 基线告警:根据实际值与标准值的偏移设置告警门限;c) 组合告警,根据多个系统监测器的监测结果组合进行告警判断。故障采集的接口支持要求:a) 可扩展定义新的告警、 告警解析处理方式,具有接收和处理新的故障告警能力;b) 对于无相应监控产品可实现对其进行监控的系统,可通过开发接口,调用应用系统的命令行或者直接编写对应的监控程序。提供基本的系统事件规则配置支持如下:a) 提供友好的配置界面:能够方便地定制各类事件的标准化处理规则,以及定制将标准事件转化为告警事件的规则
37、;b) 配置规则的内容:包括事件过滤、 事件标准化、 告警传递、 告警升级、 告警清除等内容。7.3 IT 资源信息库资源信息库是(综合网管)系统数据库的核心,保存了各类被管理对象和资源的基本信息,并在资源信息基础上提供了相关维护支持。7.3.1 IT 资源信息内容提供完整的信息网资产类别:网络设备、 服务器、 桌面主机、 软件资产、 网络链路、 布线系统,为每类资产提供管理、 来源、 维护、 保修等属性类别,包括以下内容:a) 资源基本信息:包括资源的内部标识、 名称、 类型、 IP 地址、 物理地址、 厂商、 操作系统版本等基本信息,作为资源的最基本的识别、 判断信息;b) 资源管理信息:
38、包括资源的管理分类、 用途分类、 管理部门、 管理人、 安装位置、 开始使用时间、 终止使用时间、 使用状态、 重要级别、 风险级别等,作为资源的管理属性,支持进一步的管理需求;c) 资源来源信息:包括购买日期、 资产价值、 资产来源类型、 资产来源描述;d) 资源属性信息:资源的附加配置属性,不同类型资源的配置属性有所不同,例如网络设备的固件版本、 设备模块组成、 端口种类、 服务器的操作系统类型、 硬件配置、 存储设备、 软件资源的使用许可( License)、 服务端口、 模块组成等;e) 资源状态信息:资源当前的运行状态信息,例如网络设备的端口状态,数据库运行状态、 服务器的进程状态、 Oracle 数据库的实例名、 归档模式等;f) 资源关联信息:提供资源的关联信息,必须提供网络节点的拓扑信息,可选提供资源的父子、安装等其他关联信息;g) 资源维护信息:包括资产编号、 资产的负责人,资产的集成商,产品支持厂商、 当前质保期、历次故障记录、 历次购保记录、 历次维护记录,为资产维护提供数据的支持。7.3.2 资源信息管理功能要求达到以下扩展能力:a) 资源类型可扩充:通过资产管理模板进行扩展,建立最适合的资源类型;b) 资源属性可扩展