1、lCS 33030Y口中华人民共和国通信行业标准YD厂r 1 9262-2009IT运维服务管理技术要求第2部分:管理服务定义IT Operations and Maintenance Service Management Technical SpecificationPart 2:Managed Service Definition2009-06-1 5发布 2009-09-01实施中华人民共和国工业和信息化部发布目 次1 9262-2009前言III1范J蜀-l2规范性引用文件l3术语定义及缩略语14 rr运维服务定义方法35 rr基础设施管理服务36 IT应用管理服务367 IT终端用户
2、工作环境服务388 IT安全管理服务4l9 IT业务连续性服务47附录A(规范性附录)服务定义汇总表50附录B(规范性附录)故障,问题分级52附录C(规范性附录)服务报告模板53附录D(资料性附录)服务质量考核案例55月U 吾YD厂r 1 9262-2009rr运维服务管理技术要求分为5个部分:第l部分:体系架构第2部分:管理服务定义第3部分:服务管理流程第4部分:服务管理支撑系统第5部分:配置管理数据库本部分为rr运维服务管理技术要求的第2部分。本部分在编制过程中,主要参考了通信行业标准:YDT19261,国际标准化组织(ISO)和国际电工委员会(IEC)标准:ISOIEC 20000;国际
3、电信联盟电信标准化部门(ITU-T)建议M3342:英国(OGC)标准:1TIL V2和ITIL V3等相关标准,并结合我国的具体情况编制而成。其中,对相关主要标准的引用或参考情况的说明如下:本部分在制定过程中,参考了该标准中的IX,q务管理流程。uTRecM3342:本部分在制定过程中,参考了该建议中SLA表示模板的描述和解释。oGc ITIL20和ITIL30:本部分在制定过程中,参考了该标准中关于服务管理流程的描述以及部分相关术语的定义。本部分与上述标准的关系为非等效。本部分的附录A、附录B、附录c为规范性附录,附录D为资料性附录。本部分由中国通信标准化协会提出并归口。本部分起草单位:中
4、国电信集团公司、北京邮电大学、成都勤智数码科技有限公司、北京交通大学、亿阳信通股份有限公司本部分主要起草人:朱挺、王燕川、李凌、王志恒、高志鹏、詹志强、刘会永、冯根怀、杨芳南、张钊IT运维服务管理技术要求第2部分:管理服务定义1 9262-20091范围本部分规定了各类rr运维服务的服务内容、服务方式、服务条件和相关服务质量指标等内容,规定了rr运维服务的报告模板。本部分适用于rr运维服务提供商和客户就服务内容和服务标准达成共识,为服务提供商编制服务产品目录和客户选购相关服务提供参考。2规范性引用文件下列文件中的条款通过本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(
5、不包括勘误的内容)或修订版均不适用于本部分。然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。YDfT 19261 IT运维服务管理技术要求第1部分:体系架构ISOIEC200001 信息技术服务管理一规范ISOIEC200002 信息技术服务管理一实施指南rruT M3342 SLA表示模板定义指南rrUTM3000uTM3000电信管理网TMN建议总览OGC 1THV2 信息技术基础设施库第二版OGC ITIL V3 信息技术基础设施库第三版ETFRFC 1213 基于TCPflP互联网网管应用的管理信息库:MIBII3术语
6、、定义和缩略语31 术语和定义在标准第1部分“体系架构”中的有关术语和定义以及下列术语和定义均适用于本部分。311故障Fault设备或系统丧失规定的功能,导致服务中断或降质,或对服务正常运行造成潜在威胁。312异常Exceptionrr设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。3 13故障隐患Potential FaultYD厂r 1 9262-2009rr设备或系统运行偏离初始设计或期望的状态,但尚未对rr服务造成影响,当条件在设计指标范围内发生改变时,有可能引发故障。rr设备或系统运行条件处于临界状态,当运行条件进一
7、步变化超出设计容忍范围时,将有可能引发故障。314健康档案Health Recordrr设备或系统的运行历史记录,包括设备或系统正常运行时的各种状态和指标、各类指标随业务负荷变化的趋势曲线、故障历史记录、故障件更换记录、软硬件扩容或调整记录、软件补丁和升版记录。315故障类服务请求Fault Request由于故障引发的服务请求。316业务类服务请求Service Requesl由于业务变更需要引发的服务请求。317终端用户工作环境End-user Working Environment用户使用的桌面设备、膝上设备、手持设备、工作站和打印机等各种rr系统的访问设备及周边生产和办公环境的总称。3
8、t2缩略语下列缩略语适用于本部分。2Information TechnologyPrivate Branch ExchangeVirtual Private NetworkMultipoint Control UIlitCentral Processing Unit15me Division ModulationStorage Area NetworkNetworkAttach StorageUninterruptible Power SystemPost Office Protoc01version 3Domain Nallle ServiceFile Transfer ProtocolUn
9、iform Resource LocatorDenial of ServiceEnterprise Resource PlanningCustomer Relation ManagementO伍ce AUtomationPersonal Di百tal Assistant信息技术专用交换机虚拟专用网多点控制单元中央处理器时分调制存储区域网网络附加存储不问断电源邮局协议版本3域名服务文件传输协议统一资源定位器拒绝服务企业资源计划系统客户关系管理系统办公自动化系统个人数字助理盯嗽一伽一蚕|室|刍一|耋田吼莹附一队吼POSCVEUDPHrTPICMPP2PVb母BCPRTORPOPoint of Sa
10、leCommon Vulnerabilities and ExposuresUser Datagram ProtocolHypertext Transfer ProtocolInternet Control Message ProtocolPerson-to-PersonVbice over Intemet ProtocolBlock CopyRecovery Time ObjecfivesRecovery Point 0bjective1 9262-2009销售点终端通用漏洞披露用户数据报协议超文本传输协议Intemet控制消息协议个人对个人基于协议的语音传输批量拷贝恢复时间目标恢复点目标4
11、 lT运维服务定义方法rr运维服务指服务提供商综合利用各种资源为客户提供的确保其rr系统及网络正常、安全、高效、经济运行的服务。rr运维服务定义规定了服务的内容、服务的方式以及服务的标准和实施服务所必需具备的条件,规定服务双方的权利和义务。在rr运维服务提供商为客户提供rr运维服务之前,服务双方基于客户的业务需求,经过沟通和协商,就服务内容、服务方式、服务标准及服务条件等方面的详细内容达成一致,这些内容作为技术条款,和其他商务条款一起,形成服务双方共同认可的服务合约。服务合约中的技术条款构成服务定义。本标准中的rr运维服务包括rr基础设施管理服务、rr应用管理服务、rr终端用户工作环境服务、r
12、r系统安全管理服务以及业务连续性服务。附录A里规定了rr运维服务定义汇总表。5 IT基础设施管理服务rr基础设施管理服务为客户管理网络(包括通信网络)、服务器、存储、备份、数据库、中间件以及机房环境等基础设施,服务供应商对上述基础设施提供监视、日常代维、维修保障(包括备件服务)等维护和管理服务。IT基础设施管理服务的具体服务项目见表1。表1 IT基础设施管理服务项目戮黼麟黼黼燃 黼戮黼鳓懿黼网络监控网络管理服务网络设各日常代维视频会议服务(包括通信网络)网络设备维修保障(含备件服务)重要通信保障服务器监控基础设施管理服务 服务器管理服务 服务器日常代维服务器设备维修保障(含备件服务)存储系统监
13、控存储管理服务 存储系统设各日常代维存储系统设备维修保障(含备件服务)日常备份维护服务备份管理服务备份设备维修保障(含各件服务)YD厂r 1 92622009表1(续)粼麟黼黼缫徽黼黼 黼黼黼黼黼黼燃燃 黼黼黼缫瓣黼缫黼黼黼黼黼獭鬻黼麟数据库系统运行监控数据库日常维护数据库管理服务数据库软件支持(含升级服务)数据库性能调优rr基础设施管理服务 中间件运行监测和日常维护中间件管理服务中间件软件支持(含升级服务)机房动力及环境监控机房动力及环境管理服务 机房动力及环境设各日常代维机房动力及环境设各维修保障以上服务项可以灵活组合,客户的不同类型的基础设施管理服务可选择不同的服务提供商,同一类型的基础
14、设施的不同服务项也可以由不同的服务提供商分别承担。客户还可以指定某一服务提供商负责多家服务提供商的统一协调管理。51 网络管理服务网络管理服务为客户管理局域网、广域网、通信设施等,具体管理的网络设备对象可包括以下范围:(1)IP网络设备,如交换机、路由器、防火墙、VPN接入、加密机、无线接入及负载均衡等设备;(2)语音通信或统一通信设备,如电话小交换机、PBX、话务台,呼叫中心及VoIPIP电话系统等;(3)视频会议设备,女IMCU、视频会议终端及外围音视频设备等。服务提供商为客户提供以上对象的网络监控服务、网络日常代维服务、网络设备维修保障服务、重要通信保障等网络管理服务,针对视频会议设备的
15、日常代维,服务提供商还可提供视频会议服务。511网络监控服务5111服务内容服务提供商实时监测客户网络的运行状态和性能,要求所监测的内容,参数能及时反映影响业务或可能影响业务的所有客户网络故障或运行异常,监测内容,参数分状态值和性能参数两类,具体内容,参数根据具体设备类型和应用场景而定。服务提供商应根据客户网络应用情况,结合客户需求特点,设计合理的监控参数和处理策略。各类设备应监测的内容参数最小集见表2。除表2中的设备能自身报告的监测参数外,服务提供商也可根据业务情况,配备必要的外部监测手段,提供端到端的业务质量指标监测,如网络端到端时延、端到端丢包率及语音质量评估等。当以上网络设备监测状态发
16、生变化或监测参数值超过预设门限时,服务提供商应根据约定向客户或客户指定的代表及时报告异常。服务提供商应提供灵活的性能参数报警触发条件选择,如绝对值触发、相对值触发、变化率触发及趋势线触发等。服务提供商能根据客户业务的变化,对触发报警门限进行自适应调整。如果双方有约定,在异常消除时,服务提供商也应该向客户及时报告。各类设备性能参数的监测周期,可根据设备和业务状况而定,一般有2s、5s、lmin、5min、10rain、15rain等可选周期。监测周期推荐为5min,并要求历史记录至少保存24h;对于监测周期更短的参数,如以2s为监测周期的参数,要求历史记录至少保存15rain。根据服务双方约定,
17、在发生异常时,服务提供商可在客户授权范围内,对设备进行必要的操作,以便及时恢复业务或控制异常对业务影响的程度和范围。本服务项内的操作一般局限于简单操作,根据双41 92622009方约定,操作一般可包括以下内容:重启端1:3、启用备用设备或路由、临时关闭服务、重启进程、重启服务、重启设备、重启协议及初始化数据等。表2网络监控服务监测内容,参数最小集鬻戮獭膝獭麟黼 蕤翻麟设备掉电或重启事件 状态设备板卡或模块的主要告警 状态所有网络设备 设备CPU占用率 性能参数设备内存占用率 性能参数关键端口链路状态告警 状态、普通IP网络设备 关键链路带宽占用率 性能参数广域网络端口误码率 性能参数VPN设
18、备、无线接入设备 当前周期的会话数峰值 性能参数负载均衡设备 针对各类应用,不同路由或负载上的流量统计(握手数量、带宽占用等) 性能参数关键端口链路状态告警 状态电路占用率(针对TDM) 性能参数语音通信或统一通信设备 出口链路带宽占用率 性能参数广域网络端口误码率 性能参数呼叫接通率 性能参数关键端口链路状态告警 状态主要终端状态 状态视频会议设备 MCU的会议资源占用率 性能参数链路带宽占用率 性能参数注:上表中的设备类型,均特指5I网络管理服务中所列的设备针对所监测到的每一次异常,服务提供商均应进行详细记录。记录内容应包括发生地点、发生时间、设备、异常类型、异常等级、异常对业务的影响程度
19、和范围、报告时间、报告人、报告接收人、异常清除时间、异常处理结果等,作为将来运行分析和服务考核的依据。服务提供商根据双方约定的周期,定期为客户提供网络运行情况分析报告。5112服务方式对于本服务项中监控的具体实施,服务提供商应提供远程监控或现场监控两种方式,客户根据实际业务需要进行选择。对于本服务项中异常报告的通知,服务提供商应能提供现场、电话、短信、E-mail等各种方式供用户选择,服务提供商还应该提供Web、电话等方式供客户进行历史异常报告的查询。对于本服务项的服务时间,服务提供商应提供724、7X 11、58(或59)等方案供客户选择,如果客户对服务时间有特殊要求,则由双方另行约定。51
20、13服务条件双方首先应明确所需监控设备的清单和监控业务需求,根据业务情况协商确定各类异常报告触发条件。客户为服务提供商开放设备控制端口的查看权限和必要的操作权限,并为服务提供商将被监控设备接入服务管理支撑系统的监控模块提供配合。服务提供商应配备服务管理支撑系统,实现设备的集中监控和服务流程的电子化管理。如果服务采用远程监控方式实现,双方协商确定并实施远程连接的通信手段:如果服务采用现场监控方式实现,客户应为服务提供商提供必要的办公条件。5YD厂r 1 9262-20095114服务指标(1)异常报告的时间约定服务提供商根据异常等级和客户要求在规定时间内进行报告,对于异常报告的时间要求建议采用表
21、3标准,如有特殊要求双方也可另行约定。表3网络监控服务异常报告时间要求l豢霸g攒黪$灞鬟雾纂l劳黪g;黧g獭鬻鹾燃|瓣鬻静游黪嚣霜黪$黎|嚣|雾簿|案黪嚣濯碧溯嬲黪鳓黪躲霸尊黪纂“;一级 25min2 广播会场音频中断15min3 非广播会场音视频全断会议时间的504 会议总体质量评分在3分以下会议流程顺畅程度反映音视频切换跟会议议程的配合情况,主要包含以下要素:发言人变换时,及时进行音响控制进行话筒切换;发言人切换时,适时切换到发言人特写画面;在会议过程中,适当进行各类画面切换,保证画面生动性和会议效果。514网络设备维修保障服务5141服务内容服务提供商为客户网络设备提供维修保障服务,主要
22、包括故障定位、故障维修、故障件替换、软件BUG修补和软件版本升级等内容。对于本服务项的具体实施,一般采用“远程响应和支持“+”按需到现场支持”的方式进行。服务提供商受理客户或客户指定代表的服务请求,及时作出响应,进行故障判断和定位,综合故障等级、故障现象以及客户要求做出是否需要赶赴现场的决定。远程响应和支持一般又分远程指导和远程操作两种方式。远程指导是指服务提供商通过电话等手段为客户提供技术支持,协助故障分析定位,提出解决故障的方法建议;客户根据服务提供商提供的建议负责实施具体操作。远程操作是指服务提供商利用远程接入等手段,直接访问和控制设备,对设备实施直接操作,客户负责现场操作的配合。采取远
23、程操作方式时,一般应配备必要的安全保障手段,如身份认证、权限控制和操作日志记录等,保证实施服务时服务提供商能拥有必要和充分的操作权限,并自动对服务提供商维护设备所实施的操作命令以及返回结果进行完整记录。服务提供商按照优先恢复业务的原则进行故障处理,如果恢复业务后,故障原因未查明或故障隐患仍存在,服务提供商应将该服务请求转换成问题并负责后续处理。服务提供商负责问题的后续处理,查找故障发生的真正原因,并提出预防措施建议,消除故障隐患,尽量避免类似故障再次发生。对于本服务项的服务时间,服务提供商应提供远程响应和支持,现场支持分别按724、711、58(或59)的方案供客户选择。表1l是服务时问的一个
24、示例。表1 1 网络设备维修保障服务时间;。 :二酵劬莓i囊t一|二! |棼 誊每j誊5 7|j旃霹省棚 。 。 i远程响应和支持 724现场支持 58在客户自行负责网络监控和日常维护工作的情况下,本服务项目可包括设备的维护巡检,具体工作内容为网络日常代维服务中的维护作业计划的一部分,相关内容参见512。5142服务指标(1)服务约定指标本服务项主要关注服务提供商在受理客户服务请求后的响应时间和故障恢复时间,在同城条件下或省会等中心城市,有关服务时间的约定建议见表12。10表12网络设备维修保障服务约定指标1 92622009辫j-瘟舞齑囊羞豢 黪囊藿锄瀚澎雾g器黪雾 |蓥露豢|磐#g$痧g9
25、谚学|黪参身 蓥髫蘩搿酾纛黪雾爹謦一级故障 800kin 视交通情况另行约定(2)服务质量指标网络设备维修保障韵服务质量指标建议见表14。毒雾爹彰i|警鬻j篁|囊i 。*彝oI j 强-簸?j奔瓣岔伊廖f群嬲赣|誊荨豫鞭*劳=嚣。一尊o j;$i瞧詹ji 争爹专镑鏊I服务响应及时率 服务提供商接到客户请求后及时作出响应的次数百分比 98 95当需要现场服务时,服务提供商接到客户请求后及对到达现场到达现场及时率 98 95的次数百分比故障修复及时率 故障设备在规定时间内得到修复的次数百分比 98 95问题解决率 1个月内的问题解决率 80 粥515重要通信保障服务5151服务内容在客户进行重大活
26、动时,根据客户的业务需求,服务提供商针对客户网络进行网络通信保障方案设计及实施、实施设备和网络运行状态检查、进行备用设备和路由保障,保证重要通信期间网络的运行质量和高可用性。具体内容包括:检查各类设备运行状态,清除告警;检查各类网络设备性能参数,对超门限的指标进行处理,对异常负荷进行清查和处理;检查网络拓扑和配置数据,保证数据准确性和倒换备份机制工作正常;提供临时设备或线路备份,并测试工作正常;部署保障期间的保障人员、物资和流程,确保应急流程畅通;在通信保障时间,及时和快速地处理故障和异常,确保通信畅通。515-2服务方式本服务项目一般为定制服务,根据客户的业务需求,双方协商确定服务内容和具体
27、服务方式。YD厂r 1 926220095153服务指标该服务的质量通过重要通信保障期间的客户业务中断次数和中断时长进行衡量,本服务原则上不允许出现任何影响业务的故障,双方也可根据实际情况,就出现故障时的业务恢复时间要求进行约定。52服务器管理服务服务器管理服务为客户管理客户rr应用系统的各类主机服务器,包括unixLinux服务器、Windows务器等。服务提供商为客户提供服务器监控服务、服务器日常代维服务及服务器设备维修保障服务。521服务器监控服务5211服务内容服务提供商实时监测客户服务器的运行状态和性能,要求所监测的内容,参数能及时反映影响业务或可能影响业务的所有服务器故障或运行异常
28、。监测内容廖数分状态值和性能参数两类,具体内容参数根据具体设备类型和应用场景而定。服务提供商应根据服务器上运行的应用系统情况,根据客户需求特点,设计合理的监测参数和处理策略。本服务应监测的服务器运行状态,参数最小集见表15。表15服务器监控服务监测内容,参数最小集。;嚣i舞黪参髫;渗g萄|:鬻霪誊纛籍黪 攒黪垂|l辨黪露黪瘩醋埔汹彩碧簦j_弦糖辨群黪 i鬟雾黪彭爹毒溪萄誊ij?全局参数设备掉电或重启事件 状态设备板卡或模块的主要告警 状态设备CPU占用率 性能参数总进程数 性能参数内存占用率 性能参数硬盘,卷占用率 性能参数网络网络通断 状态网络丢包率 性能参数服务器(通用)应用关键进程运行状
29、态 状态登录用户数 性能参数典型操作响应时间 性能参数I0交换内存占用数 性能参数磁盘Io次数fs 性能参数磁盘IO字节,s 性能参数页面调入次数,S 性能参数页面调出次数,s 性能参数系统日志中的错误报告 状态Unix服务器 关键文件监控,如大小、增长率 性能参数双机HA的可用性 状态Windows服务器 系统补丁更新情况 状态当以上服务器设备监测状态发生变化或监测参数值超过预设门限时,服务提供商应根据约定向客户或客户指定的代表及时报告异常。服务提供商应提供灵活的性能参数报警触发条件选择,如绝对值触发、121 9262-2009相对值触发、变化率触发及趋势线触发等。服务提供商能根据客户业务的
30、变化,对触发报警门限进行自适应调整。如果双方有约定,在异常消除时,服务提供商也应该向客户及时报告。服务器各类运行性能参数的监测周期,可根据设备和业务状况而定,一般有2s、5s、lmin、5min、10min、15min等可选周期。监测周期推荐为5min,并要求历史记录至少保存24h;对于监测周期更短的参数,如以2s为监测周期的参数,要求历史记录至少保存15rain。根据服务双方约定,在发生异常时,服务提供商可在客户授权范围内,对设备进行必要的操作,以便及时恢复业务或控制异常对业务影响的程度和范围。本服务项内的操作一般局限于简单操作,根据双方约定,操作一般可包括以下内容:重启进程、重启设备及清理
31、硬盘空间等。针对所监测到的每一次异常,服务提供商均应进行详细记录。记录内容应包括发生地点、发生时间、设备、异常类型、异常等级、异常对业务的影响程度和范围、报告时间、报告人、报告接收人、异常清除时间、异常处理结果等,作为将来运行分析和服务考核的依据。服务提供商根据双方约定的周期,定期为客户提供服务器运行情况分析报告。5212服务方式对于本服务项中监控的具体实施,服务提供商应提供远程监控或现场监控两种方式,客户根据实际业务需要进行选择。对于本服务项中异常报告的通知,服务提供商应能提供现场、电话、短信、Email等各种方式供用户选择,服务提供商还应该提供Web、电话等方式供客户进行历史异常报告的查询
32、。对于本服务项的服务时间,服务提供商应提供724、711、58(或59)等方案供客户选择,如果客户对服务时间有特殊要求,则由双方另行约定。5213服务条件双方首先应明确所需监控服务器的清单和监控业务需求,根据业务情况协商确定各类异常报告触发条件。客户为服务提供商开放具有必要权限的服务器账号,并为服务提供商将被监控服务器接入服务管理支撑系统的监控模块提供配合。服务提供商应配备服务管理支撑系统,实现服务器设备的集中监控和服务流程的电子化管理。如果服务采用远程监控方式实现,双方协商确定并实施远程连接的通信手段;如果服务采用现场监控方式实现,客户应为服务提供商提供必要的办公条件。5214服务指标(1)
33、异常报告的时间约定服务提供商根据异常等级和客户要求在规定时间内进行报告,对于异常报告的时间要求建议采用表16标准,如有特殊要求双方也可另行约定。表16服务器监控服务异常报告时间要求i誊i雾考。舷*雾 器髫|露癣旁p黼謦F妊雾;自酝矗舅二l劳l; 鬈辫黎髫黪溆鳓誊葡零:缬劳奔瓣爹饕黪簿嚣黯爱I一级 999 99时间内进行报告的百分比异常漏报率 衡量服务提供商完整报告服务器运行异常的能力 800km 视交通情况另行约定(2)服务质量指标服务器设备维修保障的服务质量指标建议见表25。表25服务器设备维修保障服务质量指标叠r荔*毒醪鬻i 荔i二秘缮?;g|霪群黪g雾痞尝爵雾雾蠢掰谚雾鬃爹爹荣l;i髫露
34、l黪争l;磐 -|雾奄雾势 露爹国管雾爹服务响应及时率 服务提供商接到客户请求后及时作出响应的次数百分比 98 95当需要现场服务时,服务提供商接到客户请求后及时到达现场的次数到达现场及时率 98 95百分比故障修复及时率 故障设备在规定时间内得到修复的次数百分比 98 95问题解决率 1个月内的问题解决率 80 6053存储管理服务存储管理服务为客户管理客户rr应用系统中的各类相对独立的存储设备,如磁盘阵列、SAN及NAS等存储系统。服务提供商为客户提供存储系统监控服务、存储系统设备日常代维服务、存储系统设备维修保障服务。17YD厂r 1 9262-2009531 存储系统监控服务5311服
35、务内容服务提供商实时监测客户存储系统的运行状态和性能,要求所监测的内容,参数能及时反映影响业务或可能影响业务的所有存储系统故障或运行异常。监测内容参数分状态值和性能参数两类,具体内容,参数根据具体设备类型和应用场景而定。服务提供商应根据存储系统上的应用系统情况,结合客户需求特点,设计合理的监控参数和处理策略。本服务应监测的存储系统运行状态,参数最小集见表26。表26存储系统监控服务监测内容,参数最小集| 。_|锑|弘童菇对囊豫鬟尊嚣蘩誊尊掣 参髻|$参|碧g爹露为参窘5i澎lil磐鹫|9|雾gj|劳I磐 。务黪参参黪g蜜l曩尊;|设备掉电或重启事件 状态设各板卡或模块的主要告警 状态设备存储空
36、间占用率 性能参数设备CPU占用率 性能参数存储系统 设备内存占用率 性能参数平均读写吞吐量 性能参数峰值读写吞吐量 性能参数Cache读命中率 性能参数Cache写命中率 性能参数当以上存储系统监测状态发生变化或监测参数值超过预设门限时,服务提供商应根据约定向客户或客户指定的代表及时报告异常。服务提供商应提供灵活的性能参数报警触发条件选择,如绝对值触发、相对值触发、变化率触发、趋势线触发等。服务提供商能根据客户业务的变化,对触发报警门限进行自适应调整。如果双方有约定,在异常消除时,服务提供商也应该向客户及时报告。存储系统各类性能参数的监测周期,可根据设备和业务状况而定,一般有2s、5s、lm
37、in、5min、10min、15min等可选周期。监测周期推荐为5min,并要求历史记录至少保存24h;对于监测周期更短的参数,如以2s为监测周期的参数,要求历史记录至少保存15min。根据服务双方约定,在发生异常时,服务提供商可在客户授权范围内,对设备进行必要的操作,以便及时恢复业务或控制异常对业务影响的程度和范围。本服务项内的操作一般局限于简单操作,根据双方约定,操作一般可包括以下内容:重启设备、主备模块切换等。针对所监测到的每一次异常,服务提供商均应进行详细记录。记录内容应包括发生地点、发生时间、设备、异常类型、异常等级、异常对业务的影响程度和范围、报告时问、报告人、报告接收人、异常清除
38、时间、异常处理结果等,作为将来运行分析和服务考核的依据。服务提供商根据双方约定的周期,定期为客户提供存储系统运行情况分析报告。5312服务方式对于本服务项中监控的具体实施,服务提供商应提供远程监控或现场监控两种方式,客户根据实际业务需要进行选择。对于本服务项中异常报告的通知,服务提供商应能提供现场、电话、短信、Email等各种方式供用户选择,服务提供商还应该提供Web、电话等方式供客户进行历史异常报告的查询。对于本服务项的服务时间,服务提供商应提供724、711、58(或59)等方案供客户选择,如果客户对服务时间有特殊要求,则由双方另行约定。5313服务条件181 9262-2009双方首先应
39、明确所需监控存储系统设备的清单和监控业务需求,根据业务情况协商确定各类异常报告触发条件。客户为服务提供商开放存储系统设备访问端口的查看权限和必要的操作权限,并为服务提供商将被监控存储系统设备接入服务管理支撑系统的监控模块提供配合。服务提供商应配备服务管理支撑系统,实现存储系统设备的集中监控和服务流程的电子化管理。如果服务采用远程监控方式实现,双方协商确定并实施远程连接的通信手段;如果服务采用现场监控方式实现,客户还应为服务提供商提供必要的办公条件。5314服务指标(1)异常报告的时间约定服务提供商根据异常等级和客户要求在规定时间内进行报告,异常报告时问要求建议采用表27标准,如有特殊要求双方也
40、可另行约定。表27存储系统监控服务异常报告时间要求jI酶蒜鹾缓耄 j争薯|誊簦聱浮醪孝害滴尊;(船番蜜善j绺I雾|掌|l零。磐 蒜蓬蠹l翳豁骚睡喾雠闻磐滑窿辞錾癌|。B芽i-誊誊麓氆一#矗董一级 999 99约定时间内进行报告的百分比I异常漏报率 衡量服务提供商完整报告存储系统运行异常的能力 800kin 视交通情况另行约定(2)服务质量指标存储系统设备维修保障的服务质量指标建议见表36。表36存储系统设备维修保障服务质量指标霪豢缫橥黼缀 缫黼蓠赣獭畿服务响应及时率 服务提供商接到客户请求后及时作出响应的次数百分比 98 95当需要现场服务时,服务提供商接到客户请求后及时到达现场的到达现场及时
41、率98 95次数百分比故障修复及时率 故障设备在规定时间内得到修复的次数百分比 98 95问题解决率 1个月内的问题解决率 80 6054备份管理服务备份管理服务为客户管理rr应用系统中的各类备份设施(如磁带机、光盘库、异地备份设备等)及其应用,服务提供商为客户提供日常备份维护服务、备份设备维修保障服务。541 日常备份维护服务5411服务内容服务提供商根据客户业务需求,为客户设计备份策略,实施日常备份和维护工作,并负责进行备份有效性监测,配合客户进行系统灾难备份恢复演练,主要包括以下内容。(1)备份策略设计和备份计划编制服务提供商根据业务系统的应用特性,设计备份策略,并制定详细的备份作业计划
42、。进行系统备份策略设计时,应考虑备份数据量、数据变化情况、数据重要性、备份系统能力、备份成本、备份所需时间、业务忙闲时间、备份对正常业务的影响及恢复时间等因素,选择合适的完全备份、增量备份、差异备份等策略或组合策略。确定基本策略后,制定出详细的备份作业计划,经客户认可后批准实施。(2)日常备份和维护工作服务提供商根据事先确定的备份策略和备份作业计划,采取人工干预(如启动备份命令或放置磁带等)或自动(自动作业计划或填充自动装载设备等)的方式完成备份操作,对每次备份操作进行详细记录,将备份完成的介质存放在安全的地方。服务提供商应按计划检查备份设施的工作状态是否正常,备份工作是否按计划正常完成。当发
43、现异常时,及时进行处理。对于无法解决的问题,及时向客户或客户指定的代表报告,或根据客户授权,协调相关方面(一般为542所描述的备份设备维修保障服务的提供商)进行处理。(3)备份有效性检查服务提供商应采取必要的手段,按照事先确定的作业计划对备份的数据拷贝进行有效性检测,包括介质有效性检测、数据完整性检查等。介质有效性检测是指采用设备对介质进行读操作,检查介质是否存在物理损坏现象。数据完整性检查,是采用人工或程序检查的手段,检查备份数据逻辑上是否完整,是否能有效满足数据恢复的需要。(4)灾难备份恢复演练通过双方协商约定,服务提供商配合客户进行系统灾难备份恢复演练。通过模拟可能发生的系统宕机、数据丢
44、失等灾难性故障,进行系统和数据恢复操作,验证备份方案的有效性,并演练人员和流程配合的熟练程度。23YD厂r 1 9262-2009服务提供商应对以上工作的执行情况进行详细记录,为客户提供汇总的分析报告。5412服务方式对于本服务项的具体实施,日常备份和维护作业一般采用“现场或远程操作”+“定期到现场操作”的方式进行,具体方式由双方约定。对于本服务项的服务时间,双方根据备份工作的作业计划协商确定。5413服务条件双方首先应明确日常备份和维护工作职责和范围,根据设备状况和业务需求制定备份维护作业计划。客户为服务提供商开放设备控制端口和具备必要权限的操作账号。服务提供商应配备服务管理支撑系统,实现服
45、务流程和服务记录的电子化管理。如双方约定采用远程操作维护的方式,客户还应配合将所涉及的设备接入服务提供商的服务管理支撑系统。需要现场服务时,客户应为服务提供商提供必要的办公条件。5414服务指标(1)服务约定指标维护项目的执行按维护作业计划约定执行。日常备份失败或执行作业计划发现异常时,应及时处理,并按约定向客户或客户指定的代表报告。(2)服务质量指标日常备份维护服务的服务质量指标见表37。表37存储系统设备日常代维服务质量指标蘩;夔蘩囊潦舔缓壤骥 簇鬃囊黧翻撩黼黼鬃蘸麟 鬻缫戳簇 獭纛鹾i服务提供商按客户要求在规定时间内完成维护作业计划的及时完成率 100 100作业计划的百分比根据各份记录
46、进行检查完整性,通过抽查检备份的完整性及有效性 99 95查备份的有效性服务提供商执行维护作业计划,发现设备故故障隐患发现率 障隐患的百分比(本指标的具体计算以后续 999 99抽检或故障分析得到的数据为依据)客户对服务质量的考核,可根据实际情况为以上指标分配不同权重,计算出服务总得分,并和商务条款挂钩,具体案例参见附录D。542备份设备维修保障服务5421服务内容服务提供商为客户发生故障的备份系统设备提供维修保障服务,主要包括故障定位、故障维修、故障件替换、软件BUG修补和软件版本升级等内容。对于本服务项的具体实施,一般采用“远程响应和支持”+“按需到现场支持”的方式进行。服务提供商受理客户
47、或客户指定代表的服务请求,及时作出响应,进行故障判断和定位,综合故障等级、故障现象以及客户要求做出是否需要赶赴现场的决定。远程响应和支持一般又分远程指导和远程操作两种方式。远程指导是指服务提供商通过电话等手段为客户提供技术支持,协助故障分析定位,提出解决故障的方法建议;客户根据服务提供商提供的建议负责实施具体操作。远程操作是指服务提供商利用远程接入等手段,直接访问和控制备份系统设备,对1 9262-2009设备实施直接操作,客户负责现场操作的配合。采取远程操作方式时,一般应配备必要的安全保障手段,如身份认证、权限控制和操作日志记录等,保证实旅服务时服务提供商能拥有必要和充分的操作权限,并自动对服务提供商维护备份系统设备所实施的操作命令以及返回结果进行完整记录。服务提供商按照优先恢复业务的原则进行故障处理,