1、 ICS 35.240.01 M 63 DB11/Z 384.172008 图像信息管理系统技术规范 第17部分:运行维护要求 Technical Specification for Image Information Management System Part 17:Requirement for Operation and Maintenance 2008-05-28发布 北京市质量技术监督局 发 布 DB 北京市标准化指导性技术文件 DB11/Z 384.172008 I 目 次 前言.II 引言.III 1 范围.1 2 规范性引用文件.1 3 术语和定义、缩略语.1 4 技术要求.
2、2 5 故障处置流程与要求.4 6 维护与故障处理要求.5 7 服务与管理要求.6 附录A(资料性附录)系统的可用性.8 A.1 设备的MTBF值.8 A.2 系统的MTBF值.8 A.3 系统的可用性.8 参考文献.9 DB11/Z 384.172008 II 前 言 DB11/Z 384图像信息管理系统技术规范分为以下几个部分: 第1部分:总体平台结构; 第2部分:视频格式与编码; 第3部分:通信控制协议; 第4部分:传输网络; 第5部分:图像质量要求与评价方法; 第6部分:图像存储与回放; 第7部分:工程要求与验收; 第8部分:危险场所的施工与验收; 第9部分:图像资源及系统设备编码与管
3、理; 第10部分:图像采集点设置要求; 第11部分:控制权限分类与管理; 第12部分:图像采集区域标志的设计与设置; 第13部分:图像信息存储系统; 第14部分:手持移动终端联接技术要求; 第15部分:软件质量评价方法; 第16部分:视频图像字符叠加要求; 第17部分:运行维护要求; 第18部分:系统平台技术要求。 本部分为DB11/Z 384的第17部分。 其他图像信息管理系统技术要求将结合实际需要适时制定,作为本规范的分部。 本部分的附录A为资料性附录。 本指导性技术文件由北京市质量技术监督局、北京市信息化工作办公室、北京市公安局提出。 本指导性技术文件由北京市质量技术监督信息研究所归口。
4、 本指导性技术文件主要起草单位:北京市质量技术监督局、北京市信息化工作办公室、北京市公安局、北京声迅电子有限公司、北京富盛星电子有限公司、信息产业部电子六所、北京邮电大学。 本指导性技术文件主要起草人:聂蓉、杨栋梁、宋国建、吕元元、杜振洲、姚世全、邓中亮、余和初、楚林、娄健、许翠玲、宋银芳、马新风、汤梦然。DB11/Z 384.172008 III 引 言 根据北京市人民政府关于加强图像信息管理系统建设工作的意见(京政发200617号)文件精神,以本市应急指挥部门目前使用的图像信息管理系统为基础,并考虑数字图像信息系统建设的实际需求。由北京市质量技术监督局、北京市公安局、北京市信息办牵头组织开
5、展了图像信息管理系统技术规范的编写工作。编写组由北京市质量技术监督局、北京市公安局、北京市信息办等政府管理部门、技术研究机构与图像信息系统相关企业组成。 DB11/Z 384.172008 1 图像信息管理系统技术规范 第17部分:运行维护要求 1 范围 本标准规定了图像信息管理系统运行维护要求。包括技术要求、故障发现与处置要求、维护要求、服务与管理要求。 本标准适用于图像信息管理系统的运行维护,并可供图像信息管理系统的工程设计参考。 2 规范性引用文件 下列文件中的条款通过本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,然
6、而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。 GB/T 5080.7 设备可靠性试验 恒定失效率假设下的失效率与平均无故障时间的验证试验方案 DB11/Z 384.2 图像信息管理系统技术规范 第2部分:视频格式与编码 3 术语和定义、缩略语 3.1 术语和定义 以下术语和定义适用于本标准。 3.1.1 运行维护系统(Maintenance System for Operation) 运行维护系统是图像信息管理系统的子系统,可对图像信息管理系统中的各类设备进行集中管理、控制和统计分析处理。该系统可接收图像信息管理系统中各类可
7、管理设备的状态信息和故障信息等,对图像信息管理系统中各类可管理设备进行配置和复位操作,将所有运行信息和维护操作信息记录并生成统计报表。 3.1.2 处置预案(Advance Preparation Treatment Project) 是针对系统运行可能发生的各类事件制定的保障方案和操作手册。 3.1.3 平均无故障间隔时间MTBF (Mean Time Between Failure) 指产品在规定的工作环境条件下工作从一次故障到下一次故障的平均时间,是衡量一个产品的可靠性指标(仅用于发生故障后经修理或更换零件能继续工作的设备或系统),单位为“小时”。 DB11/Z 384.172008 2
8、 3.1.4 修复时间TTR (Time To Repair) 修复设备故障所需的时间。 3.1.5 平均修复时间MTTR (Mean Time To Repair) 是从出现故障到恢复所需的平均时间。 3.1.6 故障响应时间 (Time To Response Failure) 从出故障到维护人员到达现场的时间。 3.1.7 系统可用率(Ratio of Usefulness) 指系统无故障时长与总时长之比。 3.1.8 在线率(Ratio of Online) 在任意时间点上同一种设备正常运行数量与总设备数量之比。 3.2 缩略语 下列缩略语适用于本部分: SNMP 简单网络管理协议(S
9、imple Network Management Protocol) 4 技术要求 4.1 系统运行维护模式 各级图像信息管理平台应设置运行维护系统,负责图像信息管理系统内的设备、系统与平台运行。运行维护系统模式如图1所示。 图1 图像信息管理系统运行维护模式 4.2 图像系统设备要求 4.2.1 编解码设备应向运行维护系统定时报告设备运行状态和设备故障告警信息,通信协议可参照DB11/Z 384.2附录A图像编解码器管理协议的要求。 4.2.2 具有网管功能设备应支持SNMP协议。 4.3 运行维护系统要求 4.3.1 应基于 C/S 模式或 B/S 结构,对图像信息管理系统中的设备和资源进
10、行维护管理,包括系统运行状态监控、设备管理、配置管理、故障告警处理、维护管理等功能。 DB11/Z 384.172008 3 4.3.2 运行维护系统应具有完善的网络安全保障措施,进行安全保护检查。 4.3.3 应能监测系统平台中设备和资源运行状,应对服务器群的运行状态实时检测,包括但不限于监测CPU和内存的占用状况,对管辖的数据库和备份数据作完整性检查。监测网络流量。 4.3.4 应能自动或手动对设备进行巡检。 4.3.5 应根据备份方案,对关键设备的配置数据和数据库进行在线备份。 4.3.6 应具备对系统平台中的热备系统进行切换的能力,并进行测试和维护。 4.3.7 应保存系统平台中设备的
11、配置信息和运行软件版本等信息。 4.3.8 应对图像系统设备的故障报警实时响应,提供声光告警功能,显示设备位置信息和故障点具体位置。 4.3.9 可自动或手动生成电子故障单,并记录、统计故障处理情况,提供故障单填报、转发、受理分派、查询统计、反馈、打印等功能。 4.3.10 运行维护系统日志的内容包括:日常维护、配置变更、网络状况和故障记录等,并可获取图像信息管理平台中各服务器日志并进行统计分析。 4.3.11 应对设备进行管理,提供摄像机、编码解码器、管理服务器、矩阵、磁盘阵列、网络等设备的安装、更换等记录功能,并能根据设备类型进行查询、统计并输出报表。 4.3.12 可对事件进行分类,并根
12、据不同事件类型和重要程度编制不同的处置预案。 4.4 图像信息管理系统运行指标要求 4.4.1 系统的平均故障间隔时间(MTBF)5000小时。 4.4.2 系统的平均修复时间60000小时 60000小时 40000小时 60000小时 30000小时 40000小时 40000小时 60000小时 60000小时 60000小时 60000小时 60000小时 60000小时 60000小时 60000小时 60000小时 60000小时 60000小时 20000小时 2小时 5 故障处置流程与要求 5.1 故障处置流程图 故障处置流程如图2所示。 信息提示是否故障状态信息是否现场维护图
13、2 故障处置流程图事件记录通知相关人员5.2 故障处置要求 5.2.1 故障受理 5.2.1.1 受理方式可为:人工受理和自动受理。人工受理是通过电话接受故障报告;自动受理主DB11/Z 384.172008 5 要针对设备告警信息形成故障报告。运行维护系统应有信息提示。 5.2.1.2 受理要求:设备故障受理的优先级高于其他事件的处理。 5.2.2 故障复核:接收到故障报告后,应对根据故障信息对故障现象进行复核。应具自动和人工复核功能。 5.2.3 故障处置 5.2.3.1 运行维护系统应具有预案提示和处置流程自动控制功能,应能采用人机结合编制事件处置预案,可依据不同类型的事件启动不同的处置
14、流程。 5.2.3.2 应根据设备故障类型及时通知相关人员到现场对故障进行处理。 5.2.4 处置记录 5.2.4.1 对真实故障报警应记录原因。 5.2.4.2 应记录故障处置经过和结果。故障处置记录应至少包括:信息报告时间、事件类型、故障地点、维护人员、处理时间和处理结果。 5.2.4.3 应能提供按故障时间和类型对故障记录进行检索。故障记录应至少保存一年。 6 维护与故障处理要求 6.1 硬件系统的故障处理和维护 6.1.1 硬件系统的故障修复应该由专业人员负责,硬件系统故障修复方法分为设备更换和部件更换:故障修复时间要求见表1。 6.1.2 应按设备总量配备备品备件,数量可参考表2。
15、表2 备品备件数量一览表 设备名称 备品比例(%) 备件比例(%) 备 注 摄像机 2 0 备整机 矩阵主机 0 2 备视频输入输出卡 编解码器 3 3 备整机或部件 视频监视器 2 0 备整机 磁盘阵列 0 4 备硬盘 硬盘录像机 2 3 备整机和硬盘 光端机 2 0 备整机 表中比例基数为图像信息管理系统中使用的设备总数。 6.1.3 对双机热备系统要定期进行切换测试,测试间隔时间不大于一个月。 6.1.4 对设备运行状况作自动或手动巡检,每台设备巡检间隔时间不大于24小时。 6.1.5 应根据设备特性和运行环境定期对图像系统设备进行维护保养,包括但不限于硬件设备的检查、保养和清洁。对摄像
16、机进行人工保养和清洁的最长间隔时间不大于180天。 6.2 软件系统的维护和故障处理 DB11/Z 384.172008 6 应制定基础软件和应用软件的维护和故障修复方案。基础软件包括操作系统、数据库、中间件。 6.2.1 操作系统 6.2.1.1 当操作系统运行状态异常时,可通过重新启动、重新配置、重新安装操作系统等手段进行故障修复。 6.2.1.2 应定期对操作系统进行检查,对操作系统升级。检查时间间隔不大于一个月。 6.2.2 数据库 应建立起包括问题发现、故障诊断、问题解决和日常维护在内的完整的数据库性能及可用性管理流程,并借助相关管理工具,实现管理功能。 6.2.3 中间件 应根据中
17、间件具有的自主管理能力,简化系统维护成本。 当应用目标和环境变化变化时,应通过中间件实现应用系统的自主再配置。 6.2.4 应用软件 6.2.4.1 在应用软件出现错误或发现潜在设计缺陷时,应能进行改正性维护。 6.2.4.2 当应用软件的配置或运行环境改变时,应能进行适应性维护。 6.2.4.3 宜采用更新升级的维护机制,自动检查软件更新状态并提供更新布署。 6.3 数据维护 6.3.1 应定期备份包括系统配置参数、系统日志、管理数据等。各类数据备份周期应不大于 30天。 6.3.2 数据备份可采用自动或手动方式完成。 6.3.3 应具备数据恢复功能,数据恢复前应制订数据恢复计划和恢复方案。
18、 6.3.4 应具备数据整理功能,定期对系统内数据进行整理,清理不必要的数据、文件。 7 服务与管理要求 应制定系统运行维护计划、工作流程、管理制度、服务质量要求,应根据不同的系统设备和环境制定具体的保养方案。并符合以下要求。 7.1 应配备专业(包括软件、硬件和网络等)的运行维护队伍,工作人员须经专门培训和考核合格后方能上岗。 7.2 应配备必需的维护工具、防护用具、通讯设备及交通工具。 7.3 应保证724小时服务。 7.4 应制订系统日常维护工作计划,并严格按照工作计划进行系统的日常维护。日常维护应不影响系统的正常使用。 7.5 应制订非突发事件的处置程序和应急预案,并定期进行演练。 7
19、.6 应制定文档管理制度,完整地做好维护记录,定期整理系统的维护文档。 7.7 应制定运维检查、现场故障处置、系统更新升级、硬件更换和修复等操作规范。 7.8 应制订软件升级工作流程,确保应用程序的稳定运行及更新。 7.9 应建立与设备供应商和网络供应商建立故障修复的协调机制和服务规范。 DB11/Z 384.172008 7 7.10 应建立保密制度。妥善保管系统的各种档案资料,不得擅自复制、向外传播。 7.11 应有充足的经费预算,满足日常维护和重大故障突发时的应急处置。 7.12 应定期评估系统运行质量。按ISO9001要求建立和完善运行维护服务质量体系。 DB11/Z 384.1720
20、08 8 附 录 A (资料性附录) 系统的可用性 A.1 设备的MTBF值 在产品设计之初,质量工程人员会根据Telcordia(即以前的Bellcore)“零件计数方法”计算出一个预测的MTBF(平均故障间隔时间)。从最新版Telcordia技术规范SR-332表中取每个设备的故障率,然后按照方法一情况一模型(Method 1 Case 1 model)进行组合。数据库中最后的预测MTBF值为该计算结果的两倍。 SR-332 表中所列出的设备级 MTBF 值代表相似设备的历史 MTBF 的 90%下置信水平(Lower Confidence Level)点估算值。这就是说,实际设备的 MT
21、BF 值有 90%的可能性会高于表中所列数值。通过这个模型所产生的综合估算值相当保守,业界惯例是将根据SR-332计算出来的值加倍以 产生一个更切实的标杆MTBF。 然后,采用加速寿命可靠性测试方法来验证这一预测MTBF是可达到的,而历史数据则表明,现场测试结果一般都会超过这个两倍的Telcordia值。 在图像设备(摄像机、编码器、光端机、服务器等)里,各模块(卡)的故障率要用元件的数据来计算,这意味着要考虑所有构成模块(卡)的元件。这是很实际的且非常保守的,因为,当模块(卡)不工作时,并不是其上的每一个元件都会导致整个模块(卡)的故障。 故障率简称FITs,是每1,000,000,000小
22、时在发生的故障数。 MTBF是故障率的倒数,代表一组FRU(现场可更换单元部件级,如板卡、模块、电源、裸机箱、摄像机、编码器、云台等)在一个典型应用环境中故障之间的工作小时。可按下列公式计算: MTBF = 1,000,000,000 小时 / (FITs * 8766) A.2 系统的MTBF值 随着系统节点数量增加,单个节点出故障的机率会增加。 对n个节点(或设备)组成的系统的MTBF可按以下公式计算: MTBF=1,000,000,000/ (节点1的FITs+ +节点n的FITs) * 8,766 A.3 系统的可用性 系统的可用性是用于比较相似系统的,所以也称作系统的统计寿命。 其计算公式如下: 可用性(率)= MTBF / (MTBF+MTTR) DB11/Z 384.172008 9 参考文献 1.Telcordia Bellcore SR-332 可靠性预计程序文件 贝尔通讯实验室