Q GDW 11545-2016 信息系统检修作业规程.pdf

上传人:周芸 文档编号:298578 上传时间:2019-07-10 格式:PDF 页数:27 大小:560.19KB
下载 相关 举报
Q GDW 11545-2016 信息系统检修作业规程.pdf_第1页
第1页 / 共27页
Q GDW 11545-2016 信息系统检修作业规程.pdf_第2页
第2页 / 共27页
Q GDW 11545-2016 信息系统检修作业规程.pdf_第3页
第3页 / 共27页
Q GDW 11545-2016 信息系统检修作业规程.pdf_第4页
第4页 / 共27页
Q GDW 11545-2016 信息系统检修作业规程.pdf_第5页
第5页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 信息系统检修作业规程 Information system maintenance specification 2017 - 07 - 12 发布 2017 - 07 - 12 实施 国家电网公司 发 布ICS 29.240 Q/GDW 国 家 电 网 公 司 企 业 标 准 Q/GDW 11545 2016 Q/GDW 11545 2016 I 目 次 前 言 . III 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 总则 . 4 5 基本要求 . 4 5.1 人员的基本条件 . 4 5.2 工器具和仪器仪表要求 . 4 5.3 检修作业要求 . 5 5.4 安

2、全要求 . 5 5.5 职责分工 . 5 6 硬件平台 . 6 6.1 服务器 . 6 6.2 网络设备 . 7 6.3 存储设备 . 7 6.4 安全设备 . 8 7 系统平台软件 . 8 7.1 数据库 . 8 7.2 中间件 . 9 8 应用系统 . 9 8.1 配置变更 . 9 8.2 版本升级 . 10 9 灾备系统 . 10 9.1 数据库复制 . 10 9.2 存储复制 . 11 10 基础设施 . 11 10.1 机房空调 . 11 10.2 机房电源 . 11 11 事故抢修 . 12 附录 A(资料性附录) 网络与信息系统运行方式单格式 . 13 附录 B(规范性附录) 工

3、作票编写格式 . 14 附录 C(规范性附录) 操作票编写格式 . 16 Q/GDW 11545 2016 II 附录 D(资料性附录) 验证单编写格式 . 17 编制说明 . 18 Q/GDW 11545 2016 III 前 言 为规范国家电网公司信息系统检修作业操作的流程与步骤,提高运维操作的规范化水平,确保信息系统安全稳定运行,制定本标准。 本标准由国家电网公司信息通信部提出并解释。 本标准由国家电网公司科技部归口。 本标准 起草单位:国网天津市电力公司、国家电网公司信息通信分公司、国网陕西省电力公司、国网辽宁省电力有限公司、国网湖南省电力公司、国网内蒙古东部电力有限公司。 本标准主要

4、起草人: 吴凡、王伟、何 金、孙轶凡、 闫龙川、高靖文、 胡斌、 刘立朋、 雷振江、杨壮观、赵丽、朱继阳、王磊、韩 强、束建武、张志东、 刘冬梅、来风刚、毛一凡、崔硕、张晓亮、杨猛、宋文婷、孙添资、刘世民、高敏 。 本标准首次发布。 本标准在执行过程中的意见或建议反馈至国家电网公司科技部。 Q/GDW 11545 2016 1 信息系统检修作业规程 1 范围 本标准规定了信息系统检修基本要求、 检修 作业要求 及 事故抢修作业要求。 本标准适用于国家电网公司(以下简称公司)总(分)部、各单位及所属各级单位(含全资、控股)信息系统检修工作。 2 规范性引用文件 下列文件对于本文件的应用是必不可少

5、的。凡是注日期的引用文件,仅 注日期的版本适用于本文件。凡是不注日期的引用文件,其最新 版本(包括所有的修改单)适用于本文件。 GB/T 5271.17 2010 信息技术 词汇 第 17部分:数据库 (ISO/IEC 2382-17: 1999, IDT) GB 7260.1 2008 不间断电源设备 第 1-1部分:操作人员触及区使用的 UPS的一般规定和安全要求 Q/GDW 11414 2015 国家电网公司信息系统调度运行规程 Q/GDW 1799.1 2013 电力安全工作规程 变电部分 3 术语和定义 下列术语和定义适用于本文件。 3.1 信息系统 information syst

6、em 公司一体化企 业级信息系统,主要包括信息网络以及承载其上的一体化企业级信息集成平台、业务应用系统、灾备系统和安全防护、信息管控等信息化支撑保障系统等。 Q/GDW 11414 2015,定义 2.1 3.2 信息系统检修 information system maintenance 对处于试运行和正式运行状态的信息系统开展的检测、维护和升级等,分为计划检修、临时检修和紧急抢修三种。 3.2.1 计划检修 scheduled maintenance 列入年度、月度和周检修计划的检修工作。 3.2.2 临时检修 non-scheduled maintenance 未列入年度、月度和周检修计划

7、,需要适时安排的检修工作。 Q/GDW 11545 2016 2 3.2.3 紧急抢修 emergency maintenance 因系统或设备异常影响系统正常使用需紧急处理以及系统故障停运后所开展的应急处置工作。 3.3 信息系统运行方式 information system operation mode 网络与信息系统运行的方法和形式,是信息系统运行计划和方案,是信息系统按照计划和方案运行在某一时刻的现状描述,分为信息系统常态运行方式、信息系统检修运行方式和信息系统特殊运行方式。 3.3.1 信息系统常态运行方式 information system normal operation mo

8、de 现有运行资源基础上,信息系统最合理的运行方式,是在综合考虑安全性、稳定性、可靠性、经济性基础上实现的最优运行方式。 3.3.2 信息系统检修运行方式 information system maintenance operation mode 因检修导致信息系统常态方式无法正常运行,以牺牲一定的稳定或安全等性能,最大程度保持业务应用所采取的运行方式。 3.3.3 信息系统特殊运行方式 information system special operation mode 因非管辖信息系统运行资源发生变化,造成所辖资源的运行方式变化,或者应急抢修或特殊保障期间,网络与信息系统的非常态运行方式。

9、3.4 一单两票 flow management of tracks,order and operation sheets “一单”是 指电力信息系统调度管理、运行管理、检修管理、客服管理方面的各类 业务工单。“两票 ” 是指电力信息 系统 运维的工作票与操作票。 3.5 工作票 work sheet 准许进行信息系统检修作业工作的书面命令,也是执行保证安全技术措施的依据。主要包括:工作时间、地点 、内容、 工作负责人 、工作人员、安全措施等内容。 3.6 操作票 operation order sheet 为防止误操作,在进行信息系统检修工作时,由操作人按照操作内容和顺序填写,并作为此操作的

10、书面依据。 3.7 工作票签发人 work sheet signer 负责信息系统 工作 票签发环节,由信息系统运行管理单位审核合格并认定的人员。 Q/GDW 11545 2016 3 3.8 工作负责人 working controller 信息系统检修工作的现场安全第一责任人,负责信息系统两票的填写和归档关闭环节,由 信息系统运行管理单位审核合格并认定 的人员。 3.9 工作许可人 work approver 信息系统调度监控人员,负责信息系统两票的许可环节,由 信息系统运行管理单位审核合格并认定的人员。 3.10 工作班成员 members of the working class 依照

11、信息系统两票 执行检修操作的人员, 由工作负责人审核合格并认可的人员。 3.11 硬件平台 hardware platform 指公司信息系统运行所需的物理硬件设备,包括服务器、网络设备、存储设备、安全设备等。 3.12 虚拟机 virtual machine 物理实体计算机设备之上,通过软件模拟的具有完整硬件系统功能的、运行在 一个完全隔离环境中的完整计算机系统。 3.13 系统平台软件 system platform software 指位于操作系统之上,支撑应用系统的软件,包括数据库、中间件等。 3.14 数据库 database 支持一个或多个应用领域,按概念结构组织的数据集合,其概念

12、结构描述这些数据的特征及其对应实体间的联系。 GB/T 5271.17 2010,定义 17.01.01 3.15 中间件 middleware 基础软件的一大类,属于可复用软件的范畴。中间件在操作系统、网络和数据库之上,应用软件的下层,中间件是为处于自己上层的应用 软件提供运行与开发的环境,帮助用户灵活、高效地开发和集成复杂的应用软件。 信息 系统所用的中间件通常包括:通信(信息)处理中间件、交易管理中间件、数据存取管理中间件、以及各类应用 /服务中间件组成。 3.16 应用系统 application system Q/GDW 11545 2016 4 计算机及相关配套设备、设施构成的,按

13、照一定的应用目标和规则对信息进行采集、加工、存储、传输、检索处理的,为电力生产、经营、管理业务提供支持的信息系统。 3.17 灾备系统 disaster recovery system 用于灾难恢复目的,在北京、上海、西安三地信息灾备中心 (以下简称灾备端 )及被灾备单位生产中心 (以下简称生产端 )部署的,由数据库复制系统、存储复制系统、数据验证系统和网络系统等组成的信息系统。 Q/GDW 11414 2015,定义 2.8 3.18 基础设施 infrastructure 信息机房空调、电源等支持信息系统运行维护的相关软硬件设施。 4 总则 4.1 信息系统检修管理工作应坚持“统一管理、分

14、级调度、逐级审批、规范操作”的原则,实行闭环管理;未经批准,任何单位和个人不得对运行中的信息系统进行操作。 4.2 信息系统检修执行工作应坚持“应修必修,修必修好”的原则,实行统一领导、 分级负责。 4.3 信息系统检修作业应基于统一、规范的流程,注重与现行管理的有效衔接和整合,持续改进。 4.4 公司各单位可依据本标准,制定相应的实施细则,编制典型作业指导书(卡)、信息系统巡视卡等。 5 基本要求 5.1 人员的基本条件 5.1.1 经医师鉴定,无妨碍工作的病症 。 5.1.2 熟悉 Q/GDW 1799.1 2013 及 Q/GDW 11414 2015 相关内容。 5.1.3 具备必要的

15、安全生产知识和信息安全知识,熟悉相关规章制度。 5.1.4 工作票签发人应熟悉人员技术水平、设备情况及检修作业内容,并具有相关工作经验。 5.1.5 工作 负责人应具有相关工作经验,熟悉 信息系统及 设 备情况 、检修作业内容及 工作班成员 的工作能力。 5.1.6 工作许可人应 为熟悉信息系统及设备运行方式、检修作业内容的信息调度运行人员 。 5.1.7 工作班成员 应 熟悉 检修作业 内容、 作业 流程、掌握安全措施, 具备必要的 信息 专业知识和业务操作 技能 , 明确工作中的危险点 , 正确使用安全工器具和劳动防护用品。 5.2 工器具和仪器仪表要求 信息系统检修作业的工器具和仪器仪表

16、应满足: a) 仪器仪表及工器具必须满足作业要求; b) 仪器仪表应定期检验合格; c) 安全工器具应定期检验合格 ; d) 信息系统运维单位应 按工作需要,对工器具 和仪器仪表进行 配置 ,定置存放,定期维护检验,落实专人负责; Q/GDW 11545 2016 5 e) 检修配置终端应为具有审计功能的专用设备,确保操作过程可追溯 。 5.3 检修作业 要求 信息系统检修作业的基本 要求如下: a) 应执行工作票和操作票流程 ,一张操作票对应且仅 对应一张工作票,一张工作票可对应一张或多张操作票; b) 应执行 电话汇报、工作变更和终结的工作要求 ; c) 应提前落实组织措施、技术措施、安全

17、措施和实施方案,提前做好对关键用户、重要系统及相关系统的影响范围和影响程度的评估,开展故障预想和风险分析,制定相应的应急预案及回退、恢复机制; d) 信息系统升级检修前应严格信息系统升级包测试,若测试不通过,不应开展检 修工作; e) 正式开工前,应检查检修工作准备是否完整,确保现场人员清楚工作内容、范围和安全措施等 。 若检修工作由外部单位承担,应签订安全承诺书和保密协议; f) 涉及信息系统运行方式变化的,应依照运行方式工作管理制度执行,网络与信息系统运行方式单 参见附 录 A; g) 所有检修都应在指定的信息检修操作专区和专用检修终端上开展; h) 检修工作操作过程应按照工作票和操作票的

18、工作内容严格执行,不应擅自扩大 或变更 工作票工作内容和范围,工作票编写格式见附录 B,操作票编写格式见附录 C; i) 检修全过程操作应通过安全运维审计系统,记录整个操作过程; j) 检修完成后应立即组织自验收,重点针对检修工作内容开展业务测试及相关集成测试 以及运维监控测试 ,确保检修质量,验证确认单参见附录 D。 k) 机房电源检修 操作人员 应 具备相应的资格认证,并 设置专人监护, 检修工作 应依照 GB 7260.1-2008 及 Q/GDW 1799.1 2013 的要求开展。 l) 检修拆除或更换的硬件应由信息系统运维人员依照信息设备及资产全寿命周期等相关管理要求进行处置。 5

19、.4 安全要求 信息系统检修作业的安全要求如下: a) 若信息系统检修存在业务数据 不可用(损坏、丢失)的风险,则 应 在检修操作前对业务数据进行备份; b) 应 加强 工作班成员 信息安全管理, 与关键岗位员工尤其是外部单位人员签订保密协议,明确信息安全保密的内容和职责; c) 信息系统运维帐号应由运维单位 管理 ,确需厂商人员提供现场支持服务的,应履行一事一授权 ,且使用部门与运维单位应现场监督,确保操作过程可追溯; d) 重大检修应编写相应的应急预案和针对检修不同阶段的回退方案,宜联系厂商技术人员现场技术支持或 远程技术 支持 。 5.5 职责分工 5.5.1 工作票签发人职责 包括 :

20、 a) 负责工作票签发环节; b) 审核检修作业的必要性和安全性; c) 审核工作票所列检修工作内容、工作条件、安全措施等信息是否正确完备; d) 确认所 派 工作负责人 和 工作班成员 是否 适当和充足。 Q/GDW 11545 2016 6 5.5.2 工作 负责 人职责 包括 : a) 负责两票的填写、归档关闭环节; b) 组织编制三措一案、检修计划 ; c) 检修执行前后执行电话汇报制度; d) 负责检修计划的执行,对检修作业过程的安全、工作质量、进度等进行监督和把控; e) 对 工作班成员 进行安全教育及现场安全、技术交底; f) 对检修作业过程进行组织、指导,合理分配各项工作; g

21、) 检修工作完成后,对工作内容开展测试验证,确保检修质量; h) 负责检修完成后相关资料的归档。 5.5.3 工作许可人职责 包括 : a) 负责两票许可环节; b) 负责审查工作票所列安全措施是否正确、完备,是否符合 现场条件 ; c) 负责核实当前信息系统运行方式是否满足检修作业条件; d) 负责监控作业过程中检修相关设备状况。 5.5.4 工作班成员 职责 包括 : a) 严格依照两票执行检修操作, 服从 工作负责 人的指挥、指导和监督; b) 负责检修相关文档、方案的 编制; c) 负责信息系统故障抢修执行。 6 硬件平台 6.1 服务器 6.1.1 配置变更 6.1.1.1 设备硬件

22、操作前应佩戴 防 静电手环或 防 静电手套,进行静电释放。 6.1.1.2 服务器的硬件配置变更( CPU、内存、磁盘容量 扩容 等)操作前应备份系统重要配置文件乃至整个操作系统及文件型数据,确保变更操作的可回退性。 6.1.1.3 服务器配置变更前后应确认设备运行正常、无 硬件告警 , 确认硬件加载及操作系统各项服务运行正常 。 6.1.1.4 涉及集群配置时,应确保相关 信息同步, 并 确认宿主机运行状态正常、集群高可用功能正常、时钟同步正常、管理网与业务网正常等。 6.1.1.5 服务器关闭或重启操作前,应关闭服务器上运行的业务系统及相关服务,确保重要数据不丢失。 6.1.2 系统升级

23、6.1.2.1 系统升级 前 , 应 提前 在测试 环境 完成相关 功能 和 性能的测试和验证 工作。 6.1.2.2 服务器操作系统或固件微码版本变更前应进行系统稳定性测试及与承载业务的兼容性测试,并备份原操作系统及文件型数据,确保变更操作的可回退性。 6.1.2.3 服务器关闭或重启操作前,应关闭服务器上运行 的业务系统及相关服务,确保重要数据不丢失。 6.1.2.4 系统升级后,应对操作系统及业务系统进行全面的功能测试及非功能性测试,确保业务运行正常 。 6.2 网络设备 Q/GDW 11545 2016 7 6.2.1 配置变更 6.2.1.1 设备硬件操作配置前应佩戴防静电手环或防静

24、电手套,进行静电释放。 6.2.1.2 应备份网络设备当前的配置及状态信息, 确认当前配置已保存 ,确保变更 操作的可回退性。 6.2.1.3 重要网络设备的更换、拓扑结构调整、链路调整、核心参数调整等检修应在检修前分析所承载的业务数据及检修操作引发的数据流变化情况,针对高风险、高难度、高复杂性的步骤制定相应的处置措施;检修操作应细分为多个子模块,每个模块 操作完成后及时进行验证确认,确认正常进入下一模块,不正常则进行分析或回退。 6.2.1.4 网络交换机配置变更后,应 对 生 成 树配置、双机热备配置、 VLAN 配置等参数验证,确认配置变更后,逻辑拓扑状态与预想一致 。 6.2.1.5

25、重要参数 调整前,应在测试环境验证或采用模拟器进行配置验证 ; 配置调整 过程中 ,应 实时监控 参数 变化情况 , 逐步进行 验证 及记录;调整完成后 应进行 全面 验证。 6.2.1.6 参数 配置调整应符合 公司 要求,如参数调整影响 上级业务访问或 上下级网络互联, 则 配置 调整 方案应征得上级单位认可后方可执行。 6.2.1.7 负载均衡配置变更后应检查主备设备配置 的 同步 状态 , 确认 业 务系统流量 与 预期 一致 。 6.2.1.8 网络设备检修操作应依照 Q/GDW 11414 2015 中 3.3.1 执行。 6.2.1.9 涉及网络设备重启操作的检修宜准备相关备品备

26、件,避免重启过程中部分板卡失效。 6.2.2 版本升级 6.2.2.1 版本变更前应进行承载业务的兼容性测试,并备份原 版本 文件和配置文件,确保变更操作的可回退性。 6.2.2.2 设备重启操作前,应对网络设备所承载业务系统及相关服务进行确认,确保重要数据不丢失。 6.2.2.3 版本升级前,应确认 设备 存储 空间能够容纳新版本, 重要网络设备 升级 宜 在本地执行。 6.2.2.4 版本升级 过程中 ,应 有专人在 设备现场 配合 ,并 记录 升级过程 的 运行日志,发现 异常 及时反馈处置 。 6.2.2.5 版本 升级后,应 确认新版本生效,对运行配置 、路由协议、 承载业务等进行

27、验证。 6.2.2.6 版本升级完成后,宜加强设备及所承载业务的监控,组织技术力量保障,确保新版本稳定运行。 6.3 存储设备 6.3.1 配置变更 6.3.1.1 配置 变更 前,应确认 存储设备及相关网络处于信息系统常态运行方式,备份配置并确认冗余设备运行正常 。 6.3.1.2 配置变更前,应 分析检修对设备 相关业务系统的影响并通知相关业务管理部门, 经业务管理部门同意后方可开展。 6.3.1.3 配置变更过程中,应实时监控设备的运行状态,确认每个步骤与预想一致 。 6.3.1.4 变更操作 完成后应确认 存储设备 多路径状态 、 存储配置同 步、存储复制,数据备份系统 等正常 ,备份

28、配置信息。 6.3.2 缺陷修复 6.3.2.1 依照缺陷类型 准备 相应的备品 备件, 并 按照 设备 操作 手册 操作。 6.3.2.2 缺陷 修复后,验证存储设备各 项 功能恢复正常并持续观察 30 分钟以上。 Q/GDW 11545 2016 8 6.3.3 设备迁移 6.3.3.1 应备份配置信息,确认 ZONE 信息划分模式、端口链路信息与服务器和存储对应关系。 6.3.3.2 设备迁移 应 严格按照 方案 执行 ,并确认每个步骤的执行情况 。 6.3.3.3 设备迁移后应确认业务系统、存储复制、灾备复制等运行正常 。 6.4 安全设备 6.4.1 配置变更 6.4.1.1 防火墙

29、配置策略 应遵循最小安全原则,配置基于 IP 地址 (段 )、端口级的拒绝或允许访问的安全策略,源地址和目的地址的范围 应 以实际访问需求为前提,尽可能缩小范围。 6.4.1.2 安全设备配置变更应详细记录变更原因、检修时间、作业人员、执行结果等,安全策略的存放和调整应满足公司信息安全保密的相关要求。 6.4.1.3 双机热备方式的 安全设备 进行检修前应确认 双机运行状态、配置同步 等 正常, 检修操作后应再次确认 。 6.4.2 版本升级 6.4.2.1 安全设备 应采用运行稳定版本,应提前 在测试环境进行版本升级验证与测试,不 宜 使用最新发布软件版本。 6.4.2.2 版本 升级前应备

30、份 原版本文件和配置文件,确保升级 操作的可回退性。 6.4.2.3 双机部署方式下,应先升级备用设备版本,待备用设备升级完毕 , 再 升级主用设备版本。 7 系统平台软件 7.1 数据库 7.1.1 配置变更 7.1.1.1 配置变更前,应 确认服务器资源 满足配置变更要求 ,并 对 配置变更 的影响进行评估和测试。 7.1.1.2 配置 变更前,应对数据库参数文件进行备份 , 根据数据库性能分析报告生成性能基线、设计调优模型。性能调优操作时,根据性能瓶颈进行实例级和语句级优化。操作后再次进行性能分析,根据优化前后性能指标比对以判断性能调优的有效性。 7.1.1.3 创建数据库实例前,确认数

31、据库软件已正确安装、相应的文件系统目录的权限正确配置,操作系 统内核参数配置及性能参数正确设置,确认数据库用户的环境变量正确设置。 7.1.1.4 涉及灾备的业务系统数据库节点 配置变更前,应评估灾备端数据库服务器是否应做相应变更 ;配置变更完成后,应确认灾备状态恢复正常 。 7.1.1.5 数据库用户的变更,以最小权限原则为每个用户分配角色、系统权限、对象权限, 新建用户的默认表空间不能为数据库系统表空间。 7.1.2 版本 升级 7.1.2.1 版本升级前,应提前在测试环境上 验证 数据库功能,确认服务器资源满足升级需求 。 7.1.2.2 版本升级前应依照业务应用系统的需求进行数据库备份

32、及数据备份。备份完成后,应确认备份数据的可用性。 7.1.2.3 数据库 集群环境 下 ,应 确认集群节点的状态,关注需在所有节点执行的步骤 。 Q/GDW 11545 2016 9 7.1.2.4 数据库启动顺序 为 :先启动灾备端数据库的管理、复制进程,然后再启动生产端的管理,抽取和传输进程;停止顺序 为 :先停止生产端的抽取,传输和管理进程,然后再停止灾备端的管理 、复制 进程。 7.1.3 缺陷 修复 7.1.3.1 数据库不能对外提供服务时, 应 检查数据库实例和监听 状态是否正常,检查数据库相关日志文件及操作记录等,定位故障原因,及时恢复。 7.1.3.2 数据丢失时, 可 采取数

33、据库 自 身机制 (闪回、回滚等 )或外部备份 (本地备份 、 灾备 )等措施进行恢复,恢复正常后, 应进行完整 备份。 7.1.3.3 数据库响应延迟时,应检查 当前并发 用户量是否突增,检查数据库是否存在大量的锁,确认当前数据库的等待事件,并 查看 数据库参数、表空间、索引、 SQL 语句执行计划等的合理性,定位故障原因,及时恢复。 7.1.3.4 数据库集群 异常 时, 应 检查集群节点、网络、权限 等的 状态是否正常,检查集群节点相关的日志文件,定位 异常 原因,及时恢复。 7.2 中间件 7.2.1 配置变更 7.2.1.1 参数变更前,应 确认 服务器资源 满足要求 ,并 对中间件

34、域配置文件进行备份, 确保操作可回退 。 7.2.1.2 中间件部署时,应依据所承载的业务应用规模,对中间件的资源池连接数、内存等关键参数进行优化,提高系统稳定性。 7.2.1.3 配置变更完成后应验 证变更配置生效及业务系统运行正常。 。 7.2.2 版本 升级 7.2.2.1 版本升级前,应提前在测试环境上验证中间件功能,确认服务器资源满足升级需求。 7.2.2.2 版本升级前应备份原版本中间件及业务系统软件。 7.2.2.3 版本升级后,应 验证 中间件及业务系统运行情况 ,确认 系统运行 正常 。 7.2.3 缺陷整改 7.2.3.1 中间件控制台无法访问时,如果为集群环境, 则 重启

35、管理节点服务 后登录 。如果为单机环境, 则通过 排查应用系统是否部署在管理节点,排查中间件相关日志,定位 异常 原因,及时恢复。 7.2.3.2 中间件响应缓慢时,登录 管理控制台,查看堆内存使用情况、线程状态、数据源连接状态、后台日志中 的 相关信息 等 ,定位 异常 原因,及时恢复。 7.2.3.3 中间件 程序异常导致业务系统不可用时,应依照中间件的 启停顺序执行重启操作,及时恢复业务系统,后续排查异常原因。 8 应用系统 8.1 配置变更 8.1.1 配置变更前 , 应在测试环境进行测试,并对 原配置进行备份 。 Q/GDW 11545 2016 10 8.1.2 配置变更前,应全面

36、梳理与其他应用系统的接口,分析变更对其他应用系统的影 响;如影响其他应用系统,应在检修前提前一周将检修相关内容通知相关业务部门。业务部门如有异议应及时反馈意见。 8.1.3 配置变更过程中,应及时验证变更的有效性及范围准确性,如涉及其他应用系统,应同时开展验证工作。 8.1.4 配置变更后,应 全面 验证 业务 应用 系统 各项功能及相关接口 , 确认业务恢复正常 ;如影响其他应用系统,应同时验证该业务应用系统各项功能及相关接口,确认业务恢复正常。 8.2 版本 升级 8.2.1 版本升级前,应在测试环境对系统升级包测试 ,同时要提前落实组织措施、技术措施、安全措施和实时方案,提前做好对关键用

37、户、重要系统的影响范围和影响程度的评估,开展故障预想和风险分析,制定相应的应急预案及回退、恢复机制。 8.2.2 版本升级过程中,应指派专人全程监护检修操作,保证升级安全执行 。 8.2.3 版本 升级后,应 立即进行自验收,重点针对升级变化内容开展业务测试及相关集成测试,确保检修质量,并 加强业务系统监控及技术保障 。 9 灾备系统 9.1 数据库复制 9.1.1 复制进程调整 9.1.1.1 中断进程前, 应 确认复制进程已将数据变化写入灾备端 , 即 当前复制进程延迟为 0。 9.1.1.2 复制进程增加 , 应 检查增加的进程映射表与当前已存在的复制进程映射表是否一致 ,在 修改、参数

38、修改时,注意输入字符大小写、格式 等。 9.1.1.3 复制进程调整, 应确认 更改的复制进程同步的数据表与 生产 端的数据一致性,确保复制进程可用。 9.1.2 数据库初始化 9.1.2.1 初始化 应 保证 生产 端 数据复制软件 抽取进程正常运行, 并 对 生产 端数据库进行 全库 备份,包括对其数据文件、参数文件、控制文件以及归档日志进行备份 。 9.1.2.2 数据库 备份时,停止其他所有相关进程。 9.1.2.3 数据库初始化 过程中, 应 通过 SQL 语句监控恢复进度。 9.1.2.4 数据库初始化 后, 应 创建 复制软件指定 用户,调整复制进程参数,启动复制进程,追平 检修

39、时间段内产生的数据变化。 9.1.3 文件系统优化 9.1.3.1 根据被灾备端数据库使用的实际情况对文件系统进行调优 , 测试 进程 各项功能,确保其在文件系统优化后正常运行。 9.1.3.2 应对优化前后 数据库的各项指标进行对比,并进行记录。 9.1.4 单表数据初始化和修复 9.1.4.1 应 停止初始化和修复数据表的 相关 数据 复制进程。 9.1.4.2 进程停止后 导出 所需 初始化和修复的数据表 ,之后 导入灾备端。 Q/GDW 11545 2016 11 9.1.4.3 启动 数据 复制进程,追平灾备 端数据。 9.1.5 配置变更 9.1.5.1 参数变更前,应进行参数更改

40、的评估 、 分析和测试工作,并对调整的参数做好相应的记录, 确保操作的可回退性。 9.1.5.2 配置更改完成后,检查生产端和灾备端的相关进程均处于运行状态且复制正常。 9.1.6 版本升级 9.1.6.1 版本升级前应备份生产端和灾备端的数据复制软件及相关配置。 9.1.6.2 版本升级过程中,应参照数据复制软件历史参数配置情况,配置 生产端和灾备端 抽取、投递和复制进程等参数。 9.2 存储复制 9.2.1 配置变更前,应通过复制管理软件备份配置参数,确保变更操作的可回退性 。 9.2.2 配置变更完成后, 通过生产端及 灾备 端的管理界面检查存储复制的一致性组 处于运行状态且复制正常,数据为同步状态。 9.2.3 由 生产端 调整数据复制状态; 灾备端 根据磁盘空间的调整 情况变更 验证快照 配置, 同时对变更操作进行监控 。 10 基础设施 10.1 机房空调 10.1.1 停机检修 10.1.1.1 机房空调停机检修前应确认备用机房空调工况良好,机房温湿度可达到机房环境要求。 10.1.1.2 如 无 空调 备用机 ,应安装临时制冷设施或采取临时制冷措施。 10.1.1.3 检修过程中,应加强机房环境的监控,确保温湿度处于正常范围;如温湿度超出正常阀值,则及时

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 标准规范 > 企业标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1