云平台故障应急方案.doc
《云平台故障应急方案.doc》由会员分享,可在线阅读,更多相关《云平台故障应急方案.doc(4页珍藏版)》请在麦多课文档分享上搜索。
1、云计算管理平台故障应急方案 目 录 云计算管理平台故障应急预案 . 2 1 目的 . 2 2 适用范围 2 3 预案流程 2 3.1 上报 . 2 3.2 了解和分析 . 2 3.3 处理方法 3 4 有关应急预案 . 4 4.1 服务器操作系统的故障应急预案 4 4.2 服务器软件系统故障应急预案 . 4 附件:云平台一般故障诊断表 5 云计算管理平台故障应急预案 1 目的 为了确保云计算管理平台(以下简称云平台)使用过程中遇到突发事件后能正确、有序、高效地进行应急处理,保障工作的正常运转,结合实际,特制定本预案。 2 适用范围 本预案适用于云平台中可能出现的各类突发事件。 3 预案流程 云
2、平台服务故障预防措施包括分析风险,建立检测体系,准备应急处理措施,控制影响扩大。 3.1 上报 各部门在云平台使用过程中遇到突发问题导致系统无法正常运转时,报本部门管理员登陆确认,情况属实立即报知数据中心运维人员。 3.2 了解和分析 根据实际情况 ,我司安排应急值班,确保到岗到人,联络畅通,技术人员即时开展软件的检修工作,对具体情况进行了解并进行初步判断、处理,并将初步情况上报数据中心运维人员知晓。 3.3 处理方法 3.3.1 如突发问题为操作系统引起 首先由技术人员对突发问题进行分析,确定引起问题的具体原因,如操作系统已无法启动,则由技术人员将具体情况通报数据中心,进行系统备份恢复,如操
3、作系统可启动,则由技术小组根据实际情况进行妥善快速处理。 3.3.2 如突发问题为软件引起 首先由技术人员收集系统日志,对突发问题进行分析,确定引起问题的具体原因,通过讨论确定初步解决方案,并对突发问题进行初步解决,如仍无法解决,则由技术人员备份数据库后,重装云平台解决。 3.3.3 如突发问题为网络引起 技术人员先将问题反馈给数据中心运维人员,协调网络管理员进行初步检查后确定问题原因,并在最短时间内给予解决。 在事件处理过程中,技术人员要随时将突发问题处理情况上报数据中心运维人员。 4 有关应急预案 4.1 服务器操作系统的故障应急预案 数据中心中主机群集启用 HA 高可用配置,在云平台服务器虚拟机所在物理主机当机后自动将云平台服务器迁移至正常运行物理主机上,确保云平台正常运行。 4.2 服务器软件系统故障应急预案 ( 1)做好服务器软件系统的定时备份,系统崩溃后,能够及时恢复系统。 ( 2)发生服务器软件系统故障后,相关人员应检查出现故障的原因并尽快排除。 ( 3)如遇服务器系统崩溃,应启用备份系统进行恢复。 ( 4)云平台一般故障预防与排除参考附件。
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
最后一页预览完了!喜欢就下载吧,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 平台 故障 应急 方案
