2018年信息系统运维服务项目技术方案2018-6-13.doc

上传人:ownview251 文档编号:368875 上传时间:2018-09-27 格式:DOC 页数:53 大小:326.29KB
下载 相关 举报
2018年信息系统运维服务项目技术方案2018-6-13.doc_第1页
第1页 / 共53页
2018年信息系统运维服务项目技术方案2018-6-13.doc_第2页
第2页 / 共53页
2018年信息系统运维服务项目技术方案2018-6-13.doc_第3页
第3页 / 共53页
2018年信息系统运维服务项目技术方案2018-6-13.doc_第4页
第4页 / 共53页
2018年信息系统运维服务项目技术方案2018-6-13.doc_第5页
第5页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、1 2018 年信息系统运维服务项目 技术方案 XXXX 有限公司 2018-6 2 目录 一 、运维方案 3 1.1 运维服务 定位和 目标及服务范围 3 1.2 运维 服务内容 及运维重点难点分析 3 1.2.1 运维 服务内容 . 3 基础设施维护 3 软件及信息资源维护 5 信息系统安全服务 5 运维管理咨询服务 6 1.2.2 运维 重点难点分析 . 7 1.3 运维人员组织架构 及管理制度 10 1.3.1 运维组织结构介绍 . 10 1.3.2 运维组织 管理制度 . 10 1.3.3 运维成员职责 . 14 1.3.4 运维成员组织结构 . 16 1.4 运维质量保 证措施 及

2、服务承诺 17 1.4.1 质量控制管理 . 17 1.4.2 进度控制管理 17 1.4.3 服务承诺 17 1.5 运维流程及服务方式 19 1.5.1 服务方式 . 19 1.5.2 运维流程 . 20 1.6 运维方案及实施安排 23 1.6.1 小 型机、 PC 服务器、网络设备及存储系统 23 1.6.2 机房空调、 UPS 设备运维服务 . 30 1.6.3 数据库系统运维服务 . 33 1.6.4 中间件系统运维服务 . 40 1.7 应急服 务响应措 施 48 1.7.1 突发事件应急 流程 . 48 1.7.2 预防措施 及处理办法 . 51 1.8 对外委托专项服务情况表

3、 51 1.8投标人近三年以来类似项目一览表 . 52 1.9 投标人与运维服务相关的资质等证书汇总表 53 3 一 、运维方案 1.1 运维服务 定位和 目标及服务范围 通过专业运维服务,进一步加强 信息系统 运行维护,对 信息系统 运行维护流程提供先进的管理理念与流程,并通过专业的技术支持为 信息系统 运行维护工作提供专业的技术平台,满足 信息系统软硬件的维护 要求,可以满足多种 基础设施环境稳定的要求,可以满足 软件及信息资源 高效、可靠和安全运行的要求,可以满足运行设备统一管理、及时的故障恢复的要求,可以保证在 信息系统 构建的应用系统和数据集中运行的设备平台正常运行,达到高效、稳定、

4、安全和高扩展性的要求, 可以提供运维保障之外的管理咨询要求, 为实现省本级信息化建设的可持续发展奠定集中统一的设施基础。 1.2 运维 服务内容 及运维重点难点分析 1.2.1 运维 服务内容 依据 现网普遍的信息系统 设备及 常用 软件清单,我公司对提供如下服务内容: 基础设施维护 业务系统 服务项 保证措施办法 小型机、服务器 、 PC、多媒体系统、 网络设备、存储系统 、信息安全设备等 现场驻点服务 ( 如需 ) 5 8小时 到达客户现场时间 ( 应急响应 ) 30 分钟内 电话后响应时间 90 分钟内 备件到达现场时间 24小时 配件维修、更换服务 提供 高级工程师现场支持 提供 检查

5、设备各部件的状态灯; 提供 检查并处理设备的错误日志; 提供 硬件设备的全面检查; 提供 网络配置的检查及测试; 提供 4 定期升级配套软件的版本 ; 提供 系统重部署及调试:新机上架协助及系统移位协助 ; 提供 针对重要设备,实时监控运行状况,及时发现故障、排除故障; 提供 操作系统性能分析; 提供 小型机 、 网络设备、信息安全设备 配置信息,根据需要调整配置; 提供 设备的微码版本检查; 提供 存储设备运行情况检查; 提供 提交详细的预防性维护报告和总结; 提供 对检查结果综合分析,并形成分析报告; 提供 协助采购人制订安全策略,定期检查、排除风险,保障设备及网络环境安全; 提供 协助采

6、购人规范硬件管理维护标准化工作 ; 提供 周期性 全面巡检 ( 与采购人协商、合同约定 ) 提供 系统运行环境检查:包括机房温度、湿度和零地电压、零火电压等 提供 机房空调运维 设备故障恢复时间 48 小时内 周期性 全面巡检 ( 与采购人协商、合同约定 ) 提供 坏件更换 提供 日常清理及更换过滤网和加湿罐等耗材 提供 定期清理机房空调的室外机;检修机房内各供水管路及排水管路,杜绝漏水,保证管路畅通。 提供 配备机房专业知识的人员对机房实行 5X8 小时值班 ( 如需 ) 提供 UPS 设备运维 故障恢复时间 72 小时内 周期性全面 巡检 ( 与采购人协商、合同约定 ) ,巡检时检查蓄电池

7、使用情况,并且进行充放电; 提供 坏件更换 提供 配备机房专业知识的人员对机房实行 5X8 小时值班 ( 如需 ) 提供 备件保证 备件库 提供 备件更换 现场更换 技术服务 驻点服务: 1.提供 7 24小时免费故障检测与维修换件现场服务 2.预防性维护服务 提供 远程技术支持服务: 1.提供 7 24小时的故障响应电话支持 2.每周一次与客户沟通交流 提供 培训服务: 1.专业知识培训 2.日常运维管理 提供 远程诊断 5 远程拨入系统分析 提供 远程故障解决 提供 远程系统性能监控 提供 软件及信息资源维护 系统软件、 数据库 、 中间件 现场驻点服务 ( 如需 ) 5 8小时 到达客户

8、现场时间 ( 应急响应 ) 60 分钟内 要求完整、详细、真实的维护记录文档,按月、季、年度提交规范的维护报告。 提供 维护文档 提供 每日监控系统运行情况,协助应用系统的升级以及各种安全补丁的升级工作 提供 BUG管理 、系统故障检测及排除 提供 应用系统功能 、 数据库 优化、调整服务及少量的二次开发 提供 系统软件安装、 数据库安装、配置管理 提供 存储管理 提供 根据备份策略定时进行系统及数据的备份,对重点数据要求能够进行定时备份 提供 协助采购人规范计算机终端软件安装标准化工作 提供 周期性 全面巡检 ( 与采购人协商、合同约定 ) 提供 解决数据库运行中出现的各类故障 立即响应 文

9、档提交 提供 技术服务 驻点服务: 1.提供 7 24小时免费故障检测与维修换件现场服务 2.预防性维护服务 提供 远程技术支持服务: 1.提供 7 24小时的故障响应电话支持 2.每周一次与客户沟通交流 提供 培训服务: 1.专业知识培训 2.日常运维管理 提供 远程诊断 远程拨入系统分析 提供 远程故障解决 提供 远程系统性能监控 提供 信息系统安全服务 信息系统安全服务 现场驻点服务 ( 如需 ) 5 8小时 到达客户现场时间 ( 应急响应 ) 60 分钟内 漏洞扫描服务 :制定安全扫描计划,对信息系统的服务器、网络设备、安全设备和应用系统进行安全漏洞扫描,包括系统漏洞扫描、数据库扫描、

10、应用安全扫描 提供 6 安全加固服务 : 根据漏洞扫描所发现的弱点和安全隐患,对信息系统的服务器、网络设备、信息安全设备进行安全加固服务,提高系统与服务器与系统平台运行的安全性、可靠性 提供 应急预案和演练服务 : 针对可能发生的重大事件,制定对应的应急预案,并通过应急演练发现应急过程中存在的问题,进而对应急预案和演练进行优化 提供 信息系统安全测试服务 提供 技术服务 驻点服务: 1.提供 7 24小时免费故障检测与维修换件现场服务 2.预防性维护服务 提供 远程技术支持服务: 1.提供 7 24小时的故障响应电话支持 2.每周一次与客户沟通交流 提供 培训服务: 1.专业知识培训 2.日常

11、运维管理 提供 远程诊断 远程拨入系统分析 提供 远程故障解决 提供 远程系统性能监控 提供 运维管理咨询服务 运维管理咨询服务 IT服务管理现状数据与信息收集; 提供 建立服务台,配置相关服务人员; 提供 协助部署 IT服务管理软件、设计管理制度和流程; 提供 IT服务管理流程设计(应包括事件管理流程、问题管理流程、配置管理流程、变更和发布管理流程) 。 提供 技术服务 驻点服务: 1.提供 7 24小时免费故障检测与维修换件现场服务 2.预防性维护服务 提供 远程技术支持服务: 1.提供 7 24小时的故障响应电话支持 2.每周一次与客户沟通交流 提供 培训服务: 1.专业知识培训 2.日

12、常运维管理 提供 远程诊断 远程拨入系统分析 提供 远程故障解决 提供 远程系统性能监控 提供 7 1.2.2 运维 重点难点分析 网络规模的发展和扩大,使得应用产品技术日渐多样和复杂,越来越多的企事业单位的生产业务和日常工作将实现信息化,并通过提高信息化水平实现对内提高经营水平、对外提高服务水平的目的。各企业事业单位业务的展开越来越依赖 IT 系统的正常运转,生产业务日渐依赖 IT 部门提供的系统服务, IT 部门正由“成本中心”转变为“服务中心”、“效益中心”。 随之而来的问题是 运维 部门将如何通过管理为 企事业单位 提供更好的、可度量的、符合业务需求的服务?同时,这些服务需要能够适应业

13、务需求以及新技术带来的影响,为新业务系统的运行提供支撑,让运维管理成为 企事业单位 成长的助力。 运维管理包含内容 IT运维是 IT管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于 IT部门内部日常运营管理,涉及的对象分成两大部分,即 IT业务系统和运维人员。其管理内容又可细分为七个子系统: 第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系 统、 DNS、 Web等的监控与管理 ; 第二、数据 /存储 /容灾管理:对系统和业务数据进行统一存储、备份和恢复 ; 第三、业务管理:包含对企业

14、自身核心业务系统运行情况的监控与管理,对于 业 务 的 管 理 , 主 要 关 注 该 业 务 系 统 的 CSF( 关 键 成 功 因 素CriticalSuccessFactors)和 KPI(关键绩效指标 KeyPerformanceIndicators); 第四、目录 /内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理 ; 第五、资源资产管理:管理企业中各 IT 系统的资源资产情况,这些资源资产 可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互 ; 第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是

15、 ISO17799,该标准涵盖了信息安全管理的十大控制方面,8 36 个控制目标和 127 中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等 ; 第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段 IT 运行维护管理的每一 个子系统中都包含着十分丰富的内容,实现完善的 IT 运维管理是企业提高经营水平和服务水平的关键。 IT运维管理面临的难题 IT 运维管理是一门探讨如何提高网络应用性能的课题,怎样利用网络管理做到企业 IT 基础设施建设的管理、合

16、理分配网络资源、保障生产业务、对网络规划和新业务上马提供支撑,而其最核心的目的是保障企业生产业务。 日常 IT运维管理面临诸多难题,具体体现在以下多个方面: 网络设备 在企业 IT基础设施的搭建过程中,底层的网络设备厂商和类型多样且复杂。随之而来的问题是:如何将不同厂商的网络和应用管理产品在界面级 、消息级和数据级集成起来实现统一管理?如何让 IT 管理员了解到整个网络全局的运行情况、发展趋势和可能存在的故障隐患点,以便及时采取相应措施,实现事前管 理。 科学的运维管理思路告诉我们,首先需要解决的是对 IT 基础设施的管理,管理范围要能覆盖到机房所有硬件设备。这一点是前提和基础。其次,才是对各

17、种应用系统做到很好的监控。最后,才能为业务系统提供足够的保障。 网络流量 在绝大多数的企业网络中,存在不同程度的网络延迟,造成重要业务和应用时断时续,这直接成为企业业务的杀手。另外,网络的带宽也是企业关心的重 点。比 如,哪个时间段很拥挤,哪个时间段很空闲,有没有规律,怎么样去调查拥塞的原因,网络带宽都是被谁占用了,是被哪些客户端、哪些应用或者异常应用所占用了。这些都是摆在每一个企业运维管理领域中很实际的问题。 该如何很好的解决这些问题呢? 根据多年的运维管理经验得出,对于这种情况,需要采用流量分析的方式。通过对出口流量或者监控对象进行采集,进行 24小时实时的监控和分析,可 9 以对流量进行

18、多角度多层次的挖掘分析,比如按照流量、数据包个数、连接数、协议等类别分析当前网络的负载情况,为网络的优化配置提供参考。通过报表分析展现流量特征,让 IT 管理员明白流量被谁、被何种应用、被何种异常行为占用得怎么样。 IT运维管理怎么样帮助 IT管理员判断和控制安全问题,也就是作为与防病毒、防火墙、 IPS等安全产品不同的角色,从网络的整体情况要能够判断未知的安全问题,并提供修复方案,在不影响正常网络运行状况下将安全问题防患于未然。如果 IT 管理员能针对异常行为的特征建立自动告警,在某些安全攻击出现前发现故 障隐患,并提供连动的判断和处理机制,这样 IT 管理员可以及时采取了措施避免业务遭受损

19、失。如果能在对问题特征自动告警的同时,自动记录问题的原始数据以供事后分析,这样 IT 管理员可以再现数据异常行为、捕捉网络数据异动入侵记录,对症下药制订策略防止问题的再次发生。 业务系统 针对日益复杂的业务系统,现有的运维管理系统更多的强调的是功能的展现。比如,从业务主机负载、数据库服务器负载、数据库、中间件、应用系统、 网际流量、进程状况等等不同角度实施联合监控,强调的是性能参数指标的多少,或者是界面的美观程度。当然,这是落实业 务系统管理环节所采用的方法。 但事实上,作为企业自身来说,无论采用哪种监控也好, IT 管理手段或者运维管理系统也罢,其核心总是需要围绕保障和改进企业的业务系统。

20、这就提出一个问题,如何来保障又如何改进企业的业务系统呢? 首先,需要了解清楚业务系统所涉及的具体环节,针对每一个环节进行管理落实。按照科学运维管理的建设思路,分为:用户 -网络 -硬平台 -软平台 -业务系统这五个环节。需要从这五个环节所涉及到的五个方面去做工作。这五个方面分别是:全局的性能管理、故障和事件管理、资源的使用状况管理、安全管理和 数据分析管理。其次,通过性能和历史数据的反映,又可以做到对业务系统提供改进决策的指导。 当然,对于如何保障和改进业务系统这个问题,目前业界众说纷纭,没有统一的标准。但有一点是肯定的,就是需要从企业用户的角度出发,通过明确的管10 理思路作为指引,使用软件

21、 +服务的方式和企业用户共同探索和研究,最终达到对业务的保障和改进。 当前 IT运维管理的任务 在企业网络运维早期, IT 运维管理侧重于网络、硬件等设备。随着业务系统涉及的环节日益增多,单一的网络管理已经不足以满足管理需求,越来越多的企业已经将关注点从单一网络转变到当前 的业务系统,落实保障业务系统的各个环节成为重中之重。 1.3 运维人员组织架构 及管理制度 1.3.1 运维组织结构介绍 我公司将在此运维项目中投入业务水平高、技术能力强的运维人员和质量控制人员,采用公司严格规范的运维管理模式,进行全方位管理。 为了进一步确保运维项目的进度与质量,公司在项目运维阶段、质量管理、技术文档等方面

22、进行严密规范的部署。 公司的运维队伍组成包括: 运维项目总负责人(常务总经理兼任); 运维管理委员会(项目经理、甲方代表、监理代表); 运维驻点服务小组; 技术支持专家组; 备品备件供应小组; 文档管理小组 1.3.2 运维组织 管理制度 运维部工作职责 根据 维保项目 实施推进和发展目标,负责系统信息协同管理及协同数据交换策略研究的整体架构、应用系统等技术开发方案制定和组织开发,保障基础 设施平台的稳定性和先进性。 信息系统基础 设施 设备和软件操作规程和应用管理制度的制定,并负责监督执行。 11 信息系统基础 设施 设备和软件安装、调试和验收,使用培训和维修保养。 信息系统基础 设施 日常

23、运行过程中信息安全和技术问题的协调解决,保障 系统 24小时安全稳定运行。 主要管理制度一览表 项目名称: 招标编号: 企业 名称: 序号 管理制度名称 执行起始时间 备注 1 机房基础设施及硬件运维管理 办法 2016.1 2 信息类设备运维管理 办法 2016.7 3 主机运维管理 办法 2017.3 说明:表格 中 列出目录即可,主要规章制度的具体内容可在下方提供图片 或者截图。 附 :各类制度图片 或 截图: 12 13 14 1.3.3 运维成员职责 项目经理职责: 项目经理受公司总经理任命和委托,全权负责运维项目合同的各项条款的履行。对运维项目的优质、高效、安全负全责。 运维工程师

24、 职责: 1、负责对基础设施维护(如服务器与存储设备、网络和信息安全设备、机房基础设备及环境、桌面设备、多媒体设备等) ,软件及信息资源维护(如系统软件、工具软件、业务系统及数据等) 相关的15 申报事件进行处理和解决。 2、负责对基础设施维护(如服务器与存储设备、网络和信息安全设备、机房基础设备及环境、桌面设备、多媒体设备等) ,软件及信息资源维护(如系统软件、工具软件、业务系统及数据等) 提供日常性能和运行状况监控,对故障进行分析处理及建立完善预警机制。 3、负责保障 基础设施 正常运行,遵循用户的安全保障管理要求。 4、接受用户对 信息系统 维护事件的督办、检查,协助服务台完成对用户意见

25、进行回访和事件统计、分析。对服务过程和反馈的意见进行改进,同时接受服务台的绩效考评工作。 5、及时提供 信息新系统 运行和问题处理情况,并向用户负责,并按周、月、季、年提交运维运维服务工作进度总结和计划。 6、负责整理和归纳服务器日常维护知识库,提交至运维服务平台。 7、负责整理和提交 信息系统 运维过程资料和相关配套维护 文档。 技术支持专家职责: 1. 为客户提供 7 24 小时的故障响应电话支持。 2. 接听客户服务热线电话和接收(电话 /Email/Fax 等)客户服务请求 ; 3. 通过网络或电话为客户提供即时的远程技术支持 , 包括软硬件故障的诊断和排除 , 客户端软件的安装和设置

26、。 4. 协调多方服务团队,及时跟进未完成的服务请求并及时更新系统信息和状态 ; 备品备件管理员职责: 16 1. 组织实施备品备件的订购、 运输 及入库工作 2. 负责汇总待料备件,及时采购或调拨,并主动向项目经理说明待料原因、追踪处理。 1.3.4 运维成员组织结构 针对 单 维保项目我公司配备了 4-5名专职人员具体如下表: 序号 分派职位 数量(人) 姓名 获得证书 1 项目经理 1 项目管理师资格证 2 运维工程师 1 专业化证书 3 技术支持专家 1 厂商 认证证书 4 备件管理员 1 5 文档管理员 1 备注:人员证书附下页: 项目名称: 招标编号 : 企业 名称: 说明: 1.

27、上述人员必须是本企业在职职工,应与本单位近期社保缴纳证明一致,否则不予认可。 2.岗位安排指在具体运维项目中可担任的岗位,如技术支持专家、项目经理、现场维护人员、其他服务人员及是否可安排驻场等。 3.业绩说明:指在以往运维项目曾经担任的岗位,如技术支持专家、项目经理(负责人)、现场维护人员、其他服务人员等。 附相关学历 证书 : 序号 姓名 年龄 文化程度 专业 获得资格证书情况 入职本单位时间 岗位安排 业绩说明 其他说明 1.4 运维质量保证措施 及服务承诺 1.4.1 质量控制管理 按照相应的 ISO9001: 2000国际质量体系标准及国家规定进行质量控制,还以相应的规范要求对设计质量

28、,施工质量、材料和设备质量进行管理、要求、控制。 公司的施工阶段性内部验收制度,是质量控制管理的有利保证。工程的每一个阶段完成时,公司技术支持部门都要按有关部门规范和要求进行严格的内部验收。验收标准整体上高于用户验收标准。 1.4.2 进度控制管理 针对 普遍 客户 的需求 做出如下运维计划: 序号 名称 人员 周期 1 小型机、存储系统巡检报告 运维工程师 /技术支持专家 每周 2 PC 服务器 、 存储系统 运维工程师 /技术支持专家 每周 3 多媒体系统 运维工程师 每周 4 网络设备 、 信息安全设备 运维工程师 /技术支持专家 每周 5 机房空调巡检报告 运维工程师 每周 6 UPS

29、 巡检报告 运维工程师 每季 7 数据库系统运维 运维工程师 /技术支持专家 每周 8 中间件系统运维 运维工程师 /技术支持专家 每周 9 问题报告 运维工程师 /技术支持专家 问题解决后 10 信息系统安全服务 运维工程师 /技术支持专家 每半年 11 月总结报告 运维工程师 每月 12 季度总结报告 运维工程师 /技术支持专家 每季度 13 年总结报告 运维工程师 /技术支持专家 /项目经理 每半年 14 运维管理咨询服务 运维工程师 /技术支持专家 每周 15 定期培训 技术支持专家 每季度 1.4.3 服务承诺 1.系统定期巡检是指我司安排现场工程师对应用系统实施现场检查,及时发现系

30、统运行中出现的隐患,减少系统发生故障的概率,保证系统的稳定运行。 在系统巡检过程中发现的问题,依据我司故障分类标准,由现场技术服务工程师进行相应的故障排除。 本项目中巡检服务主要指软件检查,内容包括:数据完整性检查、性能指标检查、告警功能检查、软件可用性与安全性检查等。 2.电话故障诊断是指用户在遇到使用中的疑难问题或者系统出现不正常状态,通过电话或传真向我司寻求技术支持和帮助,我司在确认用户的服务请求后,将安排技术人员在规定的时间内(即响应时间)通过电话帮助用户进行故障定位,并提出解决方案,最终指导用户排除设备故障。 表:故障性质定义 用户在维护系统过程中,当出现技术故障的时候,应对故障现象

31、进行仔细认真的调查和记录,然后通过服务热线向我司提供故障的详细情况、服务请求时间、联系人和联系电话等。 我司服务热线提供每周 5天、每天 8小时的电话故障诊断,如热线电话号码需要更改,我司至少提前三天以书面形式(含传真)通知用户。 用户应及时反馈解决方案的有效性,以便我司是否进一步采取技术支持措施。 3.远程故障诊断是指用户在遇到使用中的疑难问题或者系统出现不正常状态,通过电话或传真向我司寻求技术支持和帮助,我司在确认用户的服务请求后,通过服务项目不能解决 系统故障问题的情况下,或在进行的同时,根据需要并征得用户同意后,采用远程拨号技术,将用户系统与工程师所在地终端连通,在远端对用户设备进行诊

32、断,提出解决问题的方案,并最终指导用户解决问题。 我司工程师负责进行远程故障诊断,即只查看数据,寻找故障原因,不对数据进行修改,具体故障排除由工程师指导用户现场维护人员进行。 用户应按我司的要求提供必要的配合和协助,确认并反馈方案的有效性。 我司还可以通过远程故障诊断对用户数据进行检查,进行远程巡检。 我司提供每周5天,每天 8小时的远程故障诊断。 1.5 运维流程及服务方式 1.5.1 服务方式 针对本次项目我公司为保证各系统的稳定可靠的运行我公司根据该项目的具体要求提供三种方式的技术支持服务,分别为:现场服务、远程技术支持服务、针对甲方运维人员的技术培训服务。 现场服务 对客户的系统进行现

33、场维护和巡检, 运维工程师 对各个应用系统完成定期巡检,同时输出巡检报告提交给客户,驻点工程是还应对客户的故障设备进行维修和更换备件服务。为了让客户得到更及时和更快的服务, 运维工程师 还 提供 7 24小时的故障响应电话支持。 远程技术支持服务 远程技术服务主要是通过电话或其他方式受理客户和 运维工程师 的疑难问题,通过沟通来指导客户或 运维工程师 解决问题,同时远程技术服务工程师还通过电话或者其他方式与客户主动沟通来提高客户管理和运维能力。 技术培训服务 为提高客户的运维人员的技术水平及运维管理能力,我公司将派遣具有丰富实施经验的技术专家定期对客户进行相关专业(主机、存储、数通、网络、安全

34、、机房环境等)的培训。 培训可以采用灵活多样的方式如面对面交流、课堂授课、邮件沟通等。 1.5.2 运维流程 我公司除培训服务外,为本项目提供两种服务方式:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。 1、技术人员现场值守运行维护服务的基本操作流程如下图所示: 日 常 巡 检是 否 存 在 问 题巡 检 报 告N O 输 出定 位 问 题Y E S可 现 场 排 除更 换 备 件问 题 解 决N OY E S问 题 报 告输 出运 维 文 件归 档 归 档运 维 资 源 建 档更 新 资 源 配 置2、定期巡检结合故障现场运行维护服务的基本操作流程如下图所示 : IT 资源汇总技

35、术专家识别问题备件管理员备件更换问题报告故障解决输出运维资源建档用户运维工程师IT 资源更新告知客户1.6 运维方案及实施安排 1.6.1 小型机、 PC 服务器、网络设备及存储系统 小型机、 PC 服务器、网络设备及存储系统运维部分主要分为三部分,分别为小型机存储系统运维、 PC服务器运维、网络设备运维 。 小机存储系统运维内容主要包含小型机设备、光纤交换机、存储设备三部分主要从以下几个方面进行维护: 1、检查设备各部件的状态灯; 2、检查并处理设备的错误日志; 3、硬件设备的全面检查; 4、网络配置的检查及测试; 5、操作系统性能分析; 6、核对各小型机配置信息,根据需要调整配置; 7、检

36、查设备的微码版本; 8、检查存储设备运行情况; 针对如上要求输出如下检测报告: 小型机系统巡检报告 用户单位名称: 设备名: 设备型号: 产品序列号: 检测项目 检测方式 说明 检查结果 巡检周期 电源风扇 检查主电源灯状态 指示灯常绿表示系统正在运行 正常 异常 检查直流电源指示灯状态 指示灯常绿表示电源供电正常 正常 异常 检查直流电源风扇状态 检查风扇是否散热 正常 异常 处理器 执行命令: lsdev Cc processor 检查 CPU 的数量及状态。 CPU 状态为 Available,表示CPU 使用正常 正常 异常 内存 执行命令: lsattr El mem0 检查内存数量

37、及状态。 size 与 goodsize 的数量相等表示内存使用正常 正常 异常 磁盘 执行命令: lsdev Cc disk 检查磁盘的数量及状态。磁盘状态为 Available,表示磁盘使用正常 正常 异常 适配器 执行命令: lsdev Cc adapter 检查系统中配置了哪些适配器及使用状态。各个适配器的状态为 Available,表示各个适配器目前工作正常。 若适配器状态为 Define,则表示该设备已经被配置但是未被当前系统使用。 正常 异常 分页空间 执行命令: lsps -a 检查分页空间的分配数量及利用率。 Size为已分配的分页空间数量; %Used为目前系统的分页空间使

38、用率,该值若超过 70,正常 异常 表示系统内存不足 系统镜像 执行命令: lsvg l rootvg 检查系统卷组的镜像状态。 各个逻辑卷的 PPs 数量应该为 LPs 数量的整数倍,倍数大于 1 并且能被 PVs 整除,表示卷组已经作镜像。各个逻辑卷的 LV STATE应该为 syncd,否则表示镜像不同步。 正常 异常 文件系统 执行命令: df -k 检查已经挂载的文件系统的使用状态。重点检查 /(根 ) /tmp(临时) /var (日志文件 )这些动态文件系统的使用率最好保持在 70以下。 正常 异常 错误日志 执行命令: errpt 检查系统日志是否有硬件或软件方面的永久错误。若

39、发现错误类型为 P的信息,则需要注意。 正常 异常 网卡配置情况 执行命令: ifconfig a 检查各个网卡的配置情况,状态是否为 UP,检查 ip 地址和子网掩码等配置是否正确。 正常 异常 系统备份 执行命令: lsmksysb -V -f /dev/rmt0 检查磁带备份的可读性。若没有错误显示,则表示备份磁带的数据是有效可恢复的。 正常 异常 客户确认 巡检结论: 【 】合格【 】不合格 用户代表签字: 年 月 日 服务工程师签字: 年 月 日 存储系统设备巡检: 设备名称: 检查时间: 年 月 日 时 本年度第 次检查 检查项目: 检查结果: 1. 检查存储硬件情况: 设备故障灯

40、是否有亮 SAN 交换机端口 LED状态 有 无 正常 不正常 2. 存储系统故障报告 (Problem Log): 正常 不正常 Problem Log/Serviceable Event 正常 不正常 有否硬件故障 3. 存储系统运行状态: View Storage Facility State / 正常 不正常 CdaPreverify / View RIO Topology 正常 不正常 4. 通信: 正常 不正常 /Master Console/SMC/HMC和存储设备的通信 Good Degraded Offline Rebuilding 6. 存储设备内部状态: 正常 不正常 7

41、. 存储系统硬件状态: 正常 不正常 双控制器同时正常工作 正常 不正常 电池、电源和风扇模块 是 否 物理硬盘和逻辑盘 是 否 8. 微码 (Microcode)是否满足 IBM的最低要求 是 否 9. 是否启用了 Call Home 是 否 10.收集存储设备基本信息存档 是 否 目前存在的问题: 改进措施或建议: 检查结论: 客户签字: 工程师签字: 日期: 年 月 日 日期:年 月 日 PC 服务器运维内容主要包含设备硬件、操作系统、软件几个方面进行考虑。 PC 服务器巡检: 服务器设备巡检报告 用户单位名称: 设备名: 设备型号: 产品序列号: 检测项目 检测方式 说明 检查结果 巡

42、检周 期 显示器 正常 异常 光驱 正常 异常 磁带机 正常 异常 电源 正常 异常 键盘 /鼠标 正常 异常 风扇 正常 异常 系统指示灯状态 前面板指示灯 正常 异常 电源指示灯 正常 异常 磁盘指示灯 正常 异常 系统控制板指示灯( CPU/MEM, I/O等) 正常 异常 系统日志信息 IML日志 正常 异常 操作系统日志 正常 异常 交换区使用率 TOP或任务管理器查看 使用率 正常 异常 磁盘分区使用率 Windows系统 Unix系统用命令 df -k C: / 使用率 正常 异常 D: /usr 使用率 正常 异常 E: /var 使用率 正常 异常 其它分区 正常 异常 正常

43、 异常 操作系统版本 / 正常 异常 核心 patch版本 正常 异常 高可用性软件 正常 异常 数据库软件 正常 异常 存储软件 正常 异常 备份软件 正常 异常 正常 异常 正常 异常 巡检结论: 【 】合格 【 】不合格 用户代表签字: 年 月 日 服务工程师签字: 年 月 日 网络设备的运维内容主要包含交换机、防火墙以及负载均衡等相关设备 输出文档按照如下: 网络安全设备巡检报告 用户单位名称: 设备名: 设备型号: 产品序列号: 检测项目 检测方式 说明 检查结果 巡检周 期 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常

44、正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 正常 异常 1.6.2 机房空调、 UPS 设备运维服务 为保证机房内各个应用系统的设备正常稳定的运行,良好的机房环境是非常必要的,我公司针对本次项目主要从机房空调系统、 UPS供配电系统,作为重点运维内容,同时对机房内的其他指标项进行检测如机房内温度、湿度、消防系统、新风系统等。 机房空调系统的运维内容主要遵循如下表单进行巡检: 机房空调巡检报告 用户单位名称: 设备名: 设备型号: 产品序列号: 系统

45、 检查项目 检查时间: 检查时间: 空调 1 控制温度 控制湿度 % % 当前温度 当前湿度 % % 业务机房 当前温度 当前湿度 % % 监控室、 /ups 当前温度 当前湿度 % % 当前运行空调 检查空调是否有排水不出产生积水、漏水现象 ( ) 1号机在用 ( ) 2号机在用 () 1 号机在用 () 2 号机在用 ( )无积水、漏水现象 ()无积水、漏水现象 ( )有积水、漏水现象 ()有积水、漏水现象 目前存在的问题: 改进措施或建议: 巡检结论: 客户签字: 工程师签字: 日期:年月日 日期:年月日 备注:我公司巡检人员每周会严格按照机房空调巡检报告具体要求对客户的空调系统检测,为保证空调系统的工作正常,每年不低于 2 次的全面巡检,对故障配件进行检修,在日常维护中及时清理及更换过滤网和加湿罐等耗材,定期清理机房空调的室外机,检修内各供水管路及排水管路,杜绝漏水,保证管路畅通。在设备出现故障后,保证在 48 小时内恢复正常。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 方案计划

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1