1、,XXXX年终工作总结运维部,X X X X X X X X 科 技 有 限 公 司,运维年度报告,运维年度报告一关于运维 运维年度报告二运维现状 运维年度报告三运维规划 运维年度报告四运维建设 运维年度报告五运维总结 运维年度报告六来年目标,关于运维运维的概念,他们可能是在办公室中安装系统、帮同事排除机器故障的技术支持; 他们可能在机房干着插网线、搬机器、拆服务器箱子的体力活儿; 他们可能是天天盯着N个监控屏幕、8小时一动不动盯着流量图的监工; 他们可能是在BOSS、开发工程师、网络/系统工程师、DBA中间跑来跑去的沟通者; 他们可能是在夜半三更收到服务器监控系统的警报,起床赶到机房的特种部
2、队; 他们自称IT民工,神仙,装机男以及SA(快速响应者)。 他们的统一称谓叫做运维,同时也有技术支持、系统管理员(SA)、网管、网络工程师、研发工程师、架构师等多种称谓。种种看似凌乱、不相干甚至矛盾的工作,都是运维。运维到底是什么?, 设备管理:对网络设备、服务器备、操作系统运行状况进行监控。应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理。 数据/存储/容载管理:对系统和业务数据进行统一存储、备份和恢复。 业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关
3、键成功因素Critical Success Factors)和KPI。(关键绩效指标Key Performance Indicators) 目录/内容管理:对于企业需要统一发布或因人定制的内容管理和对公共信息的管理。 资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互。 信息安全管理:目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127种控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理
4、等。 日常工作管理:规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。,关于运维运维管理的内容,关于运维运维的重要性,完善的运维管理是企业提高经营水平和服务水平的关键。,运维负责管理和维护公司业务系统的核心用户数据。,运维负责管理和采购业务系统硬件。,运维负责生产环境性能优化。,运维负责管理和维护业务系统的安全。,运维负责处理生产环境故障处理和运营保障。,关于运维运维需要做什么?,业务可用性所谓业务可用性(availability)也即系统正常运行时间的百分比,这是每个运营团队最主要的 KPI (Key Performance Indicator
5、s ,关键业绩指标)。对于 Web 站点来说,现在业界更倾向用 N 个9 来量化可用性, 最常说的就是类似 “4个9(也就是99.99%)” 的可用性。,关于运维业务可用性,运维能力最直观的表现是业务可用性。,运维年度报告,运维年度报告一关于运维 运维年度报告二运维现状 运维年度报告三运维规划 运维年度报告四运维建设 运维年度报告五运维成果 运维年度报告六来年目标,运维现状运维发展的几个阶段。,救火式运维,监控式运维,规范化运维,智能化运维,通过监控系统,集中管理和监控所有主机。,运维事务较为完善,故障响应时间更短。,业务集群,故障自动响应,业务不中断。,疲于奔命,对于突发事件缺乏智能判断,无
6、法做出迅速响应。,安全性,稳定性,运维年度报告运维建设,奉献智慧创造价值自我实现,安 全稳 定高 效,系统运维部,旨在为满足公司各项运营系统需求,为系统正常运行提供技术支持,保障全线产品的高效运营。,职能概述,工作宗旨,工作理念,不断提高,年度运维报告运维建设,运维年度报告运维职能,运维年度报告运维职能,运维年度报告,运维年度报告一关于运维 运维年度报告二运维现状 运维年度报告三运维规划 运维年度报告四运维建设 运维年度报告五运维成果 运维年度报告六来年目标,高效,稳定,安全,运维 核心,业务保障能力,运维年度报告运维规划,运维三大核心,高效性,用户满意,执行力,可扩展性,稳定性,安全性,四大
7、方向着力提升业务服务能力,运维年度报告运维规划,运维年度报告运维管理,规范化运维事务响应流程,运维年度报告风险分析,运维年度报告安全架构,运维年度报告,运维年度报告一关于运维 运维年度报告二运维现状 运维年度报告三运维规划 运维年度报告四运维建设 运维年度报告五运维成果 运维年度报告六来年目标,运维年度报告资产汇报,增强了对设备的可控性,资源调配更加合理。,运维年度报告运维事件,运维年度报告,运维年度报告一关于运维 运维年度报告二运维现状 运维年度报告三运维规划 运维年度报告四运维建设 运维年度报告五运维成果 运维年度报告六来年目标,年度运维报告运维成果,零:一:三:四:五:六:,运维年度报告
8、运维管理成果,运维年度报告运维成果,作用:通过监视平台,可即时掌握系统状态和系统故障,即时处理故障,同时通过统计数据对性能进行充分分析。对系统做出新的评估。促进系统改进和升级。,系统运维性能监视,性能图表应有尽有。,系统监视服务告警,邮件通知,一条不漏。,网页监视,语音提示。,您有新短消息,请注意查收。,短信通知,随时随地。,Service: Disk_/swap on host_OAsjk Address: 192.168.0.66 is CRITICAL Date/Time: Mon Aug 2 13:35:17 CST 2010,监控平台带来的改变,改变传统的事找人 的局面。,有效提高了
9、对系统性能了解。为性能改进提供依据。,通过性能分析,预知系统趋势。提前改进。,年度技术突破高效运维,增量备份:备份产生数据量小,速度更快,恢复更安全。,动静分离:系统服务更专一,处理效率大幅提高,吞吐量变大。,Memcache优化:查询速度提升,数据库压力减轻。,Cache优化:文件读取速度提升,系统效率大幅提高。,session 集群:负载均衡,性能提高,业务保障能力全面提升。,JVM优化:服务停顿时间缩短,增强持续服务能力。,智能DNS:根据用户网络,选择最快访问路径。提高响应速度。,xfs文件系统:采用xfs文件系统比传统ext3效率更高。,年度技术突破高效运维,VPN安全隧道:通过专用
10、通道,使管理更方便,通信更安全。,防火墙:针对内外网分别采用不同的策略,抵御攻击。,远程监控:主动报警机制,使故障发现更及时,管理更方便。,权限控制:通过构建账户与文件权限策略,使操作更安全。,高效运维系统优化,多角度全方位优化,增量备份:备份产生数据量小,速度更快,恢复更安全。,系统优化增量备份,备 份 服务器,第8天,是什么情况?,备 份 服务器,备份,引入增量备份技术后,在一次全量备份的基础上,做增量备份,只需备份每日改变的数据。,系统运维系统优化,多角度全方位优化,动静分离:系统服务更专一,处理效率大幅提高,吞吐量变大。,系统优化动静分离,静态服务,杂七杂八,力不从心。,内容请求,优化
11、前:一个系统承载多种服务。从资源利用上说是节约成本,但系统效率显得比较低下。系统性能得不到完全有效发挥。,系统优化动静分离,静态服务,因为专注,所以高效。,内容请求,优化后:静态内容和动态内容由不同服务器处理。各司其职,各尽所长。单个系统性能得到充分发挥,综合系统整体性能表现明显提升。,前导器,系统吞吐量变 大,动静分离,系统运维系统优化,多角度全方位优化,智能DNS:根据用户网络,选择最快访问路径。提高响应速度。,系统优化智能DNS,用户体验,访问速度更快了。,访问速度 提升,系统运维系统优化,多角度全方位优化,session 集群:负载均衡,性能提高,业务保障能力全面提升。,系统优化ses
12、sion 集群(cluster)技术,优化前,系统服务可能发生的状况,用户反应:怎么又不能用了?,采用服务器集群和负载均衡技术,服务更加稳定。,系统优化session 集群(cluster)技术,系统优化session 集群(cluster)技术,优化后,业务保障能力大幅提升。用户满意度提升。,业务保障能力提高,系统运维系统优化,多角度全方位优化,校讯通系统Cache优化:文件读取速度提升,系统效率大幅提高。,cache,系统优化Cache优化,内容,内容,内容,磁盘,文件请求,优化前:大部分文件请求,都必须通过磁盘查找。效率低下。,cache,系统优化Cache优化,目标,内容,内容,内容,
13、内容,内容,内容,磁盘,文件请求,一下就找到了,我就知道你在这里。,Cache优化以后,将频繁请求内容写入cache,从而提高文件访问效率。,优化后:文件直接从cache中读取,且命中率高达98%,效率更高。,系统性能 提升,系统运维系统优化,多角度全方位优化,校讯通系统JVM优化:服务停顿时间缩短,增强持续服务能力。,系统优化JVM优化,优化前:由于JVM垃圾清理,所引起的服务停顿,导致的部分用户体验满意度下降。这种情况可能随着人数的增多而增多。,1000人访问系统时,500人访问系统时,更多人访问系统时,系统优化JVM优化,优化后:服务停顿时间大大缩短。用户体验更加良好。,1000人访问系
14、统时,500人访问系统时,更多人访问系统时,系统优化JVM优化,1000人访问系统时,500人访问系统时,更多人访问系统时,优化前,优化后,系统性能 提升,系统运维系统优化,多角度全方位优化。,校讯通系统Memcache优化:查询速度提升,数据库压力减轻。,系统优化Memcache优化,我快不行了,你想累死我啊。,优化前:数据全部从数据库中读取,系统效率主要受数据库影响,数据库压力较大。,数据库 服务器,系统优化Memcache技术,数据库 服务器,前台 服务器,后台 服务器,“数据库兄弟,我来帮你。”,: Memcache引入后,大部分数据查询从缓存服务器中直接读取,效率将大幅提升,同时数据库压力也将大大减轻。,优化后,运维年度报告,运维年度报告一关于运维 运维年度报告二运维现状 运维年度报告三运维规划 运维年度报告四运维建设 运维年度报告五运维成果 运维年度报告六来年计划,2011年工作计划,2011年工作目标,救火式运维,监控式运维,规范化运维,智能化运维,安全性,稳定性,运维是一份持久,重复,挑战而长远的工作!,by:逸马驰骋 QQ:441886051欢迎交流,批评指正。,祝大家在新的一年里,大展宏图,财运亨通!,