1、可用性度量,董唯元 中国计算机报 51CTO.com 联合存储实验室 技术总监,话题,可用性与存储技术 度量可用性的目的 探讨可用性度量方法 实例分析,可用性相关存储技术,量化可用性依据,设备资源层面 MTBF标准 新技术与直接统计检验 Firmware故障 数据层面 数据组织模式 数据应用模式 应用服务层面 加法原则 故障屏蔽和传递,大部分复杂系统缺乏量化依据和结果,宕机时间百分率,环境要求差异 Web服务的8秒原则 视频采集的持续带宽要求 未涉及“降级”状态 RAID组磁盘离线 集群节点离线 未涉及宕机行为规律 96.7% =每分钟宕机2秒 96.7% =每月宕机1天,可用性描述应包括,性
2、能描述性能指标目标对象,度量目标,硬件故障 软件故障 系统维护 固件升级,功能系统,性能损耗 响应延迟 功能失效 服务中断,量化认知各类事件对系统QoS的影响,度量过程,确立基准 生成合理工作负载 量化并测量各服务性能 插入事件 硬件故障(磁盘、电源) 软件故障 维护升级 测量结果 独立事件影响 组合事件影响,可视性结果,生成图表结果 转化为数据结果,联合实验室实例,基于软件RAID5的Web服务 Linux/Apache和Windows2000/IIS 测试内容 磁盘故障对系统服务影响 指标定义 每秒响应点击 负载发生器 SpecWeb99 Web Benchmark 以2分钟为周期测量每秒
3、点击数,事件插入,故障发生器模拟磁盘接入SCSI总线 2颗真实磁盘与1颗模拟磁盘RAID5 1颗模拟磁盘Hot Spare 模拟故障 介质故障(瞬时/可修复/不可修复) 硬件故障(Firmware/机械) 校验错 供电故障 磁盘挂起/超时,故障效果,Linux对所有错误重建 Win2000忽略非严重错误 Win2000不能自动重建 两系统均无法处理挂起状态,重建过程,Windows 2000/IIS,Linux/ Apache,Win2000重建过程更快,但占用资源较多 Linux的重建过程基本不影响正常服务,联合实验室介绍,中国计算机报和51CTO.com联合发起成立 存储领域最前沿的技术工程师团队 国际领先水准的存储评测环境 多家权威IT媒体合作伙伴 努力打造一个客观中立的 存储产品性能检测中心 解决方案发布中心 存储技术咨询中心,权威、专业、严谨,联合实验室服务项目,存储产品测试 解决方案模拟实验 存储技术培训 用户采购咨询,合作媒体,51CTO存储频道,日均PV:7.3万 日均访客:5万 内容相关度高 技术专业性强,实验室近期活动,系统可用性量化分析 多磁盘校验技术性能及可用性测试 虚拟存储性能及可用性测试 IP存储技术测试 IP存储产品性能评测,谢 谢!,http:/stor.51CTO.com,