ImageVerifierCode 换一换
格式:DOC , 页数:16 ,大小:199.50KB ,
资源ID:492898      下载积分:2000 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
如需开发票,请勿充值!快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
注意:如需开发票,请勿充值!
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【http://www.mydoc123.com/d-492898.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文([计算机类试卷]2010年上半年软件水平考试(高级)系统分析师下午(案例分析)试题真题试卷及答案与解析.doc)为本站会员(postpastor181)主动上传,麦多课文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文库(发送邮件至master@mydoc123.com或直接QQ联系客服),我们立即给予删除!

[计算机类试卷]2010年上半年软件水平考试(高级)系统分析师下午(案例分析)试题真题试卷及答案与解析.doc

1、2010年上半年软件水平考试(高级)系统分析师下午(案例分析)试题真题试卷及答案与解析 0 某软件企业为网络音像制品销售公司 W重新开发一套影音产品在线管理及销售系统,以改进原有系统 AVMSS中存在的问题。在系统需求分析阶段,完成的工作包括: 1系统分析员老王利用 PIECES框架组织了系统需要获取的非功能性需求,如表 1-1所示。 2项目组小赵从 W公司客户代表处了解到现有系统中经常有会员拒绝履行订单,并将其作为问题记录了下来。老王指出了小赵并未发现系统真正的问题,并以会员拒绝履行订单为例,利用如图 1-1所示的鱼骨图分析了系统中真正存在的问题。 3获取到相应的需求之后,将需求记录下来形成

2、需求定义文档,同其他项目信息合并形成需求陈述,作为需求分析阶段最终的交付成果。 1 PIECES框架的主要作用是什么 ?请将以下需要获取的需求 (1) (8)根据 PIECES框架进行分类并将序号填入表 1-1对应的单元格内。 (1)系统能否采用新方法以降低使用资源的成本 ? (2)系统可接受的吞吐率是多少 ? (3)系统可接受的响应时间是多少 ? (4)应该减少多少开支或增加多少收益 ? (5)对用户隐私有什么要求 ? (6)对系统的可靠性和可用性有什么要求 ? (7)系统中需要包括哪些文档和培训材料 ? (8)对外部系统的接口是什么 ? 2 请将下列问题按照不同的类型序号填入图 1-1所示

3、的鱼骨图 (g) (n)中。 (1)缺少强制履行合同的规定; (2)合同相关信息没有通知到会员; (3)没有催单提示客户; (4)没有跟踪执行情况; (5)设备成本太高造成价格不合理; (6)合同的履行缺乏灵活性; (7)账务问题或者 隐瞒相关内容; (8)价格太高并且无法修改。 3 一份需求定义文档应该包括哪些内容 ?对于与系统开发相关的人员:系统所有者、用户、系统分析人员、设计人员和构造人员、项目经理,需求定义文档各有什么作用 ? 3 A市经过软课题研究已经形成了一整套宏观经济指标体系,用于描述该市的经济状态,涉及包括区域 GDP、人口与就业、城市建设与投资、财政收入和支出、土地、进出口贸

4、易、社会保障、人民生活、制造业和高新技术产业等方面,并为主要指标建立了计算模型。与宏观经济指标有关的数据称为宏观经济数据,主要的宏观经 济数据广泛地分布于政府统计部门、计划部门、财政部门、税收部门、教育部门、商业部门、物价部门、农业主管部门、工业信息化主管部门等等,还分布于金融部门、大中型企业等。这些部门针对自身业务,多数都有自己的管理信息系统或者办公自动化系统,主要的宏观经济数据都已经实现了电子化。 目前, A市宏观经济指标的获得还采取传统方式,即通过有关部门逐级报表汇总宏观经济数据的方式和统计调查的方式得到。统计调查方式存在系统性的误差,而报表汇总方式则存在基础数据不准确、人为影响较大、指

5、标分析灵活性差等问题。 为准确掌握 经济动态信息,进一步规范各级经济信息资源管理行为,加快信息资源共享,提高政府的管理科学化和服务社会化水平,该市决定建设宏观经济数据库,将宏观经济数据统一管理。 4 为稳步推动 A市宏观经济数据库建设, A市市政府委托咨洵公司 B进行项目原型研究。 B公司经过调研,认为 A市电子政务网络、存储和计算平台非常完善,为宏观经济数据库的建设奠定了良好的基础。请用 200字以内文字指出此时 B公司在进行原型分析的时候应重点做好哪几方面的工作 ? 5 经过分析比较, B公司确定了 “物理分散,逻辑集中 ”的建设思路,因此未来宏观经 济数据库是一个分布式数据库系统。请用

6、200字以内文字简要分析,除了数据交换机制外,是否还需要建设一个集中的数据库 ?并叙述理由。 6 小张是 B公司的开发经理,在开发 A市宏观经济数据库原型的时候,用前端分析工具按照指标计算模型,计算 “宏观投资现状 ”指标,该指标计算模型的输入参数包括: 交易额,信息来源是市国税局和市地税局的税收征管系统; 项目立项信息,信息来源是市发改委的立项审批管理系统; 资金拨付信息,信息来源是市财政局的统一支付系统; 贷款信息,信息来源于银行的信贷管理系 统等; 资源消耗信息,信息来源于电力公司、自来水公司等。 小张按照输入参数来源单位提供的数据接口说明取得了输入参数,经过计算得到了 “宏观投资现状

7、”指标,但发现该指标与传统方式得到的指标差别很大。 请用 200字以内文字,指出存在差别的可能技术原因。 6 某公司长期从事嵌入式商用软件的开发工作。随着业务范围的扩展,公司最近签署了一项大型客机信息综合处理的软件研制合同,作为机载软件,其可靠性和安全性直接影响着大型客机的安全特性。合同要求承制方在开展工作之前必须完成安全性、可靠性分析报告 ,在软件开发过程中应严格遵循相关工程化标准。 公司总经理将此项任务交给了张工程师,要求他尽快掌握航空软件研制的各项要求,并拿出项目的策划书。张工在深入研究了可信计算等相关知识的基础上,结合航空软件的特点,提出了一项项目实施策划方案。此方案在安全性设计方面借

8、鉴了可信计算的相关技术,得到了甲方的认可,但是,针对此方案,公司领导层存在极大争议,问题主要焦点在于若按此方案实施,公司的人员、成本和资源投入将远远超过本公司的承受能力,张工指出,传统商用软件的开发模式不能满足航空用户的需要,软件可信度太低,对后续 发展不利。经过认真讨论,公司领导层形成了统一认识,按可信计算的技术要求,提升公司的整体软件开发水平。 7 ISO/IEC 15408标准定义可信为:参与计算的组件,其操作或过程在任意的条件下是可预测的,并能够抵御病毒和物理干扰。而航空设备的基本特点就是要求设备工作的实体行为应该总是以预期的方式达到预期的目的 (即行为、资源的确定性要求 )。基于这种

9、思想,张工依据可信计算组织定义的可信链模型 (即可信测量根 (RTM)BIOSOSLoaderOS构成链式信任链模型 )理论,给出了一种适应本项目的带数据恢复的 星型信任模型 (见图 3-1)。该模型的中心思想是将可信测量根植入机载设备平台模块内部 NVRAM(非易失存储器 )中,在信任链中增加数据恢复功能,并将信任链延伸到应用。请根据张工设计思想,完善图 3-1所示的带数据恢复星型信任模型的空白部分。并用 100字以内的文字,解释该模型与链式信任链模型相比的特点。 8 交叉编译器是嵌入式软件开发必备的基础工具软件之一。目前比较流行的交叉编译器是 GNU系列产品,它是一种开源软件。编译器生成代

10、码正确与否严重影响机载设备的安全,因此,张工在方案中提出对本项目采用的交叉编译器开展可 信技术研究。可信编译器包括两方面含义,其一是编译器自身的可信性,即必须保证整个编译操作的可信性,保证编译器在编译过程中不会给编译处理对象带来任何安全问题;其二是必须保证编译器编译所得程序可执行代码的可信,即编译器必须保证,通过其编译生成的程序代码是安全和可靠的。因此,张工提出在传统编译操作的基础上加入代码安全性加强机制、代码可信性验证机制和可执行代码保护机制。图3-2给出了可信编译系统的框架。 请说明三种可信机制在传统编译操作步骤中的位置,并给出图 3-2的 (a) (c)对应的可信机制名称。 根据表 3-

11、1所示 的信息流名称,给出图 3-2中 (d) (h)对应的功能模块间的信息流编号。8 某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。 李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的 联邦数据库集成方案。专家组经过激烈讨论,认为王工方案更为合理,建议采用王工提出的集成方案。

12、9 请结合数据仓库和联邦数据库集成方案各自的特点,简要说明专家组采用王工提出的集成方案的原因。 10 部分供应商的产品信息没有相应的数据库,而是直接嵌入在 Web页面中供用户浏览。数据集成时需要直接从供应商电子商务平台的网页上获取其产品信息。请简要给出此类数据集成的方法和基本步骤。 11 在方案评审会上,项目组针对李工和王工的方案展开了激烈的讨论。刘工指出两种方案在实施的过程中,都存在数据源之间的语义映射和 转换问题,都会带来数据集成的不确定。请简要说明产生不确定的原因。 11 某电子商务公司的主要业务是书籍、服装、家电和日用品的在线销售。随着公司业务发展和用户规模的不断扩大,现有的网上交易系

13、统无法正常处理日益增大的请求流量,公司决策层决定升级其网上交易系统。在对该系统的升级方案进行设计和讨论时,公司的系统分析师王工提出采用基于高性能主机系统的方法进行系统升级,另外一位系统分析师李工则提出采用基于负载均衡集群的方法进行系统升级。公司的分析师和架构师对这两种思路进行讨论与评估,最终采纳了李工的方法。 12 请从系统的可用性、可伸缩性和应用特点三个方面说明公司为何没有采用王工提出的方法。 13 负载均衡通常分为传输层负载均衡和应用层负载均衡两类。请基于这种分类方式,说明基于 DNS的负载均衡方法和基于 HTTP重定向服务器的负载均衡方法分别属于哪类负载均衡方法,并用 200字以内的文字

14、说明这两种方法实现负载均衡的方式。 14 在确定使用基于负载均衡集群的系统升级方法后,李工给出了一个基于LVS(LinuxVirtual Server)的负载均衡集群实现方案。公司的系统分析师在对现有系统进行深入分析的基础上, 认为以下两个实际情况对升级方案影响较大,需要对该方案进行改进。 1系统需要为在线购物提供购物车功能,用来临时存放选中的产品。 2系统需要保证向所有的 VIP用户提供高质量的服务。 针对上述描述,首先说明每种情况分别会引入哪些与负载均衡相关的问题,并用200字以内的文字说明针对不同的问题,应该如何改进李工的解决方案。 2010年上半年软件水平考试(高级)系统分析师下午(案

15、例分析)试题真题试卷答案与解析 1 【正确答案】 PIECES框架是系统非功能性需求分类的技术,对各种类型的需 求进行分类使得类似的需求可以组织起来达到汇报、跟踪和验证的目的,还可能帮助确定可能忽略的需求。 (a) (2)(3) (b) (8) (c) (4) (d) (5) (e) (1) (f) (6)(7) 【试题解析】 PIECES框架是系统非功能性需求分类的技术,对各种类型的需求进行分类使得类似的需求可以组织起来达到汇报、跟踪和验证的目的,还可能帮助确定可能忽略的需求。 James Wetherbe提出的 PIECES框架能够完整、准确、快速地确定 信息系统的需求,确认业务中存在的问

16、题、机会和改进目标。包括性能 (Perforanance)、信息 (Information)、经济 (Economics)、控制 (Control)、效益(Efficiency)和服务 (Service)6个类别。 本题要求考生熟悉 PIECES框架中不同需求类型之间的差异,能够根据实际应用需求判断需求的类别。 (1)“降低使用资源的成本 ”是提高效益的方法。 (2)、 (3)“吞吐率 ”和 “响应时间 ”属于系统性能指标。 (4)“减少开支和增加收益 ”是系统经济 性指标。 (5)“用户隐私 ”属于安全性控制的内容。 (6)“可靠性和可用性 ”是系统所提供服务的质量属性。 (7)“文档和培训

17、材料 ”是为用户提供的服务。 (8)“外部系统的接口 ”说明系统与外界交互的信息需求。 2 【正确答案】 (g)和 (h) (2)和 (7) (i)和 (j) (3)和 (4) (k)和 (l) (6)和 (8) (m) (5) (n) (1) 【试题解析】 鱼骨图主要应用于问题的因果分析,是一种用于确 定、探索和描述问题及其原因和结果的图形工具,它也经常被称为因果图。一般会将产生问题的原因分为人、方法、合同、材料和策略 5个方面。 本题要求考生熟悉鱼骨图中不同类型原因之间的差异,能够根据实际应用问题判断产生该问题的原因的类别。 (1)“措施 ”属于系统开发策略的范畴。 (2)“会员没有得到通

18、知 ”是相关人员工作没有完成。 (3)、 (4)“没有催单警告用户 ”、 “没有跟踪执行情况 ”是所采用的方法不正确。 (5)“成本太高价 ”是所购买材料价格高。 (6)“合同履行缺乏灵 活性 ”是合同执行的问题。 (7)“财务问题或隐瞒相关内容 ”属于财务人员工作问题。 (8)“价格太高无法修改 ”是指合同中价格条款。 3 【正确答案】 一份需求定义文档可能是项目文档中被阅读和引用得最多的文档。应该包含以下内容:系统应该提供的功能和服务;非功能需求,包括系统的特征、特点和属性;限制系统开发或者系统运行必须遵守的约束条件;系统必须连接的其他系统的信息。 系统所有者和用户使用需求定义文档来确认需

19、求以及任何可能产生的变化,并作为验收的依据;系统分析人员、设计人员和构造人员使 用它来理解需要什么以及处理需求变更,开发用于验证系统的测试用例;项目经理使用它作为制定项目计划、处理变更及验收的依据。 【试题解析】 本题要求考生能够准确掌握需求定义文档的组成部分,和需求定义文档对不同的系统开发关联人员对其工作的具体作用。 4 【正确答案】 1数据分布及状态详细调查 (或者数据梳理 )。 2各政府部门业务流程以及信息系统使用情况调查。 3统一的数据标准规范研究。 4指标计算模型研究,确定各个指标的输入数据。 5提出数据管理 (采集、存储、使用、 维护等 )工作流程方案。 6获取有关部门宏观经济数据

20、的具体应用需求。 【试题解析】 问题 1说明中指出了该市的基础信息平台很完善 (网络、存储和计算平台 ),因此 B公司在进行原形分析时,主要分析的不是数据库的运行平台,而是数据的生产、数据的存储、数据的消费 (应用 )、标准规范等情况。 5 【正确答案】 需要建设一个集中的数据库作为核心数据库。主要理由: 1数据分布广,同一数据类或数据项存在信息冗余和不一致的情况,应用前需要比对和清洗,整理后的数据应存放于核心数据库。 2宏观经济 信息的实时性要求不高,以集中的统一的核心数据库为基础,提供经济信息服务,形成的经济指标更加科学。 【试题解析】 对于 “物理分散,逻辑集中 ”的数据库,在进行逻辑集

21、中的时候,要对数据进行整合,消除数据的不一致性,而且宏观经济数据库的应用没有实时性要求,为便于计算模型获得口径一致的输入数据,应该建设一个集中的数据库。 6 【正确答案】 1输入参数的时间戳不一致,或者时间段口径不一致。 2数据不符合统一的标准,或者数据标准不一致 (如投资主体的代码在不同的系统中不一致 )。 3数据来源单位的数据没有及时更新,或者不全。 4存在无效数据,如某个投资主体有误或不存在。 【试题解析】 指标差别大,主要是因为数据的不一致性造成的,产生不一致性的原因可能包括数据的时间戳、标准等。 7 【正确答案】 (1)OSLoader (2)操作系统 (3)应用 (4)恢复 带数据

22、恢复星型信任模型的特点: (1)可信测量根被保护,安全性更高。 (2)具有数据恢复功能,安全性更高。 (3)都是一级测量,没有多级信任传递,信任损 失少。 【试题解析】 可信计算组织的信任链采用了一种链式的信任测量模型,即由RTM(可信测量根 )BIOSOSLoaderOS 构成一个串行链。由于采用了一种迭代计算哈希值的方式,即将现值与新值相连,再计算哈希值并作为新的完整性度量值存储起来。 链式信任链具有如下缺点:信任链越长,信任损失的可能性就越大。在链中加入或删除一个部件, PCR的值需要重新计算,很麻烦。信任链中的软件部件可能会更新 (如 BIOS升级, OS打补丁等 ),而 PCR的值也

23、得重新计算,这样一来使得部件更新工作很麻烦。 它 将可信测量根置入可信平台模块内部 NVRAM(Non-VolatileRandom AccessMemory,非易失性随机访问存储器 ),在信任链中增加了数据恢复功能,并将信任链延伸到应用。与可信计算组织的链式信任链相比,该模型具有如下特点:可信测量根被保护,安全性更高;具有数据恢复功能,安全性更高;都是一级测量,没有多级信任传递,信任损失少。但是,所有测量都由可信测量根执行,可信测量根通过可信平台模块完成任务,这使得可信平台模块负担加重。 在可信计算的信任链中应当度量的是可信性。但是,由于可信性目前尚 不易直接度量,所以可信计算组织在信任链中

24、采用的是度量数据完整性,而且是通过校验数据哈希值的方法来度量数据的完整性。但是,可信 可靠 +安全,完整性 可信性,完整性可信性,即完整性只是可信性中的一个侧面。 由于可信计算组织在信任链中采用的是度量数据完整性,因此它能确保数据的完整性,确保 BIOS、 OSLoader和 OS数据的完整性。但是完整性只能说明这些软件没有被修改,并不能说明这些软件没有安全缺陷,更不能确保这些软件在运行时的安全性。基于数据完整性的度量是一种静态度量,基于软件行为的动态度量更实用。 8 【正确答案】 【试题解析】 编译器作为重要的系统软件,其可信性对于整个计算机系统的可信具有重要意义。如果编译器不可信,则很难保

25、证其他软件的可信性。软件的可信性很大程度上依赖于程序代码的可信性,影响软件可信性的主要因素包括来自软件内部的代码缺陷、代码错误、程序故障以及来自软件外部的病毒、恶意代码等。因此,从代码角度来保证软件的可信性是实现可信软件的重要途径之一。 可信编译的目标就是从编译的角度保证软件的可信性,主要包括两方面含义,一方面,必须保证编译器自身是可信的。即必须保证整个编译操作 的可信性,保证编译器在编译过程中不会给编译处理对象带来任何安全性问题,防止恶意攻击者通过修改编译器,在编译过程中对代码的原始语义进行篡改,影响程序代码本身的可信性;另一方面,必须保证编译器编译所得程序可执行代码是可信的,即编译器必须保

26、证,通过其编译生成的程序代码是安全和可靠的。 编译器白身的可信性主要是指其编译过程的正确性、安全性和可靠性。一般认为,通过形式化验证的系统具有较高的可信性,可将形式化方法用于编译器本身。通过在传统编译操作的基础上加入代码安全性加强机制、代码可信性验证机制及可执行代码保护 机制等三种机制,来保证编译所产生代码的可信性。 (1)代码安全性加强机制:该机制主要用于识别和处理程序中常见的一些安全漏洞。目前已提出许多针对程序常见安全漏洞的编译处理技术,具有代表性的如针刈缓冲区溢出攻击的 StackGuard方法等。 (2)代码可信性验证:该机制不可能解决所有的代码安全性问题。对于可信性要求较高的程序代码

27、,必须通过形式化方法对其进行可信性验证。因此,我们提出在代码安全性加强机制对代码进行安全加强之后,通过代码可信性验证机制对代码的可信属性进行验证,对未通过验证的非可信代码 进行报警或其他处理。这样,通过代码安全性加强和可信性验证相结合的方法保证编译生成可执行代码的可信性。 (3)可执行代码保护机制:为了防止攻击者对可信编译器最终生成的可执行代码进行恶意攻击或修改,可信编译器在完成编译之后,对可执行代码实施保护机制,保护编译所得可执行代码的完整性、秘密性和可用性,从而确保系统最终执行代码的可信运行。 9 【正确答案】 数据仓库集成是把多种来源的数据集中在一起,建立数据仓库,所有数据都驻留在单个数

28、据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数据 处理过程中强调分析。其特点是: (1)集成的数据。 (2)面向主题。 (3)数据相对稳定。 (4)包含历史信息。 联邦数据库集成是把多个数据库系统联合在一起,构成 “联邦数据库系统 ”,数据库之间通过接口查询,互相通信,数据分布在不同地方的计算机或数据库服务器上,通过网络连接。其特点是: (1)联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的 实际情况。 (2)异构数据源不仅仅是数据库系统,通过中间

29、件,可以扩展到传感器、文件和应用程序等。 【试题解析】 本问题考查数据仓库和联邦数据库集成方案的基本概念。数据仓库集成是把多种来源的数据集中在一起,建立数据仓库,所有数据都驻留在单个数据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数据处理过程中强调分析。其特点是: 集成的数据; 面向主题; 数据相对稳定; 包含历史信息。但是此种集成方法中需要将数据源的数据转换为数据仓库中的语义,而且需要定期的数据复制和数据更新。数据 源往往指的是数据库系统。 联邦数据库集成是把多个数据库系统联合在起,构成 “联邦数据库系统 ”,数据库之间通过接口查询,互相通信,数据分布在不同地方的计算机

30、或数据库服务器上,通过网络连接。其特点是: 联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的实际情况。 异构数据源不仅仅是数据库系统,通过中间件,可以扩展到传感器、文件和应用程序等。 两种方式都需要将数据源中的数据语义 转换为统一数据语义,这种转换往往存在不确定性。 10 【正确答案】 此类数据往往是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,因此应该采用 Web内容提取 (挖掘 /文本挖掘 )的集成方法来获取对应供应商的产品信息。 其基本步骤为: (1)

31、分析页面,确定其页面中的数据模式。 (2)抓取页面,通过爬虫技术获取对应的网页。 (3)特征提取与处理,获取相应数据。 (4)数据清洗,根据规则进行判断,抛弃异常数据。 (5)数据转换,根据预先定义好的语义映射关 系,将数据转换为统一格式。 【试题解析】 本问题考查 Web内容提取或 Web数据挖掘的相关知识。 Web信息系统中的数据往往是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,但是其数据呈现是嵌入在页面中。因此需要采用 Web内容提取 (挖掘 /文本挖掘 )的集成方法来获取对应供应商的产品信息。 其基本的步骤是: (1)分析页面,确定其页面中的数据模式。制定数据挖掘的特征

32、和提取规则,编写特定的页面分析和数据提取程序。 (2)抓取页面,通过爬虫技术获取对应的网页。将远端的页面下载到 本地进行存储,为后续数据提取做准备。 (3)特征提取与处理,获取相应数据,依据的原则是分析页面阶段所形成的特征和提取规则。 (4)数据清洗,根据规则进行判断,抛弃异常数据。 (5)数据转换,根据预先定义好的语义映射关系,将数据转换为统一格式。 Web内容提取的算法程序本身是近似的,因此在获取数据的内容上存在不确定性。 11 【正确答案】 数据集成系统依靠模式映射来指明数据源中的数据和中介所用数据之间的语义关系,但映射过程中可能发生不确定性,其原因有: (1)数据源与 中介模式之间的语

33、义映射可能是近似的。 (2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。 (3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是 “大致可用 ”,所取得的数据可能是不确定的。 【试题解析】 本问题考查在数据集成过程存在的不确定性问题。问题 1和问题 2中实际已经明确了集成过程中存在不确定性。主要的原因在于数据集成系统依靠模式映射来指明数据源中的数据和中介所用数 据之间的语义关系,但映射过程中可能发生不确定性。具体原因有: (1)数据源与中介模式之间的语义映射可能是近似的。实际

34、系统中往往很难有非常精确、完整的语义映射。 (2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。 (3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是 “大致可用 ”,所取得的数据可能是不确定的。 因此,在本试题中,无论采用数据仓库或者联邦数据库集 成方案,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。 12 【正确答案】 王工提出的方案是采用高性能的主机系统实现系统升级。从可用性角度看,采用高性能的主机系统很难实现系统的冗余机制,当发生故障后会导致整个系统

35、会失去响应能力,从而无法保证系统的高可用性;从可伸缩性角度看,采用高性能的主机系统,升级服务器的成本与获得的相应能力不成比例,整个系统的可扩展性较差;从应用特点来看, Internet中的 Web应用绝大多数是简单任务、高强度的并发处理,而主机系统只是对于复杂单一任务和有限的并发处 理具有高性能,不能同时处理大量的并发请求。因此,公司没有采用王工的方案。 【试题解析】 本问题考查 Web应用系统升级时的方案选择问题。在 Web应用中,服务器的处理能力和 IO已经成为提供应用服务的瓶颈。由于涉及的信息量非常大,用户访问频率也高,许多基于 Web的大型应用系统每秒钟需要处理上百万个甚至更多的请求。

36、显然单台服务器有限的性能难以解决这个问题。 为了解决上述问题,采用高性能的主机系统 (小型机或大型机 )是可行的。但是,除了其价格昂贵、可扩展性差以外,这种主机系统在很多情况 _卜也不能同时处理上 百万个并发的请求。因为高速主机系统只是对于复杂单一任务和有限的并发处理显得高性能,而 Internet中的 Web应用绝大多数处理是简单任务、高强度并发处理。因此,即便有大量资金投入,采用高性能、高价格的主机系统,也不能满足 Web应用的需要。 13 【正确答案】 基于 DNS的负载均衡属于传输层负载均衡技术,其主要原理是在 DNS服务器中为同一个主机名配置多个地址,在应答 DNS查询时, DNS服

37、务器对每个查询将以 DNS文件中主机记录的 IP地址按顺序返回不同的解析结果,将客户端的访问引导到不同的节点上去,使得不同的 客户端访问不同的节点,从而达到负载均衡的目的。 基于 HTTP重定向服务器的负载均衡属于应用层负载均衡技术,其主要原理是服务器使用 HTTP重定向指令,将一个客户端重新路由到另一个位置。服务器返回一个重定向响应,而不是返回请求的对象。客户端确认新地址然后重发请求,从而达到负载均衡的目的。 【试题解析】 本问题主要考查负载均衡技术的分类和两种具体方法的掌握。负载均衡技术是集群系统中一项重要技术,可以提高集群系统的整体处理能力,也提高了系统的可靠性,最终目标是加快集群系统的

38、响应速度,提高客户端访问的成功概率。 负载均衡通常分为传输层负载均衡和应用层负载均衡两类。基于 DNS的负载均衡属于传输层负载均衡技术,其主要原理是在 DNS服务器中为同一个主机名配置多个地址,在应答 DNS查询时, DNS服务器对每个查询将以 DNS文件中主机记录的 IP地址按顺序返回不同的解析结果,将客户端的访问引导到不同的节点上去,使得不同的客户端访问不同的节点,从而达到负载均衡的目的。基于 HTTP重定向服务器的负载均衡属于应用层负载均衡技术,其主要原理是服务器使用HTTP重定向指令,将一个客户端重新路由到另一个位置。服务器返回一个 重定向响应,而不是返回请求的对象。客户端确认新地址然

39、后重发请求,从而达到负载均衡的目的。 14 【正确答案】 第一种情况的描述说明系统需要提供应用会话数据支持。通常采用会话服务器机制在服务器端存放应用会话数据。但需要注意的是,应用会话数据大多数情况下是不可恢复的,因此采用支持应用会话数据容错的解决方案非常重要。 第二种情况的描述要求保证特定用户的服务质量。当数据量不断增长时,由于在会话服务器或缓存服务器,业务服务器和会话 (或缓存 )服务器之间可能会反复移动较大量的数据,从而无法保证服务质量。因此, 通常的做法是基于应用层负载均衡器实现客户端联系,将某个客户端的所有请求转发到相同的服务器,使得一个用户会话的所有请求被同一服务器实例处理,从而保证

40、服务质量。 【试题解析】 主要考查负载均衡技术的实际应用。在实际应用中,通常会将传输层负载均衡方法与应用层负载均衡方法结合起来使用,以提高系统整体的性能、可用性和可靠性。 题干描述中,第一种情况的描述说明系统需要提供应用会话数据支持。通常采用会话服务器 (session server)机制在服务器端存放应用会话数据。但需要注意的是,应用会话数据大多数情 况下是不可恢复的,因此采用支持应用会话数据容错的解决方案非常重要。 第二种情况的描述要求保证特定用户的服务质量。当数据量不断增长时,由于在会话服务器或缓存服务器,业务服务器和会话 (或缓存 )服务器之间可能会反复移动较大量的数据,从而无法保证服务质量。因此,通常的做法是基于应用层负载均衡器实现客户端联系 (client affinity),将某个客户端的所有请求转发到相同的服务器上,使得一个用户会话的所有请求被同一服务器实例处理,从而保证服务质量。

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1