1、数据库新技术、数据仓库和数据挖掘及答案解析(总分:100.00,做题时间:90 分钟)一、B选择题/B(总题数:39,分数:40.00)1.在分布式数据库系统中,一般不适合作为衡量查询代价依据的是_。 A.CPU 代价 B.I/O 代价 C.通信代价 D.存储代价(分数:2.00)A.B.C.D.2.在分布式数据库的数据分配策略中,若全局数据存在多个副本,且在每个物理场地都保存一个完整的数据副本,则该策略属于_。 A.集中式策略 B.分割式策略 C.全复制式策略 D.混合式策略(分数:1.00)A.B.C.D.3.关于分布式数据库的分布策略,下述说法正确的是_。 A.数据分配是对关系的操作,数
2、据分片是对数据分配的操作 B.集中式数据分配策略不便于进行数据控制 C.全复制式数据分配策略可靠性高,响应速度快,但数据冗余大,同步维护复杂 D.分割式数据分配策略对全局数据控制灵活,但对局部数据存取效率低(分数:1.00)A.B.C.D.4.关于分布式数据库系统,下述说法正确的是_。 A.查询代价主要考虑 CPU 代价和 I/O 代价 B.分布透明性是指用户需要并能完全看清数据分片的位置、分片的分配位置及数据复制的过程 C.分布式查询优化一般不需要考虑操作的执行顺序和数据在不同场地间的传输顺序 D.执行分布式数据查询时,导致数据传输量大的主要原因是数据间的连接操作和并操作(分数:1.00)A
3、.B.C.D.5.最高级别的分布透明性是_。 A.分片透明性 B.位置透明性 C.局部数据模型透明性 D.分布透明性(分数:1.00)A.B.C.D.6.在面向对象模型中,根据可继承父类个数通常把继承分为两种:单继承和多重继承,单继承的层次结构图是_。 A.树 B.无向图 C.有向图 D.二叉树(分数:1.00)A.B.C.D.7.关于并行数据库结构,以下说法错误的是_。 A.在共享内存结构的系统中,如果处理器数量过多,容易造成内存访问冲突 B.在共享磁盘结构的系统中,所有处理机都没有独立的主存储器,并且通过网络共享磁盘 C.在无共享结构的系统中,每个处理机拥有独立的主存储器和磁盘,不共享资源
4、 D.层次结构综合了共享内存、共享磁盘和无共享结构的特点(分数:1.00)A.B.C.D.8.关于并行数据划分策略,下列说法错误的是_。 A.散列划分采用某种散列函数,以数据的划分属性作为函数参数,计算数据应存储的磁盘序号 B.范围划分根据某个属性的取值,将数据划分为 n 个部分,分别存储到不同的磁盘上 C.范围划分有利于范围查询和点查询,但也可能会引起数据分布不均匀及并行处理能力下降等问题 D.轮转法划分能保证元组在多个磁盘上的平均分配,并具有较高的点查询和范围查询效率(分数:1.00)A.B.C.D.9.在支撑繁忙业务的并行数据库系统中,有一个数据量很大的表 T(a1,a2,a n),对该
5、表的查询多数为针对主码 a1的范围查询和点查询。为了改善查询性能,需要对该表进行划分。关于该表的划分和应用策略,下列说法错误的是_。 A.采用轮转法对 T 中的元组进行划分,这样使数据均匀分布,适合于点查询和范围查询 B.以 a1为划分属性,对 T 采用散列划分是一种可行的划分方法,有利于对该表的点查询 C.以 a1为划分属性,对 T 采用范围划分并建立索引,是一种有效的划分方法 D.以 a1为划分属性,对 T 采用散列划分和范围划分都有可能带来 T 的各个数据分区的数据分布不均匀的问题(分数:1.00)A.B.C.D.10.一个典型的分布式数据库管理系统包括_。全局数据库管理系统(GDBMS
6、) 全局数据字典(GDD)局部数据库管理系统(LDBMS) 通信管理(CM) A. B. C. D.(分数:1.00)A.B.C.D.11.用户编写程序时只需对全局关系进行操作,这种最高级别的分布透明性是_。 A.分片透明性 B.位置透明性 C.局部数据模型透明性 D.分布透明性(分数:1.00)A.B.C.D.12.在分布式数据库系统中,查询代价是由_来衡量的。 A.CPU 代价 B.I/O 代价 C.通信代价 D.以上全部(分数:1.00)A.B.C.D.13.分布式数据库系统中分片模式和分配模式均是_。 A.全局的 B.局部的 C.分布的 D.集中的(分数:1.00)A.B.C.D.14
7、.如果一个对象可以是由其他的若干对象组合而成,即一个对象的属性也可以是一个对象,我们称之为_。 A.对象的嵌套 B.滞后联编 C.对象的继承 D.对象的封装(分数:1.00)A.B.C.D.15.以下关于封装说法错误的是_。 A.每一个对象是其状态和行为的封装 B.状态是该对象一系列属性的集合 C.行为是在对象状态上操作的集合 D.封装的目的是将对象的使用者和设计者合并(分数:1.00)A.B.C.D.16.对象一关系数据库系统的特点包括_。扩充数据类型支持复杂对象支持继承的概念提供通用的规则系统 A. B. C. D.(分数:1.00)A.B.C.D.17.关于数据划分策略,下述说法错误的是
8、_。 A.散列划分采用某种散列函数,以数据的划分属性作为函数参数,计算数据应存储的磁盘序号 B.范围划分根据某个属性的取值,将数据划分为 n 个部分,分别存储到不同磁盘上 C.范围划分有利于范围查询和点查询,但也可能会引起数据分布不均匀及并行处理能力下降问题 D.轮转法划分能保证元组在多个磁盘上的平均分配,并具有较高的点查询和范围查询(分数:1.00)A.B.C.D.18.比较适用于银行出纳等 OLTP 之类应用的并行数据库系统结构是_。 A.共享内存 B.共享磁盘 C.无共享结构 D.层次结构(分数:1.00)A.B.C.D.19.操作型数据和分析型数据是不同的,下列选项中_不属于分析型数据
9、的特点。 A.包括过去的数据 B.生命周期不符合 SDLC C.当前的、准确的 D.分析驱动(分数:1.00)A.B.C.D.20.从联机事务处理(OLTP)环境中抽取数据、建立新的数据分析环境的最初出发点是_。 A.对企业信息系统中的数据进行整理 B.解决企业信息系统中的数据孤岛问题 C.解决企业基本业务应用和数据分析应用之间的性能冲突问题 D.解决企业信息系统中的蜘蛛网问题(分数:1.00)A.B.C.D.21.关于数据仓库的特性,下列说法正确的是_。 A.面向主题的特征是指在组织数据仓库数据时,需要将各种分析需求归类并抽象,形成相应的分析应用主题,并根据分析应用主题的数据需求设计和组织数
10、据 B.集成特征是指需要将业务系统中的所有数据抽取出来,载入到数据仓库中 C.集成特性是指需要将企业整个架构中的各个数据和应用集中到数据仓库中 D.随时间变化性是指数据仓库中的每个数据单元一般都有时间标志,且其中各种数据(包括原始数据)会随时间变化被经常修改(分数:1.00)A.B.C.D.22.下列 ODS 体系不是根据数据更新的速度来划分的是_。 A.ODS B.ODS C.ODS D.ODS(分数:1.00)A.B.C.D.23.关于数据仓库设计,下述说法正确的是_。 A.数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计 B.在进行数据仓
11、库主题数据模型设计时,应该按面向部门业务应用的方式来设计数据模型 C.在进行数据仓库主题数据模型设计时要强调数据的集成性 D.在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域(分数:1.00)A.B.C.D.24.给定如下 3 个关系表:销售明细表(商品标识,销售时间,单价,数量,金额)日销售表(商品标识,销售日,总数量,总金额)月销售表(商品标识,销售月份,总数量,总金额)下述说法正确的是_。 A.销售明细表的数据粒度最大,数据量最大 B.日销售表的数据粒度最大,数据量最小 C.月销售表的数据粒度最大,数据量最小 D.月销售表的数据粒度最小,数据量最
12、小(分数:1.00)A.B.C.D.25.数据仓库的维护策略包括_。实时维护 延时维护 快照维护 A. B. C. D.(分数:1.00)A.B.C.D.26.OLAP 的基本概念包括维、维的层次等,其中维是_。 A.决策者所关心的具有实际意义的数量 B.人们观察数据的特定角度 C.细节程度不同的多个描述方面 D.数组的取值(分数:1.00)A.B.C.D.27.下列关于数据仓库的叙述中,哪一个是不正确的_。 A.数据仓库通常采用三层体系结构 B.底层的数据仓库服务器一般是一个关系型数据库系统 C.数据仓库中间层 OLAP 服务器只能采用关系型 OLAP D.数据仓库前端分析工具中包括报表工具
13、(分数:1.00)A.B.C.D.28.数据挖掘的目的在于_。 A.从已知的大量数据中统计出详细的数据 B.从已知的大量数据中发现潜在的规则 C.对大量数据进行归类整理 D.对大量数据进行汇总统计(分数:1.00)A.B.C.D.29.在超市所从事的信息活动中,下列哪种属于挖掘时间序列模式_。 A.针对匿名客户,记录其购买某种商品时与该商品有关的优惠 B.针对注册客户,分析他们的购买,向他们设定下次可能购买的优惠规则 C.针对所有客户,对其货篮子里的商品进行分析 D.针对注册客户,进行客户分类,确定重要客户及服务对策(分数:1.00)A.B.C.D.30.数据挖掘和_是同义词。 A.系统工程
14、B.操作处理 C.知识发现 D.规范化处理(分数:1.00)A.B.C.D.31.许多大中型企业出于多种原因建立了数据仓库,以下哪项不是建立数据仓库的合理理由_。 A.充分利用企业信息系统生成的数据 B.把企业的各种应用系统集中在一起 C.解决企业基本业务应用和数据分析应用之间的性能冲突问题 D.以面向主题、集成的方式合理组织数据,实现跨专业视图(分数:1.00)A.B.C.D.32.数据仓库通过数据转移从多个数据源中提取数据,为了解决不同数据源格式上的不统一,需要进行_操作。 A.简单转移 B.清洗 C.集成 D.聚集和概括(分数:1.00)A.B.C.D.33.下列有关数据仓库数据的说法错
15、误的是_。 A.数据细化程度越高,粒度就越小 B.数据仓库是一种存储技术,包含了大量的历史数据、当前的详细数据及综合数据 C.为了特定的应用从数据仓库中独立出来的数据称为数据集市 D.数据仓库分割必须在系统层完成(分数:1.00)A.B.C.D.34.下面不是数据仓库基本特征的是_。 A.数据相对稳定 B.包括当前准确数据 C.数据反映历史变化 D.面向主题(分数:1.00)A.B.C.D.35.数据仓库与操作型数据库之间的主要区别是_。 A.数据仓库没有概念模型 B.数据仓库没有逻辑模型 C.数据仓库没有物理模型 D.数据仓库在物理实现上对 I/O 要求更高(分数:1.00)A.B.C.D.
16、36.关于 DSS 的说法,下列不正确的是_。 A.DSS 是在系统工程基础上发展起来的 B.在三部件结构 DSS 的基础上增加知识库,形成了智能 DSS C.新 DSS 是以 DB 为基础,将 DW、OLAP、DM 集成到一个系统内形成的系统 D.新 DSS 以数据驱动方式提供决策支持,数据是主体,模型是辅助的(分数:1.00)A.B.C.D.37.有关 OLAP 和 OLTP 的正确描述是_。 A.OLAP 面向操作人员,OLTP 面向决策人员 B.OLAP 使用历史性的数据,OLTP 使用当前数据 C.OLAP 经常对数据进行插入、删除等操作,OLTP 仅对数据进行汇总和分析 D.OLA
17、P 不会从已有数据中发掘新的信息,而 OLTP 可以(分数:1.00)A.B.C.D.38.在为业务繁忙的企业的多个部门服务的数据库系统中,同时开展各部门的 OLTP 业务和数据分析业务会给数据库系统带来性能冲突,下列方案中无法从根本上解决性能冲突的是_。 A.抽取出各部门所需要的分析数据,建立各部门的数据集市,将数据分析业务转移到数据集市中 B.抽取出企业所有分析功能所需的分析数据,建立统一的企业级数据仓库环境,将企业的大部分分析业务转移到数据仓库环境中 C.抽取出企业的近期业务数据,建立操作型数据存储(ODS),将一些快速分析业务转移到操作型数据存储中 D.不建立新的数据存储体系,在基本业
18、务处理时间内开展 OLTP 业务,在其余时间开展分析业务(分数:1.00)A.B.C.D.39.联机分析处理包括以下哪些基本分析功能_。聚类 切片 旋转 切块 A.、和 B.、和 C.、和 D.都是(分数:1.00)A.B.C.D.二、B应用题/B(总题数:13,分数:60.00)40.定义并解释 OO 模型中以下核心概念:对象与对象标识、封装、类、类层次。(分数:5.00)_41.什么是单继承?什么是多继承?继承性有什么优点?(分数:5.00)_42.分布式数据库系统有什么特点?(分数:5.00)_43.试述分布式数据库系统的模式结构。(分数:5.00)_44.什么是数据分片?有几种分片方式
19、?有什么优点?与数据分配如何区别?(分数:5.00)_45.试述分布透明性的内容。(分数:5.00)_46.什么是同构型 D-DBMS?什么是异构型 D-DBMS?(分数:5.00)_47.试述下列概念:两段提交协议、分布式事务的原子性、全局死锁。(分数:5.00)_48.在分布式数据库系统中,对多副本的封锁有几种解决方法?(分数:4.00)_49.并行数据库系统有哪几种体系结构?试比较它们的特点。(分数:4.00)_50.试述数据划分在并行查询处理中的重要性。(分数:4.00)_51.并行数据库系统中有哪几种数据划分方法?(分数:4.00)_52.试述并行数据库系统与分布式数据库系统的区别。
20、(分数:4.00)_数据库新技术、数据仓库和数据挖掘答案解析(总分:100.00,做题时间:90 分钟)一、B选择题/B(总题数:39,分数:40.00)1.在分布式数据库系统中,一般不适合作为衡量查询代价依据的是_。 A.CPU 代价 B.I/O 代价 C.通信代价 D.存储代价(分数:2.00)A.B.C.D. 解析:解析 在分布式数据库系统中,有两种不同的目标来考虑查询优化:一是以总代价最小为标准,总代价除了考虑 CPU 代价和 I/O 代价外,还包括通过网络在站点间传输数据或信息的代价;二是以每个查询的响应时间最短为标准。因此分布式查询优化准则可以总结为:使通信费用最低和响应时间最短,
21、即以最小的总代价在最短的响应时间内获得所需要的数据。很显然,答案 D 不适合分布式数据库系统作为查询代价的依据。2.在分布式数据库的数据分配策略中,若全局数据存在多个副本,且在每个物理场地都保存一个完整的数据副本,则该策略属于_。 A.集中式策略 B.分割式策略 C.全复制式策略 D.混合式策略(分数:1.00)A.B.C. D.解析:解析 分布式数据库的数据分配策略分为 4 种,其中集中式策略是指所有数据片段都安排在同一个场地上;分割式策略是指所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上;全复制式策略是指数据在每个场地重复存储,也就是每个场地上都有一个完整的
22、数据副本;混合式策略是一种介乎于分割式和全复制式之间的分配方式。3.关于分布式数据库的分布策略,下述说法正确的是_。 A.数据分配是对关系的操作,数据分片是对数据分配的操作 B.集中式数据分配策略不便于进行数据控制 C.全复制式数据分配策略可靠性高,响应速度快,但数据冗余大,同步维护复杂 D.分割式数据分配策略对全局数据控制灵活,但对局部数据存取效率低(分数:1.00)A.B.C. D.解析:解析 集中式数据分配策略有利于进行数据控制:分割式数据分配策略对局部数据控制灵活,但对全局数据存取效率低;全复制式数据分配策略可靠性高,响应速度快,但数据冗余大,同步维护复杂。4.关于分布式数据库系统,下
23、述说法正确的是_。 A.查询代价主要考虑 CPU 代价和 I/O 代价 B.分布透明性是指用户需要并能完全看清数据分片的位置、分片的分配位置及数据复制的过程 C.分布式查询优化一般不需要考虑操作的执行顺序和数据在不同场地间的传输顺序 D.执行分布式数据查询时,导致数据传输量大的主要原因是数据间的连接操作和并操作(分数:1.00)A.B.C.D. 解析:解析 分布式数据库系统查询除了考虑 CPU 代价和 I/O 代价外,还必须重点考虑通过网络在站点间传输数据或信息的代价,也就是通信代价,所以答案 A 说法错误。分布透明性包含分片透明性(用户无须考虑如何数据分片)、位置透明性(用户无须考虑数据分片
24、的分配位置,只需要考虑数据分片情况,不需要了解各分片在各个场地的分配情况)和局部数据模型透明性(用户无须考虑局部场地上数据库支持哪种数据模型),所以答案 B 说法错误。一般来说,分布式查询优化主要考虑 3 个策略:操作的执行顺序、操作的执行算法(主要是连接操作和并操作)及不同场地间数据流动的顺序,因此答案 C 错误。在分布式数据查询中,导致数据传输量大的主要原因是数据间的连接操作和并操作,针对连接操作的优化策略有:基于半连接的优化策略和基于连接的优化策略,因此答案 D 说法正确。5.最高级别的分布透明性是_。 A.分片透明性 B.位置透明性 C.局部数据模型透明性 D.分布透明性(分数:1.0
25、0)A. B.C.D.解析:解析 分布透明性包含分片透明性、位置透明性、局部数据模型透明性和分布透明性。其中分片透明性是最高级别的透明性,位于全局概念模式与分片模式之间,用户无须考虑数据分片,只需对全局关系进行操作即可,当数据分片改变时,应用程序不会受到影响。由此可见答案 A 为正确选项。6.在面向对象模型中,根据可继承父类个数通常把继承分为两种:单继承和多重继承,单继承的层次结构图是_。 A.树 B.无向图 C.有向图 D.二叉树(分数:1.00)A. B.C.D.解析:解析 在面向对象模型中,根据可继承的父类个数把继承分为单继承和多重继承,其中单继承的层次结构图是一棵树,多重继承的层次结构
26、图是一个带根的有向无回路图。继承性是数据间概化/特化联系,实现了代码重用,避免了许多重复的定义;同时也是建模的有效工具,能够对现实世界进行简明、精确的描述。由此可见答案 A 为正确选项。7.关于并行数据库结构,以下说法错误的是_。 A.在共享内存结构的系统中,如果处理器数量过多,容易造成内存访问冲突 B.在共享磁盘结构的系统中,所有处理机都没有独立的主存储器,并且通过网络共享磁盘 C.在无共享结构的系统中,每个处理机拥有独立的主存储器和磁盘,不共享资源 D.层次结构综合了共享内存、共享磁盘和无共享结构的特点(分数:1.00)A.B. C.D.解析:解析 共享内存结构由多个处理机、一个共享内存(
27、主存储器)和多个磁盘存储器构成,多个处理机和共享内存由高速通信网络连接,每个处理机可直接存取一个或多个磁盘,即所有内存与磁盘为所有处理机共享;共享磁盘结构由多个具有独立内存(主存储器)的处理机和多个磁盘构成,每个处理机都可以读/写磁盘,多个处理机和磁盘存储器由高速通信网络连接;无共享资源结构由多个处理节点构成,每个处理节点具有自己独立的处理机、内存(主存储器)和磁盘存储器,多个处理机节点由高速通信网络连接;层次结构综合了共享内存、共享磁盘和无共享资源结构的特点。很显然,答案 B 说法错误。8.关于并行数据划分策略,下列说法错误的是_。 A.散列划分采用某种散列函数,以数据的划分属性作为函数参数
28、,计算数据应存储的磁盘序号 B.范围划分根据某个属性的取值,将数据划分为 n 个部分,分别存储到不同的磁盘上 C.范围划分有利于范围查询和点查询,但也可能会引起数据分布不均匀及并行处理能力下降等问题 D.轮转法划分能保证元组在多个磁盘上的平均分配,并具有较高的点查询和范围查询效率(分数:1.00)A.B.C.D. 解析:解析 散列法依据某个属性使用一个随机函数进行 Hash,根据 Hash 所得结果来决定元组所在的片段。轮转法将前 N 个元组依次分配给 N 个磁盘后,再从第 N+1 个元组开始依次分配,如此往复,直至所有元组被分配完。轮转法是最简单的划分策略,它保证了数据均匀分布在所有磁盘上。
29、对点查询和范围查询的处理非常复杂,但是范围划分法就相当简单,它将查询的执行仅局限于包含相关元组的处理机上,省去了许多并行处理的通信、启动和结束的开销,从而减少了执行时间。9.在支撑繁忙业务的并行数据库系统中,有一个数据量很大的表 T(a1,a2,a n),对该表的查询多数为针对主码 a1的范围查询和点查询。为了改善查询性能,需要对该表进行划分。关于该表的划分和应用策略,下列说法错误的是_。 A.采用轮转法对 T 中的元组进行划分,这样使数据均匀分布,适合于点查询和范围查询 B.以 a1为划分属性,对 T 采用散列划分是一种可行的划分方法,有利于对该表的点查询 C.以 a1为划分属性,对 T 采
30、用范围划分并建立索引,是一种有效的划分方法 D.以 a1为划分属性,对 T 采用散列划分和范围划分都有可能带来 T 的各个数据分区的数据分布不均匀的问题(分数:1.00)A. B.C.D.解析:解析 本题尽管以某一个并行数据库系统案例出现,但其实考查的还是并行数据库系统的数据划分的分类及各自的优缺点。轮转法保证了元组在多个磁盘上的平均分配,最适合于扫描整个关系的应用,在扫描时可以并行地从 n 个磁盘读取数据,负载均衡,充分发挥了并行性;缺点是对于点查询和范围查询的处理非常复杂,因为不知道所要查找的元组具体分布在哪个磁盘上,必须对所有磁盘都进行查找,所以查询效率低。散列划分比轮转法更加适合于点查
31、询,对于顺序扫描关系也是非常高效的;缺点是如果散列函数选择得不合理,则可能会引起数据划分的不均衡。范围划分有利于范围查询及点查询,但是它也可能会引起数据分布不均匀,导致并行处理能力下降。由此可知答案 A 说法错误。10.一个典型的分布式数据库管理系统包括_。全局数据库管理系统(GDBMS) 全局数据字典(GDD)局部数据库管理系统(LDBMS) 通信管理(CM) A. B. C. D.(分数:1.00)A.B.C.D. 解析:11.用户编写程序时只需对全局关系进行操作,这种最高级别的分布透明性是_。 A.分片透明性 B.位置透明性 C.局部数据模型透明性 D.分布透明性(分数:1.00)A.B
32、. C.D.解析:12.在分布式数据库系统中,查询代价是由_来衡量的。 A.CPU 代价 B.I/O 代价 C.通信代价 D.以上全部(分数:1.00)A.B.C.D. 解析:13.分布式数据库系统中分片模式和分配模式均是_。 A.全局的 B.局部的 C.分布的 D.集中的(分数:1.00)A. B.C.D.解析:14.如果一个对象可以是由其他的若干对象组合而成,即一个对象的属性也可以是一个对象,我们称之为_。 A.对象的嵌套 B.滞后联编 C.对象的继承 D.对象的封装(分数:1.00)A. B.C.D.解析:15.以下关于封装说法错误的是_。 A.每一个对象是其状态和行为的封装 B.状态是
33、该对象一系列属性的集合 C.行为是在对象状态上操作的集合 D.封装的目的是将对象的使用者和设计者合并(分数:1.00)A.B.C.D. 解析:16.对象一关系数据库系统的特点包括_。扩充数据类型支持复杂对象支持继承的概念提供通用的规则系统 A. B. C. D.(分数:1.00)A.B.C.D. 解析:17.关于数据划分策略,下述说法错误的是_。 A.散列划分采用某种散列函数,以数据的划分属性作为函数参数,计算数据应存储的磁盘序号 B.范围划分根据某个属性的取值,将数据划分为 n 个部分,分别存储到不同磁盘上 C.范围划分有利于范围查询和点查询,但也可能会引起数据分布不均匀及并行处理能力下降问
34、题 D.轮转法划分能保证元组在多个磁盘上的平均分配,并具有较高的点查询和范围查询(分数:1.00)A.B.C.D. 解析:18.比较适用于银行出纳等 OLTP 之类应用的并行数据库系统结构是_。 A.共享内存 B.共享磁盘 C.无共享结构 D.层次结构(分数:1.00)A.B.C. D.解析:19.操作型数据和分析型数据是不同的,下列选项中_不属于分析型数据的特点。 A.包括过去的数据 B.生命周期不符合 SDLC C.当前的、准确的 D.分析驱动(分数:1.00)A.B.C. D.解析:解析 操作型数据与分析型数据之间的主要区别如表所示。 B操作型数据和分析型数据的区别/B操作型数据分析型数
35、据细节的综合的或提炼的在存取瞬间是准确的代表过去的数据可更新不更新操作需求事先知操作需求事先不道 知道生命周期符合SDLC完全不同的生命周期对性能要求高对性能要求宽松事务驱动分析驱动面向应用面向分析一次操作数据量小一次操作数据量大支持日常操作支持管理需求20.从联机事务处理(OLTP)环境中抽取数据、建立新的数据分析环境的最初出发点是_。 A.对企业信息系统中的数据进行整理 B.解决企业信息系统中的数据孤岛问题 C.解决企业基本业务应用和数据分析应用之间的性能冲突问题 D.解决企业信息系统中的蜘蛛网问题(分数:1.00)A.B.C. D.解析:解析 从联机事务处理环境中抽取数据的主要原因是解决
36、不同类型应用程序之间的性能冲突问题。21.关于数据仓库的特性,下列说法正确的是_。 A.面向主题的特征是指在组织数据仓库数据时,需要将各种分析需求归类并抽象,形成相应的分析应用主题,并根据分析应用主题的数据需求设计和组织数据 B.集成特征是指需要将业务系统中的所有数据抽取出来,载入到数据仓库中 C.集成特性是指需要将企业整个架构中的各个数据和应用集中到数据仓库中 D.随时间变化性是指数据仓库中的每个数据单元一般都有时间标志,且其中各种数据(包括原始数据)会随时间变化被经常修改(分数:1.00)A. B.C.D.解析:解析 面向主题的特性是指将关于主题的数据组织起来分析数据及数据之间的关系。集成
37、是将业务系统中关于主题的数据集中起来,对数据进行一系列预处理。随时间变化的特征体是不进行分析数据更新操作,但数据仓库随时间变化会不断增加、删除、修改数据。22.下列 ODS 体系不是根据数据更新的速度来划分的是_。 A.ODS B.ODS C.ODS D.ODS(分数:1.00)A.B.C.D. 解析:解析 A、B、C 3 种 ODS 是根据数据更新的速度划分的,D 是根据数据来源方向和类型区分的。23.关于数据仓库设计,下述说法正确的是_。 A.数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计 B.在进行数据仓库主题数据模型设计时,应该按面向
38、部门业务应用的方式来设计数据模型 C.在进行数据仓库主题数据模型设计时要强调数据的集成性 D.在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域(分数:1.00)A.B.C. D.解析:解析 数据仓库设计的主要目的在于建立数据仓库环境,强调数据的集成性。24.给定如下 3 个关系表:销售明细表(商品标识,销售时间,单价,数量,金额)日销售表(商品标识,销售日,总数量,总金额)月销售表(商品标识,销售月份,总数量,总金额)下述说法正确的是_。 A.销售明细表的数据粒度最大,数据量最大 B.日销售表的数据粒度最大,数据量最小 C.月销售表的数据粒度最大,数据
39、量最小 D.月销售表的数据粒度最小,数据量最小(分数:1.00)A.B.C. D.解析:解析 粒度是数据仓库的数据单位中保存数据的细化或综合程度级别,粒度越大,数据的细节程度越低,综合程度越高,数据存储量就越小。月销售表中保存按月统计的销售数据,综合程度最高,数据粒度最大。25.数据仓库的维护策略包括_。实时维护 延时维护 快照维护 A. B. C. D.(分数:1.00)A.B.C.D. 解析:解析 数据仓库中数据的维护策略分为实时维护、延时维护和快照维护 3 种。26.OLAP 的基本概念包括维、维的层次等,其中维是_。 A.决策者所关心的具有实际意义的数量 B.人们观察数据的特定角度 C
40、.细节程度不同的多个描述方面 D.数组的取值(分数:1.00)A.B. C.D.解析:解析 维是一种类型划分,是从观察数据的视角出发的。维的层次是指在观察数据的某个特定角度时可以存在细节程度不同的多个描述方面。27.下列关于数据仓库的叙述中,哪一个是不正确的_。 A.数据仓库通常采用三层体系结构 B.底层的数据仓库服务器一般是一个关系型数据库系统 C.数据仓库中间层 OLAP 服务器只能采用关系型 OLAP D.数据仓库前端分析工具中包括报表工具(分数:1.00)A.B.C. D.解析:解析 OLAP 根据存储数据的物理组织方式不同可以采用不同的形式:ROLAP、MOLAP 和 HOLAP。2
41、8.数据挖掘的目的在于_。 A.从已知的大量数据中统计出详细的数据 B.从已知的大量数据中发现潜在的规则 C.对大量数据进行归类整理 D.对大量数据进行汇总统计(分数:1.00)A.B. C.D.解析:解析 从数据挖掘的定义中得知,数据挖掘是从大型数据库的数据集中识别出新颖的、潜在的规则。29.在超市所从事的信息活动中,下列哪种属于挖掘时间序列模式_。 A.针对匿名客户,记录其购买某种商品时与该商品有关的优惠 B.针对注册客户,分析他们的购买,向他们设定下次可能购买的优惠规则 C.针对所有客户,对其货篮子里的商品进行分析 D.针对注册客户,进行客户分类,确定重要客户及服务对策(分数:1.00)
42、A.B. C.D.解析:解析 时间序列分析的侧重点在于分析数据间的前后序列关系。在某一段时间内,顾客购买商品A,接着购买商品 B,而后购买商品 C,即序列 A-B-C 出现的频度较高,是时间序列分析的内容。30.数据挖掘和_是同义词。 A.系统工程 B.操作处理 C.知识发现 D.规范化处理(分数:1.00)A.B.C. D.解析:解析 数据挖掘即数据的知识发现。31.许多大中型企业出于多种原因建立了数据仓库,以下哪项不是建立数据仓库的合理理由_。 A.充分利用企业信息系统生成的数据 B.把企业的各种应用系统集中在一起 C.解决企业基本业务应用和数据分析应用之间的性能冲突问题 D.以面向主题、集成的方式合理组织数据,实现跨专业视图(分数:1.00)A.B.C.D. 解析:32.数据仓库通过数据转移从多个数据源中提取数据,为了解决不同数据源格式上的不统一,需要进行_操作。 A.简单转移