1、数据据工程师高频练习试卷 5及答案与解析 1 关于数据仓库的特性,下列说法正确的是 _。 A)面向主题的特性是指在组织数据仓库数据时,需要将各种分析需求归类并抽象,形成相应的分析应用主题,并根据分析应用主题的数据需求设计和组织数据 B)集成特性是指需要将业务系统中的所有数据抽取出来,载入到数据仓库中 C)集成特性是指需要将企业整个架构中的各种数据和应用集中到数据仓库中 D)随时间变化性是指数据仓库中的每个数据单元一般都有时间标志,且其中各种数据 (包括原始数据 )会随时间变化被经常修改 2 从联机 事务处理 (OLTP)环境中抽取数据、建立新的数据分析环境的最初出发点是 _。 A)对企业信息系
2、统中的数据进行整理 B)解决企业信息系统中的数据孤岛问题 C)解决企业基本业务应用和数据分析应用之间的性能冲突问题 D)解决企业信息系统中的蜘蛛网问题 3 某个数据仓库中保存有商品销售明细数据表 T(商品号,数量,价格,时间 ),其细节数据保存期为 2年,每年销售记录约有 5千万条。设前端应用需要针对这些数据进行每月重要商品销售情况与趋势分析,可供用户查询或分析的数据时间跨度最长为 5年,为了提高这项分析需求的执 行效率,下列方案合理且有效的是 _。 A)按月份为商品明细数据建立分区,并为商品销售明细数据建立索引,每次分析时根据细节数据实时计算生成月粒度级数据,并用于趋势分析 B)按月份为商品
3、明细数据建立分区,并为商品销售明细数据建立索引,建立视图V1(商品号,日销售总数量,日销售总金额,日期 ),将 V1作为数据分析源 C)在商品号属性上为 T建立索引,建立物化视图 V2(商品号,日销售总数量,日销售总金额,日期 ),每天根据 T中新产生的数据对 V2进行增长式更新,并将 V2作为分析数据源 D)建立物化视图 V3(商品号, 月销售总数量,月销售总金额,月份 ),每天清空V3,并根据表 T重新计算 V3,并将 V3作为分析数据源 4 给定以下三个关系表: 销售明细表 (商品标识,销售时间,单价,数量,金额 )日销售表 (商品标识,销售日,总数量,总金额 )月销售表 (商品标识,销
4、售月份总数量,总金额 )下述说法正确的是 _。 A)销售明细表的数据粒度最大,数据量最大 B)日销售表的数据粒度最大,数据量最小 C)月销售表的数据粒度最大,数据量最小 D)月销售表的数据粒度最小,数据量最小 5 许多大中型企业出于多种原因建立了数据 仓库,以下哪项不是建立数据仓库的合理理由 ?_ A)充分利用企业信息系统生成的数据 B)把企业的各种应用系统集中在一起 C)解决企业基本业务应用和数据分析应用之间的性能冲突问题 D)以面向主题、集成的方式合理组织数据、实现跨专业视图 6 对于联机事务处理系统和数据仓库系统中的数据,下列说法正确的是 _。 A)一般情况下,联机事务处理系统中的数据不
5、能被修改,数据仓库系统中的数据可被修改 B)联机事务处理系统中的数据库规模一般大于数据仓库系统中的数据规模 C)联机事务处理系统中的数据一般按面 向业务应用的方式组织,数据仓库系统中的数据一般按面向分析主题的方式组织 D)一般情况下,在安全性和一致性要求上,对数据仓库系统中的数据的要求要高于对联机事务处理系统中数据的要求 7 在为业务繁忙的企业的多个部门服务的数据库系统中,同时开展各部门的 OLTP业务和数据分析业务会给数据库系统带来性能冲突,下列方案中无法从根本上解决性能冲突的是 _。 A)抽取出各部门需要的分析数据,建立各部门独立的数据集市,将数据分析业务转移到数据集市中 B)抽取出企业所
6、有分析功能所需的分析数据,建立统一的企业级数据仓 库环境,将企业的大部分分析业务转移到数据仓库环境中 C)抽取出企业的近期业务数据,建立操作型数据存储 (ODS),将一些快速分析业务转移到操作型数据存储中 D)不建立新的数据存储体系,在基本业务处理时间内开展 OLTP业务,在其余时间开展分析业务 8 数据模型定义了数据库中数据的组织、描述、存储和操作规范,可以分为概念模型、数据结构模型和物理模型三大类。概念模型的典型代表是 _。 ( A)实体一联系模型 ( B)关系模型 ( C)面向对象模型 ( D)网状模型 9 关于数据视图与三级模式,下列说 法错误的是 _。 ( A)数据视图是指用户从某个
7、角度看到的客观世界数据对象的特征 ( B)外模式是数据库用户能使用的局部数据,描述外模式时,通常需要给出其物理结构 ( C)概念模式以数据模型的形式描述数据 ( D)三级模式结构实现了数据的独立性 10 关于数据模型和模式结构,有下列说法: 数据库系统的开发者利用数据模型描述数据库的结构和语义,通过现实世界到信息世界再到机器世界的抽象和转换,构建数据库 数据结构模型是按用户的观点对数据进行建模,是现实世界到信息世界的第一层抽象, 强调语义表达功能,易于用户理解,是用户与数据库设计人员交流的工具 在数据模型中有 “型 ”和 “值 ”的概念,其中值是对某一类数据的结构和属性的说明 在三级模式结构中
8、,概念模式是对数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图 上述说法正确的是 _。 ( A) 和 ( B) 、 和 ( C) 和 ( D) 和 11 在数据库系统中,下列哪个映像关系用于提供数据与应用程序间的逻辑独立性 ? ( A)外模式 /模式 ( B)模式 /内模式 ( C)外模式 /内模式 ( D)逻辑模式 /内模式 12 在数据库三级模式结构中,对数据库中全部的数据逻辑结构和特征进行描述的是 _。 ( A)外模式 ( B)模式 ( C)子模式 ( D)内模式 13 查询处理器是数据库管理系统的重要组成部分,下列不属于查询处理器功能组成模块的是 _。 ( A) DML
9、编译器 ( B)查询执行引擎 ( C)嵌入式 DML的预编译器 ( D)查询权限管理器 14 DBMS通过加锁机制允许用户并发访问数据库,这属于 DBMS提供的 _。 ( A)数据定义功能 ( B)数 据操纵功能 ( C)数据库运行管理与控制功能 ( D)数据库建立与维护功能 15 关于数据库管理系统功能,有下列说法: 数据管理系统具有将 E-R模型转换为数据结构模型、数据库操作、数据库运行管理和控制、数据库建立和维护功能 数据管理系统具有将 E-R模型转换为数据结构模型、数据库定义、数据库操作、数据库运行管理和控制、数据库建立和维护功能 数据管理系统具有数据库定义、数据库操作、数据库运行管理
10、和控制、数据库建立和维护功能 数据管理系统具有数据库定义、数据库操作、数据 库运行管理和控制、数据库建立和维护,以及直接存取数据等功能。 上述说法完全正确的是 _。 ( A) 和 ( B) 、 和 ( C) 和 ( D) 16 关于数据库系统,有下列说法: 数据库系统 (DBS)自上而下可以分为用户、人机交互界面、 DBMS和磁盘四个层次 采用了数据库技术的计算机系统 是位于用户与操作系统之间的数据库管理系统 DBS是由 DB、软件和 DBA组成 上述说法完全正确的是 _。 ( A) 和 ( B) 、 和 ( C) 和 ( D) 17 在明确了数据库应用系统的任务目标和系统范围之后,需要进行项
11、目的可行性分析,关于可行性分析,下列说法错误的是 _。 ( A)经济可行性分析是指对项目进行成本效益分析,其中项目成本一般包括开发费用、软硬件购置费用、安装调试及维护费用 ( B)技术可行性分析一般以系统的性能要求为主要依据,对系统的软件、硬件和技术方案做出评估和选择建议 ( C)操作可行性分析的主要目的在于论证系统开发是否具备所需要的人员、软件、硬件和工作环境等条件 ( D)开发方案选择的目的在于提出并 评价实现系统的各种开发方案,并从中选择出合理的方案 18 按照数据库应用系统生命周期模型,在开发某数据库应用系统时,对系统采用的软硬件及技术方案等做出合理的评估并提出选择建议的工作属于 _。
12、 ( A)规划与分析阶段的系统规划与定义 ( B)规划与分析阶段的可行性分析 ( C)需求分析阶段的业务规则需求分析 ( D)系统设计阶段的总体设计 一、简答题 请用蓝、黑色钢笔或圆珠笔将答案写在答题卡的相应位置上,否则无效。 19 数据库应用系统功能设计包括哪两个方面 ?每个方面主要由哪些设计步骤组成 ? 20 数据库系统处理死锁一般采用哪两类方法 ?简述每类方法的基本原理。 21 现有关系模式: 教师授课 (教师号,姓名,职称,课程号,课程名,学分,教科书名 ) 其函数依赖集为: 教师号 姓名,教师号 职称,课程号 课程名,课程号 学分,课程号 教科书名 指出这个关系模式的主码。 这个关系
13、模式是第几范式,为什么 ? 将其分解为满足 3NF要求的关系模式 (分解后的关系模式名自定 )。 22 现有某图书销售数据库,其关系表结构如下: 图书表 (图书编号,图书名 称,出版社编号,出版社名称,出版时间,出版数量,版次 ) 图书销售表 (图书编号,销售日期,销售数量,书店编号,读者编号,读者姓名,读者电话 ) 书店表 (书店编号,联系电话,所在城市编号,城市名称 ) 该系统所涉及的数据存在以下约束: 出版社可以出版多本图书,一本图书只能在一个出版社出版,在该系统的记录的图书出版信息包括出版时间、版次及出版数量信息; 一个书店可以出售多本图书给多个读者,每位读者可以从多个书店购买多本图书
14、,一本图书可以通过多个书店出售给读者,书店把图书出售给读者 后会在系统中记录售书日期和售书数量信息; 每个书店只能位于一个城市,一个城市可以有多个书店。 以图书销售表为例说明原数据库设计的不合理之处。 给出该数据库符合 3NF要求的全部关系模式,并指出关系模式中的全部主码和外码。 23 有两张关系表: Students(SID, SName, Sex, Dept) Prizing(SID, PName, Type, PDate) Students表描述的是学生基本信息, Prizing表描述的是学生获奖信息。 若在 应用程序中经常使用以下查询语句: SELECT S. SID, SName,
15、PName, Type FROM Students AS S JOIN Prizing AS P ON S.SID=P. SID 请问能否使用聚集文件提高此查询的性能 ?并给出原因。 为了提高查询性能,数据库管理员在 Students表的 SName列上建立了一个非聚集索引 SName_ind。如果应用程序使用如下语句查询数据: SELECT* FROM Students WHERE SName like%华 请问 SName_ind索引是否能够提高语句的查询速度,并给出原因。 24 有学生表 学号,姓名,年龄,性别,系名,专业名,班号 ,设一个系可有多个专业,每个专业可有多个班,各班班号不重
16、复,一个学生只在一个班学习,现经常需要按 “系名 ”和 “班号 ”进行查询,为提高查询效率,需要为 “系名 ”和 “班号 ”两个列建立一个非聚集索引,建立此索引有下列两种方法: 方法 1:索引列顺序为 (系名,班号 ) 方法 2:索引列顺序为 (班号,系名 ) 这两种方法哪个更合理 ?请简要说明原因。 针对你认为合理的方 法,写出创建该索引的 SQL语句。 25 在 SQL Server 2000中,有教师表 Teachers(TeacherID, Name, LeaderID),其中TeacherID是主码,类型是长度为 4的普通编码定长字符串,且每位是 0 9的数字字符; Name的类型是
17、长度为 10的普通编码可变长字符串; LeaderID是每个教师的领导的 TeacherID。 写出创建 Teachers表的 SQL语句,要求语句中包含所有的约束。 现要查询 TeacherID为 “1234”的教师的领导的 TeacherID, 请给出相应的 SQL语句,要求只使用一条 SQL语句实现,且此语句中不允许包含子查询。 26 以下两个关系表: Emp(eid, ename, age, did, salary),其各列含义为: 职工号,姓名,年龄,部门号,工资 Dept(did, dname, mgr_id),其各列含义为:部门号,部门名称,部门经理职工号 写出一条 SQL语句,
18、查询工资大于 10000,且与他所在部门的经理年龄相同的职工姓名。 27 请按要求解答下列问题: (1)在设计数据库应用系统时,需要对系统所需的 存储空间进行规划。规划时需要考虑多种因素,请列出其中的 4种。 (2)设有商品销售系统,该系统每天最多产生万条商品销售记录,并用商品销售数据表保存销售记录。系统需要保存 3年的销售记录,每年按 365天计算。商品销售数据表包含的属性及各属性占用的字节分别为:商品号 (10字节 )、销售数量 (8字节 )、价格 (8字节 )、金额 (8字节 )、收银台编号 (4字节 )、销售员编号 (4字节 )、销售时间 (8字节 )。保存该表的数据库管理系统的数据存
19、储单位是数据页,每页大小为8KB(共 8192字节 )。该数据库管理系统规定数据页空间全部用于保存销售数据,并且存储销售数据时单条记录不允许跨数据页存放 。 请计算在数据库中保存商品销售数据表需要的数据页数目,要求写出计算过程。 28 现有以下两个关系模式: Employees(Eid, Name, DeptNO) Departments(Dept NO, DeptName, TotalNumber) Employees关系模式描述了职工编号、姓名和所在部门编号; Departments关系模式描述了部门编号、名称和职工总人数。 请按 SQL Server所采用的 Tansact-SQL语法格
20、式编写实现具有功能的后触发型触发器:每当在 Employees表中插入一行数据时,相应部门的职工总人数就加 1。 29 为在某种程度上保证某数据库系统可靠地运行,在 SQL Server 2000环境中,对其制定有以下三种备份策略。假设对此数据库进行一次完全备份需要 4小时,差异备份需要 2小时,日志备份需要 1小时。设所有备份都是从凌晨 1: 00开始。 策略 1:每周周日进行一次完全备份,每周周一至周六每天进行一次日志备份。 策略 2:每周周日进行一次完全备份,每周周一至周六每天进行一次差异备份。 策略 3:每天进行一次完全备份。 假设需要保留一 年的备份数据,比较三种备份策略所占用的空间
21、。 比较每种备份策略的备份和恢复速度。 数据据工程师高频练习试卷 5答案与解析 1 【正确答案】 A 【试题解析】 数据仓库是一个面向主题的、集成的、非易失的,且随时间变化的数据集合,用来支持管理人员的决策。数据仓库的主要特性: 主题与面向主题:数据仓库中的数据是以面向主题的方式进行组织的,主题是一个抽象的概念,主题也可以称为分析主题或分析领域,用于表示某一宏观的分析领城所涉及的对象,以及与对象有关的数据的集合。 集成:集成是数据仓库数据的第二个特 性,也是最为重要的特性。人们一般把数据仓库的数据集成功能分成数据抽取、转换、清理 (过滤 )和装载这四项任务。数据集成主要完成从数据源获取数据,并
22、按目标数据模型要求,如数据仓库核心层模型的要求对数据进行转换,并清除错误或无效数据,装载入目标数据体系中。 不可更新:数据仓库中的数据通常是以批量方式载入与访问的,在数据仓库环境中,并不进行一般意义上的数据更新。 随时间变化:数据仓库的时变性是指数据仓库中的每个数据单元都有时间标志,记录一般都加有时戳,有时记录中可能包含有事务的发生时间。同时,数据仓库随时间变化的特性 还指数据仓库在运行中必须不断捕捉操作型环境中的数据,并将新的数据集成后追加到其中。显然, B、 C、 D是错误的,只有 A正确。 【知识模块】 数据据工程师高频 2 【正确答案】 C 【知识模块】 数据据工程师高频 3 【正确答
23、案】 C 【试题解析】 每次分析时根据细节数据实时计算生成月粒度级数据,数据量大时效率很低。 B中视图并不在数据库中以存储的数据值集形式存在,所以建立视图的方法不能提高效率。每天清空 V3并根据表 T重新计算 V3,并将 V3作为分析数据源,这样也不能提高效率。只有 C选项方案 比较合理有效。 【知识模块】 数据据工程师高频 4 【正确答案】 C 【知识模块】 数据据工程师高频 5 【正确答案】 B 【试题解析】 建立数据仓库不是简单的把企业的各种应用集中在一起,而是利用企业信息系统生成的数据,以面向主题、集成的方式合理组织数据,解决数据分析应用和企业基本业务之间的性能冲突的问题,所以本题的答
24、案为 B。 【知识模块】 数据据工程师高频 6 【正确答案】 C 【知识模块】 数据据工程师高频 7 【正确答案】 D 【知识模块】 数据据工 程师高频 8 【正确答案】 A 【知识模块】 数据据工程师高频 9 【正确答案】 B 【试题解析】 外模式是对数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是与某一应用有关的数据的逻辑表示,所以描述外模式时不需要给出其物理结构。 【知识模块】 数据据工程师高频 10 【正确答案】 A 【试题解析】 数据模型是数据库系统的形式框架,是用来描述数据的一组概念和定义。包括描述数据、数据联系、数据操作、数据语义以及数据一致性的概念工具。它是数据库系
25、统的核心和基础。按照 数据模型在数据建模和数据管理中的不同作用,可以将其分为概念数据模型、数据结构模型和物理数据模型。概念数据模型也可简称为概念模型,是按用户的观点对数据和信息进行建模,是现实世界到信息世界的第一层抽象。数据结构模型也称为表示型或实现型的数据模型,是机器世界中与具体 DBMS相关的数据模型。物理数据模型属于底层数据模型,通过诸如记录格式、记录顺序和存取路径等表示信息,描述数据在数据库系统中的实际存储方式。 错误。数据模式仅涉及集的描述,不涉及具体的值。 【知识模块】 数据据工程师高频 11 【正确答案】 A 【试题解析】 外模式 /模式映像定义了数据库中不同用户的外模式与数据库
26、逻辑模式之间的对应关系。当数据库模式发生变化时,通过调整外模式 /模式间的映像关系,使得应用程序不必随之修改,从而保证数据与应用程序间的逻辑独立性,简称数据的逻辑独立性,所以本题的答案为 A。 【知识模块】 数据据工程师高频 12 【正确答案】 B 【知识模块】 数据据工程师高频 13 【正确答案】 D 【知识模块】 数据据工程师高频 14 【正确答案】 C 【试题解析】 DBMS的数据库运行管理 与控制功能是指统一管理和控制数据库的建立、运行和维护, DBMS通过加锁机制允许用户并发访问数据库,这属于DBMS提供的数据库运行管理与控制功能。 【知识模块】 数据据工程师高频 15 【正确答案】
27、 D 【知识模块】 数据据工程师高频 16 【正确答案】 C 【试题解析】 数据库系统 (DBS)自上而下可以分为用户、人机交互界面、 DBMS和磁盘四个层次。采用了数据库技术的计算机系统, DBS是由 DB、软件、硬件和DBA组成的计算机系统。 【知识模块】 数据据工程师高频 17 【正确答案】 B 【试题解析】 技术可行性分析所依据的并不只是系统的性能要求,还包括用户提出的系统功能以及实现系统的各项约束条件要求。 B并不恰当。 【知识模块】 数据据工程师高频 18 【正确答案】 B 【试题解析】 系统开发的技术可行性研究正是根据用户提出的系统功能、性能及实现系统的各项的约束条件,对系统软件
28、、系统硬件、技术方案做出评估和选择建议,它属于规划与分析阶段的可行性分析。 【知识模块】 数据据工程师高频 一、简答题 请用蓝、黑色钢笔或圆珠笔将答案写在答题卡的相应位置 上,否则无效。 19 【正确答案】 数据库应用系统功能设计包括数据库事务设计和应用程序设计。与数据库应用系统概念设计、逻辑设计、物理设计相对应,应用程序 (软件 )设计分为总体设计、概要设计和详细设计,数据库事务设计则由事务概要设计和事务详细设计组成。 【知识模块】 数据据工程师高频 20 【正确答案】 解决死锁主要采用死锁预防和死锁检测与恢复两类方法。 死锁预防利用死锁预防协议,通过破坏死锁产生的必要条件来避免系统进入死锁
29、状态,防止死锁发生。死锁检测与恢复则是允许系统进入死锁状态,并且定期 检查系统是否发生死锁。当发现系统发生死锁后,采取相应的恢复机制使系统摆脱死锁状态。 【知识模块】 数据据工程师高频 21 【正确答案】 主码为: (教师号、课程号 ) 第 1范式,因为存在部分依赖。 分布方法为: 教师表 (教师号,姓名,职称 ) 课程表 (课程号,课程名,学分,教科书名 ) 教师授课表 (教师号,课程号 ) 【知识模块】 数据据工程师高频 22 【正确答案】 图书销售表中,读者信息应该单独新建一张表,否则就会造成大量的数据冗余。 关系模式如下 : 出版社表 (出版社编号,出版社名称 )主码:出版社编号 出版
30、表 (出版社编号,图书编号,出版时间,出版数量,版次 )主码: (出版社编号,图书编号 ) 图书表 (图书编号,图书名称 )主码:图书编号 书店表 (书店编号,联系电话,所在城市编号 )主码:书店编号 城市表 (所在城市编号,城市名称 )主码:所在城市编号 读者表 (读者编号,读者姓名,读者电话 )主码:读者编号图书销售表 (图书编号,读者编号,销售日期,销售数量,书店编号 )主码: (图书编号,读者编号 ) 【知识模块】 数据据工程师高 频 23 【正确答案】 可以用聚集文件提高此查询性能。因为聚集文件本身存储不同类型表的联系,能够减少表间的连接操作,提高查询性能。 此索引不能提高该语句的查
31、询速度。因为该索引是建立在 SNAME上的非聚集索引,以 SNAME首字母排序,而查询语句却要求查询名字最后一个是 “华 ”的SNAME,还是需要全部扫描 students表,因此不能提高该语句的查询速度。 【知识模块】 数据据工程师高频 24 【正确答案】 方法 1更加合理,理由如下:更加有利于减少索引层次,提高查询效率;更加符合使用习惯 ;更加便于 (系、班 )进行统计。 创建索引的 SQL语句: create index index_1 on学生表 (系名,班号 ) 【知识模块】 数据据工程师高频 25 【正确答案】 create table Teachers( TeacherID ch
32、ar(4)check(TeacherID like“ 0 90 90 90 9“), Name varchar(10), LeaderID char(4), primary key TeacherID, foreign key LeaderlD references Teachers (TeacherID) ) select T2. LeaderID from Teachers as T1 join Teachers as T2 on T1.LeaderID=T2.TeacherID where T1.TeacherID=1234 【知识模块】 数据据工程师高频 26 【正确答案】 selec
33、t a.*from Emp a, Dept b, Emp c where a. did=b.did and b.mgr_id=c.eid and a.salary 10000 and a.age=c.age 【知识模块】 数据据工程师高频 27 【正确答案】 单条数据的长度;每年、每天、每小时等数据所增长的大小;备份和冗余备份空间;系统文件的大小;占用内存空间的大小等等。 (2)单条商品销售记录占用字节: 10+8+8+8+4+4+8=50字节。 单数据页可存储销售记录条数: 163条 (16350=8150字节; 16450=8200字节 )。 保存三 年的销售总记录数: 336510000
34、=10950000条。 需要的数据页数目 =67178(67178163=10950014; 67177163=10949851)。 【知识模块】 数据据工程师高频 28 【正确答案】 create trigger sql_tri on employees for insert as declare eid varchar(11) declare name varchar(20) declare deptno varchar(11) declare yjy cursor for select * from inserted open yjy fetch next from yiy into e
35、id, name, deptno while fetch_status=0 begin update departments set totalnumber=totalnumber+1 where deptno= deptno fetch next from yjy into eid, name, deptno end lose yjy deallocate yjy 【试题解析】 本题考查了后触发器的 TransactSQL语句。其语法格式为: CREATE TRIGGER触发器名称 ON表名 |视图名 WITH ENCRYPTION AS SQL语句 AFTER和 FOR,指定触发器只有在引发的 SQL语句中指定的操作都已成功执行,并且所有的约束检查也成功完成后,才执行此触发器,即后触发型触发器。 【知识 模块】 数据据工程师高频 29 【正确答案】 占用空间量从大到小排序为:策略 3,策略 2,策略 1。 备份速度从快到慢排序为:策略 1,策略 2,策略 3。 恢复速度从快到慢排序为:策略 3,策略 2,策略 1。 【知识模块】 数据据工程师高频