【计算机类职业资格】系统分析师-数据库系统2及答案解析.doc

上传人:visitstep340 文档编号:1336249 上传时间:2019-10-17 格式:DOC 页数:26 大小:161.50KB
下载 相关 举报
【计算机类职业资格】系统分析师-数据库系统2及答案解析.doc_第1页
第1页 / 共26页
【计算机类职业资格】系统分析师-数据库系统2及答案解析.doc_第2页
第2页 / 共26页
【计算机类职业资格】系统分析师-数据库系统2及答案解析.doc_第3页
第3页 / 共26页
【计算机类职业资格】系统分析师-数据库系统2及答案解析.doc_第4页
第4页 / 共26页
【计算机类职业资格】系统分析师-数据库系统2及答案解析.doc_第5页
第5页 / 共26页
点击查看更多>>
资源描述

1、系统分析师-数据库系统 2 及答案解析(总分:42.00,做题时间:90 分钟)一、单项选择题(总题数:23,分数:42.00)设有职工实体 Employee(职工号,姓名,性别,年龄,通信地址,家庭成员),其中通信地址记录了邮编、省、市、街道信息;家庭成员记录了职工的亲属得姓名。职工实体中的通信地址是一个 (1) 属性;为了将数据库模式设计得更合理,对于家庭成员属性 (2) 。(分数:2.00)A.简单B.复合C.多值D.派生A.可以不作任何处理直接记录亲属的姓名B.只允许记录一个亲属的姓名C.需要对职工实体设置若干个亲属姓名字段D.应该将职工的亲属的姓名加上职工号设计成为一个独立的实体1.

2、若关系模式中存在非主属性对码的部分依赖,则该关系模式属于 (3) 。(分数:1.00)A.1NFB.2NFC.3NFD.BCNF2.在某学校的综合管理系统设计阶段,教师实体在学籍管理子系统中被称为“教师”,而在人事管理子系统中被称为“职工”,这类冲突被称为 (4) 。(分数:1.00)A.语义冲突B.命名冲突C.属性冲突D.结构冲突3.关于数据库中关系性质的描述,错误的是 (5) 。(分数:1.00)A.表中任意两行的值不能相同B.表中任意两列的值不能相同C.行在表中的顺序无关D.列在表中的顺序无关4.关系数据库中,实现实体之间的联系是通过表与表之间的公共 (6) 。(分数:1.00)A.索引

3、B.存储C.元组D.属性建立一个供应商零件数据库。其中“供应商”表 S(Sno,Sname,Zip,City)中的属性分别表示:供应商代码、供应商名、供应商邮编、供应商所在城市,其函数依赖为:Sno(Sname,Zip,City),ZipCity。“零件”表 P(Pno,Pname,Color,Weight,City),表示零件号、零件名、颜色、重量及产地。表 S 与表 P 之间的关系 SP(Sno,Pno,Price,Qty)表示供应商代码、零件号、价格、数量。A“供应商”表 S 属于 (7) 。B若要求:供应商代码不能为空,且值是唯一的,供应商名也是唯一的;零件号不能为空,且值是唯一的;一

4、个供应商可以供应多种零件,而一种零件可以由多个供应商供应。请将下面的 SQL 语句空缺部分补充完整。CREATE TABLE S(Sno CHAR(5) (8) ,Sname CHAR(30)UNIQUE,Zip CHAR(8),City CHAR(20)(9) );(分数:3.00)A.1NFB.2NFC.3NFD.BCNFA.FOREIGN KEYB.NOT NULL UNIQUEC.FOREIGN KEY(Sno)D.PRIMARY KEY(Sname)A.NOTNULLB.NOTNULLUNIQUEC.PRIMARY KEY(Sno)D.PRIMARY KEY(Sname)5. (10

5、) 不属于关系数据库管理系统。(分数:1.00)A.OracleB.MS SQL ServerC.DB2D.IMS6. (11) 是一种信息分析工具,能自动地找出数据仓库中的模式及关系。(分数:1.00)A.数据集市B.数据挖掘C.预测分析D.数据统计某公司的部门(部门号,部门名,负责人,电话)、商品(商品号,商品名称,单价,库存量)和职工(职工号,姓名,住址)三个实体之间的关系如表 4-8、表 4-9 和表 4-10 所示。假设每个部门有一位负责人和一部电话,但有若干名员工;每种商品只能由一个部门负责销售。表 4-8 部门表部门号 部门名 负责人 电 话001 家电部 E002 100100

6、2 百货部 E026 1002003 食品部 E030 1003表 4-9 商品表商品号 商品名称 单 价 库存量30023 计算机 4800 2630024 打印机 1650 7 30101 毛巾 1 10630102 牙刷 3.8 288 表 4-10 职工表职工号 姓 名 住 址E001 王军 南京路E002 李晓斌 淮海路E021 杨烨 江西路E026 田波 西藏路E028 李晓斌 西藏路E029 刘丽华 淮海路E030 李彬彬 唐山路E031 胡慧芬 昆明路 表 4-11 统计结果职工号 姓 名 部门名 月销售额E001 王军 家电部 528900E002 李晓斌 家电部 36800

7、0E021 杨烨 百货部 12500E028 李晓斌 百货部 82500E031 胡慧芬 食品部 282608 部门关系不属于第三范式的原因是 (12) 。如果用户要求得到表 4-11 所示的结果,需要 (13) ,并增加关系模式 (14) 。(分数:3.00)A.没有消除非属性对码的部分函数依赖,如:部门名负责人B.没有消除非主属性对码的部分函数依赖,如:负责人电话C.只消除了非主属性对码的部分函数依赖,而未消除传递函数依赖D.没有消除非主属性对码的部分函数依赖和传递函数依赖A.修改表 4-8 的结构,在表 4-8 中增加一个职工号B.修改表 4-9 的结构,在表 4-9 中增加一个职工号C

8、.修改表 4-9 的结构,在表 4-9 中增加一个部门号D.修改表 4-10 的结构,在表 4-10 中增加一个部门号A.销售(职工号,商品号,日期,数量)B.销售(职工号,商品名称,商品号,数量)C.销售(职工号,部门号,日期,数量)D.销售(职工号,部门号,商品号,日期)由于软硬件故障可能造成数据库中数据被破坏,数据库恢复就是 (15) 。可以有多种方法实现数据库恢复,如:定期将数据库作备份;在进行事务处理时,对数据更新(插入、删除、修改)的全部有关内容写入 (16) ;当系统正常运行时,按一定的时间间隔,设立 (17) ,把内存缓冲区内容还未写入到磁盘中去的有关状态记录到该文件中;当发生

9、故障时,根据现场数据内容及相关文件来恢复系统的状态。(分数:3.00)A.重新安装数据库管理系统和应用程序B.重新安装应用程序,并将数据库做镜像C.重新安装数据库管理系统,并将数据库做镜像D.在尽可能短的时间内,把数据库恢复到故障发生前的状态A.日志文件B.程序文件C.检查点文件D.图像文件A.日志文件B.程序文件C.检查点文件D.图像文件希赛公司网上销售管理系统的数据库部分关系模式如下所示。其中,客户号唯一标识一位客户,产品号唯一标识一件产品,订单号唯一标识一份订单。一份订单必须且仅对应一位客户,一份订单可由一到多条订单明细组成,一位客户可以有多份订单。客户(客户号,姓名,性别,地址,邮编)

10、产品(产品号,名称,库存,单价)订单(订单号,时间,金额,客户号)订单明细(订单号,产品号,数量)订单关系模式的主键为 (18) ;订单明细关系模式的主键为 (19) ;其中订单的外键为 (20) 。(分数:3.00)A.订单号B.客户号C.(订单号,客户号)D.(订单号,时间)A.订单号B.产品号C.(订单号,产品号)D.(订单号,数量)A.客户号,订单明细的外键为订单号B.客户号,订单明细的外键为订单号和产品号C.订单号,订单明细的外键为产品号D.订单号,订单明细的外键为订单号和产品号某高校管理信息系统的数据库设计过程中, (21) 阶段是在需求分析的基础上,对用户信息加以分类、聚集和概括

11、,建立信息模型,并依照选定的数据库管理系统软件,转换成为数据的 (22) ,再依照软硬件环境,最终实现数据的合理存储。(分数:2.00)A.物理设计B.逻辑结构设计C.数据库实施D.概念结构设计,A.物理模式B.逻辑模式C.内模式D.概念模式7.在数据库系统中,数据的完整性是指数据的 (23) 。(分数:1.00)A.有效性、正确性和一致性B.有效性、正确性和可维护性C.有效性、正确性和安全性D.正确性、一致性和安全性8.数据仓库在收集数据过程中,会遇到一些略微不一致但可以纠正的数据,纠正的过程称为 (24) 。(分数:1.00)A.数据转换B.数据抽取C.数据清洗D.数据装载9.在数据库设计

12、的需求分析阶段,业务流程一般采用 (25) 表示。(分数:1.00)A.数据流图B.E-R 图C.程序结构图D.功能模块图10.若要使某用户只能查询表 EMP 中的部分记录,应采取的策略是 (26) 。(分数:1.00)A.将该用户级别设定为 DBAB.将表 EMP 的查询权限赋予该用户C.编写查询表 EMP 的存储过程D.构建该部分记录的行级视图,并将该视图的查询权限赋予该用户某公司的商品(商品号,商品名称,生产商,单价)和仓库(仓库号,地址,电话,商品号,库存量)两个实体之间的关系如表 4-12 和表 4-13 所示。表 4-12 商品表商品号 商品名称 生产商 单 价10023 笔记本

13、联想 480010024 激光打印机 联想 165010025 台式电脑 联想 386020003 激光打印机 HP 128020004 笔记本 HP 390020005 电冰箱 海尔 3860 表 4-13 仓库表仓库号 地 址 电 话 商品号 库存量01 高新路 1 号 8601 10024 2601 高新路 1 号 8601 10025 8901 高新路 1 号 8601 20003 1002 友谊路 6 号 8602 10023 3902 友谊路 6 号 8602 20004 2603 高新路 1 号 8603 20005 18 商品关系的主键是 (27) ;仓库关系的主键是 (28)

14、 ;仓库关系 (29) ,为了解决这一问题,需要将仓库关系分解为 (30) 。(分数:4.00)A.商品号B.商品名称C.生产商D.单价A.仓库号,地址B.仓库号,电话C.仓库号,商品号D.地址,电话A.无冗余、无插入异常,但存在删除异常B.无冗余,但存在插入异常和删除异常C.存在冗余,但不存在修改操作的不一致D.存在冗余、修改操作的不一致,以及插入异常和删除异常A.仓库 1(仓库号,地址)和仓库 2(仓库号,电话,商品号,库存量)B.仓库 1(仓库号,地址,电话)和仓库 2(商品号,库存量)C.仓库 1(仓库号,电话)和仓库 2(仓库号,地址,商品号,库存量)D.仓库 1(仓库号,地址,电话

15、)和仓库 2(仓库号,商品号,库存量)11.SQL 支持关系数据库的三级模式结构如图 4-2 所示,图 4-2 中视图、基本表、存储文件分别对应 (31) 。(分数:1.00)A.模式、内模式、外模式B.外模式、模式、内模式C.模式、外模式、内模式D.外模式、内模式、模式确定系统边界应在数据库设计的 (32) 阶段进行;关系规范化是在数据库设计的 (33) 阶段进行。(分数:2.00)A.需求分析B.概念设计C.逻辑设计D.物理设计A.需求分析B.概念设计C.逻辑设计D.物理设计某销售公司数据库的零件关系(零件号,零件名称,供应商,供应商所在地,库存量)如表 4-14 所示,其中同一种零件可由

16、不同的供应商供应,一个供应商可以供应多种零件。零件关系的主键为 (34) ,该关系存在冗余以及插入异常和删除异常等问题。为了解决这一问题,需要将零件关系分解为 (35) ,分解后的关系模式可以达到 (36) 。表 4-14 零件关系表零件号 零件名称 供应商 供应商所在地 库存量010023P2 S1 北京市海淀区苏州街 58 号 380010024P3 S1 北京市海淀区苏州街 58 号 1350010022P1 S2 长沙市五一大道 717 号 160010023P2 S2 长沙市五一大道 717 号 1280010024P3 S2 长沙市五一大道 717 号 3900010022P1 S

17、3 北京市新城区朝阳街 65 号 2860 (分数:3.00)A.零件号,零件名称B.零件号,供应商C.零件号,供应商所在地D.供应商,供应商所在地A.零件 1(零件号,零件名称,供应商,供应商所在地,库存量)B.零件 1(零件号,零件名称)、零件 2(供应商,供应商所在地,库存量)C.零件 1(零件号,零件名称)、零件 2(零件号,供应商,库存量)、零件 3(供应商,供应商所在地)D.零件 1(零件号,零件名称)、零件 2(零件号,库存量)、零件 3(供应商,供应商所在地)、零件 4(供应商所在地,库存量)A.1NFB.2NFC.3NFD.4NF12.数据库的视图与基本表之间,基本表与存储文

18、件之间分别通过建立 (37) 之间的映像,保证数据的逻辑独立性和物理独立性。(分数:1.00)A.模式到内模式和外模式到内模式B.外模式到内模式和内模式到模式C.外模式到模式和模式到内模式D.内模式到模式和模式到外模式给定关系模式 R(U,F),其中,属性集 u=城市,街道,邮政编码,函数依赖集 F=(城市,街道)邮政编码,邮政编码城市。关系 R (38) ,且分别有 (39) 。(分数:2.00)A.只有 1 个候选关键字“城市,街道”B.只有 1 个候选关键字“街道,邮政编码”C.有 2 个候选关键字“城市,街道”和“街道,邮政编码”D.有 2 个候选关键字“城市,街道”和“城市,邮政编码

19、”A.1 个非主属性和 2 个主属性B.0 个非主属性和 3 个主属性C.2 个非主属性和 1 个主属性D.3 个非主属性和 0 个主属性设有员工实体 Employee(员工号,姓名,性别,年龄,电话,家庭住址,家庭成员,关系,联系电话)。其中,“家庭住址”包括邮编、省、市、街道信息;“家庭成员,关系,联系电话”分别记录了员工亲属的姓名、与员工的关系以及联系电话,且一个员工允许有多个家庭成员。员工实体 EmPloyee 的主键为 (40) ;该关系属于 (41) ;为使数据库模式设计更合理,对于员工关系模式 Employee (42) 。(分数:3.00)A.员工号B.员工号,家庭成员C.姓名

20、D.姓名,家庭成员A.2NF,无冗余,无插入异常和删除异常B.2NF,无冗余,但存在插入异常和删除异常C.1NF,存在冗余,但不存在修改操作的不一致D.1NF,存在冗余和修改操作的不一致,以及插入异常和删除异常A.只允许记录一个亲属的姓名、与员工的关系以及联系电话B.可以不作任何处理,因为该关系模式达到了 3NFC.增加多个家庭成员、关系及联系电话字段D.应该将家庭成员、关系及联系电话加上员工号作为一个独立的模式系统分析师-数据库系统 2 答案解析(总分:42.00,做题时间:90 分钟)一、单项选择题(总题数:23,分数:42.00)设有职工实体 Employee(职工号,姓名,性别,年龄,

21、通信地址,家庭成员),其中通信地址记录了邮编、省、市、街道信息;家庭成员记录了职工的亲属得姓名。职工实体中的通信地址是一个 (1) 属性;为了将数据库模式设计得更合理,对于家庭成员属性 (2) 。(分数:2.00)A.简单B.复合 C.多值D.派生解析:A.可以不作任何处理直接记录亲属的姓名B.只允许记录一个亲属的姓名C.需要对职工实体设置若干个亲属姓名字段D.应该将职工的亲属的姓名加上职工号设计成为一个独立的实体 解析:分析 简单属性是原子的,不可再分的。复合属性可以细分为更小的部分(即划分为别的属性)。有时用户希望访问整个属性,有时希望访问属性的某个成分,那么在模式设计时可采用复合属性。本

22、题职工实体 Employee 的通信地址可以进一步分为邮编、省、市、街道等,因此是一个复合属性。定义的属性对于一个特定的实体都只有单独的一个值,则这个属性为单值属性。例如,对于一个特定的职工,只对应一个职工号、职工姓名。而如果某个属性可能有多种取值,则这样的属性称为多值属性,例如,对于一个特定的职工号,其家庭成员可能有多个。为了将数据库模式设计得更合理,对于家庭成员属性,应该将职工亲属的姓名加上职工号设计成为一个独立的实体。1.若关系模式中存在非主属性对码的部分依赖,则该关系模式属于 (3) 。(分数:1.00)A.1NF B.2NFC.3NFD.BCNF解析:分析 若关系模式 R 的每一个分

23、量都是不可再分的数据项,则关系模式 R 属于第一范式(1NF);若关系模式属于 1NF,且每一个非主属性完全依赖于码,则关系模式 R 属于 2NF。换句话说,当 1NF 消除了非主属性对码的部分依赖,则该关系模式属于 2NF。2.在某学校的综合管理系统设计阶段,教师实体在学籍管理子系统中被称为“教师”,而在人事管理子系统中被称为“职工”,这类冲突被称为 (4) 。(分数:1.00)A.语义冲突B.命名冲突 C.属性冲突D.结构冲突解析:分析 根据局部应用设计好各局部 E-R 图之后,就可以对各分 E-R 图进行合并。合并的目的在于在合并过程中解决分 E-R 图中相互间存在的冲突,消除分 E-R

24、 图之间存在的信息冗余,使之成为能够被全系统所有用户共同理解和接受的统一的、精练的全局概念模型。分 E-R 图之间的冲突主要有命名冲突、属性冲突和结构冲突三类。选项 B 正确,因为命名冲突是指相同意义的属性,在不同的分 E-R 图上有着不同的命名,或是名称相同的属性在不同的分 E-R 图中代表着不同的意义,这些也要进行统一。选项 C 不正确,因为属性冲突是指同一属性可能会存在于不同的分 E-R 中,由于设计人员不同或是出发点不同,对属性的类型、取值范围和数据单位等可能会不一致,这些属性对应的数据将来只能以一种形式在计算机中存储,这就需要在设计阶段进行统一。选项 D 不正确,因为结构冲突是指同一

25、实体在不同的分 E-R 图中有不同的属性,同一对象在某一分 E-R 图中被抽象为实体而在另一分 E-R 图中又被抽象为属性,需要统一。3.关于数据库中关系性质的描述,错误的是 (5) 。(分数:1.00)A.表中任意两行的值不能相同B.表中任意两列的值不能相同 C.行在表中的顺序无关D.列在表中的顺序无关解析:分析 关系可以有三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表。基本表是实际存在的表,它是实际存储数据的逻辑表示。查询表是查询结果对应的表。视图表是由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据。基本关系具有以下六条性质。(1)列是同质的,即每一列中的分量是同一

26、类型的数据,来自同一个域。(2)不同的列可出自同一个域,称其中的每一列为一个属性,不同的属性要给予不同的属性名。(3)列的顺序无所谓,即列的次序可以任意交换。(4)任意两个元组不能完全相同。但在大多数实际关系数据库产品中,例如 Oracle 等,如果用户没有定义有关的约束条件,它们都允许关系表中存在两个完全相同的元组。(5)行的顺序无所谓,即行的次序可以任意交换。(6)分量必须取原子值,即每一个分量都必须是不可分的数据项。4.关系数据库中,实现实体之间的联系是通过表与表之间的公共 (6) 。(分数:1.00)A.索引B.存储C.元组D.属性 解析:分析 关系数据库中,实现实体之间的联系是通过表

27、与表之间的公共属性。建立一个供应商零件数据库。其中“供应商”表 S(Sno,Sname,Zip,City)中的属性分别表示:供应商代码、供应商名、供应商邮编、供应商所在城市,其函数依赖为:Sno(Sname,Zip,City),ZipCity。“零件”表 P(Pno,Pname,Color,Weight,City),表示零件号、零件名、颜色、重量及产地。表 S 与表 P 之间的关系 SP(Sno,Pno,Price,Qty)表示供应商代码、零件号、价格、数量。A“供应商”表 S 属于 (7) 。B若要求:供应商代码不能为空,且值是唯一的,供应商名也是唯一的;零件号不能为空,且值是唯一的;一个供

28、应商可以供应多种零件,而一种零件可以由多个供应商供应。请将下面的 SQL 语句空缺部分补充完整。CREATE TABLE S(Sno CHAR(5) (8) ,Sname CHAR(30)UNIQUE,Zip CHAR(8),City CHAR(20)(9) );(分数:3.00)A.1NFB.2NF C.3NFD.BCNF解析:A.FOREIGN KEYB.NOT NULL UNIQUE C.FOREIGN KEY(Sno)D.PRIMARY KEY(Sname)解析:A.NOTNULLB.NOTNULLUNIQUEC.PRIMARY KEY(Sno) D.PRIMARY KEY(Sname

29、)解析:分析 显然,表 S 的主键是 Sno,说明 S 至少是 2NF。但因为存在 Snozip 和 ZipCity,也就是说,City 是传递依赖于主键的,所以 S 不是 3NF。在给定的 SQL 语句中,因为 Sno 是主键,所以(8)空应该填“PRIMARY KEY”,但给出的选项中没有这个词组。试题描述告诉我们,“供应商代码不能为空,且值是唯一的”,所以应该选择 B,而在(9)空处填写“PRIMARY KEY(Sno)”。5. (10) 不属于关系数据库管理系统。(分数:1.00)A.OracleB.MS SQL ServerC.DB2D.IMS 解析:分析 显然,IMS 不是关系数据

30、库管理系统。6. (11) 是一种信息分析工具,能自动地找出数据仓库中的模式及关系。(分数:1.00)A.数据集市B.数据挖掘 C.预测分析D.数据统计解析:分析 数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定且随时间变化的数据集合,用于支持管理决策。(1)面向主题。操作型数据库的数据组织面向事务处理任务(面向应用),各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。例如,一个保险公司所进行的事务处理(应用问题)可能包括汽车保险、人寿保险

31、、健康保险和意外保险等,而公司的主要主题范围可能是顾客、保险单、保险费和索赔等。(2)集成。在数据仓库的所有特性中,这是最重要的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据进行抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。(3)相对稳定。操作型数据库中的数据通常实时更新,数据根据需要即时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,

32、也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需定期加载、刷新。(4)随时间变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。数据仓库反映历史变化的属性主要表现在:(1)数据仓库中的数据时间期限要远远长于传统操作型数据系统中的数据时间期限,传统操作型数据系统中的数据时间期限可能为数十天或数个月,数据仓库中的数据时间期限往往为数年甚至几十年。(2)传统操作型数据系统中的数据含有“当前值”的数据,这

33、些数据在访问时是有效的,当然数据的当前值也能被更新,而数据仓库中的数据仅仅是一系列某一时刻(可能是传统操作型数据系统)生成的复杂的快照。(3)传统操作型数据系统中可能包含也可能不包含时间元素,如年、月、日、时、分、秒等,而数据仓库中一定会包含时间元素。从结构的角度看,有 3 种数据仓库模型,分别是企业仓库、数据集市和虚拟仓库。企业仓库收集跨越整个企业的各个主题的所有信息,它提供全企业范围的数据集成,数据通常来自多个操作型数据库和外部信息提供者,并且是跨多个功能范围的。它通常包含详细数据和汇总数据;数据集市包含对特定用户有用的、企业范围数据的一个子集,它的范围限于选定的主题;虚拟仓库是操作型数据

34、库上视图的集合。数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析。常见和应用最广泛的数据挖掘方法有:(1)决策树。决策树方法是利用信息论中的互信息(信息增益)寻找数据库中具有最大信息量的属性字段,建立决策树的一个节点,再根据该属性字段的不同取值建设树的分支;在每个分支子集中重复建立树的下层节点和分支的过程。国际上最早的、也是最有影响的决策树方法是 Quiulan 研究的 ID3 方法。(2)神经网络。神经网络方法是模拟人脑神经元结构,

35、完成类似统计学中的判别、回归、聚类等功能,是一种非线性的模型。主要有 3 种神经网络模型:前馈式网络、反馈式网络和自组织网络。人工神经网络最大的长处是可以自动地从数据中学习,形成知识,这些知识有些是我们过去未曾发现的,因此具有较强的创新性。神经网络的知识体现在网络连接的权值上,神经网络的学习主要表现在神经网络权值的逐步计算上。(3)遗传算法。遗传算法是模拟生物进化过程的算法,它由三个基本过程组成:繁殖(选择)、交叉(重组)、变异(突变)。采用遗传算法可以产生优良的后代,经过若干代的遗传,将得到满足要求的后代,即问题得解。(4)关联规则挖掘算法。关联规则是描述数据之间存在关系的规则,形式为“A1

36、A2AnB1B2Bn”。一般分为两个步骤:求出大数据项集。用大数据项集产生关联规则。不论采用哪种技术完成数据挖掘,从功能上都可以将数据挖掘的分析方法划分为 4 种,即关联分析(Associations)、序列模式分析(Sequential Pattems)、分类分析(Classifiers)和聚类分析(Clustering)。(1)关联分析。关联分析的目的是挖掘出隐藏在数据间的相互关系。设 R=A1,A2,AP为0,1域上的属性集,r 为 R 上的一个关系,关于 r 的关联规则表示为 XB,其中 XR,BR,且 XB=*。关联规则的矩阵形式为:矩阵 r 中,如果在行 X 的每一列为 1,则行

37、B 中各列趋向于为 1。在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。(2)序列模式分析。序列模式分析的目的也是挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。(3)分类分析。分类分析时首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后

38、检查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。(4)聚类分析。聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有作任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。在实际应用的数据挖掘系统中,上述 4 种分析方法有着不同的适用范围,因此经常被综合运用。某公司的部门(部门号,部门名,负责人,电话)、商品(商品号,商品名称,单价,库存量)和职工(职工号,姓名,住址)三个实体之间的关系如表 4-8、表 4-9 和表 4-10 所示。假设每个部门有一位负责人和一部电

39、话,但有若干名员工;每种商品只能由一个部门负责销售。表 4-8 部门表部门号 部门名 负责人 电 话001 家电部 E002 1001002 百货部 E026 1002003 食品部 E030 1003表 4-9 商品表商品号商品名称单价库存量30023计算机48002630024打印机1650730101毛巾 110630102牙刷3.8288表 4-10 职工表职工号姓 名住 址E001王军南京路E002李晓斌淮海路E021杨烨江西路E026田波西藏路E028李晓斌西藏路E029刘丽华淮海路E030李彬彬唐山路E031胡慧芬昆明路 表 4-11 统计结果职工号姓 名部门名月销售额E001王

40、军家电部528900E002李晓斌家电部368000E021杨烨百货部12500E028李晓斌百货部82500E031胡慧食品2826芬 部 08部门关系不属于第三范式的原因是 (12) 。如果用户要求得到表 4-11 所示的结果,需要 (13) ,并增加关系模式 (14) 。(分数:3.00)A.没有消除非属性对码的部分函数依赖,如:部门名负责人B.没有消除非主属性对码的部分函数依赖,如:负责人电话C.只消除了非主属性对码的部分函数依赖,而未消除传递函数依赖 D.没有消除非主属性对码的部分函数依赖和传递函数依赖解析:A.修改表 4-8 的结构,在表 4-8 中增加一个职工号B.修改表 4-9

41、 的结构,在表 4-9 中增加一个职工号C.修改表 4-9 的结构,在表 4-9 中增加一个部门号D.修改表 4-10 的结构,在表 4-10 中增加一个部门号 解析:A.销售(职工号,商品号,日期,数量) B.销售(职工号,商品名称,商品号,数量)C.销售(职工号,部门号,日期,数量)D.销售(职工号,部门号,商品号,日期)解析:分析 现在,在部门(部门号,部门名,负责人,电话)关系模式中,部门号是主码,所以不存在对码的部分依赖问题。根据试题假设,每个部门有一位负责人和一部电话,也就是说,存在“负责人电话”这样的函数依赖,即存在对主码的传递函数依赖。在表 4-11 中,有职工号、姓名、部门、

42、月销售额,其中职工号和姓名可以由表 4-10 得出,但是,由表4-8表 4-10 无法得出职工所在的部门,因此,应该在表 4-10 中增加“部门号”属性。同时,要计算出职工的月销售总额,还需要一个表来记录职工销售的数据。该表需要包括的属性有职工号、商品号、日期、数量。由于软硬件故障可能造成数据库中数据被破坏,数据库恢复就是 (15) 。可以有多种方法实现数据库恢复,如:定期将数据库作备份;在进行事务处理时,对数据更新(插入、删除、修改)的全部有关内容写入 (16) ;当系统正常运行时,按一定的时间间隔,设立 (17) ,把内存缓冲区内容还未写入到磁盘中去的有关状态记录到该文件中;当发生故障时,

43、根据现场数据内容及相关文件来恢复系统的状态。(分数:3.00)A.重新安装数据库管理系统和应用程序B.重新安装应用程序,并将数据库做镜像C.重新安装数据库管理系统,并将数据库做镜像D.在尽可能短的时间内,把数据库恢复到故障发生前的状态 解析:A.日志文件 B.程序文件C.检查点文件D.图像文件解析:A.日志文件B.程序文件C.检查点文件 D.图像文件解析:分析 数据库恢复是指在数据库中的数据被破坏时,在尽可能短的时间内,把数据库恢复到故障发生前的状态。在进行事务处理时,对数据更新(插入、删除、修改)的全部有关内容写入日志文件;当系统正常运行时,按一定的时间间隔,设立检查点文件,把内存缓冲区内容

44、还未写入到磁盘中去的有关状态记录到该文件中;当发生故障时,根据现场数据内容及相关文件来恢复系统的状态。希赛公司网上销售管理系统的数据库部分关系模式如下所示。其中,客户号唯一标识一位客户,产品号唯一标识一件产品,订单号唯一标识一份订单。一份订单必须且仅对应一位客户,一份订单可由一到多条订单明细组成,一位客户可以有多份订单。客户(客户号,姓名,性别,地址,邮编)产品(产品号,名称,库存,单价)订单(订单号,时间,金额,客户号)订单明细(订单号,产品号,数量)订单关系模式的主键为 (18) ;订单明细关系模式的主键为 (19) ;其中订单的外键为 (20) 。(分数:3.00)A.订单号 B.客户号

45、C.(订单号,客户号)D.(订单号,时间)解析:A.订单号B.产品号C.(订单号,产品号) D.(订单号,数量)解析:A.客户号,订单明细的外键为订单号B.客户号,订单明细的外键为订单号和产品号 C.订单号,订单明细的外键为产品号D.订单号,订单明细的外键为订单号和产品号解析:分析 根据试题描述,“订单号唯一标识一份订单”,所以,订单关系模式的主键为“订单号”。在订单关系模式中,“一份订单必须且仅对应一位客户”,而在客户关系模式中,“客户号唯一标识一位客户”,也就是说,“客户号”是客户关系模式的主键,因此,“客户号”是订单关系模式的外键。因为“一份订单可由一到多条订单明细组成”,也就是说,在订

46、单明细关系模式中,“订单号”是可以重复的,因此,需要与“产品号”联合起来作为主键。又因为“订单号”是订单关系模式的主键,“产品号”是产品关系模式的主键(因为“产品号唯一标识一件产品”),所以,“订单号”和“产品号”都是订单明细关系模式的外键。某高校管理信息系统的数据库设计过程中, (21) 阶段是在需求分析的基础上,对用户信息加以分类、聚集和概括,建立信息模型,并依照选定的数据库管理系统软件,转换成为数据的 (22) ,再依照软硬件环境,最终实现数据的合理存储。(分数:2.00)A.物理设计B.逻辑结构设计C.数据库实施D.概念结构设计, 解析:A.物理模式B.逻辑模式 C.内模式D.概念模式

47、解析:分析 通常将数据库设计分为需求分析、概念结构设计、逻辑结构设计和数据库物理设计 4 个阶段。需求分析是指收集和分析用户对系统的信息需求和处理需求,得到设计系统所必需的需求信息,建立系统说明文档。其目标是通过调查研究,了解用户的数据要求和处理要求,并按一定格式整理形成需求说明书。概念结构设计阶段的目标是对需求说明书提供的所有数据和处理要求进行抽象与综合处理,按一定的方法构造反映用户环境的数据及其相互联系的概念模型,即用户的数据模型或企业数据模型。这种概念数据模型与 DBMS 无关,是面向现实世界的、极易为用户所理解的数据模型。为保证所设计的概念数据模型能正确、完全地反映用户的数据及其相互关

48、系,便于进行所要求的各种处理,在本阶段设计中可吸收用户参与和评议设计。在进行概念结构设计时,可先设计各个应用的视图,即各个应用所看到的数据及其结构,然后再进行视图集成,以形成一个单一的概念数据模型。这样形成的初步数据模型还要经过数据库设计者和用户的审查与修改,最后形成所需的概念数据模型。逻辑结构设计阶段的设计目标是把上一阶段得到的与 DBMS 无关的概念数据模型转换成等价的,并为某个特定的 DBMS 所接受的逻辑模型所表示的概念模式,同时将概念设计阶段得到的应用视图转换成外部模式,即特定 DBMS 下的应用视图。在转换过程中要进一步落实需求说明,并满足 DBMS 的各种限制。该阶段的结果是用

49、DBMS 所提供的数据定义语言(DDL)写成的数据模式。逻辑设计的具体方法与 DBMS 的逻辑数据模型有关。逻辑模型应满足数据库存取一致性及运行等各方面的用户需求。物理设计阶段的任务是把逻辑设计阶段得到的满足用户需求的已确定的逻辑模型在物理上加以实现,其主要的内容是根据 DBMS 提供的各种手段,设计数据的存储形式和存取路径,如文件结构、索引的设计等,即设计数据库的内模式或存储模式。数据库的内模式对数据库的性能影响很大,应根据处理需求及DBMS、操作系统和硬件的性能进行精心设计。7.在数据库系统中,数据的完整性是指数据的 (23) 。(分数:1.00)A.有效性、正确性和一致性 B.有效性、正确性和可维护性C.有效性、正确性和安全性D.正确性、一致性和安全性解析:分析 数据库完整性是指数据库中数据的正确性、有效性和相容性(一致性)。数据库完整性由各种各样的完整性约束来保证,因此可以说数据库完整性设计就是数据库完整性约束的设计。数据库完整性约束可以通过 DBMS 或应用程序来实现,基于 DBMS 的完整

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 职业资格

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1