1、计算机专业基础综合数据结构(文件)历年真题试卷汇编 1 及答案与解析一、单项选择题1 散列文件使用散列函数将记录的关键字值计算转化为记录的存放地址,因为散列函数是一对一的关系,则选择好的( )方法是散列文件的关键。【哈尔滨工业大学2001 二、5(2 分) 】(A)散列函数(B)除余法中的质数(C)冲突处理(D)散列函数和冲突处理2 顺序文件采用顺序结构实现文件的存储,对大型的顺序文件的少量修改,要求重新复制整个文件,代价很高,采用( )的方法可降低所需的代价。【北京邮电大学2000 二、8(208 分) 】(A)附加文件(B)按关键字大小排序(C)按记录输入先后排序(D)连续排序3 用 IS
2、AM 组织文件适合于( )。【中科院软件所 1998】(A)磁带(B)磁盘4 下述文件中适合于磁带存储的是( )。【中科院计算所 2000 一、7(2 分)】(A)顺序文件(B)索引文件(C)散列文件(D)多关键字文件5 用 ISAM 和 VSAM 组织文件属于( )。【中国科技大学 1998 二、5(2 分) 中科院计算所 1998 二、5(2 分) 】(A)顺序文件(B)索引文件(C)散列文件6 ISAM 文件和 VASM 文件属于( )。【山东大学 2001 二、5(1 分) 】(A)索引非顺序文件(B)索引顺序文件(C)顺序文件(D)散列文件7 B+树应用在 ( )文件系统中。【北京邮
3、电大学 2001 一、1(2 分)】(A)ISAM(B) VSAM 8 倒排文件包含有若干个倒排表,倒排表的内容是( )。【哈尔滨工业大学 2005 二、8(1 分)】(A)一个关键字值和该关键字的记录地址(B)一个属性值和该属性的一个记录地址(C)一个属性值和该属性的全部记录地址(D)多个关键字和它们相对应的某个记录的地址二、填空题9 文件可按其记录的类型不同而分成两类,即_和_文件。【西安电子科技大学 1998 二、6(3 分)】10 从用户的观点看,文件的逻辑结构通常可以区分为两类:一类是如 dBASE 中数据库文件那样的文件组织结构,称为(1)文件;另一种是诸如用各种文字处理软件编辑成
4、的文本文件,称为(2)文件。从文件在存储器上的存放方式来看,文件的物理结构往往可区分为三类,即(3),(4) 和(5)。B+树适用于组织(6)的索引结构,m阶 B+树每个结点至多有 (7)个儿子,除根结点外每个结点至少有(8)个儿子,根结点至少有(9)个儿子,有 k 个子的结点必有(10) 个关键字。【山东工业大学 1996 一、4(5 分)】11 文件由_组成;记录由_组成。【大连海事大学 1996(2 分)】12 顺序文件中,要存取第 I 个记录,必须先存取_个记录。【哈尔滨工业大学 2001 一、4(2 分) 】13 索引顺序文件既可以顺序存取,也可以_存取。【武汉大学 2000 一、1
5、0】14 建立索引文件的目的是_。【中山大学 1998 一、12(1 分)】15 倒排序文件的主要优点在于_。【山东工业大学 1995 一、3(1 分)】16 检索是为了在文件中寻找满足一定条件的记录而设置的操作。检索可以按_检索,也可以按_检索;按_检索又可以有_检索和_检索。【山东大学 1999 一、1(5 分)】17 散列检索技术的关键是_和_。【山东工业大学 1995 一、2(2 分)】18 VSAM 系统是由 _、_、_构成的。【北京科技大学 1997 一、9】19 VSAM(虚拟存储存取方法)文件的优点是:动态地_,不需要文件进行_,并能较快地_进行查找。【山东大学 2001 三、
6、4(2 分)】三、判断题20 若在磁盘上的顺序文件中插入新的记录,不一定要复制整个文件。( )【哈尔滨工业大学 2005 三、4(1 分)】(A)正确(B)错误21 倒排文件是对次关键字建立索引。( )【南京航空航天大学 1997 一、10(1 分)】(A)正确(B)错误22 倒排序文件的优点是维护简单。( )【南京航空航天大学 1995 二、10(1 分)】(A)正确(B)错误23 倒排文件与多重表文件的次关键字索引结构是不同的。 ( )【西安交通大学1996 二、6(3 分) 】(A)正确(B)错误24 Hash 表与 Hash 文件的唯一区别是 Hash 文件引入了“ 桶”的概念。( )
7、【南京航空航天 大学 1996 六、10(1 分)】(A)正确(B)错误25 文件系统采用索引结构是为了节省存储空间。( )【北京邮电大学 2000 一、10(1 分 )】(A)正确(B)错误26 对处理大量数据的外存介质而言,索引顺序存取方法是一种方便的文件组织方法。( )【东南大学 2001 一、1-10(1 分)】(A)正确(B)错误27 对磁带机而言,ISAM 是一种方便的文件组织方法。 ( )【中科院软件所 1997 一、10(1 分 )】(A)正确(B)错误28 直接访问文件也能顺序访问,只是一般效率不高。( )【北京邮电大学 2002 一、10(1 分 )】(A)正确(B)错误2
8、9 存放在磁盘、磁带上的文件,既可以是顺序文件,也可以是索引结构或其他结构类型的文件。( ) 【山东大学 2001 一、7(1 分) 】(A)正确(B)错误30 检索出文件中关键字值落在某个连续的范围内全部记录,这种操作称为范围检索。对经常需要做范围检索的文件进行组织,采用散列法优于顺序检索法。( )【中山大学 1994 一、5(2 分)】(A)正确(B)错误31 倒排文件是为了多关键字查找。( )【北京邮电大学 2006 二、10(1 分)】(A)正确(B)错误四、综合题32 名词解释:文件。【山东工业大学 1998 一、11(2 分)】33 名词解释:索引文件。【哈尔滨工业大学 2000
9、一、4(3 分)】34 什么是索引顺序文件?【哈尔滨工业大学 2001 三、5(3 分)】35 索引顺序存取方法(ISAM)中,主文件已按关键字排序,为何还需要主关键字索引?【东南大学 1995 四(6 分) 】36 分析 ISAM 文件(INDEXED SEQUENTIAL ACCESS METHORD)和 VSAM 文件(VIRTUALSTORAGE ACCESS METHORD)的应用场合、优缺点等。 【华南理工大学 2001 一、4(4 分) 】37 一个 ISAM 文件除了主索引外,还包括哪两级索引 ?【北京科技大学 1999 一、8(2 分)】38 名词解释:倒排文件。【山东工业大
10、学 1998 一、1-3(2 分)】39 为什么在倒排文件(inverted file)组织中,实际记录中的关键字域(key field)可删除以节约空间? 而在多表(multilist) 结构中这样做为什么要牺牲性能? 【东南大学1997 一、4(8 分) 】40 简单比较文件的多重表和倒排表组织方式各自的特点。【东南大学 2000 一、2(6 分)】41 组织待检索文件的倒排表的优点是什么?【北京科技大学 2001 一、10(2 分)】42 为什么文件的倒排表比多重表组织方式节省空间? 【东南大学 2001 一、2(6 分)】43 试比较顺序文件、索引非顺序文件、索引顺序文件、散列文件的存
11、储代价、检索、插入、删除记录时的优点和缺点。【西北工业大学 1999 四(8 分)】44 已知两个各包含 N 和 M 个记录的排好序的文件能在 O(N+M)时间内合并为一个包含 N+M 个记录的排好序的文件。当有多于两个排好序的文件要被合并在一起时,只需重复成对地合并便可完成。合并的步骤不同,所需花费的记录移动次数也不同。现有文件 F1, F2,F3,F4,F5,各有记录数为 20,30,10,5 和 30,试找出记录移动次数最少的合并步骤。【重庆大学 2000 二、3】45 已知职工文件中包括职工号、职工姓名、职务和职称 4 个数据项(见下表)。职务有校长、系主任、室主任和教员;校长领导所有
12、系主任,系主任领导他所在系的所有室主任,室主任领导他所在室的全体教员;职称有教授、副教授和讲师 3 种。请在职工文件的数据结构中设置若干指针和索引,以满足下列两种查找的需要:(1)能够检索出全体职工间领导与被领导的情况;(2)能够分别检索出全体教授、全体副教授、全体讲师。要求指针数量尽可能少,给出各指针项索引的名称及含义即可。【北京航空航天大学 1 996】计算机专业基础综合数据结构(文件)历年真题试卷汇编 1 答案与解析一、单项选择题1 【正确答案】 D2 【正确答案】 A3 【正确答案】 B4 【正确答案】 A5 【正确答案】 B6 【正确答案】 B7 【正确答案】 B8 【正确答案】 C
13、二、填空题9 【正确答案】 操作系统文件,数据库10 【正确答案】 (1)数据库 (2) 文本 (3)顺序组织 (4) 随机组织 (5)链组织 (6)随机组织 (7)m (8)m2 (9)2 (10)k11 【正确答案】 记录,数据项12 【正确答案】 第 113 【正确答案】 随机14 【正确答案】 提高查找速度15 【正确答案】 检索记录快16 【正确答案】 关键字,记录号,记录号,顺序,直接17 【正确答案】 构造散列函数,解决冲突的方法18 【正确答案】 索引集,顺序集,数据集19 【正确答案】 分配和释放存储空间,重组,对插入的记录三、判断题20 【正确答案】 B21 【正确答案】
14、A22 【正确答案】 B23 【正确答案】 A24 【正确答案】 B25 【正确答案】 B26 【正确答案】 B27 【正确答案】 B28 【正确答案】 B29 【正确答案】 B30 【正确答案】 A31 【正确答案】 A四、综合题32 【正确答案】 文件是由大量性质相同的记录组成的集合,按记录类型不同可分为操作系统文件和数据库文件。文件的基本组织方式有顺序组织、索引组织、散列组织和链组织。文件的存储结构可以采用将基本组织相结合的方法,常用的结构有顺序结构、索引结构、散列结构。 (1)顺序结构,相应文件为顺序文件,其记录按存入文件的先后次序顺序存放。顺序文件本质上就是顺序表。若逻辑上相邻的两个
15、记录在存储位置上相邻,则为连续文件;若记录之间以指针相链接,则称为串联文件。顺序文件只能顺序存取,要更新某个记录,必须复制整个文件。顺序文件连续存取的速度快,主要适用于顺序存取、批量修改的情况。 (2)索引结构,相应文件为索引文件。索引文件包括索引表和数据表,索引表中的索引项包括数据表中数据的关键字和相应地址,索引表有序,其物理顺序体现了文件的逻辑次序,实现了文件的线性结构。索引文件只能是磁盘文件,既能顺序存取,又能随机存取。(3)散列结构,也称计算寻址结构,相应文件称为散列文件,其记录是根据关键字值经散列函数计算确定其地址,存取速度快,不需索引,节省存储空间。不能顺序存取,只能随机存取。其他
16、文件均由以上文件派生而得。文件采用何种存储结构应综合:考虑各种因素,如:存储介质类型、记录的类型、大小和关键字的数目以及对文件做何种操作。33 【正确答案】 在主文件外,再建立索引表指示关键字及其物理记录的地址间一一对应关系。这种由索引表和主文件一起构成的文件称为索引:文件。索引表依关键字有序。主文件若按关键字有序称为索引顺序文件,否则称为索引非顺序文件(通常简称索引文件) 。索引顺序文件因主文件有序,一般用稀疏索引,占用空间较少。常用索引顺序文件有 ISAM 和 VSAM。ISAM 采用静态索引结构,而 VSAM采用 B+树的动态索引结构。索引文件既能顺序存取,也能随机存取。34 【正确答案
17、】 在索引文件中,若(数据区)主文件中关键字有序,则文件称为索引顺序文件.35 【正确答案】 ISAM 是专为磁盘存取设计的文件组织方式。即使主文件关键字有序,但因磁盘是以盘组、柱面和磁道(盘面)三级地址存取的设备,因此通常对磁盘上的数据文件建立盘组、柱面和磁道(盘面)三级索引。在 ISAM:史件上检素记录时,先从主索引(柱面索引的索引)找到相应柱面索引。再从柱面索引找到记录所在柱面的磁道索引,最后从磁道索引找到记录所在磁道的第一个记录的位置,由此出发在该磁道上进行顺序查找直到查到为止;反之,若找遍该磁道而未找到所查记录,则文件中无此记录。36 【正确答案】 ISAM 是一种专为磁盘存取设计的
18、文件组织形式,采用静态索引结构,对磁盘上的数据文件建立盘组、柱面、磁道三级索引。ISAM 文件中记录按关键字顺序存放,插入记录时需移动记录并将同一磁道上最后的一个记录移至溢出区,同时修改磁道索引项,删除记录只需在存储位置作标记,不需移动记录和修改指针。经过多次插入和删除记录后,文件结构变得不合理,需周期整理 ISAM 文件。VSAM 文件采用 B+树动态索引结构,文件只有控制区间和控制区域等逻辑存储单位,与外存储器中柱面、磁道等具体存储单位没有必然联系。VSAM 文件结构包括索引集、顺序集和数据集三部分,记录存于数据集中,顺序集和索引集构成B+树,作为文件的索引部分可实现顺链查找和从根结点开始
19、的随机查找。与 ISAM文件相比,VSAM 文件有如下优点:动态分配和释放存储空间,不需对文件进行重组;能保持较高的查找效率,且查找先后插入记录所需时间相同。因此,基于B+树的 VSAM 文件通常作为大型索引顺序文件的标准组织。37 【正确答案】 ISAM 文件有三级索引:磁盘组、柱面和磁盘,柱面索引存放在某个柱面上,若柱面索引较大,占多个磁道时,可建立柱面索引的索引主索引。故本题中所指的两级索引是盘组和磁道。38 【正确答案】 倒排文件是一种多关键字的文件,主数据文件按关键字顺序构成串联文件,并建立主关键字索引。对次关键字也建立索引,该索引称为倒排表。倒排表包括两项,一项是次关键字,另一项是
20、具有同一次关键字值的记录的物理记录号(若数据文件非串联文件,而是索引顺序文件,如 ISAM,则倒排表中存放记录的主关键字而不是物理记录号)。倒排表作索引的优点是索引记录快,缺点是维护困难。在同一索引表中,不同的关键字其记录数不同,各倒排表的长度不同,同一倒排表中各项长度也不相等。39 【正确答案】 因倒排文件组织中,倒排表有关键字值及同一关键字值的记录的所有物理记录号,可方便地 查询具有同一关键字值的所有记录;而多重表文件中次关键字索引结构不同,删除关键字域后查询性能受到影响。40 【正确答案】 多重表文件是把索引与链接结合而形成的组织方式。记录按主关键字顺序构成一个串联文件,建立主关键字的索
21、引(主索引)。对每一次关键字建立次关键字索引,具有同一关键字的记录构成一个链表。主索引为非稠密索引,次索引为稠密索引,每个索引项包括次关键字、头指针和链表长度。多重表文件易于编程,也易于插入,但删除烦琐。需在各次关键字链表中删除。倒排文件的特点见上面第 7 题和第 8 题。41 【正确答案】 倒排表作索引的优点是索引记录快,因为从次关键字值直接找到各相关记录的物理记录号,倒排因此而得名(因通常的查询是从关键字查到记录)。在插入和删除记录时,倒排表随之修改,倒排表中具有相同次关键字的记录号是有序的。42 【正确答案】 倒排表有两项,一是次关键字值,二是具有相同次关键字值的物理记录号,这些记录号有
22、序且顺序存储,不使用多重表中的指针链接,因而节省了空间。43 【正确答案】 (1)顺序文件只能顺序查找,优点是批量检索速度快,不适于单个记录的检索。顺序文件不能像顺序表那样插入、删除和修改,因文件中的记录不能像向量空间中的元素那样“移动” ,只能通过复制整个文件实现上述操作。(2)索引非顺序文件适合随机存取,不适合顺序存取,因主关键字未排序,若顺序存取会引起磁头频繁移动。索引顺序文件是最常用的文件组织,因主文件有序,既可顺序存取也可随机存取。索引非顺序文件是稠密索引,可以“预查找” ,索引顺序文件是稀疏索引,不能“ 预查找 ”,但由于索引占空间较少,管理要求低,提高了索引的查找速度。(3)散列
23、文件也称直接存取文件,根据关键字的散列函数值和处理冲突的方法,将记录散列到外存上。这种文件组织只适用于像磁盘那样的直接存取设备,其优点是文件随机存放,记录不必排序,插入、删除方便,存取速度快,无需索引区,节省存储空间。缺点是散列文件不能顺序存取,且只限于简单查询。经多次插入、删除后,文件结构不合理,需重组文件,这很费时。44 【正确答案】 类似最优二叉树(哈夫曼树),可先合并含较少记录的文件,后合并含较多记录的文件,使移动次数减少。见下面的哈夫曼树。45 【正确答案】 在职务项中增加一个指针项,指向其领导者。因题目中未提出具体的隶属关系,如哪个系的系主任,哪个系哪个室的室主任,哪个室的教员等。这里假设每个室主任隶属于他前边离他最近的那个系主任,每个教员隶属于他前边离他最近的那个室主任,见下面多重表文件。在职称项中增加一个指针项,指向同一职称的下一个职工,增加一个次关键字索引表。