1、统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 3 及答案与解析一、单项选择题以下每小题各有四项备选答案,其中只有一项是正确的。1 某学校 10000 名女生身高服从正态分布,其均值为 160cm,标准差为 5cm,其中6827 名女生身高的可能范围是( )。2016 年中级真题(A)160cm 到 165cm(B) 150cm 到 170cm(C) 155cm 到 165cm(D)155cm 到 160cm2 从一个服从正态分布的总体中随机抽取样本容量为 n 的样本,在 95的置信度下对总体参数进行估计的结果为 20008。如果其他条件不变,样本容量扩大到原来的 4 倍,则总体参数的
2、置信区间应该是( )。2016 年中级真题(A)20016(B) 20004(C) 80016(D)800043 估计总体参数时,评价估计量有三个标准,其中无偏性是指( )。2014 年中级真题(A)估计量的方差尽可能小(B)估计量抽样分布的期望值等于被估计总体的参数(C)估计量抽样分布的标准差等于被估计总体的参数(D)随着样本量的增大,点估计量的值越来越接近被估计总体的参数4 在一项比例的电话调查中,样本量是 615,允许误差为 4。下面对 4的允许误差描述正确的是( ) 。2014 年中级真题(A)调查中有 4的被调查者可能会改变他们的想法(B)在 615 人中大约会有 4的人拒绝访问(C
3、)在 615 人中大约会有 4的人没有电话(D)样本比例与总体比例之间的差异绝对值小于 45 关于样本比例 p 正确的说法是( )。2014 年初级真题(A)随着样本容量的增大,p 的方差愈来愈小(B)随着样本容量的增大,p 的方差愈来愈大(C)随着样本容量的增大,p 的方差不会发生改变(D)随着样本容量的增大,p 的方差在某些区间会变大,在某些区间会变小6 点估计是用样本统计量的( )来近似相应的总体参数。2014 年初级真题(A)实现值(B)估计值(C)近似值(D)精确值7 区间估计是包括样本统计量在内的一个区间,该区间通常由样本统计量加减( )得到。2014 年初级真题(A)标准差(B)
4、估计标准误差(C)方差(D)估计方差8 “一致性”是统计学家评价估计量的一个标准,它是指( )。2014 年、2010 年初级真题(A)估计量的方差尽可能小(B)估计量抽样分布的期望值等于被估计的总体参数(C)随着样本量的增大,点估计量的值越来越接近被估计总体的参数(D)点估计量的值与被估参数的值相等9 下列关于样本量错误的说法是( )。2014 年初级真题(A)它表明一个样本所包含的单位数(B)样本量的大小会影响抽样效果(C)样本量不少于 25 个样本称为大样本(D)样本量的大小与抽样方法有关二、多项选择题以下每小题至少有两项正确答案,每选对一项得 0.5 分,全部选对得满分。多选或错选不得
5、分。10 估计总体参数时,评价估计量的三个常用标准是( )。2016 年、2010 年中级真题(A)无偏性(B)有效性(C)多边性(D)一致性(E)最优性11 在一个有限总体中,抽取样本容量为 n 的样本,其可能抽取的样本个数取决于( )。2014 年中级真题 (A)样本容量的大小(B)总体全部单位数(C)抽样方法(D)抽样目的(E)总体方差12 由样本统计量来估计总体参数的方法主要有( )。2014 年中级真题(A)无偏估计(B)一致估计(C)点估计(D)总体总量估计(E)区间估计13 在抽样推断中,以下说法正确的是( )。2014 年初级真题(A)参数是一个随机变量(B)统计量是惟一确定的
6、量(C)参数是一个确定的量(D)统计量是一个随机变量(E)参数和统计量都是随机变量14 抽样分布( ) 。2014 年初级真题(A)是由样本统计量所形成的概率分布(B)仅仅是一种理论分布(C)是一种经验分布(D)是推断总体参数的理论基础(E)与总体分布是完全相同的15 假设总体中有 5 个个体单位,从中随机抽取两个进行调查,则( )。2014 年初级真题(A)采用重置抽样,可以组成 25 个不同的样本(B)采用不重置抽样,可以组成 25 个不同的样本(C)采用重置抽样,可以组成 10 个不同的样本(D)采用不重置抽样,可以组成 10 个不同的样本(E)采用重置抽样与不重置抽样,可以组成的样本数
7、相同三、判断题请判断下列各题说法正确或错误。16 抽样中所有可能组成的样本平均数的平均数等于总体平均数。( )2016 年中级真题(A)正确(B)错误17 参数估计中,统计量的标准误差是用于衡量样本统计量与总体参数之间差距的一个重要尺度。( )2014 年中级真题(A)正确(B)错误18 如果总体服从正态分布,样本均值一定服从正态分布。( )2014 年初级真题(A)正确(B)错误19 样本均值的抽样分布就是指抽取出来的样本均值 X 的分布。( )2013 年中级真题(A)正确(B)错误20 在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、惟一的。( )2013 年中级真题(A
8、)正确(B)错误21 如果要缩小置信区间,在其他条件不变的情况下,必须提高对置信水平的要求。( )2013 年初级真题(A)正确(B)错误四、综合应用题以下每道综合应用题包括 5 道小题,每道小题有一项或一项以上的正确答案,每选对一项得 0.5 分,全部选对得满分。多选或错选不得分。21 某调查机构欲进行某城市居民对某项政策支持率的电话调查,该城市的总人口在 1000 万以上,根据抽样理论,在置信度为 95,允许误差范围为 5的条件下,计算出所需调查的样本量为 385。请根据上述资料回答下列问题:2014 年中级真题22 如果调查结果显示,样本的支持率为 68,现在欲对总体的支持率进行区间估计
9、,其可以应用正态分布统计量进行估计的前提条件是( )。(A)总体的支持率大于 5(B) np5,其中 n 是样本量,p 是样本的支持率(C) n(1p)5,其中 n 是样本量,p 是样本的支持率(D)样本的支持率大于 523 如果该地区有人认为,居民的支持应该是在 70或以上,根据抽样调查结果( )。(A)在 005 的显著性水平下,没有理由拒绝这个结论(B)在 005 的显著性水平下,可以拒绝这个结论(C)在 001 的显著性水平下,没有理由拒绝这个结论(D)不能确定这个结论。24 本调查中的样本量为 385,其计算中的 p 值取值应该是( )。(A)p01(B) p03(C) p05(D)
10、p0825 调查结果显示,样本的支持率为 68,如果以置信度为 9545的条件下,推断总体的支持率应该在( )。(A)63 2,727(B) 659,741(C) 612,741(D)66 0,74026 如果本市分为两个区,每个区的人口大约为 500 ,本次调查想分别对两个区的人口进行推断,都以 95的置信度和允许误差范围 5的条件下推断总体,这时两个小区应该抽取的样本量是( )。(A)385(B) 770(C) 1155(D)不能确定26 从全班 60 名学生中按学号随机抽取 6 名学生调查其上网情况。6 名学生的上网时间(小时周) 分别是:16、12、5、5、10 和 18。请根据上述资
11、料从下列备选答案中选出正确答案。2013 年初级真题27 本例中学生上网时间数据是( )。(A)通过概率抽样的方法取得的(B)通过非概率抽样的方法取得的(C)通过简单随机抽样的方法取得的(D)通过整群抽样的方法取得的28 6 名学生上网时间(小时周)的( ) 。(A)平均数为 11(B)中位数为 11(C)中位数为 12(D)众数为 529 可以采用( ) 来反映学生上网时间的差异程度。(A)极差(B)众数(C)方差(D)标准差30 6 名学生上网时间(小时周)的( ) 。(A)方差为s2 296(B)方差为s2 2467(C)离散系数为 V 4946(D)离散系数为 V 451531 假设总
12、体服从正态分布,全班学生平均上网时间 95的置信区间为( )。(注:t0025 (5)2 571)(A)置信下限 112571(B)置信上限 112571(C)置信下限 112571(D)置信上限 112571统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 3 答案与解析一、单项选择题以下每小题各有四项备选答案,其中只有一项是正确的。1 【正确答案】 C【试题解析】 6827 名女生占总人数的 6827,根据正态分布的 3 原则,可知身高的可能范围为(16051cm,16051cm) ,即(155cm,165cm)。【知识模块】 统计方法2 【正确答案】 B【试题解析】 以均值的区间估
13、计为例,在正态分布下,其区间估计为 ,故样本容量扩大到原来的 4 倍,误差项变为原来的一半。【知识模块】 统计方法3 【正确答案】 B【试题解析】 评价估计量的标准包括:无偏性; 有效性;一致性。其中,无偏性是指估计量抽样分布的期望值等于被估计总体的参数。【知识模块】 统计方法4 【正确答案】 D【试题解析】 抽样调查的允许误差指参数估计值与实际值间的差异绝对值,题中所估计的参数为比例,因此,允许误差指样本比例与总体比例之间的差异的绝对值,D 项为正确答案。【知识模块】 统计方法5 【正确答案】 A【试题解析】 样本比例为样本均值的特殊情况,其估计方差与样本容量成反比,与未人样比例、总体方差成
14、正比。因此,p 的方差随样本容量的增大而减小。【知识模块】 统计方法6 【正确答案】 A【试题解析】 点估计是用样本统计量的实现值来近似相应的总体参数。统计量为样本的函数,样本确定时样本统计量的值也确定,即为点估计值。【知识模块】 统计方法7 【正确答案】 B【试题解析】 区间估计就是根据估计可靠程度的要求,利用随机抽取的样本的统计量值确定能够覆盖总体参数的可能区间的一种估计方法。它是包括样本统计量在内(有时是以统计量为中心)的一个区间,该区间通常由样本统计量加减估计标准误差得到。【知识模块】 统计方法8 【正确答案】 C【试题解析】 一致性是指随着样本量的增大,点估计量的值越来越接近被估计总
15、体的参数,即一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。【知识模块】 统计方法9 【正确答案】 C【试题解析】 样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。一般而言,样本量越大,抽样误差越小。在要求同样精度的情况下,不同抽样方法需要的样本量大小不同。通常将样本量不少于 30 的样本称为大样本。【知识模块】 统计方法二、多项选择题以下每小题至少有两项正确答案,每选对一项得 0.5 分,全部选对得满分。多选或错选不得分。10 【正确答案】 A,B,D【试题解析】 评价估计量的三个常用标准包括:无偏性,是指估计量的期望与参数值相等;有效性,是指在无偏估
16、计中方差较小的估计值更有效; 一致性,是指当样本量趋于无穷大时,估计量的值和参数真值近似相等。【知识模块】 统计方法11 【正确答案】 A,B,C【试题解析】 总体,又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用 N 表示。样本,又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用 n 表示。样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的,用 A 表示。当和 n 一定时,A 的多少与抽样方法有关。【知识模块】 统计方法12 【正确答案】 C,E【试题解析】 参数估计的方法有点估计、区间估计两种。
17、点估计是指用样本统计量的某个取值直接作为总体参数的估计值;区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。【知识模块】 统计方法13 【正确答案】 C,D【试题解析】 抽样推断中,参数是一个确定的量,不是一个随机变量;统计量是样本的函数,是随机变量。【知识模块】 统计方法14 【正确答案】 A,B,D【试题解析】 由样本统计量所形成的概率分布就是抽样分布。一个样本的统计量我们可以观察到,但不能观察到所有可能的统计量值,因此,抽样分布仅仅是一种理论分布,与总体分布不完全相同。抽样分布提供了该统计量长远而稳定的信息,它构成了推断总体参数的理论基础
18、。【知识模块】 统计方法15 【正确答案】 A,D【试题解析】 采用重置抽样,可以组成 5525 个不同样本;采用不重置抽样,可以组成 54210 个不同样本。【知识模块】 统计方法三、判断题请判断下列各题说法正确或错误。16 【正确答案】 A【试题解析】 样本均值的抽样分布是指所有可能抽出来的样本 的分布,有 E( ),即样本均值的均值就是总体均值。【知识模块】 统计方法17 【正确答案】 A【试题解析】 参数估计中,一个点估计量的可靠性,即统计量与总体参数之间的差距,是由它的抽样标准误差来衡量的。【知识模块】 统计方法18 【正确答案】 A【试题解析】 样本均值是独立同分布的随机变量的线性
19、组合,而正态分布的线性组合也服从正态分布,因此,总体服从正态分布时,样本均值一定服从正态分布。【知识模块】 统计方法19 【正确答案】 B【试题解析】 样本均值的抽样分布就是指所有可能抽出来的样本 的分布。【知识模块】 统计方法20 【正确答案】 B【试题解析】 由于样本是从总体中随机抽取的,因此样本具有随机性,而不是确定的、惟一的。【知识模块】 统计方法21 【正确答案】 B【试题解析】 在其他条件不变的情况下,置信水平越高,置信区间越宽。因此如果要缩小置信区间,则必须降低置信水平。【知识模块】 统计方法四、综合应用题以下每道综合应用题包括 5 道小题,每道小题有一项或一项以上的正确答案,每
20、选对一项得 0.5 分,全部选对得满分。多选或错选不得分。【知识模块】 统计方法22 【正确答案】 B,C【试题解析】 在进行比例估计时,使用正态分布统计量的需要满足两个条件:np5,其中 n 是样本量,p 是样本比例;n(1p) 5,其中 n 是样本量,p 是样本比例。【知识模块】 统计方法23 【正确答案】 A,C【试题解析】 构造假设检验,不妨用 表示总体比例,则H0:70;H 1:70 。检验统计量 ,在显著性水平 下,拒绝域为 p07 Z,其中 Z为标准正态分布的 右分位数。在005 的显著性水平下,Z 005 164,拒绝域为p07 Z005 ,即 p066。由题知,样本比例为 6
21、8,故不能拒绝原假设。在 001 的显著性水平下,Z 001 233,拒绝域为 p07Z001 ,即 p064,故不能拒绝原假设。综上,AC 两项为正确答案。【知识模块】 统计方法24 【正确答案】 C【试题解析】 通过控制置信区间长度计算样本量,不妨设绝对误差限为 d。在显著性水平为 下,样本量 n 满足 n ,此时 p 值应取使p(1p)最大的值,而在 p05 时有最大值,因此,应取 p05。【知识模块】 统计方法25 【正确答案】 A【试题解析】 在置信度为 1 下,总体支持率的置信区间为其中,p68,00455,Z 097725 198,n385,代入数据计算得,置信区间为632 ,7
22、27 。【知识模块】 统计方法26 【正确答案】 B【试题解析】 分为两个区后,每个区人口约为 500 万,依旧为大样本,确定样本量时计算方式与分为两个区前相同,因此,每个区样本量均为 385,两个小区总抽取样本量为 3852770。【知识模块】 统计方法【知识模块】 统计方法27 【正确答案】 A,C【试题解析】 A 项,概率抽样是根据一个已知的概率随机选取被调查者。 C 项,简单随机抽样是概率抽样最基本的形式,是完全随机地选择样本。本例属于简单随机抽样,故也属于概率抽样。【知识模块】 统计方法28 【正确答案】 A,B,D【试题解析】 A 项,简单平均数 ;BC 两项,中位数,它是数据按照
23、大小排列之后位于中间的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数),即 11;D 项,众数,就是数据中出现次数或出现频率最多的数值。本题数据中出现次数最多的数值为 5。【知识模块】 统计方法29 【正确答案】 A,C,D【试题解析】 数据的差异程度反映的是各变量值远离其中心值的程度。差异的度量可采用的量:极差,即一组数据的最大值与最小值之差; 方差和标准差,方差是各变量值与其平均数离差平方的平均数,方差的平方根即为标准差;离散系数,也称变异系数,它是一组数据的标准差与其相应的平均数之比;标准分数,即变量值与其平均数的离差除以标准差后的值。【知识模块】 统计方法30 【正确答案】 A,C【试题解析】 AB 两项,方差为各变量值与其平均数离差平方的平均数,其计算公式为: 2 ;CD 两项,离散系数,也称变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v 。【知识模块】 统计方法31 【正确答案】 A,B【试题解析】 在小样本,正态总体方差未知的情况下,均值的区间估计为:, 11,195,s ,n 6,代入即求得。【知识模块】 统计方法