1、统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 4 及答案与解析一、单项选择题以下每小题各有四项备选答案,其中只有一项是正确的。1 为了估计总体比例 ,已经求得其 95的置信区间为 (82,88),下列说法中错误的是( )。2014 年初级真题(A)点估计值为 85(B)此次估计的误差范围是 3(C)用该方法估计的可靠程度 95(D)总体比例落在这个置信区间的概率为 952 假定一个拥有一亿人口的大国和五百万人口的小国居民年龄差异程度相同,采用抽样方法各自抽取本国的 1人口计算平均年龄,则样本平均年龄的标准差( )。2013 年中级真题(A)两者相等(B)前者比后者大(C)前者比后者小
2、(D)不能确定3 在抽样推断中,需要推断的总体参数是一个( )。2013 年初级真题(A)统计量(B)已知的量(C)随机变量(D)未知的量4 根据随机抽样调查资料,某企业工人生产定额平均完成 103,标准误为 1,置信度为 9545,可以推断该企业工人的生产定额平均完成百分比( )。2012年中级真题(A)小于 101(B)大于 105(C)在 102104之间(D)在 101105之间5 如果 表示样本的均值, 表示总体的均值,当 E( ) 时,说明( )。2012 年初级真题(A) 是 的无偏估计量(B) 是 的有效估计量(C) 与 是完全等价的(D)用 估计 是没有误差的6 某企业生产大
3、米,包装标准是每包大米 100 斤。假定每包大米的重量服从正态分布,且标准差为 2,则在 9545的包装中大米重量的取值范围是( )。2011 年初级真题(A)(100 4,1004)(B) (1002,1002)(C) (1006,1006)(D)(100 8,1008)7 记总体均值为 ,方差为 2,样本容 n。则在重置抽样时,关于样本均值 和样本方差 ,有:( ) 。2010 年初级真题(A)(B)(C)(D)8 下述关于确定样本量的几种说法中,正确的是( )。2010 年初级真题(A)样本量与置信水平成反比(B)样本量与总体方差成反比(C)样本量与允许的估计误差成反比(D)样本量与允许
4、的估计误差的平方成反比二、多项选择题以下每小题至少有两项正确答案,每选对一项得 0.5 分,全部选对得满分。多选或错选不得分。9 使用同一组样本根据正态分布估计总体均值时,如果将置信度由 95调整为90,则( )。2014 年初级真题(A)z 2 将增大(B) z2 将减小(C)样本均值保持不变(D)置信区间宽度减小(E)置信区间宽度增加10 抽样调查中,样本量的多少会影响( )。2013 年中级真题(A)样本代表性的大小(B)标准误差的大小(C)系统误差的大小(D)总体差异的大小(E)置信度的大小11 一项研究中要对贫困户的比例进行推断。在 95的置信度下要求误差不超过3。采用重置简单随机抽
5、样中,已知 z0025 196,则以下说法正确的有( )。2013 年初级真题(A)如果总体中贫困户的比例估计为 30,则必要样本容量为 896 人(B)如果总体中贫困户的比例估计为 30,则必要样本容量为 897 人(C)如果缺乏关于总体中贫困户比例的信息,则必要样本容量为 1068 人(D)如果缺乏关于总体中贫困户比例的信息,则必要样本容量为 1067 人(E)如果缺乏关于总体中贫困户比例的信息,则必要样本容量无法计算12 在一个总体均值的假设检验中,确定检验统计量,需要考虑的主要因素有( )。2012 年中级真题(A)总体方差已知还是未知(B)双侧检验还是单侧检验(C)显著性水平的大小(
6、D)用于进行检验的是大样本还是小样本(E)总体和样本的方差是否相等13 汽车经销商为开发市场欲估计某地区拥有汽车的家庭所占的比例。此项调查要求估计误差不超过 005,可靠程序为 95,则样本容量( )。(注:没有可利用的总体比例 值)2012 年初级真题(A)无法确定(B)计算公式中的 可以采用试验性调查估计的样本比例来代替(C)计算公式中的 可以取 05(D)n 38416,即取 384 户调查(E)n 38416,即取 385 户调查14 下列表述中,错误的是( )。2011 年初级真题(A)总体均值的置信区间都是由样本均值加减估计误差得到(B)在小样本情况下,对总体均值的估计都是建立在总
7、体服从正态分布的假定条件下(C)当样本量 n 充分大时,样本均值的分布近似服从正态分布(D)当总体服从正态分布时,样本均值不服从正态分布(E)对总体均值进行区间估计时,不需要考虑总体方差是否已知15 下列关于统计量的表述中,正确的有( )。(A)统计量是样本的函数(B)估计同一总体参数可以用多个不同统计量(C)统计量是随机变量(D)统计量不能含有任何总体参数(E)统计量不能含有未知的参数三、判断题请判断下列各题说法正确或错误。16 样本容量是指一个总体中可能抽取的样本个数。( )2012 年中级真题(A)正确(B)错误17 在一个统计样本中,其标准差越大,它的趋中程度就越好。( )2011 年
8、初级真题(A)正确(B)错误18 统计量是样本的函数。( )2010 年中级真题(A)正确(B)错误19 在参数估计中,无偏性是衡量一个估计量是否理想的惟一准则。( )2005 年中级真题(A)正确(B)错误20 对于严重偏态分布的数据,平均数比中位数和众数的代表性要好。( )2012 年初级真题(A)正确(B)错误21 当研究对象变动不均匀时,一般采用等距分组。( )2011 年初级真题(A)正确(B)错误四、综合应用题以下每道综合应用题包括 5 道小题,每道小题有一项或一项以上的正确答案,每选对一项得 0.5 分,全部选对得满分。多选或错选不得分。21 某企业试验用两种新材料生产产品。现从
9、每种材料生产的产品中各随机抽取 5个进行检验,测得产品的抗拉力(kg)数据如表 21 所示。请根据上述资料从下列备选答案中选出正确答案。2012 年初级真题22 产品抗拉力数据是( )。(A)观测数据(B)实验数据(C)通过抽样的方式取得的(D)通过重点调查的方式取得的23 采用材料 B 生产的产品,其抗拉强度(kg)的( )。(A)平均数为 30(B)中位数为 30(C)众数为 0(D)没有众数24 采用材料 B 生产的产品,其抗拉强度(kg)的( )。(A)方差为 sB2 8(B)方差为 sB2 10(C)离散系数为 VB 943(D)离散系数为 VB 105425 采用材料 A 生产的产
10、品,其平均抗拉强度 444kg,全距 RA11kg,方差sA2 283。现欲比较两种材料生产的产品的平均抗拉强度代表性好坏,( )。(A)可以根据全距作出判断。因为 RBR A,所以材料 B 比材料 A 的平均抗拉强度代表性好(B)可以根据方差作出判断。因为 sB2s A2,所以材料 B 比材料 A 的平均抗拉强度代表性好(C)可以根据标准差作出判断。因为 sBs A,所以材料 B 比材料 A 的平均抗拉强度代表性好(D)只能根据离散系数作出判断。因为 VBV A,所以材料 B 比材料 A 的平均抗拉强度代表性好26 假设总体服从正态分布。如果采用材料 B 生产产品,其抗拉力 95的置信区间为
11、( )。(注:Z 0025 196,t 0025 (4)27764)(A)30196(B) 30196(C) 3027764(D)302776426 对某地区失业人员进行调查,得到有关失业周数、失业者年龄和受教育年限等资料,对此资料进行相关与回归分析后所得的结果如表 51、表 52 所示。又已知n50, 4336, 346,Y 2168,X1730,XY 80083,X 263880,试计算与回答下列题目。2008 年中级真题27 由相关分析表 51 可知( )。(A)失业周数与年龄有显著的相关关系(B)失业周数与受教育年限有显著的相关关系(C)年龄和受教育年限有显著的相关关系(D)年龄和受教
12、育年限没有显著的相关关系28 相关系数检验的假设是( )。(A)H 0:相关系数显著,H 1:相关系数不显著(B) H0:相关系数1,H 1:相关系数1(C) H0:相关系数0,H 1:相关系数0(D)H 0:相关系数0,H 1:相关系数029 由回归分析表可知,失业周数与年龄拟合的回归方程方差分析检验结果说明( )。(A)Y 与 X 之间存在线性相关,但关系不显著(B) Y 与 X 之间不存在线性相关关系(C) Y 与 X 之间不存在非线性相关关系(D)Y 与 X 之间存在显著线性相关关系30 根据所给资料,计算回归系数为( )。(A) 2043, 066(B) 886, 151(C) 20
13、43, 066(D) 886, 15131 在求解上述回归系数过程中,利用了最小二乘估计准则,这种估计的实质是使( )。(A)(y )2最小值(B) (Y )2最小值(C) (Y )0(D)(Y )0统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 4 答案与解析一、单项选择题以下每小题各有四项备选答案,其中只有一项是正确的。1 【正确答案】 D【试题解析】 该置信区间由样本统计量加减估计标准误差得到,关于点估计值对称,因此点估计值为(8288)285,估计的误差范围为 3,估计的可靠程度为 95。总体比例是一个固定的未知数,要么落在这个置信区间内,要么在这个置信区间外,即落在这个置信区
14、间的概率为 0 或 1,不能说“落在这个置信区间的概率为 95”。【知识模块】 统计方法2 【正确答案】 C【试题解析】 在大样本条件下,样本平均数的标准差的计算公式为: 。据此可知,样本容量越大,样本平均数的标准差越小。因此,样本平均年龄的标准差前者比后者小。【知识模块】 统计方法3 【正确答案】 D【试题解析】 参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。由于总体数据通常是不知道的,所以参数是一个未知的常数。【知识模块】 统计方法4 【正确答案】 D【试题解析】 当总体方差 2 已知时,总体均值 在 1 置信水平下的置信区间为( 分位数值 的标准误差, 分
15、位数值 的标准误差),由题目知,标准误为 1,故平均完成百分比的范围为(10321, 10321 ),即为101105之间。【知识模块】 统计方法5 【正确答案】 A【试题解析】 无偏性是指估计量抽样分布的期望值等于被估计的总体参数。设总体参数为 ,所选择的估计量为 ,如果 E( ) ,则称 为 的无偏估计量。【知识模块】 统计方法6 【正确答案】 A【试题解析】 在总体为正态分布的情况下,以 9545的置信水平推断总体参数的置信区间时,误差范围为两倍的标准差。此时包装中大米重量的取值范围为( 2 , 2),代入数据得: (1004,1004)。【知识模块】 统计方法7 【正确答案】 B【试题
16、解析】 数理统计学的相关定理已经证明:样本均值的均值就是总体均值,即 E( )。在重置抽样时,样本均值的方差为总体方差的 1n ,即 ,在不重置抽样时,样本均值的方差为: ,其中, 为修正系数。【知识模块】 统计方法8 【正确答案】 D【试题解析】 样本量的计算公式为:n ,其中 E 代表在给定的置信水平下允许的估计误差。可以看出,样本量与置信水平成正比,与总体方差成正比,与允许的估计误差的平方成反比。【知识模块】 统计方法二、多项选择题以下每小题至少有两项正确答案,每选对一项得 0.5 分,全部选对得满分。多选或错选不得分。9 【正确答案】 B,C,D【试题解析】 z 2 为标准正态分布的
17、2 左分位数,随 的增大而减小,置信度由 95调整为 90时, 由 005 增大为 01, z2 减小。样本均值不受置信度变化的影响。置信度降低,说明置信区间的准确性降低,置信区间的宽度减小。【知识模块】 统计方法10 【正确答案】 A,B【试题解析】 A 项,样本均值为 ,标准差为 2 ,离散系数为 故样本的离散程度受样本量的影响,进而会影响样本的代表性。B 项, 样本均值的标准误差为 ,因此会受到样本量的影响。DE 两项,总体差异和置信水平不受样本量影响。【知识模块】 统计方法11 【正确答案】 B,C【试题解析】 AB 两项,贫困生比例已知时,n ,z 0025 196,E3,30,计算
18、得 n8964,则必要样本容量为 897 人;CDE 三项,贫困生比例信息缺失时,按照最大方差原则应假定贫困户的比例为 50,此时按照公式计算得到样本容量 n10671,为控制误差大小,必要样本容量为 1068 人。【知识模块】 统计方法12 【正确答案】 A,D【试题解析】 在对总体均值进行假设检验时,采用什么检验统计量取决于所抽取的样本是大样本(n30)还是小样本(n30),还需要考虑总体是否为正态分布、总体方差是否已知等几种情况。【知识模块】 统计方法13 【正确答案】 B,C,E【试题解析】 设 E 代表允许的估计误差,可以得到估计总体比例时所需的样本量,计算公式为: n 式中,估计误
19、差 E 由使用者预先确定。大多数情况下。E 的取值一般应小于 01。如果总体比例 7r 的值不知道可以用样本比例 P 来代替,或者取 05,使得 (1) 达到最大。【知识模块】 统计方法14 【正确答案】 D,E【试题解析】 当总体服从正态分布时,样本均值也服从正态分布。对总体均值进行区间估计时,需要分两种情况:方差已知和方差未知。【知识模块】 统计方法15 【正确答案】 A,B,C,E【试题解析】 在样本抽取出来以后,样本值就是已经观察到的值,这个样本的统计量就是已知的,构成统计量的函数中不能包含未知因素。【知识模块】 统计方法三、判断题请判断下列各题说法正确或错误。16 【正确答案】 B【
20、试题解析】 为了避免样本量的过大或过小,必须恰当地确定样本容量,从而控制抽样误差不超过某一给定范围。【知识模块】 统计方法17 【正确答案】 B【试题解析】 在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就越好。【知识模块】 统计方法18 【正确答案】 A【试题解析】 统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。因此,统计量是样本的函数。【知识模块】 统计方法19 【正确答案】 B【试题解析】 评价估计量的标准有:无偏性,是指估计量抽样分布的期望值等于被估计的
21、总体参数;有效性,是指估计量的方差尽可能小; 一致性,是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数。【知识模块】 统计方法20 【正确答案】 B【试题解析】 平均数主要缺点是更容易受少数极端数值的影响,对于严重偏态分布的数据,平均数的代表性较差。而中位数和众数是位置代表值,不受极端值的影响。【知识模块】 统计方法21 【正确答案】 B【试题解析】 在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组。【知识模块】 统计方法四、综合应用题以下每道综合应用题包括 5 道小题
22、,每道小题有一项或一项以上的正确答案,每选对一项得 0.5 分,全部选对得满分。多选或错选不得分。【知识模块】 统计方法22 【正确答案】 A,C【试题解析】 “从每种材料生产的产品中各随机抽取 5 个进行检验”,故产品抗拉力数据为观测数据,且为通过抽样的方式取得的。【知识模块】 统计方法23 【正确答案】 A,B,D【试题解析】 材料 B 的观测数据从小到大排列为:26,28,30,32,34,故平均数为 30,中位数为 30,另外由于每个组数字仅出现一次,故无众数。【知识模块】 统计方法24 【正确答案】 B,D【试题解析】 方差为标准差的平方,其中标准差为 s ,离散系数Vs 。【知识模
23、块】 统计方法25 【正确答案】 D【试题解析】 材料 A 的平均值高于材料 B,而材料 A 的方差高于材料 B,故单独用平均值或者方差均不能很好地描述两组数据的差异,只能用离散系数来做出判断。【知识模块】 统计方法26 【正确答案】 C【试题解析】 在小样本(n30)情况下,对总体均值的估计都是建立在总体服从正态分布的假定前提下。样本均值经过标准化后服从自由度为(n1) 的 t 分布。即t t(n1) 。t 分布也是对称分布,只不过计算出来的 t 值对应的概率要查 t分布概率表。在 1 置信水平下,总体均值的置信区间为:( )。即其抗拉力 95的置位区间为 3027764 。【知识模块】 统
24、计方法【知识模块】 统计方法27 【正确答案】 A【试题解析】 失业周数与年龄的相关系数检验概率 P 值0000 说明两者有显著的相关关系;失业周数与受教育年限的相关系数检验概率 P 值096 说明两者无显著的相关关系;无法判断年龄和受教育年限的相关关系是否显著。【知识模块】 统计方法28 【正确答案】 C【试题解析】 相关系数检验的假设为: H 0:两变量之间不存在线性相关, H1:两变量之间存在线性相关即 H0:0,H 1:0 。【知识模块】 统计方法29 【正确答案】 D【试题解析】 在方差分析检验法中,如果统计量的观测值 F 大于相应的临界值,则可认为 Y 与 X 的线性相关关系是显著的;否则便认为 Y 与 X 的线性相关关系不显著。由表 52 知,F 值2401F 临界值408,故 Y 与 X 之间存在显著线性相关关系,也可以根据 F 检验概率 P000 判断知 Y 与 X 之间存在显著线性相关关系。【知识模块】 统计方法30 【正确答案】 B【试题解析】 一元线性回归方程的回归系数为: 15092151 4336346151886【知识模块】 统计方法31 【正确答案】 A【试题解析】 最小二乘法估计回归方程中参数的实质是每一个指标实测值与指标理论值的离差平方和最小,即 Q(0, 1)(Y i )2Y i( 0 1Xi)2 最小。【知识模块】 统计方法
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1