1、统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 4 及答案解析(总分:62.00,做题时间:90 分钟)一、B单项选择题以下各有四项备选答案(总题数:8,分数:16.00)1.为了估计总体比例 ,已经求得其 95的置信区间为(82,88),下列说法中错误的是( )。2014年初级真题(分数:2.00)A.点估计值为 85B.此次估计的误差范围是 3C.用该方法估计的可靠程度 95D.总体比例落在这个置信区间的概率为 952.假定一个拥有一亿人口的大国和五百万人口的小国居民年龄差异程度相同,采用抽样方法各自抽取本国的 1人口计算平均年龄,则样本平均年龄的标准差( )。2013 年中级真题
2、(分数:2.00)A.两者相等B.前者比后者大C.前者比后者小D.不能确定3.在抽样推断中,需要推断的总体参数是一个( )。2013 年初级真题(分数:2.00)A.统计量B.已知的量C.随机变量D.未知的量4.根据随机抽样调查资料,某企业工人生产定额平均完成 103,标准误为 1,置信度为 9545,可以推断该企业工人的生产定额平均完成百分比( )。2012 年中级真题(分数:2.00)A.小于 101B.大于 105C.在 102104之间D.在 101105之间5.如果 表示样本的均值, 表示总体的均值,当 E( (分数:2.00)A.是 的无偏估计量B.是 的有效估计量C.与 是完全等
3、价的D.用6.某企业生产大米,包装标准是每包大米 100 斤。假定每包大米的重量服从正态分布,且标准差为 2,则在 9545的包装中大米重量的取值范围是( )。2011 年初级真题(分数:2.00)A.(1004,1004)B.(1002,1002)C.(1006,1006)D.(1008,1008)7.记总体均值为 ,方差为 2 ,样本容 n。则在重置抽样时,关于样本均值 和样本方差 (分数:2.00)A.B.C.D.8.下述关于确定样本量的几种说法中,正确的是( )。2010 年初级真题(分数:2.00)A.样本量与置信水平成反比B.样本量与总体方差成反比C.样本量与允许的估计误差成反比D
4、.样本量与允许的估计误差的平方成反比二、B多项选择题以下至少有两项正确答(总题数:7,分数:14.00)9.使用同一组样本根据正态分布估计总体均值时,如果将置信度由 95调整为 90,则( )。2014 年初级真题(分数:2.00)A.z 2 将增大B.z 2 将减小C.样本均值保持不变D.置信区间宽度减小E.置信区间宽度增加10.抽样调查中,样本量的多少会影响( )。2013 年中级真题(分数:2.00)A.样本代表性的大小B.标准误差的大小C.系统误差的大小D.总体差异的大小E.置信度的大小11.一项研究中要对贫困户的比例进行推断。在 95的置信度下要求误差不超过3。采用重置简单随机抽样中
5、,已知 z 0025 196,则以下说法正确的有( )。2013 年初级真题(分数:2.00)A.如果总体中贫困户的比例估计为 30,则必要样本容量为 896 人B.如果总体中贫困户的比例估计为 30,则必要样本容量为 897 人C.如果缺乏关于总体中贫困户比例的信息,则必要样本容量为 1068 人D.如果缺乏关于总体中贫困户比例的信息,则必要样本容量为 1067 人E.如果缺乏关于总体中贫困户比例的信息,则必要样本容量无法计算12.在一个总体均值的假设检验中,确定检验统计量,需要考虑的主要因素有( )。2012 年中级真题(分数:2.00)A.总体方差已知还是未知B.双侧检验还是单侧检验C.
6、显著性水平的大小D.用于进行检验的是大样本还是小样本E.总体和样本的方差是否相等13.汽车经销商为开发市场欲估计某地区拥有汽车的家庭所占的比例。此项调查要求估计误差不超过005,可靠程序为 95,则样本容量( )。(注:没有可利用的总体比例 值)2012 年初级真题(分数:2.00)A.无法确定B.计算公式中的 可以采用试验性调查估计的样本比例来代替C.计算公式中的 可以取 05D.nE.n14.下列表述中,错误的是( )。2011 年初级真题(分数:2.00)A.总体均值的置信区间都是由样本均值加减估计误差得到B.在小样本情况下,对总体均值的估计都是建立在总体服从正态分布的假定条件下C.当样
7、本量 n 充分大时,样本均值的分布近似服从正态分布D.当总体服从正态分布时,样本均值不服从正态分布E.对总体均值进行区间估计时,不需要考虑总体方差是否已知15.下列关于统计量的表述中,正确的有( )。(分数:2.00)A.统计量是样本的函数B.估计同一总体参数可以用多个不同统计量C.统计量是随机变量D.统计量不能含有任何总体参数E.统计量不能含有未知的参数三、B判断题请判断下列各题说法正确或(总题数:6,分数:12.00)16.样本容量是指一个总体中可能抽取的样本个数。( )2012 年中级真题(分数:2.00)A.正确B.错误17.在一个统计样本中,其标准差越大,它的趋中程度就越好。( )2
8、011 年初级真题(分数:2.00)A.正确B.错误18.统计量是样本的函数。( )2010 年中级真题(分数:2.00)A.正确B.错误19.在参数估计中,无偏性是衡量一个估计量是否理想的惟一准则。( )2005 年中级真题(分数:2.00)A.正确B.错误20.对于严重偏态分布的数据,平均数比中位数和众数的代表性要好。( )2012 年初级真题(分数:2.00)A.正确B.错误21.当研究对象变动不均匀时,一般采用等距分组。( )2011 年初级真题(分数:2.00)A.正确B.错误四、B综合应用题以下每道综合应用题包(总题数:2,分数:20.00)某企业试验用两种新材料生产产品。现从每种
9、材料生产的产品中各随机抽取 5 个进行检验,测得产品的抗拉力(kg)数据如表 21 所示。 (分数:10.00)(1).产品抗拉力数据是( )。(分数:2.00)A.观测数据B.实验数据C.通过抽样的方式取得的D.通过重点调查的方式取得的(2).采用材料 B 生产的产品,其抗拉强度(kg)的( )。(分数:2.00)A.平均数为 30B.中位数为 30C.众数为 0D.没有众数(3).采用材料 B 生产的产品,其抗拉强度(kg)的( )。(分数:2.00)A.方差为 s B 2 B.方差为 s B 2 C.离散系数为 V B D.离散系数为 V B (4).采用材料 A 生产的产品,其平均抗拉
10、强度 (分数:2.00)A.可以根据全距作出判断。因为 R B R A ,所以材料 B 比材料 A 的平均抗拉强度代表性好B.可以根据方差作出判断。因为 s B 2 s A 2 ,所以材料 B 比材料 A 的平均抗拉强度代表性好C.可以根据标准差作出判断。因为 s B s A ,所以材料 B 比材料 A 的平均抗拉强度代表性好D.只能根据离散系数作出判断。因为 V B V A ,所以材料 B 比材料 A 的平均抗拉强度代表性好(5).假设总体服从正态分布。如果采用材料 B 生产产品,其抗拉力 95的置信区间为( )。(注:Z 0025 196,t 0025 (4)27764)(分数:2.00)
11、A.30196B.30196C.3027764D.3027764对某地区失业人员进行调查,得到有关失业周数、失业者年龄和受教育年限等资料,对此资料进行相关与回归分析后所得的结果如表 51、表 52 所示。 又已知 n50, 4336, (分数:10.00)(1).由相关分析表 51 可知( )。(分数:2.00)A.失业周数与年龄有显著的相关关系B.失业周数与受教育年限有显著的相关关系C.年龄和受教育年限有显著的相关关系D.年龄和受教育年限没有显著的相关关系(2).相关系数检验的假设是( )。(分数:2.00)A.H 0 :相关系数显著,H 1 :相关系数不显著B.H 0 :相关系数1,H 1
12、 :相关系数1C.H 0 :相关系数0,H 1 :相关系数0D.H 0 :相关系数0,H 1 :相关系数0(3).由回归分析表可知,失业周数与年龄拟合的回归方程方差分析检验结果说明( )。(分数:2.00)A.Y 与 X 之间存在线性相关,但关系不显著B.Y 与 X 之间不存在线性相关关系C.Y 与 X 之间不存在非线性相关关系D.Y 与 X 之间存在显著线性相关关系(4).根据所给资料,计算回归系数为( )。(分数:2.00)A.2043, 066B.886, 151C.2043, 066D.886, 151(5).在求解上述回归系数过程中,利用了最小二乘估计准则,这种估计的实质是使( )。
13、(分数:2.00)A.(y B.(Y C.(YD.(Y统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 4 答案解析(总分:62.00,做题时间:90 分钟)一、B单项选择题以下各有四项备选答案(总题数:8,分数:16.00)1.为了估计总体比例 ,已经求得其 95的置信区间为(82,88),下列说法中错误的是( )。2014年初级真题(分数:2.00)A.点估计值为 85B.此次估计的误差范围是 3C.用该方法估计的可靠程度 95D.总体比例落在这个置信区间的概率为 95 解析:解析:该置信区间由样本统计量加减估计标准误差得到,关于点估计值对称,因此点估计值为(8288)285,估计的
14、误差范围为 3,估计的可靠程度为 95。总体比例是一个固定的未知数,要么落在这个置信区间内,要么在这个置信区间外,即落在这个置信区间的概率为 0 或 1,不能说“落在这个置信区间的概率为 95”。2.假定一个拥有一亿人口的大国和五百万人口的小国居民年龄差异程度相同,采用抽样方法各自抽取本国的 1人口计算平均年龄,则样本平均年龄的标准差( )。2013 年中级真题(分数:2.00)A.两者相等B.前者比后者大C.前者比后者小 D.不能确定解析:解析:在大样本条件下,样本平均数的标准差的计算公式为:3.在抽样推断中,需要推断的总体参数是一个( )。2013 年初级真题(分数:2.00)A.统计量B
15、.已知的量C.随机变量D.未知的量 解析:解析:参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。由于总体数据通常是不知道的,所以参数是一个未知的常数。4.根据随机抽样调查资料,某企业工人生产定额平均完成 103,标准误为 1,置信度为 9545,可以推断该企业工人的生产定额平均完成百分比( )。2012 年中级真题(分数:2.00)A.小于 101B.大于 105C.在 102104之间D.在 101105之间 解析:解析:当总体方差 2 已知时,总体均值 在 1 置信水平下的置信区间为( 分位数值 的标准误差, 分位数值 5.如果 表示样本的均值, 表示总体的均
16、值,当 E( (分数:2.00)A.是 的无偏估计量 B.是 的有效估计量C.与 是完全等价的D.用解析:解析:无偏性是指估计量抽样分布的期望值等于被估计的总体参数。设总体参数为 ,所选择的估计量为 ,如果 E( ),则称6.某企业生产大米,包装标准是每包大米 100 斤。假定每包大米的重量服从正态分布,且标准差为 2,则在 9545的包装中大米重量的取值范围是( )。2011 年初级真题(分数:2.00)A.(1004,1004) B.(1002,1002)C.(1006,1006)D.(1008,1008)解析:解析:在总体为正态分布的情况下,以 9545的置信水平推断总体参数 的置信区间
17、时,误差范围为两倍的标准差。此时包装中大米重量的取值范围为( 2,7.记总体均值为 ,方差为 2 ,样本容 n。则在重置抽样时,关于样本均值 和样本方差 (分数:2.00)A.B. C.D.解析:解析:数理统计学的相关定理已经证明:样本均值的均值就是总体均值,即 E( )。在重置抽样时,样本均值的方差为总体方差的 1n,即 ,在不重置抽样时,样本均值的方差为:,其中,8.下述关于确定样本量的几种说法中,正确的是( )。2010 年初级真题(分数:2.00)A.样本量与置信水平成反比B.样本量与总体方差成反比C.样本量与允许的估计误差成反比D.样本量与允许的估计误差的平方成反比 解析:解析:样本
18、量的计算公式为:n二、B多项选择题以下至少有两项正确答(总题数:7,分数:14.00)9.使用同一组样本根据正态分布估计总体均值时,如果将置信度由 95调整为 90,则( )。2014 年初级真题(分数:2.00)A.z 2 将增大B.z 2 将减小 C.样本均值保持不变 D.置信区间宽度减小 E.置信区间宽度增加解析:解析:z 2 为标准正态分布的 2 左分位数,随 的增大而减小,置信度由 95调整为90时, 由 005 增大为 01,z 2 减小。样本均值不受置信度变化的影响。置信度降低,说明置信区间的准确性降低,置信区间的宽度减小。10.抽样调查中,样本量的多少会影响( )。2013 年
19、中级真题(分数:2.00)A.样本代表性的大小 B.标准误差的大小 C.系统误差的大小D.总体差异的大小E.置信度的大小解析:解析:A 项,样本均值为 ,标准差为 2 ,离散系数为 故样本的离散程度受样本量的影响,进而会影响样本的代表性。B 项, 样本均值的标准误差为 11.一项研究中要对贫困户的比例进行推断。在 95的置信度下要求误差不超过3。采用重置简单随机抽样中,已知 z 0025 196,则以下说法正确的有( )。2013 年初级真题(分数:2.00)A.如果总体中贫困户的比例估计为 30,则必要样本容量为 896 人B.如果总体中贫困户的比例估计为 30,则必要样本容量为 897 人
20、 C.如果缺乏关于总体中贫困户比例的信息,则必要样本容量为 1068 人 D.如果缺乏关于总体中贫困户比例的信息,则必要样本容量为 1067 人E.如果缺乏关于总体中贫困户比例的信息,则必要样本容量无法计算解析:解析:AB 两项,贫困生比例已知时,n 12.在一个总体均值的假设检验中,确定检验统计量,需要考虑的主要因素有( )。2012 年中级真题(分数:2.00)A.总体方差已知还是未知 B.双侧检验还是单侧检验C.显著性水平的大小D.用于进行检验的是大样本还是小样本 E.总体和样本的方差是否相等解析:解析:在对总体均值进行假设检验时,采用什么检验统计量取决于所抽取的样本是大样本(n30)还
21、是小样本(n30),还需要考虑总体是否为正态分布、总体方差是否已知等几种情况。13.汽车经销商为开发市场欲估计某地区拥有汽车的家庭所占的比例。此项调查要求估计误差不超过005,可靠程序为 95,则样本容量( )。(注:没有可利用的总体比例 值)2012 年初级真题(分数:2.00)A.无法确定B.计算公式中的 可以采用试验性调查估计的样本比例来代替 C.计算公式中的 可以取 05 D.nE.n 解析:解析:设 E 代表允许的估计误差,可以得到估计总体比例时所需的样本量,计算公式为: n14.下列表述中,错误的是( )。2011 年初级真题(分数:2.00)A.总体均值的置信区间都是由样本均值加
22、减估计误差得到B.在小样本情况下,对总体均值的估计都是建立在总体服从正态分布的假定条件下C.当样本量 n 充分大时,样本均值的分布近似服从正态分布D.当总体服从正态分布时,样本均值不服从正态分布 E.对总体均值进行区间估计时,不需要考虑总体方差是否已知 解析:解析:当总体服从正态分布时,样本均值也服从正态分布。对总体均值进行区间估计时,需要分两种情况:方差已知和方差未知。15.下列关于统计量的表述中,正确的有( )。(分数:2.00)A.统计量是样本的函数 B.估计同一总体参数可以用多个不同统计量 C.统计量是随机变量 D.统计量不能含有任何总体参数E.统计量不能含有未知的参数 解析:解析:在
23、样本抽取出来以后,样本值就是已经观察到的值,这个样本的统计量就是已知的,构成统计量的函数中不能包含未知因素。三、B判断题请判断下列各题说法正确或(总题数:6,分数:12.00)16.样本容量是指一个总体中可能抽取的样本个数。( )2012 年中级真题(分数:2.00)A.正确B.错误 解析:解析:为了避免样本量的过大或过小,必须恰当地确定样本容量,从而控制抽样误差不超过某一给定范围。17.在一个统计样本中,其标准差越大,它的趋中程度就越好。( )2011 年初级真题(分数:2.00)A.正确B.错误 解析:解析:在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差
24、。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就越好。18.统计量是样本的函数。( )2010 年中级真题(分数:2.00)A.正确 B.错误解析:解析:统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。因此,统计量是样本的函数。19.在参数估计中,无偏性是衡量一个估计量是否理想的惟一准则。( )2005 年中级真题(分数:2.00)A.正确B.错误 解析:解析:评价估计量的标准有:无偏性,是指估计量抽样分布的期望值等于被估计的总体参数;有效性,是指估计量的方差尽可能小;一致性,是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数。20.
25、对于严重偏态分布的数据,平均数比中位数和众数的代表性要好。( )2012 年初级真题(分数:2.00)A.正确B.错误 解析:解析:平均数主要缺点是更容易受少数极端数值的影响,对于严重偏态分布的数据,平均数的代表性较差。而中位数和众数是位置代表值,不受极端值的影响。21.当研究对象变动不均匀时,一般采用等距分组。( )2011 年初级真题(分数:2.00)A.正确B.错误 解析:解析:在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组。四、B综合应用题以下每道综合应用题包(总题数:2
26、,分数:20.00)某企业试验用两种新材料生产产品。现从每种材料生产的产品中各随机抽取 5 个进行检验,测得产品的抗拉力(kg)数据如表 21 所示。 (分数:10.00)(1).产品抗拉力数据是( )。(分数:2.00)A.观测数据 B.实验数据C.通过抽样的方式取得的 D.通过重点调查的方式取得的解析:解析:“从每种材料生产的产品中各随机抽取 5 个进行检验”,故产品抗拉力数据为观测数据,且为通过抽样的方式取得的。(2).采用材料 B 生产的产品,其抗拉强度(kg)的( )。(分数:2.00)A.平均数为 30 B.中位数为 30 C.众数为 0D.没有众数 解析:解析:材料 B 的观测数
27、据从小到大排列为:26,28,30,32,34,故平均数为 30,中位数为 30,另外由于每个组数字仅出现一次,故无众数。(3).采用材料 B 生产的产品,其抗拉强度(kg)的( )。(分数:2.00)A.方差为 s B 2 B.方差为 s B 2 C.离散系数为 V B D.离散系数为 V B 解析:解析:方差为标准差的平方,其中标准差为 s ,离散系数 V s (4).采用材料 A 生产的产品,其平均抗拉强度 (分数:2.00)A.可以根据全距作出判断。因为 R B R A ,所以材料 B 比材料 A 的平均抗拉强度代表性好B.可以根据方差作出判断。因为 s B 2 s A 2 ,所以材料
28、 B 比材料 A 的平均抗拉强度代表性好C.可以根据标准差作出判断。因为 s B s A ,所以材料 B 比材料 A 的平均抗拉强度代表性好D.只能根据离散系数作出判断。因为 V B V A ,所以材料 B 比材料 A 的平均抗拉强度代表性好 解析:解析:材料 A 的平均值高于材料 B,而材料 A 的方差高于材料 B,故单独用平均值或者方差均不能很好地描述两组数据的差异,只能用离散系数来做出判断。(5).假设总体服从正态分布。如果采用材料 B 生产产品,其抗拉力 95的置信区间为( )。(注:Z 0025 196,t 0025 (4)27764)(分数:2.00)A.30196B.30196C
29、.3027764 D.3027764解析:解析:在小样本(n30)情况下,对总体均值的估计都是建立在总体服从正态分布的假定前提下。样本均值经过标准化后服从自由度为(n1)的 t 分布。即 t t(n1)。t 分布也是对称分布,只不过计算出来的 t 值对应的概率要查 t 分布概率表。在 1 置信水平下,总体均值的置信区间为:()。即其抗拉力 95的置位区间为 3027764对某地区失业人员进行调查,得到有关失业周数、失业者年龄和受教育年限等资料,对此资料进行相关与回归分析后所得的结果如表 51、表 52 所示。 又已知 n50, 4336, (分数:10.00)(1).由相关分析表 51 可知(
30、 )。(分数:2.00)A.失业周数与年龄有显著的相关关系 B.失业周数与受教育年限有显著的相关关系C.年龄和受教育年限有显著的相关关系D.年龄和受教育年限没有显著的相关关系解析:解析:失业周数与年龄的相关系数检验概率 P 值0000 说明两者有显著的相关关系;失业周数与受教育年限的相关系数检验概率 P 值096 说明两者无显著的相关关系;无法判断年龄和受教育年限的相关关系是否显著。(2).相关系数检验的假设是( )。(分数:2.00)A.H 0 :相关系数显著,H 1 :相关系数不显著B.H 0 :相关系数1,H 1 :相关系数1C.H 0 :相关系数0,H 1 :相关系数0 D.H 0 :
31、相关系数0,H 1 :相关系数0解析:解析:相关系数检验的假设为: H 0 :两变量之间不存在线性相关,H 1 :两变量之间存在线性相关即 H 0 :0,H 1 :0。(3).由回归分析表可知,失业周数与年龄拟合的回归方程方差分析检验结果说明( )。(分数:2.00)A.Y 与 X 之间存在线性相关,但关系不显著B.Y 与 X 之间不存在线性相关关系C.Y 与 X 之间不存在非线性相关关系D.Y 与 X 之间存在显著线性相关关系 解析:解析:在方差分析检验法中,如果统计量的观测值 F 大于相应的临界值,则可认为 Y 与 X 的线性相关关系是显著的;否则便认为 Y 与 X 的线性相关关系不显著。
32、由表 52 知,F 值2401F 临界值408,故 Y 与 X 之间存在显著线性相关关系,也可以根据 F 检验概率 P000 判断知 Y 与 X 之间存在显著线性相关关系。(4).根据所给资料,计算回归系数为( )。(分数:2.00)A.2043, 066B.886, 151 C.2043, 066D.886, 151解析:解析:一元线性回归方程的回归系数为: 15092151(5).在求解上述回归系数过程中,利用了最小二乘估计准则,这种估计的实质是使( )。(分数:2.00)A.(y B.(Y C.(YD.(Y解析:解析:最小二乘法估计回归方程中参数的实质是每一个指标实测值与指标理论值的离差平方和最小,即 Q( 0 , 1 )(Y i