1、统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 3 及答案解析(总分:62.00,做题时间:90 分钟)一、B单项选择题以下各有四项备选答案(总题数:9,分数:18.00)1.某学校 10000 名女生身高服从正态分布,其均值为 160cm,标准差为 5cm,其中 6827 名女生身高的可能范围是( )。2016 年中级真题(分数:2.00)A.160cm 到 165cmB.150cm 到 170cmC.155cm 到 165cmD.155cm 到 160cm2.从一个服从正态分布的总体中随机抽取样本容量为 n 的样本,在 95的置信度下对总体参数进行估计的结果为 20008。如果其他
2、条件不变,样本容量扩大到原来的 4 倍,则总体参数的置信区间应该是( )。2016 年中级真题(分数:2.00)A.20016B.20004C.80016D.800043.估计总体参数时,评价估计量有三个标准,其中无偏性是指( )。2014 年中级真题(分数:2.00)A.估计量的方差尽可能小B.估计量抽样分布的期望值等于被估计总体的参数C.估计量抽样分布的标准差等于被估计总体的参数D.随着样本量的增大,点估计量的值越来越接近被估计总体的参数4.在一项比例的电话调查中,样本量是 615,允许误差为 4。下面对 4的允许误差描述正确的是( )。2014 年中级真题(分数:2.00)A.调查中有
3、4的被调查者可能会改变他们的想法B.在 615 人中大约会有 4的人拒绝访问C.在 615 人中大约会有 4的人没有电话D.样本比例与总体比例之间的差异绝对值小于 45.关于样本比例 p 正确的说法是( )。2014 年初级真题(分数:2.00)A.随着样本容量的增大,p 的方差愈来愈小B.随着样本容量的增大,p 的方差愈来愈大C.随着样本容量的增大,p 的方差不会发生改变D.随着样本容量的增大,p 的方差在某些区间会变大,在某些区间会变小6.点估计是用样本统计量的( )来近似相应的总体参数。2014 年初级真题(分数:2.00)A.实现值B.估计值C.近似值D.精确值7.区间估计是包括样本统
4、计量在内的一个区间,该区间通常由样本统计量加减( )得到。2014 年初级真题(分数:2.00)A.标准差B.估计标准误差C.方差D.估计方差8.“一致性”是统计学家评价估计量的一个标准,它是指( )。2014 年、2010 年初级真题(分数:2.00)A.估计量的方差尽可能小B.估计量抽样分布的期望值等于被估计的总体参数C.随着样本量的增大,点估计量的值越来越接近被估计总体的参数D.点估计量的值与被估参数的值相等9.下列关于样本量错误的说法是( )。2014 年初级真题(分数:2.00)A.它表明一个样本所包含的单位数B.样本量的大小会影响抽样效果C.样本量不少于 25 个样本称为大样本D.
5、样本量的大小与抽样方法有关二、B多项选择题以下至少有两项正确答(总题数:6,分数:12.00)10.估计总体参数时,评价估计量的三个常用标准是( )。2016 年、2010 年中级真题(分数:2.00)A.无偏性B.有效性C.多边性D.一致性E.最优性11.在一个有限总体中,抽取样本容量为 n 的样本,其可能抽取的样本个数取决于( )。2014 年中级真题(分数:2.00)A.样本容量的大小B.总体全部单位数C.抽样方法D.抽样目的E.总体方差12.由样本统计量来估计总体参数的方法主要有( )。2014 年中级真题(分数:2.00)A.无偏估计B.一致估计C.点估计D.总体总量估计E.区间估计
6、13.在抽样推断中,以下说法正确的是( )。2014 年初级真题(分数:2.00)A.参数是一个随机变量B.统计量是惟一确定的量C.参数是一个确定的量D.统计量是一个随机变量E.参数和统计量都是随机变量14.抽样分布( )。2014 年初级真题(分数:2.00)A.是由样本统计量所形成的概率分布B.仅仅是一种理论分布C.是一种经验分布D.是推断总体参数的理论基础E.与总体分布是完全相同的15.假设总体中有 5 个个体单位,从中随机抽取两个进行调查,则( )。2014 年初级真题(分数:2.00)A.采用重置抽样,可以组成 25 个不同的样本B.采用不重置抽样,可以组成 25 个不同的样本C.采
7、用重置抽样,可以组成 10 个不同的样本D.采用不重置抽样,可以组成 10 个不同的样本E.采用重置抽样与不重置抽样,可以组成的样本数相同三、B判断题请判断下列各题说法正确或(总题数:6,分数:12.00)16.抽样中所有可能组成的样本平均数的平均数等于总体平均数。( )2016 年中级真题(分数:2.00)A.正确B.错误17.参数估计中,统计量的标准误差是用于衡量样本统计量与总体参数之间差距的一个重要尺度。( )2014 年中级真题(分数:2.00)A.正确B.错误18.如果总体服从正态分布,样本均值一定服从正态分布。( )2014 年初级真题(分数:2.00)A.正确B.错误19.样本均
8、值的抽样分布就是指抽取出来的样本均值 X 的分布。( )2013 年中级真题(分数:2.00)A.正确B.错误20.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、惟一的。( )2013 年中级真题(分数:2.00)A.正确B.错误21.如果要缩小置信区间,在其他条件不变的情况下,必须提高对置信水平的要求。( )2013 年初级真题(分数:2.00)A.正确B.错误四、B综合应用题以下每道综合应用题包(总题数:2,分数:20.00)某调查机构欲进行某城市居民对某项政策支持率的电话调查,该城市的总人口在 1000 万以上,根据抽样理论,在置信度为 95,允许误差范围为 5的条件下
9、,计算出所需调查的样本量为 385。 请根据上述资料回答下列问题:2014 年中级真题(分数:10.00)(1).如果调查结果显示,样本的支持率为 68,现在欲对总体的支持率进行区间估计,其可以应用正态分布统计量进行估计的前提条件是( )。(分数:2.00)A.总体的支持率大于 5B.np5,其中 n 是样本量,p 是样本的支持率C.n(1p)5,其中 n 是样本量,p 是样本的支持率D.样本的支持率大于 5(2).如果该地区有人认为,居民的支持应该是在 70或以上,根据抽样调查结果( )。(分数:2.00)A.在 005 的显著性水平下,没有理由拒绝这个结论B.在 005 的显著性水平下,可
10、以拒绝这个结论C.在 001 的显著性水平下,没有理由拒绝这个结论D.不能确定这个结论。(3).本调查中的样本量为 385,其计算中的 p 值取值应该是( )。(分数:2.00)A.p01B.p03C.p05D.p08(4).调查结果显示,样本的支持率为 68,如果以置信度为 9545的条件下,推断总体的支持率应该在( )。(分数:2.00)A.632,727B.659,741C.612,741D.660,740(5).如果本市分为两个区,每个区的人口大约为 500 ,本次调查想分别对两个区的人口进行推断,都以95的置信度和允许误差范围 5的条件下推断总体,这时两个小区应该抽取的样本量是( )
11、。(分数:2.00)A.385B.770C.1155D.不能确定从全班 60 名学生中按学号随机抽取 6 名学生调查其上网情况。6 名学生的上网时间(小时周)分别是:16、12、5、5、10 和 18。 请根据上述资料从下列备选答案中选出正确答案。2013 年初级真题(分数:10.00)(1).本例中学生上网时间数据是( )。(分数:2.00)A.通过概率抽样的方法取得的B.通过非概率抽样的方法取得的C.通过简单随机抽样的方法取得的D.通过整群抽样的方法取得的(2).6 名学生上网时间(小时周)的( )。(分数:2.00)A.平均数为B.中位数为 11C.中位数为 12D.众数为 5(3).可
12、以采用( )来反映学生上网时间的差异程度。(分数:2.00)A.极差B.众数C.方差D.标准差(4).6 名学生上网时间(小时周)的( )。(分数:2.00)A.方差为 s 2 B.方差为 s 2 C.离散系数为 VD.离散系数为 V(5).假设总体服从正态分布,全班学生平均上网时间 95的置信区间为( )。(注:t 0025 (5)2571)(分数:2.00)A.置信下限 112571B.置信上限 112571C.置信下限 112571D.置信上限 112571统计师(中级)统计工作实务(统计方法)历年真题试卷汇编 3 答案解析(总分:62.00,做题时间:90 分钟)一、B单项选择题以下各
13、有四项备选答案(总题数:9,分数:18.00)1.某学校 10000 名女生身高服从正态分布,其均值为 160cm,标准差为 5cm,其中 6827 名女生身高的可能范围是( )。2016 年中级真题(分数:2.00)A.160cm 到 165cmB.150cm 到 170cmC.155cm 到 165cm D.155cm 到 160cm解析:解析:6827 名女生占总人数的 6827,根据正态分布的 3 原则,可知身高的可能范围为(16051cm,16051cm),即(155cm,165cm)。2.从一个服从正态分布的总体中随机抽取样本容量为 n 的样本,在 95的置信度下对总体参数进行估计
14、的结果为 20008。如果其他条件不变,样本容量扩大到原来的 4 倍,则总体参数的置信区间应该是( )。2016 年中级真题(分数:2.00)A.20016B.20004 C.80016D.80004解析:解析:以均值的区间估计为例,在正态分布下,其区间估计为3.估计总体参数时,评价估计量有三个标准,其中无偏性是指( )。2014 年中级真题(分数:2.00)A.估计量的方差尽可能小B.估计量抽样分布的期望值等于被估计总体的参数 C.估计量抽样分布的标准差等于被估计总体的参数D.随着样本量的增大,点估计量的值越来越接近被估计总体的参数解析:解析:评价估计量的标准包括:无偏性;有效性;一致性。其
15、中,无偏性是指估计量抽样分布的期望值等于被估计总体的参数。4.在一项比例的电话调查中,样本量是 615,允许误差为 4。下面对 4的允许误差描述正确的是( )。2014 年中级真题(分数:2.00)A.调查中有 4的被调查者可能会改变他们的想法B.在 615 人中大约会有 4的人拒绝访问C.在 615 人中大约会有 4的人没有电话D.样本比例与总体比例之间的差异绝对值小于 4 解析:解析:抽样调查的允许误差指参数估计值与实际值间的差异绝对值,题中所估计的参数为比例,因此,允许误差指样本比例与总体比例之间的差异的绝对值,D 项为正确答案。5.关于样本比例 p 正确的说法是( )。2014 年初级
16、真题(分数:2.00)A.随着样本容量的增大,p 的方差愈来愈小 B.随着样本容量的增大,p 的方差愈来愈大C.随着样本容量的增大,p 的方差不会发生改变D.随着样本容量的增大,p 的方差在某些区间会变大,在某些区间会变小解析:解析:样本比例为样本均值的特殊情况,其估计方差与样本容量成反比,与未人样比例、总体方差成正比。因此,p 的方差随样本容量的增大而减小。6.点估计是用样本统计量的( )来近似相应的总体参数。2014 年初级真题(分数:2.00)A.实现值 B.估计值C.近似值D.精确值解析:解析:点估计是用样本统计量的实现值来近似相应的总体参数。统计量为样本的函数,样本确定时样本统计量的
17、值也确定,即为点估计值。7.区间估计是包括样本统计量在内的一个区间,该区间通常由样本统计量加减( )得到。2014 年初级真题(分数:2.00)A.标准差B.估计标准误差 C.方差D.估计方差解析:解析:区间估计就是根据估计可靠程度的要求,利用随机抽取的样本的统计量值确定能够覆盖总体参数的可能区间的一种估计方法。它是包括样本统计量在内(有时是以统计量为中心)的一个区间,该区间通常由样本统计量加减估计标准误差得到。8.“一致性”是统计学家评价估计量的一个标准,它是指( )。2014 年、2010 年初级真题(分数:2.00)A.估计量的方差尽可能小B.估计量抽样分布的期望值等于被估计的总体参数C
18、.随着样本量的增大,点估计量的值越来越接近被估计总体的参数 D.点估计量的值与被估参数的值相等解析:解析:一致性是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数,即一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。9.下列关于样本量错误的说法是( )。2014 年初级真题(分数:2.00)A.它表明一个样本所包含的单位数B.样本量的大小会影响抽样效果C.样本量不少于 25 个样本称为大样本 D.样本量的大小与抽样方法有关解析:解析:样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。一般而言,样本量越大,抽样误差越小。在要求同样精度的情况下,不同抽
19、样方法需要的样本量大小不同。通常将样本量不少于 30 的样本称为大样本。二、B多项选择题以下至少有两项正确答(总题数:6,分数:12.00)10.估计总体参数时,评价估计量的三个常用标准是( )。2016 年、2010 年中级真题(分数:2.00)A.无偏性 B.有效性 C.多边性D.一致性 E.最优性解析:解析:评价估计量的三个常用标准包括:无偏性,是指估计量的期望与参数值相等;有效性,是指在无偏估计中方差较小的估计值更有效;一致性,是指当样本量趋于无穷大时,估计量的值和参数真值近似相等。11.在一个有限总体中,抽取样本容量为 n 的样本,其可能抽取的样本个数取决于( )。2014 年中级真
20、题(分数:2.00)A.样本容量的大小 B.总体全部单位数 C.抽样方法 D.抽样目的E.总体方差解析:解析:总体,又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用 N 表示。样本,又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用 n 表示。样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的,用 A 表示。当和 n 一定时,A 的多少与抽样方法有关。12.由样本统计量来估计总体参数的方法主要有( )。2014 年中级真题(分数:2.00)A.无偏估计B.一致估计C.点估计 D.总体总量估计E.区间
21、估计 解析:解析:参数估计的方法有点估计、区间估计两种。点估计是指用样本统计量的某个取值直接作为总体参数的估计值;区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。13.在抽样推断中,以下说法正确的是( )。2014 年初级真题(分数:2.00)A.参数是一个随机变量B.统计量是惟一确定的量C.参数是一个确定的量 D.统计量是一个随机变量 E.参数和统计量都是随机变量解析:解析:抽样推断中,参数是一个确定的量,不是一个随机变量;统计量是样本的函数,是随机变量。14.抽样分布( )。2014 年初级真题(分数:2.00)A.是由样本统计量所形成的
22、概率分布 B.仅仅是一种理论分布 C.是一种经验分布D.是推断总体参数的理论基础 E.与总体分布是完全相同的解析:解析:由样本统计量所形成的概率分布就是抽样分布。一个样本的统计量我们可以观察到,但不能观察到所有可能的统计量值,因此,抽样分布仅仅是一种理论分布,与总体分布不完全相同。抽样分布提供了该统计量长远而稳定的信息,它构成了推断总体参数的理论基础。15.假设总体中有 5 个个体单位,从中随机抽取两个进行调查,则( )。2014 年初级真题(分数:2.00)A.采用重置抽样,可以组成 25 个不同的样本 B.采用不重置抽样,可以组成 25 个不同的样本C.采用重置抽样,可以组成 10 个不同
23、的样本D.采用不重置抽样,可以组成 10 个不同的样本 E.采用重置抽样与不重置抽样,可以组成的样本数相同解析:解析:采用重置抽样,可以组成 5525 个不同样本;采用不重置抽样,可以组成 54210个不同样本。三、B判断题请判断下列各题说法正确或(总题数:6,分数:12.00)16.抽样中所有可能组成的样本平均数的平均数等于总体平均数。( )2016 年中级真题(分数:2.00)A.正确 B.错误解析:解析:样本均值的抽样分布是指所有可能抽出来的样本 的分布,有 E(17.参数估计中,统计量的标准误差是用于衡量样本统计量与总体参数之间差距的一个重要尺度。( )2014 年中级真题(分数:2.
24、00)A.正确 B.错误解析:解析:参数估计中,一个点估计量的可靠性,即统计量与总体参数之间的差距,是由它的抽样标准误差来衡量的。18.如果总体服从正态分布,样本均值一定服从正态分布。( )2014 年初级真题(分数:2.00)A.正确 B.错误解析:解析:样本均值是独立同分布的随机变量的线性组合,而正态分布的线性组合也服从正态分布,因此,总体服从正态分布时,样本均值一定服从正态分布。19.样本均值的抽样分布就是指抽取出来的样本均值 X 的分布。( )2013 年中级真题(分数:2.00)A.正确B.错误 解析:解析:样本均值的抽样分布就是指所有可能抽出来的样本20.在抽样推断中,作为推断对象
25、的总体和作为观察对象的样本都是确定的、惟一的。( )2013 年中级真题(分数:2.00)A.正确B.错误 解析:解析:由于样本是从总体中随机抽取的,因此样本具有随机性,而不是确定的、惟一的。21.如果要缩小置信区间,在其他条件不变的情况下,必须提高对置信水平的要求。( )2013 年初级真题(分数:2.00)A.正确B.错误 解析:解析:在其他条件不变的情况下,置信水平越高,置信区间越宽。因此如果要缩小置信区间,则必须降低置信水平。四、B综合应用题以下每道综合应用题包(总题数:2,分数:20.00)某调查机构欲进行某城市居民对某项政策支持率的电话调查,该城市的总人口在 1000 万以上,根据
26、抽样理论,在置信度为 95,允许误差范围为 5的条件下,计算出所需调查的样本量为 385。 请根据上述资料回答下列问题:2014 年中级真题(分数:10.00)(1).如果调查结果显示,样本的支持率为 68,现在欲对总体的支持率进行区间估计,其可以应用正态分布统计量进行估计的前提条件是( )。(分数:2.00)A.总体的支持率大于 5B.np5,其中 n 是样本量,p 是样本的支持率 C.n(1p)5,其中 n 是样本量,p 是样本的支持率 D.样本的支持率大于 5解析:解析:在进行比例估计时,使用正态分布统计量的需要满足两个条件:np5,其中 n 是样本量,p 是样本比例;n(1p)5,其中
27、 n 是样本量,p 是样本比例。(2).如果该地区有人认为,居民的支持应该是在 70或以上,根据抽样调查结果( )。(分数:2.00)A.在 005 的显著性水平下,没有理由拒绝这个结论 B.在 005 的显著性水平下,可以拒绝这个结论C.在 001 的显著性水平下,没有理由拒绝这个结论 D.不能确定这个结论。解析:解析:构造假设检验,不妨用 表示总体比例,则 H 0 :70;H 1 :70。检验统计量 ,在显著性水平 下,拒绝域为 p07 Z ,其中 Z 为标准正态分布的 右分位数。在 005 的显著性水平下,Z 005 164,拒绝域为 p07 Z 005 ,即p066。由题知,样本比例为
28、 68,故不能拒绝原假设。在 001 的显著性水平下,Z 001 233,拒绝域为 p07 (3).本调查中的样本量为 385,其计算中的 p 值取值应该是( )。(分数:2.00)A.p01B.p03C.p05 D.p08解析:解析:通过控制置信区间长度计算样本量,不妨设绝对误差限为 d。在显著性水平为 下,样本量 n 满足 n(4).调查结果显示,样本的支持率为 68,如果以置信度为 9545的条件下,推断总体的支持率应该在( )。(分数:2.00)A.632,727 B.659,741C.612,741D.660,740解析:解析:在置信度为 1 下,总体支持率的置信区间为 (5).如果
29、本市分为两个区,每个区的人口大约为 500 ,本次调查想分别对两个区的人口进行推断,都以95的置信度和允许误差范围 5的条件下推断总体,这时两个小区应该抽取的样本量是( )。(分数:2.00)A.385B.770 C.1155D.不能确定解析:解析:分为两个区后,每个区人口约为 500 万,依旧为大样本,确定样本量时计算方式与分为两个区前相同,因此,每个区样本量均为 385,两个小区总抽取样本量为 3852770。从全班 60 名学生中按学号随机抽取 6 名学生调查其上网情况。6 名学生的上网时间(小时周)分别是:16、12、5、5、10 和 18。 请根据上述资料从下列备选答案中选出正确答案
30、。2013 年初级真题(分数:10.00)(1).本例中学生上网时间数据是( )。(分数:2.00)A.通过概率抽样的方法取得的 B.通过非概率抽样的方法取得的C.通过简单随机抽样的方法取得的 D.通过整群抽样的方法取得的解析:解析:A 项,概率抽样是根据一个已知的概率随机选取被调查者。C 项,简单随机抽样是概率抽样最基本的形式,是完全随机地选择样本。本例属于简单随机抽样,故也属于概率抽样。(2).6 名学生上网时间(小时周)的( )。(分数:2.00)A.平均数为 B.中位数为 11 C.中位数为 12D.众数为 5 解析:解析:A 项,简单平均数 ;BC 两项,中位数,它是数据按照大小排列
31、之后位于中间的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数),即(3).可以采用( )来反映学生上网时间的差异程度。(分数:2.00)A.极差 B.众数C.方差 D.标准差 解析:解析:数据的差异程度反映的是各变量值远离其中心值的程度。差异的度量可采用的量:极差,即一组数据的最大值与最小值之差;方差和标准差,方差是各变量值与其平均数离差平方的平均数,方差的平方根即为标准差;离散系数,也称变异系数,它是一组数据的标准差与其相应的平均数之比;标准分数,即变量值与其平均数的离差除以标准差后的值。(4).6 名学生上网时间(小时周)的( )。(分数:2.00)A.方差为 s 2 B.方差为 s 2 C.离散系数为 V D.离散系数为 V解析:解析:AB 两项,方差为各变量值与其平均数离差平方的平均数,其计算公式为: 2 ;CD 两项,离散系数,也称变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v (5).假设总体服从正态分布,全班学生平均上网时间 95的置信区间为( )。(注:t 0025 (5)2571)(分数:2.00)A.置信下限 112571 B.置信上限 112571 C.置信下限 112571D.置信上限 112571解析:解析:在小样本,正态总体方差未知的情况下,均值的区间估计为:, 11,195,s