1、应用统计硕士历年真题试卷汇编 4 及答案解析(总分:58.00,做题时间:90 分钟)一、单选选择题(总题数:20,分数:40.00)1.有一个样本容量为 10 的样本,其均值为:1300 小时,方差为 817556。若按放回抽样计算,则样本均值的标准误是( )。中央财经大学 2012 研(分数:2.00)A.2835 小时B.2859 小时C.2961 小时D.3002 小时2.用简单随机重复抽样方法选择样本单位,如果要使抽样平均误差降低 50,则抽样单位数需要增加到原单位数的( )。中央财经大学 2012 研(分数:2.00)A.2 倍B.3 倍C.4 倍D.1 倍3.不重复抽样的抽样标准
2、误公式比重复抽样多了一个系数( )。浙江工商大学 2012 研(分数:2.00)A.B.C.D.4.设 X 1 ,X 2 ,X 3 ,X 4 是总体 N(, 2 )的样本, 2 未知,则统计量是( )。西南大学2012 研(分数:2.00)A.X 1 5X 4B.C.X 1 D.5.设 X 1 ,X 2 ,X n 来自总体 N(, 2 ),且相互独立,则随机变量 (分数:2.00)A. 2 (n1)B.N(C.N(, 2 )D. 2 (n)6.某地区有 60 家生产皮鞋的企业,要研究它们的生产质量情况,总体是( )。江苏大学 2012 研(分数:2.00)A.每一个企业B.所有 60 家企业C
3、.每一双皮鞋D.60 家企业生产的皮鞋7.对必要抽样单位数不会产生影响的是( )。江苏大学 2012 研(分数:2.00)A.总体的方差B.总体所处的位置C.抽样方式D.置信水平8.已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 025 厘米。如果已知该厂生产的零件厚度为正态分布,可以判断厚度在 15 厘米到 25 厘米之间的零件大约占( )。浙江工商大学 2011 研(分数:2.00)A.95B.89C.68D.999.根据一个具体的样本,计算总体均值的置信水平为 90的置信区间,则该区间( )。浙江工商大学2011 研(分数:2.00)A.以 90的概率包含总体均值B.有 10的可
4、能性包含总体均值C.绝对包含总体均值D.绝对包含总体均值或绝对不包含总体均值10.某企业计划投资 2 万元的广告费以提高某种新产品的销售量,企业经理认为做了广告可使每天销售量达 100 吨。实行此计划 9 天后经统计知,这 9 天的日平均销售量为 9932 吨。假设每天的销售量服从正态分布 N(, 2 ),在 005 的显著性水平下,检验此项计划是否达到了该企业经理的预计效果,建立的原假设和备择假设为( )。浙江工商大学 2011 研(分数:2.00)A.H 0 :100,H 1 :100B.H 0 :100,H 1 :100C.H 0 :100,H 1 :100D.H 0 :100,H 1
5、:10011.为调查某地区男性所占比例,从该地区随机重复抽取一个容量为 100 的人口样本,该样本中男性比例为 55,则男性比例的抽样平均误差为( )。江苏大学 2011 研(分数:2.00)A.0245B.00497C.04975D.0550012.在纯随机不重复抽样的情况下,调查了全及总体的 5,其抽样误差比纯随机重复抽样小( )。江苏大学 2011 研(分数:2.00)A.253B.50C.50D.9513.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此他调查了 200 名新生在教科书上的花费,该研究人员感兴趣的总体是( )。江苏大学 2011 研(分数:2.00)A
6、.该大学所有的学生B.所有的大学生C.该大学所有一年级新生D.样本中的 200 名新生14.若总体服从均值为 标准差为 的正态分布;从中抽出一个容量为 10 简单随机样本,则样本平均的抽样分布为( )。中山大学 2011 研(分数:2.00)A.N(, 2 10)B.N(10, 2 )C.N(10, 2 100)D.N(, 2 100)15.设总体 X 2 (n),X 1 、X 2 、X n ,是样本, (分数:2.00)A.B.C.D.16.重复抽样与不重复抽样相比,其样本均值抽样分布的标准差( )。西安交通大学 2007 研(分数:2.00)A.重复抽样大B.不重复抽样大C.一样大D.不一
7、定17.当抽样单位数增加 3 倍时,随机重复抽样平均误差比原来( )。首都经济贸易大学 2007 研(分数:2.00)A.减少 12B.增加 12C.减少 13D.增加 1318.设总体 XU ,其中 为未知参数,又设(X 1 ,X n )为来自总体 X 的一个样本,令 S 2 (分数:2.00)A.B.DXC.D.EX19.设随机变量 Xt(n),其中,n1,令 Y (分数:2.00)A.Y 2 (n1)B.YX 2 (n)C.YF(1,n)D.YF(n,1)20.设随机变量 X 和 Y 都服从标准正态分布,则( )。东北财经大学 2005 研,华中科技大学 2005 年研(分数:2.00)
8、A.XY 服从正态分布B.X 2 Y 2 服从 2 分布C.X 2 和 Y 2 都服从 2 分布D.X 2 y 2 服从 F 分布二、简答题(总题数:5,分数:10.00)21.简述用随机模拟法找统计量的近似分布的思想。上海财经大学 2013 研(分数:2.00)_22.总体与样本的联系与区别是什么?总体参数与样本统计量有何异同之处?东北财经大学 2012 研(分数:2.00)_23.如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的概率是不是 0050050002577 为什么?中央财经大学 2011 研(分数:2.00)_24.考虑总体参数 的估计量
9、,简述无偏估计量与最小方差无偏估计量的定义。中山大学 2011 研(分数:2.00)_25.如何解决推断统计中的精度(误差范围)与置信度(可靠程度)之间的矛盾?首都经济贸易大学 2007 研(分数:2.00)_三、计算与分析题(总题数:4,分数:8.00)26.离散型随机变量 X 的概率分布率如表 228 所示。 (分数:2.00)_27.某外贸公司对一批共 1 万台的进口彩电采用简单随机不重复抽样法进行抽查,抽 120 台作样本。抽查结果,发现有 6 台不合格。当概率为 9545(t2):(1)试求该批彩电的合格率区间;(2)如果使合格率的抽样极限误差缩小为原来的 12,做下次抽样调查。则需
10、要抽取多少样本单位数?暨南大学 2011 研(分数:2.00)_28.一油漆制造商宣称,他们生产的一种新型乳胶漆的平均干燥时间为 120 分钟;为检验这一数值是否属实,从该种乳胶漆中随机抽出 20 罐做试验,发现它们的干燥时间(分钟)为:123,109,115,121,130,127,106,120,116,136,131,128,139,110,133,122,133119,135,109; (1)假定干燥时间近似服从正态分布,在 5的显著性水平下,检验以上数据是否提供充分证据说明这种乳胶漆的平均干燥时间大于制造商宣称的 120 分钟,要求给出零假设、备择假设、检验统计量、检验结果。(经计算
11、可知,样本平均值为 1231,样本标准差为 100,自由度为 19 的 t 分布的 005 上侧分位数为 1729) (2)给出平均干燥时间 的 10置信区间。(要求给出枢轴量、置信区间的最后结果) (3)简述上述假设检验问题和置信区间问题的主要联系?中山大学 2011 研(分数:2.00)_29.设总体 X 服从指数分布 (分数:2.00)_应用统计硕士历年真题试卷汇编 4 答案解析(总分:58.00,做题时间:90 分钟)一、单选选择题(总题数:20,分数:40.00)1.有一个样本容量为 10 的样本,其均值为:1300 小时,方差为 817556。若按放回抽样计算,则样本均值的标准误是
12、( )。中央财经大学 2012 研(分数:2.00)A.2835 小时B.2859 小时 C.2961 小时D.3002 小时解析:解析:由样本均值的标准误计算公式,可得:2.用简单随机重复抽样方法选择样本单位,如果要使抽样平均误差降低 50,则抽样单位数需要增加到原单位数的( )。中央财经大学 2012 研(分数:2.00)A.2 倍B.3 倍C.4 倍 D.1 倍解析:解析:抽样平均误差是反映抽样误差一般水平的指标,它的实际含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度,其计算公式为 ,要使3.不重复抽样的抽样标准误公式比重复抽样多了一个系数( )。浙江工
13、商大学 2012 研(分数:2.00)A. B.C.D.解析:解析:在重置抽样时,样本均值的抽样标准误为: ,在不重置抽样时,样本均值的标准误为:,其中4.设 X 1 ,X 2 ,X 3 ,X 4 是总体 N(, 2 )的样本, 2 未知,则统计量是( )。西南大学2012 研(分数:2.00)A.X 1 5X 4 B.C.X 1 D.解析:解析:设 X 1 ,X 2 ,X n 是从总体 n 中抽取的容量为 n 的一个样本,如果由此样本构造一个函数 T(X 1 ,X 2 ,X n ),不依赖于任何未知参数,则称函数 T(X 1 ,X 2 ,X n )是一个统计量。由此可知统计量是不含未知参数的
14、样本函数,根据定义可知 BCD 三项都含未知参数 或 2 ,所以都不是统计量。5.设 X 1 ,X 2 ,X n 来自总体 N(, 2 ),且相互独立,则随机变量 (分数:2.00)A. 2 (n1)B.N(C.N(, 2 )D. 2 (n) 解析:解析:设 X 1 ,X 2 ,X n 是来自总体 N(, 2 )的样本,则有 N(0,1), 2 (1),X 1 ,X 2 ,X n 是相互独立的,则随机变量 6.某地区有 60 家生产皮鞋的企业,要研究它们的生产质量情况,总体是( )。江苏大学 2012 研(分数:2.00)A.每一个企业B.所有 60 家企业 C.每一双皮鞋D.60 家企业生产
15、的皮鞋解析:解析:总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成,组成总体的每个元素称为个体。根据题意可知总体是所有 60 家企业。7.对必要抽样单位数不会产生影响的是( )。江苏大学 2012 研(分数:2.00)A.总体的方差B.总体所处的位置 C.抽样方式D.置信水平解析:解析:在确定抽样单位数时,须考虑如下因素:抽样推断的可靠程度;总体方差的大小;抽样极限误差的大小;抽样方法与组织形式。8.已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 025 厘米。如果已知该厂生产的零件厚度为正态分布,可以判断厚度在 15 厘米到 25 厘米之间的零件大约占( )。浙
16、江工商大学 2011 研(分数:2.00)A.95 B.89C.68D.99解析:解析:根据 3 原则,当一组数据对称分布时,经验法则表明:约有 68的数据在平均数1 个标准差的范围之内;约有 95的数据在平均数2 个标准差的范围之内;约有 99的数据在平均数3 个标准差的范围之内。9.根据一个具体的样本,计算总体均值的置信水平为 90的置信区间,则该区间( )。浙江工商大学2011 研(分数:2.00)A.以 90的概率包含总体均值B.有 10的可能性包含总体均值C.绝对包含总体均值D.绝对包含总体均值或绝对不包含总体均值 解析:解析:由于用某个具体样本所构造的区间是一个特定的区间,而不再是
17、随机区间,所以该区间绝对包含总体均值或绝对不包含总体均值。10.某企业计划投资 2 万元的广告费以提高某种新产品的销售量,企业经理认为做了广告可使每天销售量达 100 吨。实行此计划 9 天后经统计知,这 9 天的日平均销售量为 9932 吨。假设每天的销售量服从正态分布 N(, 2 ),在 005 的显著性水平下,检验此项计划是否达到了该企业经理的预计效果,建立的原假设和备择假设为( )。浙江工商大学 2011 研(分数:2.00)A.H 0 :100,H 1 :100B.H 0 :100,H 1 :100C.H 0 :100,H 1 :100 D.H 0 :100,H 1 :100解析:解
18、析:通常把观察现象原来固有的性质或没有充分证据不能轻易否定的命题设为原假设;通常把该观察现象新的性质或不能轻易肯定的结论设为备择假设。原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。11.为调查某地区男性所占比例,从该地区随机重复抽取一个容量为 100 的人口样本,该样本中男性比例为 55,则男性比例的抽样平均误差为( )。江苏大学 2011 研(分数:2.00)A.0245B.00497 C.04975D.05500解析:解析:在重置抽样时,样本均值的抽样平均误差为:12.在纯随机不重复抽样的情况下,调查了全及总体的 5,其抽样误差比纯随机重复抽样小(
19、)。江苏大学 2011 研(分数:2.00)A.253 B.50C.50D.95解析:解析:在重置抽样时,样本均值的抽样标准误为: ,在不重置抽样时,样本均值的标准误为:为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,比较大而 nN5时,修正系数可以简化为(1nN),当比较大而 nN5时,修正系数可以近似为1,即可以按重置抽样计算。所以不重复抽样的抽样误差比重复抽样多了一个系数为(1nN)。即抽样误差比纯随机重复抽样小(113.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此他调查了 200 名新生在教科书上的花费,该研究人员感兴趣的总体是(
20、 )。江苏大学 2011 研(分数:2.00)A.该大学所有的学生B.所有的大学生C.该大学所有一年级新生 D.样本中的 200 名新生解析:解析:总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成,组成总体的每个元素称为个体。根据题意可知总体是该大学所有一年级新生。14.若总体服从均值为 标准差为 的正态分布;从中抽出一个容量为 10 简单随机样本,则样本平均的抽样分布为( )。中山大学 2011 研(分数:2.00)A.N(, 2 10) B.N(10, 2 )C.N(10, 2 100)D.N(, 2 100)解析:解析:当总体分布为正态分布 N(, 2 )时,可以得
21、到下面的结果: 的抽样分布仍为正态分布, 的数学期望为 ,方差为 ,则 15.设总体 X 2 (n),X 1 、X 2 、X n ,是样本, (分数:2.00)A. B.C.D.解析:解析:总体 XX 2 (n),则总体的均值和方差分别为:n, 2 2n。所以 E(X)n,D( 16.重复抽样与不重复抽样相比,其样本均值抽样分布的标准差( )。西安交通大学 2007 研(分数:2.00)A.重复抽样大 B.不重复抽样大C.一样大D.不一定解析:解析:在不重复抽样中,样本均值抽样分布的标准差 ;重复抽样下的样本均值抽样分布的标准差 。由于 017.当抽样单位数增加 3 倍时,随机重复抽样平均误差
22、比原来( )。首都经济贸易大学 2007 研(分数:2.00)A.减少 12 B.增加 12C.减少 13D.增加 13解析:解析:在重复抽样条件下,样本均值的标准差(抽样平均误差)为总体标准差的 1 , 即。当抽样单位数增加 3 倍时,即 n4n,则:18.设总体 XU ,其中 为未知参数,又设(X 1 ,X n )为来自总体 X 的一个样本,令 S 2 (分数:2.00)A.B.DX C.D.EX解析:解析:统计量是不含未知参数的关于样本的函数。已知 XU ,则 EX ,DX ,因为 为未知参数,所以当 19.设随机变量 Xt(n),其中,n1,令 Y (分数:2.00)A.Y 2 (n1
23、)B.YX 2 (n)C.YF(1,n)D.YF(n,1) 解析:解析:因为随机变量 Xt(n),所以令 X ,则有 X 1 N(0,1),X 2 X 2 (n),且两个变量相互独立。进而可知,Y 20.设随机变量 X 和 Y 都服从标准正态分布,则( )。东北财经大学 2005 研,华中科技大学 2005 年研(分数:2.00)A.XY 服从正态分布B.X 2 Y 2 服从 2 分布C.X 2 和 Y 2 都服从 2 分布 D.X 2 y 2 服从 F 分布解析:解析:ABD 三项在这两个随机变量是相互独立的情况下才成立。二、简答题(总题数:5,分数:10.00)21.简述用随机模拟法找统计
24、量的近似分布的思想。上海财经大学 2013 研(分数:2.00)_正确答案:(正确答案:设有一个统计量 TT(X 1 ,X 2 ,X n ),为了获得统计量 T 的分布函数 F (n) (t),其中 n 为样本容量。可连续作一系列类似试验,每次试验都是从总体中随机抽取容量为 n 的样本,然后计算其统计量的值。当这种试验进行了 N 次时,就得到统计量 T 的 N 个观测值:T 1 ,T 2 ,T N 。根据这 N 个观测值可做其经验分布函数 (t)。可以证明,这种经验分布函数 (t)是统计量T(在样本容量 n 固定的条件下)的分布 )解析:22.总体与样本的联系与区别是什么?总体参数与样本统计量
25、有何异同之处?东北财经大学 2012 研(分数:2.00)_正确答案:(正确答案:(1)总体(population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。样本(sample)是从总体中抽取的一部分单位,作为总体的代表加以研究。样本所包含的总体单位数称为样本容量(sample size)。样本来自于总体,可以根据样本提供的信息推断总体的特征。 (2)参数(parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。统计量(statistic)是用来描述样本特征的概括性数字度量。 区别:参数是从总体中计算得到,代表总体特征,由于总体数
26、据通常未知,所以参数是一个未知的常数。统计量是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是一个变量,是样本的函数。由于样本是已经抽出来的,所以统计量总是知道的。此外,参数常用希腊字母表示,统计量常用英文字母表示。 联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,统计量与参数是同一统计指标;当总体为无限时,统计量与总体参数不同,但统计量可以在某种程度上作为总体参数的估计值,通过样本统计量,对总体参数作出预测和估计。)解析:23.如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的概率是不是 0050050002577 为什么?
27、中央财经大学 2011 研(分数:2.00)_正确答案:(正确答案:不是。 显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。 当两个事件相互独立时,P(AB)P(A)P(B) 当两个事件不相互独立时,P(AB)P(A)P(BA)P(B)P(AB) 记事件 A 为小明是左撇子,事件 B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。)解析:24.考虑总体参数 的估计量,简述无偏估计量与最小方差无偏估计量的定义。中山大学 2011 研(分数:2.00)_正确答案:(正确答案:无偏性(unb
28、iasedness)是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为 ,所选择的估计量为 ,如果 E( ),则称 为 的无偏估计量。 设是 的一个无偏估计量,若对于 的任一方差存在的无偏估计量 ,都有 则称 )解析:25.如何解决推断统计中的精度(误差范围)与置信度(可靠程度)之间的矛盾?首都经济贸易大学 2007 研(分数:2.00)_正确答案:(正确答案:一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。当样本量给定时,误差范围随着置信度的增大而增大,即精度随置信度的增加而减小;当置信度固定时,误差范围随
29、样本量的增大而减小。因此,可通过选取较大的样本量来解决精度与置信度之间的矛盾。)解析:三、计算与分析题(总题数:4,分数:8.00)26.离散型随机变量 X 的概率分布率如表 228 所示。 (分数:2.00)_正确答案:(正确答案:(1)根据离散型随机变量的概率分布列的特征可知:020103a1。解得,a04。 (2)当 1 时,F()0; 当 12 时,F()02; 当 23 时,F()020103; 当 34 时,F()02010306; 当 4 时,F()020103041; 所以随机变量 X 的分布为: (3)E(X) =10220130340429 V ar (X)EXE(X) 2
30、 )解析:27.某外贸公司对一批共 1 万台的进口彩电采用简单随机不重复抽样法进行抽查,抽 120 台作样本。抽查结果,发现有 6 台不合格。当概率为 9545(t2):(1)试求该批彩电的合格率区间;(2)如果使合格率的抽样极限误差缩小为原来的 12,做下次抽样调查。则需要抽取多少样本单位数?暨南大学 2011 研(分数:2.00)_正确答案:(正确答案:(1)由于 12010000120,故可作为重复抽样来进行计算。 由题意可知,合格产品的概率为 p 9500,则在 9545的概率保证程度下,这批产品的合格率范围是:pt )解析:28.一油漆制造商宣称,他们生产的一种新型乳胶漆的平均干燥时
31、间为 120 分钟;为检验这一数值是否属实,从该种乳胶漆中随机抽出 20 罐做试验,发现它们的干燥时间(分钟)为:123,109,115,121,130,127,106,120,116,136,131,128,139,110,133,122,133119,135,109; (1)假定干燥时间近似服从正态分布,在 5的显著性水平下,检验以上数据是否提供充分证据说明这种乳胶漆的平均干燥时间大于制造商宣称的 120 分钟,要求给出零假设、备择假设、检验统计量、检验结果。(经计算可知,样本平均值为 1231,样本标准差为 100,自由度为 19 的 t 分布的 005 上侧分位数为 1729) (2)
32、给出平均干燥时间 的 10置信区间。(要求给出枢轴量、置信区间的最后结果) (3)简述上述假设检验问题和置信区间问题的主要联系?中山大学 2011 研(分数:2.00)_正确答案:(正确答案:(1)由于总体方差未知,且样本量较小,所以采用 t 统计量。 根据题意可以提出假设:H 0 :120 VS H 1 :120 已知条件为: 0 120, 1231,s100,n20,005。 t 13871729 因为 tt 0 ,样本统计量落在非拒绝域,故不能拒绝 H 0 ,即还不能充分证明这种乳胶漆的平均干燥时间大:于二制造商宣称的120 分钟。 (2)由于总体方差未知,且样本量较小,所以采用 t 统计量。已知条件为: 1231,s100,n20,01。 所以平均干燥时间 的置信区间为: )解析:29.设总体 X 服从指数分布 (分数:2.00)_正确答案:(正确答案:(1)指数分布的均值为:E(X) 样本均值为: 令 (2)要求未知参数 的极大似然估计量,可按如下步骤进行: 写出似然函数:L() 对数似然函数:l()nln 似然方程: 求解似然方程: 即参数 的极大似然估计量为: )解析: