1、应用统计硕士历年真题试卷汇编 4 及答案与解析一、单选选择题1 有一个样本容量为 10 的样本,其均值为:1300 小时,方差为 817556。若按放回抽样计算,则样本均值的标准误是( )。中央财经大学 2012 研(A)2835 小时(B) 2859 小时(C) 2961 小时(D)3002 小时2 用简单随机重复抽样方法选择样本单位,如果要使抽样平均误差降低 50,则抽样单位数需要增加到原单位数的( )。中央财经大学 2012 研(A)2 倍(B) 3 倍(C) 4 倍(D)1 倍3 不重复抽样的抽样标准误公式比重复抽样多了一个系数( )。浙江工商大学2012 研(A)(B)(C)(D)4
2、 设 X1,X 2,X 3,X 4 是总体 N(, 2)的样本, , 2 未知,则统计量是( )。西南大学 2012 研(A)X 15X 4(B) Xi (C) X1(D) 25 设 X1,X 2,X n 来自总体 N(, 2),且相互独立,则随机变量 (X) 2服从的分布是( ) 。西南大学 2012 研(A) 2(n1)(B) N( )(C) N(, 2)(D) 2(n)6 某地区有 60 家生产皮鞋的企业,要研究它们的生产质量情况,总体是( )。江苏大学 2012 研(A)每一个企业(B)所有 60 家企业(C)每一双皮鞋(D)60 家企业生产的皮鞋7 对必要抽样单位数不会产生影响的是(
3、 )。江苏大学 2012 研(A)总体的方差(B)总体所处的位置(C)抽样方式(D)置信水平8 已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 025 厘米。如果已知该厂生产的零件厚度为正态分布,可以判断厚度在 15 厘米到 25 厘米之间的零件大约占( )。浙江工商大学 2011 研(A)95(B) 89(C) 68(D)999 根据一个具体的样本,计算总体均值的置信水平为 90的置信区间,则该区间( )。浙江工商大学 2011 研(A)以 90的概率包含总体均值(B)有 10的可能性包含总体均值(C)绝对包含总体均值(D)绝对包含总体均值或绝对不包含总体均值10 某企业计划投资 2
4、 万元的广告费以提高某种新产品的销售量,企业经理认为做了广告可使每天销售量达 100 吨。实行此计划 9 天后经统计知,这 9 天的日平均销售量为 9932 吨。假设每天的销售量服从正态分布 N(, 2),在 005 的显著性水平下,检验此项计划是否达到了该企业经理的预计效果,建立的原假设和备择假设为( ) 。 浙江工商大学 2011 研(A)H 0:100,H 1:100(B) H0:100,H 1: 100(C) H0: : 100,H 1:100(D)H 0:100,H 1:10011 为调查某地区男性所占比例,从该地区随机重复抽取一个容量为 100 的人口样本,该样本中男性比例为 55
5、,则男性比例的抽样平均误差为( )。江苏大学2011 研(A)0245(B) 00497(C) 04975(D)0550012 在纯随机不重复抽样的情况下,调查了全及总体的 5,其抽样误差比纯随机重复抽样小( ) 。江苏大学 2011 研(A)253(B) 50(C) 50(D)9513 某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此他调查了 200 名新生在教科书上的花费,该研究人员感兴趣的总体是( )。江苏大学2011 研(A)该大学所有的学生(B)所有的大学生(C)该大学所有一年级新生(D)样本中的 200 名新生14 若总体服从均值为 标准差为 的正态分布;从中抽出
6、一个容量为 10 简单随机样本,则样本平均的抽样分布为( )。中山大学 2011 研(A)N(, 210)(B) N(10, 2)(C) N(10, 2100)(D)N(, 2100)15 设总体 X 2(n),X 1、X 2、X n,是样本, 是样本均值,则( )。江西财经大学 2007 研(A)(B)(C)(D)16 重复抽样与不重复抽样相比,其样本均值抽样分布的标准差( )。西安交通大学 2007 研(A)重复抽样大(B)不重复抽样大(C)一样大(D)不一定17 当抽样单位数增加 3 倍时,随机重复抽样平均误差比原来( )。首都经济贸易大学 2007 研(A)减少 12(B)增加 12(
7、C)减少 13(D)增加 1318 设总体 XU ,其中 为未知参数,又设 (X1,X n)为来自总体X 的一个样本,令 S2 (X) 2,则当 为( )时,S 2 不是统计量。中南财经政法大学 2006 研(A)(B) DX(C) i(D)EX19 设随机变量 Xt(n) ,其中,n1,令 Y ,则 ( )。中南财经政法大学(A)Y 2(n1)(B) YX 2(n)(C) YF(1,n)(D)YF(n,1)20 设随机变量 X 和 Y 都服从标准正态分布,则( )。东北财经大学 2005 研,华中科技大学 2005 年研(A)XY 服从正态分布(B) X2Y 2 服从 2 分布(C) X2
8、和 Y2 都服从 2 分布(D)X 2y 2 服从 F 分布二、简答题21 简述用随机模拟法找统计量的近似分布的思想。上海财经大学 2013 研22 总体与样本的联系与区别是什么?总体参数与样本统计量有何异同之处? 东北财经大学 2012 研23 如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的概率是不是 0050050002577 为什么?中央财经大学 2011 研24 考虑总体参数 的估计量,简述无偏估计量与最小方差无偏估计量的定义。中山大学 2011 研25 如何解决推断统计中的精度(误差范围)与置信度(可靠程度)之间的矛盾?首都经济贸易大学 2
9、007 研三、计算与分析题26 离散型随机变量 X 的概率分布率如表 228 所示。(1)确定概率分布率中 的值。 (2)试给出随机变量 X 的分布 F()。 (3)计算随机变量 X 的均值和方差。 中央财经大学 2011 研27 某外贸公司对一批共 1 万台的进口彩电采用简单随机不重复抽样法进行抽查,抽 120 台作样本。抽查结果,发现有 6 台不合格。当概率为 9545(t2):(1)试求该批彩电的合格率区间;(2)如果使合格率的抽样极限误差缩小为原来的 12,做下次抽样调查。则需要抽取多少样本单位数?暨南大学 2011 研28 一油漆制造商宣称,他们生产的一种新型乳胶漆的平均干燥时间为
10、120 分钟;为检验这一数值是否属实,从该种乳胶漆中随机抽出 20 罐做试验,发现它们的干燥时间(分钟)为:123,109,115,121,130,127,106,120,116,136,131,128,139,110,133,122,133119,135,109;(1)假定干燥时间近似服从正态分布,在 5的显著性水平下,检验以上数据是否提供充分证据说明这种乳胶漆的平均干燥时间大于制造商宣称的 120 分钟,要求给出零假设、备择假设、检验统计量、检验结果。(经计算可知,样本平均值为1231,样本标准差为 100,自由度为 19 的 t 分布的 005 上侧分位数为1729)(2)给出平均干燥时
11、间 的 10置信区间。(要求给出枢轴量、置信区间的最后结果)(3)简述上述假设检验问题和置信区间问题的主要联系?中山大学 2011 研29 设总体 X 服从指数分布 X1,X 2,X n 为来自总体的简单随机样本。 (1)求 的矩估计量; (2)求 的极大似然估计量。东北财经大学 2012 研应用统计硕士历年真题试卷汇编 4 答案与解析一、单选选择题1 【正确答案】 B【试题解析】 由样本均值的标准误计算公式,可得:2859(小时)。【知识模块】 统计量及其抽样分布2 【正确答案】 C【试题解析】 抽样平均误差是反映抽样误差一般水平的指标,它的实际含义是指抽样平均数(或成数) 的标准差。即它反
12、映了抽样指标与总体指标的平均离差程度,其计算公式为 ,要使 变为原来的一半,即可将 n 扩大到原来的四倍。【知识模块】 统计量及其抽样分布3 【正确答案】 A【试题解析】 在重置抽样时,样本均值的抽样标准误为: ,在不重置抽样时,样本均值的标准误为: ,其中 为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,比较大而nN5 时,修正系数可以简化为(1nN),当 N 比较大而 nN 5时,修正系数可以近似为 1,即可以按重置抽样计算。【知识模块】 统计量及其抽样分布4 【正确答案】 A【试题解析】 设 X1,X 2,X n 是从总体 n 中抽取的容量为 n 的一个
13、样本,如果由此样本构造一个函数 T(X1,X 2,X n),不依赖于任何未知参数,则称函数T(X1,X 2,X n)是一个统计量。由此可知统计量是不含未知参数的样本函数,根据定义可知 BCD 三项都含未知参数 或 2,所以都不是统计量。【知识模块】 统计量及其抽样分布5 【正确答案】 D【试题解析】 设 X1,X 2,X n 是来自总体 N(, 2)的样本,则有 N(0,1) , 2(1),X 1,X 2,X n 是相互独立的,则随机变量 (Xi )2 2(n)。【知识模块】 统计量及其抽样分布6 【正确答案】 B【试题解析】 总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体
14、组成,组成总体的每个元素称为个体。根据题意可知总体是所有 60 家企业。【知识模块】 统计量及其抽样分布7 【正确答案】 B【试题解析】 在确定抽样单位数时,须考虑如下因素:抽样推断的可靠程度;总体方差的大小; 抽样极限误差的大小; 抽样方法与组织形式。【知识模块】 统计量及其抽样分布8 【正确答案】 A【试题解析】 根据 3原则,当一组数据对称分布时,经验法则表明:约有 68的数据在平均数1 个标准差的范围之内;约有 95的数据在平均数2 个标准差的范围之内;约有 99的数据在平均数3 个标准差的范围之内。【知识模块】 统计量及其抽样分布9 【正确答案】 D【试题解析】 由于用某个具体样本所
15、构造的区间是一个特定的区间,而不再是随机区间,所以该区间绝对包含总体均值或绝对不包含总体均值。【知识模块】 统计量及其抽样分布10 【正确答案】 C【试题解析】 通常把观察现象原来固有的性质或没有充分证据不能轻易否定的命题设为原假设;通常把该观察现象新的性质或不能轻易肯定的结论设为备择假设。原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。【知识模块】 统计量及其抽样分布11 【正确答案】 B【试题解析】 在重置抽样时,样本均值的抽样平均误差为: 00497。【知识模块】 统计量及其抽样分布12 【正确答案】 A【试题解析】 在重置抽样时,样本均值的抽样标准
16、误为: ,在不重置抽样时,样本均值的标准误为: 为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,比较大而nN5 时,修正系数可以简化为(1nN),当比较大而 nN 5时,修正系数可以近似为 1,即可以按重置抽样计算。所以不重复抽样的抽样误差比重复抽样多了一个系数为(1nN)。即抽样误差比纯随机重复抽样小(1 )253。【知识模块】 统计量及其抽样分布13 【正确答案】 C【试题解析】 总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成,组成总体的每个元素称为个体。根据题意可知总体是该大学所有一年级新生。【知识模块】 统计量及其抽样分布14
17、【正确答案】 A【试题解析】 当总体分布为正态分布 N(, 2)时,可以得到下面的结果: 的抽样分布仍为正态分布, 的数学期望为 ,方差为 ,则 。【知识模块】 统计量及其抽样分布15 【正确答案】 A【试题解析】 总体 XX 2(n),则总体的均值和方差分别为:n, 22n 。所以E(X) n,D( ) 2n2nn2。【知识模块】 统计量及其抽样分布16 【正确答案】 A【试题解析】 在不重复抽样中,样本均值抽样分布的标准差 ;重复抽样下的样本均值抽样分布的标准差 。由于 0 1,所以重复抽样条件下的标准差要大。【知识模块】 统计量及其抽样分布17 【正确答案】 A【试题解析】 在重复抽样条
18、件下,样本均值的标准差(抽样平均误差)为总体标准差的 1 , 即 。当抽样单位数增加 3 倍时,即 n4n ,则:【知识模块】 统计量及其抽样分布18 【正确答案】 B【试题解析】 统计量是不含未知参数的关于样本的函数。已知 XU,则 EX ,DX ,因为 为未知参数,所以当 时,S 2不是统计量。【知识模块】 统计量及其抽样分布19 【正确答案】 D【试题解析】 因为随机变量 Xt(n),所以令 X ,则有 X1N(0,1),X2X 2(n),且两个变量相互独立。进而可知,Y 服从自由度为(n,1)的 F 分布。【知识模块】 统计量及其抽样分布20 【正确答案】 C【试题解析】 ABD 三项
19、在这两个随机变量是相互独立的情况下才成立。【知识模块】 统计量及其抽样分布二、简答题21 【正确答案】 设有一个统计量 TT(X 1,X 2,X n),为了获得统计量 T 的分布函数 F(n)(t),其中 n 为样本容量。可连续作一系列类似试验,每次试验都是从总体中随机抽取容量为 n 的样本,然后计算其统计量的值。当这种试验进行了 N 次时,就得到统计量 T 的 N 个观测值:T 1,T 2,T N。根据这 N 个观测值可做其经验分布函数 (t)。可以证明,这种经验分布函数 (t)是统计量 T(在样本容量n 固定的条件下)的分布 (t)的一个很好的近似,这种寻求统计量的方法就是反复地从总体中抽
20、样,这种抽样完全可由计算机来实现,由此得到的统计量的分布就是随机模拟法所获得的近似分布。【知识模块】 统计量及其抽样分布22 【正确答案】 (1)总体(population) 是包含所研究的全部个体(数据) 的集合,它通常由所研究的一些个体组成。样本(sample)是从总体中抽取的一部分单位,作为总体的代表加以研究。样本所包含的总体单位数称为样本容量(sample size)。样本来自于总体,可以根据样本提供的信息推断总体的特征。(2)参数(parameter) 是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。统计量(statistic) 是用来描述样本特征的概括性数
21、字度量。区别:参数是从总体中计算得到,代表总体特征,由于总体数据通常未知,所以参数是一个未知的常数。统计量是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是一个变量,是样本的函数。由于样本是已经抽出来的,所以统计量总是知道的。此外,参数常用希腊字母表示,统计量常用英文字母表示。联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,统计量与参数是同一统计指标;当总体为无限时,统计量与总体参数不同,但统计量可以在某种程度上作为总体参数的估计值,通过样本统计量,对总体参数作出预测和估计。【知识模块】 统计量及其抽样分布23 【正确答案】 不是。显然,小明和他弟弟都是左撇子的事件
22、不是独立的,所以这种计算方法错误。当两个事件相互独立时,P(AB)P(A)P(B)当两个事件不相互独立时,P(AB)P(A)P(BA)P(B)P(AB)记事件 A 为小明是左撇子,事件 B 为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。【知识模块】 统计量及其抽样分布24 【正确答案】 无偏性(unbiasedness)是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为 ,所选择的估计量为 ,如果 E( ),则称 为 的无偏估计量。 设 是 的一个无偏估计量,若对于 的任一方差存在的无偏估计量
23、,都有 则称 是 的一致最小方差无偏估计记为UMVUE。【知识模块】 参数估计25 【正确答案】 一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。当样本量给定时,误差范围随着置信度的增大而增大,即精度随置信度的增加而减小;当置信度固定时,误差范围随样本量的增大而减小。因此,可通过选取较大的样本量来解决精度与置信度之间的矛盾。【知识模块】 参数估计三、计算与分析题26 【正确答案】 (1)根据离散型随机变量的概率分布列的特征可知:020103a 1 。解得,a 04。 (2)当 1 时,F()0; 当 12时,F()0 2
24、; 当 2 3 时,F() 020103; 当 34 时,F()02010306; 当 4 时,F()020103041; 所以随机变量 X 的分布为: (3)E(X) =102201 30340429 V ar(X)EXE(X)2 (iE(X) 2pi (129) 202(229) 201(329) 203(429) 204 129【知识模块】 统计量及其抽样分布27 【正确答案】 (1)由于 12010000120,故可作为重复抽样来进行计算。 由题意可知,合格产品的概率为 p 9500,则在 9545的概率保证程度下,这批产品的合格率范围是:pt9500398即(9102 ,9898)
25、。 (2) 如果是合格率的抽样极限误差缩小为原来的 12,那么抽样的样本单位数应该为原 来的 4 倍,即需要抽取 480 样本单位数。【知识模块】 参数估计28 【正确答案】 (1)由于总体方差未知,且样本量较小,所以采用 t 统计量。 根据题意可以提出假设:H 0:120 VS H 1:120 已知条件为:0120, 1231,s100,n20,005。 t 13871729 因为 tt 0,样本统计量落在非拒绝域,故不能拒绝 H0,即还不能充分证明这种乳胶漆的平均干燥时间大:于二制造商宣称的 120 分钟。 (2)由于总体方差未知,且样本量较小,所以采用 t 统计量。已知条件为: 1231
26、,s100,n20,01。 所以平均干燥时间 的置信区间为: 即(1192,1270),即平均干燥时间 的 10的置信区间为 1192 分钟 1270 分钟。 (3)假设检验问题和置信区间问题的主要联系如下: 区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信度或风险;对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设检验问题,假设检验问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。【知识模块】 参数估计29 【正确答案】 (1)指数分布的均值为:E(X) 样本均值为:令 (2)要求未知参数 的极大似然估计量,可按如下步骤进行: 写出似然函数:L()对数似然函数:l()nln 似然方程:求解似然方程: 即参数 的极大似然估计量为:【知识模块】 参数估计
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1