1、应用统计硕士历年真题试卷汇编 7 及答案与解析一、单选选择题1 关于方差分析,以下说法哪一项更合理?( ) 中山大学 2012 研(A)方差分析的目的是分析各组总体方差是否有显著差异(B)方差分析的目的是分析各组总体标准差是否有显著差异(C)方差分析的目的是分析各组总体均值是否有显著差异(D)方差分析的目的是分析各组总体中位数是否有显著差异2 在方差分析中,所提出的原假设是 H0: 1 2 k,备择假设是( )。江苏大学 2012 研(A)H 1: 12 k(B) H1: 1 2 k(C) H1: 1 2 k(D)H 1: 1, 2, k 不全相等3 为研究食品的包装和销售地区对其销售量是否有
2、影响,在三个不同地区中用三种不同包装方法进行销售,根据获得的销售量数据计算得到下面的方差分析表。表中“A”单元格和“B”单元格内的结果是( )。安徽财经大学 2012 研(A)0073 和 3127(B) 0023 和 43005(C) 13752 和 0320(D)43005 和 03204 存方差分析中,数据的误差是用平方和来表示的其中绢间平方和反映的是( )。安徽财经大学 2012 研(A)一个样本观测值之间误差的大小(B)全部观测值误差的大小(C)各个样本均值之间误差的大小(D)各个样本方差之间误差的大小5 关于单因素方差分析中的 F 检验( )。中央财经大学 2011 研(A)拒绝域
3、在 F 分布曲线的右侧(B) F 统计量的样本观测值可能为负值(C)拒绝域在 F 分布曲线的左侧和右侧(D)以上表述都不对6 关于方差分析,下列说法正确的是( )。中山大学 2011 研(A)方差分析的目的是分析各组总体方差是否相同(B)方差分析的组间均方仅仅衡量了随机误差的变异大小(C)各组数据呈严重偏态时,也可以作方差分析(D)方差分析的目的是分析各组总体的均值是否相同7 方差分析是通过对多个总体均值差异的比较来( )。江苏大学 2011 研(A)判断各总体是否存在方差(B)检验各样本数据是否来自正态总体(C)比较各总体的方差是否相等(D)研究分类自变量对数值因变量的影响是否显著8 投资某
4、项目的收益率 R 是随机变量,其分布如表 244 所示;某位投资者在该项目上投资 1000 元,他的预期收入和收入的方差分别为_元和_(元) 2。( )中山大学 2011 研(A)50,10(B) 1050,10(C) 1050,80(D)50,809 在多元回归分析中,当 F 检验表明线性关系显著时,而部分回归系数的 t 检验却不显著,这意味着( ) 。 浙江工商大学 2012 研(A)不显著的回归系数所对应的自变量对因变量的影响不显著(B)所有的自变量对因变量的影响都不显著(C)模型中可能存在多重共线性(D)整个回归模型的线性关系不显著10 在多元线性回归分析中,检验是用来检验( )。中央
5、财经大学 2011 研、浙江工商大学 2011 研(A)总体线性关系的显著性(B)各回归系数的显著性(C)样本线性关系的显著性(D)H 0: 1 2 k011 在多元线性回归分析中,如果 F 检验表明线性关系显著,则意味着( ) 。安徽财经大学 2012 研、浙江工商大学 2011 研(A)在多个自变量中至少有一个自变量与因变量之间的线性关系显著(B)所有的自变量与因变量之间的线性关系都显著(C)在多个自变量中至少有一个自变量与因变量之间的线性关系不显著(D)所有的自变量与因变量之间的线性关系都不显著12 以下统计方法中,哪一种不能用来研究变量之间的关系?( )中山大学 2011 研(A)样本
6、比例估计(B)列联表分析(C)一元线性回归(D)多元线性回归二、简答题13 什么是方差分析? 它与总体均值的 t 检验或 Z 检验有什么不同? 其优势是什么?西安交通大学 2008 研14 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。中南财经政法大学 2003 研15 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的 ?中央财经大学 2009 研16 说明回归模型的假设以及当这些假设不成立时的应对方法。中国人民大学2006 研17 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?中南财经政法大学 2005
7、 研三、计算与分析题18 一项研究是调查市场专业人员的公司伦理价值观念。数据列表如表 246 所示(高分值表明伦理价值观念程度高),在显著性水平 001 下,对上述数据进行单因素方差分析,请把下面未完成的 ANOVA 表补充完整,并完成方差分析,说出检验的结论。中山大学 2012 研19 表 248 是一个单因素方差分析表。请填充表中空格。东北财经大学 2012 研20 欲调查噪声强度对学生完成作业的准确度的影响。随机抽取了 15 名学生。分配到低噪声组,中噪声组。高噪声组中,得到准确度均数与方差如表 250 所示。样本平均 ,样本方差 s2 附:分子自由度为 df1,分母自由度为 df2 的
8、 005 对应的 F 界值表。(1)计算完成方差分析表,并说明噪声强度能解释作业准确度的变异的比例。 (2)用 005 的显著性水平,分析噪声强度对作业准确度是否有影响。 (3)要具体确定低噪声组与中噪声组间的准确度是否有差异怎样分析(不需计算)。中山大学2011 研21 某公司管理者想比较 A、B、C、D 四种培训方案的效果,随机抽取了 48 个工人随机分配进行四种培训,将培训结束后每组工人每小时组织产品数进行方差分析,得到表 252 中的结果。(1)完成上面的方差分析表,要求写出主要使用的公式; (2)若显著性水平0 05,请问这四种培训方案效果是否有显著性差异。西安交通大学 2008 研
9、22 某中学为了考察学习效果,对本年级 3 个班的部分同学学习成绩进行抽样,如表 254 所示,学校想知道这几个班同学的成绩有无显著差异,请予以分析。(005)西安交通大学 2007 研23 一家汽车制造商准备购进一批轮胎。考虑的因素主要有轮胎供应商牌和耐磨程度。为了对磨损程度进行测试,分别在低速(40 公里小时)、中速(80 公里小时)、高速(120 公里小时) 下进行测试。根据对 5 家供应商抽取的轮胎随机样本在轮胎行驶 1000 公里后磨损程度进行试验,在显著性水平 001 下得到的有关结果如表 255 所示。(1)不同车速对磨损程度是否有显著影响? (2)不同供应商生产的轮胎之间磨损程
10、度是否有显著差异? (3)在上面的分析中,你都作了哪些假设? 中国人民大学 2006 研24 一家产品销售公司在 25 个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格( 1)、各地区的年人均收入( 2)、广告费用( 3)之间的关系。搜集到 25 个地区的有关数据。利用 Excel 得到下面的回归结果 (005):(1)将方差分析表中的所缺数值补齐。 (2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程。并解释各回归系数的意义。 (3)检验回归方程的线性关系是否显著? (4)计算判定系数 R2,并解释它的实际意义。 (5)计算估计标准误差Se,并解释它的实际意义。
11、 浙江工商大学 2011 研25 研究人员估计了两个回归模型,相关结果如下。中央财经大学 2010 研(1)根据表中的数据比较两个模型的拟合效果,并对 t 检验的结果进行分析。 (2)在以上两个模型中,你会选择哪一个模型进行预测?为什么? (3)写出你选定的回归方程,并分析回归系数的含义。 (4)一名男性职工上月收入为 3000 元,预测其支出。26 研究人员试图通过随机调查取得 60 名从业人员的性别、月收入和月消费支出数据,来建立居民消费支出的预测模型。分析中性别变量的取值为男性等于 1,女性等于 0。 (1)根据得到的 50 组数据,用 Excel 进行回归分析 (支出为因变量,性别和收
12、入为自变量),部分结果如表 2 一 83 所示。已知居民的平均支出为 2188 元,计算模型因变量的离散系数。 (2)Excel 输出的方差分析表如表 284 所示,计算缺少的 ABCD 四个项目(计算结果取整数)。(3)写出上表中 F 检验的零假设和备择假设。根据 Excel 的计算结果,如果0 01,检验的结论如何? (4) 根据表 285 中的结果数据写出回归方程的表达式,说明回归系数的含义,并计算月收入为 3000 元的女性的平均支出。(5)在回归分析中,我们通常需要回归方程同时做 t 检验和 F 检验。这两种检验的目的有何区别? 可以相互替代吗 ?中央财经大学 2008 研应用统计硕
13、士历年真题试卷汇编 7 答案与解析一、单选选择题1 【正确答案】 C【试题解析】 表面上看,方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是变量之间的关系。方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。【知识模块】 方差分析2 【正确答案】 D【试题解析】 在方差分析中,原假设所描述的是在按照自变量的取值分成的类中,因变量的均值相等。因此,检验因素的 k 个水平( 总体) 的均值是否相等,需要提出如下形式的假设: H 1: 1 2 k 自变量对因变量没有显著影响 H1: 1(i1, 2,k)不全相等 自变量对因变量有显著影响【知识模块
14、】 方差分析3 【正确答案】 A【试题解析】 在无交互作用的双因素方差分析中,AF R 0073,B F C 3127。【知识模块】 方差分析4 【正确答案】 C【试题解析】 组间平方和,记为 SSA,它是各组平均值 (i1,2,k)与总平均值 的误差平方和,反映各样本均值之间的差异程度,因此又称为因素平方和。【知识模块】 方差分析5 【正确答案】 A【试题解析】 在单因素方差分析中,若 FF 则拒绝原假设 H0;若 FF ,则不拒绝原假设 H0。【知识模块】 方差分析6 【正确答案】 D【试题解析】 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。如果
15、分析数据来自相同总体,那么在组间误差中只包含随机误差,而没有系统误差。反之,如果分析数据来自不同总体,在组间误差中除了包含随机误差外,还会包含系统误差。方差分析中有三个基本假定:每个总体都应服从正态分布;各个总体的方差 2 必须相同;观测值是独立的。【知识模块】 方差分析7 【正确答案】 D【试题解析】 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。【知识模块】 方差分析8 【正确答案】 D【试题解析】 预期收入1000(40350560 1701)50(元 ) 预期收入的方差(1000450) 203(10005 50)205 (1000650) 2
16、01(10007050) 280(元 2)【知识模块】 方差分析9 【正确答案】 C【试题解析】 如果出现下列情况,暗示存在多重共线性:模型中各对自变量之间显著相关;当模型的线性关系检验 (F 检验)显著时,几乎所有回归系数 i 的 t检验却不显著;回归系数的正负号与预期的相反。【知识模块】 多元线性回归10 【正确答案】 B【试题解析】 回归系数的检验又称为 t 检验。线性关系的检验又称为 F 检验,是检验因变量 y 与 k 个自变量之间的关系是否显著,其原假设 H0 为1 2 k0。【知识模块】 多元线性回归11 【正确答案】 A【试题解析】 线性关系检验(F 检验)表明回归方程显著时,只
17、是说,因变量至少同自变量中的一个自变量的线性关系是显著的,并非意味着同每个自变量之间的关系都显著。【知识模块】 多元线性回归12 【正确答案】 A【试题解析】 列联分析也称为独立性检验,是分析两个变量之间是否有关联;回归分析则侧重于考察变量之间的数量伴随关系,并通过一定的数学表达式将这种关系描述出来,进而确定一个或几个变量(自变量)的变化对另一个特定变量(因变量)的影响程度;样本比例估计是用样本比例 p 估计总体比例, ,不能用来研究变量之间的关系。【知识模块】 多元线性回归二、简答题13 【正确答案】 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
18、总体均值的 t 检验或 Z 检验,一次只能研究两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行 Cn2 次不同的检验,如果 005,每次检验犯第类错误的概率都是 005,作多次检验会使犯第类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。 方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。【知识模块】 方差分析14 【正确答案】 单因素方差分析的实质是研究一个分类型自变量对一个数值型因变量的影响。 单因素方差分析的步骤为: (1
19、)按要求检验的 k 个水平的均值是否相等,提出原假设和备择假设。 (2)构造检验统计量,计算各样本均值 ,样本总均值 ,误差平方和SST、SSE 和 SSA。 (3)计算样本统计量 F 。 (4)统计决策。比较统计量 D 和 F(k1,nk)的值。若 FF ,拒绝原假设;反之,不能拒绝原假设。【知识模块】 方差分析15 【正确答案】 在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模型对样本观测值的拟合优度。这是由于多重判定系数 R2 随着样本解释变量个数的增加,R 2 的值越来越高(即 R2 是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新的解释
20、变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,R 2 不是一个合适的指标,需加以调整。而修正判定系数 R2,其值不会随着解释变量个数 k 的增加而增加,因此在用于估计多元回归模型方面要优于多重判定系数 R2。修正判定系数 R2 的计算公式为Ra21(1 R2) 。【知识模块】 多元线性回归16 【正确答案】 (1)多元回归模型的基本假定有: 自变量 1, 2, k 是非随机的、固定的,且相互之间互不相关(无多重共线性); 误差项 是一个期望值为 0 的随机变量,即 E()0; 对于自变量 1, 2, k 的
21、所有值, 的方差2 都相同,且不存在序列相关,即 ; 误差项 是一个服从正态分布的随机变量,且相互独立,即 N(0, 2)。 (2)若模型中存在多重共线性时,即 1, 2, k 有成对自变量显著相关,解决的方法有: 第一,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。 第二,如果要在模型中保留所有的自变量,那就应该:避免根据 t 统计量对单个参数 ;进行检验;对因变量 Y 值的推断(估计或预测)限定在自变量样本值的范围内。 若模型中存在序列相关时,即 cov(i, j)0(ij),解决的方法有:如果误差项 不是相互独立的,则说明回归模型存在序列相关性,这时首先要查明序列相关
22、产生的原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺少重要的自变量,则应增加自变量;如果以上两种方法都不能消除序列相关性,则需采用迭代法、差分法等方法处理。 若模型中存在异方差性时,即 cov(i, j)2(ij) ,解决的方法有:当存在异方差性时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同。【知识模块】 多元线性回归17 【正确答案】 在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的
23、线性关系是否显著,在 k 个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。【知识模块】 多元线性回归三、计算与分析题18 【正确答案】 补充完整的 ANOVA 表如表 247 所示。从方差分析表可以看到,由于 F7F 0.01(2,15)63589,所以拒绝原假设H0,表明不同专业组之间的差异是显著的,即专业对市场专
24、业人员的公司伦理价值观念有影响。【知识模块】 方差分析19 【正确答案】 填充完整的单因素方差分析表如表 249 所示。【知识模块】 方差分析20 【正确答案】 (1)方差分析表如表 251 所示。R2 90 即噪声强度能解释作业准确度的变异的比例为 90。 (2)从方差分析表可以看到,由于 F1365F 0.05(2,14)388,所以拒绝原假设H0,表明不同噪声组之间的差异是显著的,即噪声对学生完成作业的准确度有影响。 (3)可以对低噪声组与中噪声组进行方差分析,并计算组间平方和占总平方和的比例大小,通过该比例的大小来确定两个组的准确度是否有差异。【知识模块】 方差分析21 【正确答案】
25、(1)由已知得,组间平方和 SSA、组内平方和 SSE 及总平方和 SST的自由度分别为: f A4 13,f E48444,f T48147 SSAMSA.f A2303 690,MSE 11059 SSTSSASSE69048665556,F 208 补全的方差分析表如表 253 所示。(2)设 A、B 、C、D 工人每小时组织产品数为 A, B, C, D。 建立假设: H0: A B C D 即四种培训方案效果没有显著性差异 H 1: A, B, C, D 不全相等即四种培训方案效果有显著性差异 根据表 253 可得,P 值085005,故不能拒绝原假设,说明没有证据表明这四种培训方案
26、效果有显著性差异。【知识模块】 方差分析22 【正确答案】 (1)设三个班同学的平均成绩分别为 1, 2, 3。 提出假设: H0: 1 2 3,三个班的成绩无显著性差异 H 1: 1, 2, 3 不全相等三个班的成绩有显著性差异 (2)构造检验统计量 由已知数据可得,7(67716724)27(56716724) 2 7(77296724) 2 148473 SSE10074911374295594287 2704286检验统计量 F 4941 (3) 统计决策 005,则 F4941355F 0.05(2,18) ,所以拒绝原假设,表明这三个班同学的成绩有显著性差异。【知识模块】 方差分析
27、23 【正确答案】 方差分析表中的“行” 指行因素,即轮胎供应商因素; “列”指列因素,即车速因素。 (1)设低速、中速、高速的平均磨损程度分别为 低速 , 中速 ,高速 。 提出假设:H 0: 低速 中速 高速 ,H 1: 低速 , 中速 , 高速 不全相等。 由于 P值0 0000020 01(或 F 车速 9768 865F 0.01(2,8),拒绝原假设。表明不同车速对磨损程度有显著影响。 (2)设不同供应商轮胎的平均磨损程度分别为 1, 2, 3, 4, 5。 提出假设:H0: 1 2 3 4 5,H 1: 1, 2, 3, 4, 5 不全相等。 由方差分析表 255可知,P值 00
28、00236 001(或F 应商 2172701F 0.01(4,8),拒绝原假设。表明不同供应商生产的轮胎的磨损程度有显著差异。 (3)在上面的分析中,所作出的假设有: 每个总体都应服从正态分布 每家供应商的轮胎在行驶1000 公里后的磨损程度服从正态分布 轮胎在低速、中速和高速行驶 1000 公里后的磨损程度服从正态分布 各个总体的方差 2 相同 每家供应商的轮胎在行驶 1000公里后的磨损程度的方差相同 轮胎在低速、中速和高速行驶 1000 公里后的磨损程度的方差相同 观测值是独立的 轮胎供应商牌和不同车速对轮胎的耐磨程度是独立的【知识模块】 方差分析24 【正确答案】 (1)方差分析表如
29、表 278 所示。(2)根据参数估计表,得到销售量与销售价格、年人均收入和广告费用的多元线性回归方程为: 758128784 18061 2 051 3 各回归系数的实际意义为: 187 84 表示,在年人均收入和广告费用不变的条件下,销售价格每增加 1 个单位,销售量平均减少 8784 个单位; 28061 表示,在销售价格和广告费用不变的条件下,年人均收入每增加 1 个单位,销售量平均增加 8061 个单位; 30 51 表示,在销售价格和年人均收入不变的条件下,广告费用每增加 1个单位,销售量半均增加 051 个单位。 (3)提出假设: H 0: 12 30 H1: 1, 2, 3,至少
30、有一个不等于 0 计算检验统计量 F:由方差分析表可知F4833。 查 F 分布表得 F=0.055(3,21)307 。由于F4833 F=0.05(3,21)307,所以拒绝原假设 H0。这意味着销售量与销售价格、年人均收入和广告费用之间的线性关系是显著的。 (4)R2 087 多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合度的一个统计量,反映了在因变量 Y 的变差中被估计的回归方程所解释的比例。本题中的实际意义是:在销售量取值的变差中,能被销售价格、年人均收人和广告费用的多元回归方程所解释的比例为 87。 (5)Se 2605 S e 估计的是预测误差的标
31、准差,其含义是根据自变量来预测因变量时的平均预测误差。本题中的含义为:根据所建立的多元回归方程,用销售价格、年人均收入和广告费用来预测销售量时,平均的预测误差为 2605个单位。【知识模块】 多元线性回归25 【正确答案】 (1)根据已知数据,模型 1 的调整判定系数为 0953,模型 2 的调整判定系数为 0954,二者近似相等,所以从判定系数角度看两个模型的拟合效果是一样的。 由于表中关于收入的 t 统计量的 p 值都为 0000,所以收入对于支出的影响是显著的;而在模型 1 中,关于性别的 t 统计量的 p 值为 0466,大于一般情况下给定的显著性水平,故该变量对支出的影响不显著。 (
32、2)由(1)中的分析,模型 1 中的“ 性别” 变量没有通过 t 检验,并且在模型 2 的基础上去掉该变量未使估计标准误差明显的减少,因此可以判定,应选择模型 2 进行预测。 (3)设 y 表示支出, 表示收入,则选定的回归方程为: 6399610621 回归系数0621 表示,收入每增加 1 个单位,支出平均增加 0621 个单位。 (4)当3000 时, 639961 06213000 250296l 。即当该名男性职工上月收入为 3000 元时,其支出为 2503 元。【知识模块】 多元线性回归26 【正确答案】 (1)模型因变量的离散系数为: (2)方差分析表中,缺少的 ABCD 四个
33、项目分别为: A49 247 B2900570028542745462955 C 9850 D 1449 (3) 零假设为: H 0: 1 20,即性别和月收入联合起来对月消费支出没有显著影响 备择假设为: H 1: 1 和 2 不全为 0,即性别和月收入联合起来对月消费支出有显著影响 由于 Significance F00000001,因此拒绝原假设,即两个自变量对月消费支出有显著影响。 (4)令 1,表示月收入, 2 表示性别,则回归方程为: 35589064 1 41386 2 1064 表示,在性别相同的从业人员中,月收入每增加 1 个单位,月支出将平均增加 064 个单位; 241386 表示,在收入相同的从业人员中,女性比男性平均多支出 41386 个单位。 月收人为3000 元的女性的平均支出是: 355890643000227589(元) (5)在一元线性回归中,自变量只有一个,这时 F 检验和 t 检验是等价的,即 H0: 10,如果被 t 检验拒绝,它也将被 F 检验拒绝。 但是在多元回归分析中,这两种检验的意义是不同的。F 检验是用来检验总体回归关系的显著性,而 t 检验则是检验各个回归系数的显著性,两者是不等价的。【知识模块】 多元线性回归