1、应用统计硕士历年真题试卷汇编 6 及答案解析(总分:52.00,做题时间:90 分钟)一、单选选择题(总题数:12,分数:24.00)1.关于方差分析,以下说法哪一项更合理?( )中山大学 2012 研(分数:2.00)A.方差分析的目的是分析各组总体方差是否有显著差异B.方差分析的目的是分析各组总体标准差是否有显著差异C.方差分析的目的是分析各组总体均值是否有显著差异D.方差分析的目的是分析各组总体中位数是否有显著差异2.在方差分析中,所提出的原假设是 H 0 : 1 2 k ,备择假设是( )。江苏大学 2012研(分数:2.00)A.H 1 : 1 2 kB.H 1 : 1 2 kC.H
2、 1 : 1 2 kD.H 1 : 1 , 2 , k 不全相等3.为研究食品的包装和销售地区对其销售量是否有影响,在三个不同地区中用三种不同包装方法进行销售,根据获得的销售量数据计算得到下面的方差分析表。表中“A”单元格和“B”单元格内的结果是( )。安徽财经大学 2012 研 (分数:2.00)A.0073 和 3127B.0023 和 43005C.13752 和 0320D.43005 和 03204.存方差分析中,数据的误差是用平方和来表示的其中绢间平方和反映的是( )。安徽财经大学 2012研(分数:2.00)A.一个样本观测值之间误差的大小B.全部观测值误差的大小C.各个样本均值
3、之间误差的大小D.各个样本方差之间误差的大小5.关于单因素方差分析中的 F 检验( )。中央财经大学 2011 研(分数:2.00)A.拒绝域在 F 分布曲线的右侧B.F 统计量的样本观测值可能为负值C.拒绝域在 F 分布曲线的左侧和右侧D.以上表述都不对6.关于方差分析,下列说法正确的是( )。中山大学 2011 研(分数:2.00)A.方差分析的目的是分析各组总体方差是否相同B.方差分析的组间均方仅仅衡量了随机误差的变异大小C.各组数据呈严重偏态时,也可以作方差分析D.方差分析的目的是分析各组总体的均值是否相同7.方差分析是通过对多个总体均值差异的比较来( )。江苏大学 2011 研(分数
4、:2.00)A.判断各总体是否存在方差B.检验各样本数据是否来自正态总体C.比较各总体的方差是否相等D.研究分类自变量对数值因变量的影响是否显著8.投资某项目的收益率 R 是随机变量,其分布如表 244 所示;某位投资者在该项目上投资 1000 元,他的预期收入和收入的方差分别为_元和_(元) 2 。( )中山大学 2011 研 (分数:2.00)A.50,10B.1050,10C.1050,80D.50,809.在多元回归分析中,当 F 检验表明线性关系显著时,而部分回归系数的 t 检验却不显著,这意味着( )。浙江工商大学 2012 研(分数:2.00)A.不显著的回归系数所对应的自变量对
5、因变量的影响不显著B.所有的自变量对因变量的影响都不显著C.模型中可能存在多重共线性D.整个回归模型的线性关系不显著10.在多元线性回归分析中,检验是用来检验( )。中央财经大学 2011 研、浙江工商大学 2011 研(分数:2.00)A.总体线性关系的显著性B.各回归系数的显著性C.样本线性关系的显著性D.H 0 : 1 2 k 011.在多元线性回归分析中,如果 F 检验表明线性关系显著,则意味着( )。安徽财经大学 2012 研、浙江工商大学 2011 研(分数:2.00)A.在多个自变量中至少有一个自变量与因变量之间的线性关系显著B.所有的自变量与因变量之间的线性关系都显著C.在多个
6、自变量中至少有一个自变量与因变量之间的线性关系不显著D.所有的自变量与因变量之间的线性关系都不显著12.以下统计方法中,哪一种不能用来研究变量之间的关系?( )中山大学 2011 研(分数:2.00)A.样本比例估计B.列联表分析C.一元线性回归D.多元线性回归二、简答题(总题数:5,分数:10.00)13.什么是方差分析?它与总体均值的 t 检验或 Z 检验有什么不同?其优势是什么?西安交通大学 2008 研(分数:2.00)_14.单因素方差分析的实质是什么?并说明单因素方差分析的步骤。中南财经政法大学 2003 研(分数:2.00)_15.多元回归分析中为什么需要使用修正的判定系数(可决
7、系数)来比较方程的拟合效果?是如何计算的?中央财经大学 2009 研(分数:2.00)_16.说明回归模型的假设以及当这些假设不成立时的应对方法。中国人民大学 2006 研(分数:2.00)_17.在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?中南财经政法大学 2005 研(分数:2.00)_三、计算与分析题(总题数:9,分数:18.00)18.一项研究是调查市场专业人员的公司伦理价值观念。数据列表如表 246 所示(高分值表明伦理价值观念程度高),在显著性水平 001 下,对上述数据进行单因素方差分析,请把下面未完成的 ANOVA 表补充完整,并完成方
8、差分析,说出检验的结论。中山大学 2012 研 (分数:2.00)_19.表 248 是一个单因素方差分析表。请填充表中空格。东北财经大学 2012 研 (分数:2.00)_20.欲调查噪声强度对学生完成作业的准确度的影响。随机抽取了 15 名学生。分配到低噪声组,中噪声组。高噪声组中,得到准确度均数与方差如表 250 所示。 样本平均 ,样本方差 s 2 附:分子自由度为 df1,分母自由度为 df2 的 005 对应的 F 界值表。 (分数:2.00)_21.某公司管理者想比较 A、B、C、D 四种培训方案的效果,随机抽取了 48 个工人随机分配进行四种培训,将培训结束后每组工人每小时组织
9、产品数进行方差分析,得到表 252 中的结果。 (分数:2.00)_22.某中学为了考察学习效果,对本年级 3 个班的部分同学学习成绩进行抽样,如表 254 所示,学校想知道这几个班同学的成绩有无显著差异,请予以分析。(005)西安交通大学 2007 研 (分数:2.00)_23.一家汽车制造商准备购进一批轮胎。考虑的因素主要有轮胎供应商牌和耐磨程度。为了对磨损程度进行测试,分别在低速(40 公里小时)、中速(80 公里小时)、高速(120 公里小时)下进行测试。根据对 5 家供应商抽取的轮胎随机样本在轮胎行驶 1000 公里后磨损程度进行试验,在显著性水平 001下得到的有关结果如表 255
10、 所示。 (分数:2.00)_24.一家产品销售公司在 25 个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格( 1 )、各地区的年人均收入( 2 )、广告费用( 3 )之间的关系。搜集到 25 个地区的有关数据。利用 Excel得到下面的回归结果(005): (分数:2.00)_25.研究人员估计了两个回归模型,相关结果如下。中央财经大学 2010 研 (分数:2.00)_26.研究人员试图通过随机调查取得 60 名从业人员的性别、月收入和月消费支出数据,来建立居民消费支出的预测模型。分析中性别变量的取值为男性等于 1,女性等于 0。 (1)根据得到的 50 组数据,用 Exc
11、el进行回归分析(支出为因变量,性别和收入为自变量),部分结果如表 2 一 83 所示。已知居民的平均支出为 2188 元,计算模型因变量的离散系数。 (2)Excel 输出的方差分析表如表 284 所示,计算缺少的ABCD 四个项目(计算结果取整数)。 (3)写出上表中 F 检验的零假设和备择假设。根据 Excel 的计算结果,如果 001,检验的结论如何? (4)根据表 285 中的结果数据写出回归方程的表达式,说明回归系数的含义,并计算月收入为 3000 元的女性的平均支出。 (分数:2.00)_应用统计硕士历年真题试卷汇编 6 答案解析(总分:52.00,做题时间:90 分钟)一、单选
12、选择题(总题数:12,分数:24.00)1.关于方差分析,以下说法哪一项更合理?( )中山大学 2012 研(分数:2.00)A.方差分析的目的是分析各组总体方差是否有显著差异B.方差分析的目的是分析各组总体标准差是否有显著差异C.方差分析的目的是分析各组总体均值是否有显著差异 D.方差分析的目的是分析各组总体中位数是否有显著差异解析:解析:表面上看,方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是变量之间的关系。方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。2.在方差分析中,所提出的原假设是 H 0 : 1 2 k ,备择假设是(
13、)。江苏大学 2012研(分数:2.00)A.H 1 : 1 2 kB.H 1 : 1 2 kC.H 1 : 1 2 kD.H 1 : 1 , 2 , k 不全相等 解析:解析:在方差分析中,原假设所描述的是在按照自变量的取值分成的类中,因变量的均值相等。因此,检验因素的 k 个水平(总体)的均值是否相等,需要提出如下形式的假设: H 1 : 1 2 k 自变量对因变量没有显著影响 H 1 : 1 (i1,2,k)不全相等 自变量对因变量有显著影响3.为研究食品的包装和销售地区对其销售量是否有影响,在三个不同地区中用三种不同包装方法进行销售,根据获得的销售量数据计算得到下面的方差分析表。表中“
14、A”单元格和“B”单元格内的结果是( )。安徽财经大学 2012 研 (分数:2.00)A.0073 和 3127 B.0023 和 43005C.13752 和 0320D.43005 和 0320解析:解析:在无交互作用的双因素方差分析中,AF R 0073,BF C 4.存方差分析中,数据的误差是用平方和来表示的其中绢间平方和反映的是( )。安徽财经大学 2012研(分数:2.00)A.一个样本观测值之间误差的大小B.全部观测值误差的大小C.各个样本均值之间误差的大小 D.各个样本方差之间误差的大小解析:解析:组间平方和,记为 SSA,它是各组平均值 (i1,2,k)与总平均值5.关于单
15、因素方差分析中的 F 检验( )。中央财经大学 2011 研(分数:2.00)A.拒绝域在 F 分布曲线的右侧 B.F 统计量的样本观测值可能为负值C.拒绝域在 F 分布曲线的左侧和右侧D.以上表述都不对解析:解析:在单因素方差分析中,若 FF 则拒绝原假设 H 0 ;若 FF ,则不拒绝原假设 H 0 。6.关于方差分析,下列说法正确的是( )。中山大学 2011 研(分数:2.00)A.方差分析的目的是分析各组总体方差是否相同B.方差分析的组间均方仅仅衡量了随机误差的变异大小C.各组数据呈严重偏态时,也可以作方差分析D.方差分析的目的是分析各组总体的均值是否相同 解析:解析:方差分析就是通
16、过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。如果分析数据来自相同总体,那么在组间误差中只包含随机误差,而没有系统误差。反之,如果分析数据来自不同总体,在组间误差中除了包含随机误差外,还会包含系统误差。方差分析中有三个基本假定:每个总体都应服从正态分布;各个总体的方差 2 必须相同;观测值是独立的。7.方差分析是通过对多个总体均值差异的比较来( )。江苏大学 2011 研(分数:2.00)A.判断各总体是否存在方差B.检验各样本数据是否来自正态总体C.比较各总体的方差是否相等D.研究分类自变量对数值因变量的影响是否显著 解析:解析:方差分析就是通过检验各总体的均值是
17、否相等来判断分类型自变量对数值型因变量是否有显著影响。8.投资某项目的收益率 R 是随机变量,其分布如表 244 所示;某位投资者在该项目上投资 1000 元,他的预期收入和收入的方差分别为_元和_(元) 2 。( )中山大学 2011 研 (分数:2.00)A.50,10B.1050,10C.1050,80D.50,80 解析:解析:预期收入1000(403505601701)50(元) 预期收入的方差(1000450) 2 03(1000550) 2 05(1000650) 2 01(10007050) 2 80(元 2 )9.在多元回归分析中,当 F 检验表明线性关系显著时,而部分回归系
18、数的 t 检验却不显著,这意味着( )。浙江工商大学 2012 研(分数:2.00)A.不显著的回归系数所对应的自变量对因变量的影响不显著B.所有的自变量对因变量的影响都不显著C.模型中可能存在多重共线性 D.整个回归模型的线性关系不显著解析:解析:如果出现下列情况,暗示存在多重共线性:模型中各对自变量之间显著相关;当模型的线性关系检验(F 检验)显著时,几乎所有回归系数 i 的 t 检验却不显著;回归系数的正负号与预期的相反。10.在多元线性回归分析中,检验是用来检验( )。中央财经大学 2011 研、浙江工商大学 2011 研(分数:2.00)A.总体线性关系的显著性B.各回归系数的显著性
19、 C.样本线性关系的显著性D.H 0 : 1 2 k 0解析:解析:回归系数的检验又称为 t 检验。线性关系的检验又称为 F 检验,是检验因变量 y 与 k 个自变量之间的关系是否显著,其原假设 H 0 为 1 2 k 0。11.在多元线性回归分析中,如果 F 检验表明线性关系显著,则意味着( )。安徽财经大学 2012 研、浙江工商大学 2011 研(分数:2.00)A.在多个自变量中至少有一个自变量与因变量之间的线性关系显著 B.所有的自变量与因变量之间的线性关系都显著C.在多个自变量中至少有一个自变量与因变量之间的线性关系不显著D.所有的自变量与因变量之间的线性关系都不显著解析:解析:线
20、性关系检验(F 检验)表明回归方程显著时,只是说,因变量至少同自变量中的一个自变量的线性关系是显著的,并非意味着同每个自变量之间的关系都显著。12.以下统计方法中,哪一种不能用来研究变量之间的关系?( )中山大学 2011 研(分数:2.00)A.样本比例估计 B.列联表分析C.一元线性回归D.多元线性回归解析:解析:列联分析也称为独立性检验,是分析两个变量之间是否有关联;回归分析则侧重于考察变量之间的数量伴随关系,并通过一定的数学表达式将这种关系描述出来,进而确定一个或几个变量(自变量)的变化对另一个特定变量(因变量)的影响程度;样本比例估计是用样本比例 p 估计总体比例,不能用来研究变量之
21、间的关系。二、简答题(总题数:5,分数:10.00)13.什么是方差分析?它与总体均值的 t 检验或 Z 检验有什么不同?其优势是什么?西安交通大学 2008 研(分数:2.00)_正确答案:(正确答案:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 总体均值的 t 检验或 Z 检验,一次只能研究两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行 C n 2 次不同的检验,如果 005,每次检验犯第类错误的概率都是 005,作多次检验会使犯第类错误的概率相应增加,而方差分析方法则是同时考虑所有的样
22、本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。 方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。)解析:14.单因素方差分析的实质是什么?并说明单因素方差分析的步骤。中南财经政法大学 2003 研(分数:2.00)_正确答案:(正确答案:单因素方差分析的实质是研究一个分类型自变量对一个数值型因变量的影响。 单因素方差分析的步骤为: (1)按要求检验的 k 个水平的均值是否相等,提出原假设和备择假设。 (2)构造检验统计量,计算各样本均值 ,样本总均值 ,误差平方和SST、SSE 和 SSA。 (3)计算样本统计量 F )解析:15.多
23、元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?中央财经大学 2009 研(分数:2.00)_正确答案:(正确答案:在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模型对样本观测值的拟合优度。这是由于多重判定系数 R 2 随着样本解释变量个数的增加,R 2 的值越来越高(即 R 2 是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,R 2 不是一个合适的指标,需加以调整。而
24、修正判定系数 R 2 ,其值不会随着解释变量个数 k 的增加而增加,因此在用于估计多元回归模型方面要优于多重判定系数 R 2 。修正判定系数 R 2 的计算公式为 R a 2 1(1R 2 ) )解析:16.说明回归模型的假设以及当这些假设不成立时的应对方法。中国人民大学 2006 研(分数:2.00)_正确答案:(正确答案:(1)多元回归模型的基本假定有: 自变量 1 , 2 , k 是非随机的、固定的,且相互之间互不相关(无多重共线性); 误差项 是一个期望值为 0 的随机变量,即 E()0; 对于自变量 1 , 2 , k 的所有值, 的方差 2 都相同,且不存在序列相关,即 )解析:1
25、7.在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?中南财经政法大学 2005 研(分数:2.00)_正确答案:(正确答案:在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在 k 个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。)解析:三、计算与分析
26、题(总题数:9,分数:18.00)18.一项研究是调查市场专业人员的公司伦理价值观念。数据列表如表 246 所示(高分值表明伦理价值观念程度高),在显著性水平 001 下,对上述数据进行单因素方差分析,请把下面未完成的 ANOVA 表补充完整,并完成方差分析,说出检验的结论。中山大学 2012 研 (分数:2.00)_正确答案:(正确答案:补充完整的 ANOVA 表如表 247 所示。 )解析:19.表 248 是一个单因素方差分析表。请填充表中空格。东北财经大学 2012 研 (分数:2.00)_正确答案:(正确答案:填充完整的单因素方差分析表如表 249 所示。 )解析:20.欲调查噪声强
27、度对学生完成作业的准确度的影响。随机抽取了 15 名学生。分配到低噪声组,中噪声组。高噪声组中,得到准确度均数与方差如表 250 所示。 样本平均 ,样本方差 s 2 附:分子自由度为 df1,分母自由度为 df2 的 005 对应的 F 界值表。 (分数:2.00)_正确答案:(正确答案:(1)方差分析表如表 251 所示。 R 2 )解析:21.某公司管理者想比较 A、B、C、D 四种培训方案的效果,随机抽取了 48 个工人随机分配进行四种培训,将培训结束后每组工人每小时组织产品数进行方差分析,得到表 252 中的结果。 (分数:2.00)_正确答案:(正确答案:(1)由已知得,组间平方和
28、 SSA、组内平方和 SSE 及总平方和 SST 的自由度分别为:f A 413,f E 48444,f T 48147 SSAMSA.f A 2303690,MSE 11059 SSTSSASSE69048665556,F 208 补全的方差分析表如表 253所示。 )解析:22.某中学为了考察学习效果,对本年级 3 个班的部分同学学习成绩进行抽样,如表 254 所示,学校想知道这几个班同学的成绩有无显著差异,请予以分析。(005)西安交通大学 2007 研 (分数:2.00)_正确答案:(正确答案:(1)设三个班同学的平均成绩分别为 1 , 2 , 3 。 提出假设: H 0 : 1 2
29、3 ,三个班的成绩无显著性差异 H 1 : 1 , 2 , 3 不全相等三个班的成绩有显著性差异 (2)构造检验统计量 由已知数据可得, 7(67716724) 2 7(56716724) 2 7(77296724) 2 148473 SSE 10074911374295594287 2704286 检验统计量 F )解析:23.一家汽车制造商准备购进一批轮胎。考虑的因素主要有轮胎供应商牌和耐磨程度。为了对磨损程度进行测试,分别在低速(40 公里小时)、中速(80 公里小时)、高速(120 公里小时)下进行测试。根据对 5 家供应商抽取的轮胎随机样本在轮胎行驶 1000 公里后磨损程度进行试验
30、,在显著性水平 001下得到的有关结果如表 255 所示。 (分数:2.00)_正确答案:(正确答案:方差分析表中的“行”指行因素,即轮胎供应商因素;“列”指列因素,即车速因素。 (1)设低速、中速、高速的平均磨损程度分别为 低速 , 中速 , 高速 。 提出假设:H 0 : 低速 中速 高速 ,H 1 : 低速 , 中速 , 高速 不全相等。 由于 P值0000002001(或 F 车速 9768865F 0.01 (2,8),拒绝原假设。表明不同车速对磨损程度有显著影响。 (2)设不同供应商轮胎的平均磨损程度分别为 1 , 2 , 3 , 4 , 5 。 提出假设:H 0 : 1 2 3
31、4 5 ,H 1 : 1 , 2 , 3 , 4 , 5 不全相等。 由方差分析表 255 可知,P值0000236001(或F 应商 2172701F 0.01 (4,8),拒绝原假设。表明不同供应商生产的轮胎的磨损程度有显著差异。 (3)在上面的分析中,所作出的假设有: 每个总体都应服从正态分布 每家供应商的轮胎在行驶 1000 公里后的磨损程度服从正态分布 轮胎在低速、中速和高速行驶 1000 公里后的磨损程度服从正态分布 各个总体的方差 2 相同 每家供应商的轮胎在行驶 1000 公里后的磨损程度的方差相同 轮胎在低速、中速和高速行驶 1000 公里后的磨损程度的方差相同 观测值是独立
32、的 轮胎供应商牌和不同车速对轮胎的耐磨程度是独立的)解析:24.一家产品销售公司在 25 个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格( 1 )、各地区的年人均收入( 2 )、广告费用( 3 )之间的关系。搜集到 25 个地区的有关数据。利用 Excel得到下面的回归结果(005): (分数:2.00)_正确答案:(正确答案:(1)方差分析表如表 278 所示。 (2)根据参数估计表,得到销售量与销售价格、年人均收入和广告费用的多元线性回归方程为: 758128784 1 8061 2 051 3 各回归系数的实际意义为: 1 8784 表示,在年人均收入和广告费用不变的条件
33、下,销售价格每增加 1 个单位,销售量平均减少 8784 个单位; 2 8061 表示,在销售价格和广告费用不变的条件下,年人均收入每增加 1 个单位,销售量平均增加 8061 个单位; 3 051 表示,在销售价格和年人均收入不变的条件下,广告费用每增加 1 个单位,销售量半均增加 051 个单位。 (3)提出假设: H 0 : 1 2 3 0 H 1 : 1 , 2 , 3 ,至少有一个不等于 0 计算检验统计量 F:由方差分析表可知 F4833。 查 F 分布表得 F =0.05 5(3,21)307。由于 F4833F =0.05 (3,21)307,所以拒绝原假设 H 0 。这意味着
34、销售量与销售价格、年人均收入和广告费用之间的线性关系是显著的。 (4)R 2 087 多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合度的一个统计量,反映了在因变量 Y 的变差中被估计的回归方程所解释的比例。本题中的实际意义是:在销售量取值的变差中,能被销售价格、年人均收人和广告费用的多元回归方程所解释的比例为 87。 (5)S e )解析:25.研究人员估计了两个回归模型,相关结果如下。中央财经大学 2010 研 (分数:2.00)_正确答案:(正确答案:(1)根据已知数据,模型 1 的调整判定系数为 0953,模型 2 的调整判定系数为0954,二者近似相等,
35、所以从判定系数角度看两个模型的拟合效果是一样的。 由于表中关于收入的 t统计量的 p 值都为 0000,所以收入对于支出的影响是显著的;而在模型 1 中,关于性别的 t 统计量的p 值为 0466,大于一般情况下给定的显著性水平,故该变量对支出的影响不显著。 (2)由(1)中的分析,模型 1 中的“性别”变量没有通过 t 检验,并且在模型 2 的基础上去掉该变量未使估计标准误差明显的减少,因此可以判定,应选择模型 2 进行预测。 (3)设 y 表示支出, 表示收入,则选定的回归方程为:6399610621 回归系数 0621 表示,收入每增加 1 个单位,支出平均增加0621 个单位。 (4)
36、当 3000 时, )解析:26.研究人员试图通过随机调查取得 60 名从业人员的性别、月收入和月消费支出数据,来建立居民消费支出的预测模型。分析中性别变量的取值为男性等于 1,女性等于 0。 (1)根据得到的 50 组数据,用 Excel进行回归分析(支出为因变量,性别和收入为自变量),部分结果如表 2 一 83 所示。已知居民的平均支出为 2188 元,计算模型因变量的离散系数。 (2)Excel 输出的方差分析表如表 284 所示,计算缺少的ABCD 四个项目(计算结果取整数)。 (3)写出上表中 F 检验的零假设和备择假设。根据 Excel 的计算结果,如果 001,检验的结论如何?
37、(4)根据表 285 中的结果数据写出回归方程的表达式,说明回归系数的含义,并计算月收入为 3000 元的女性的平均支出。 (分数:2.00)_正确答案:(正确答案:(1)模型因变量的离散系数为: (2)方差分析表中,缺少的 ABCD 四个项目分别为: A49247 B2900570028542745462955 C 9850 D 1449 (3)零假设为: H 0 : 1 2 0,即性别和月收入联合起来对月消费支出没有显著影响 备择假设为: H 1 : 1 和 2 不全为 0,即性别和月收入联合起来对月消费支出有显著影响 由于 Significance F00000001,因此拒绝原假设,即两个自变量对月消费支出有显著影响。 (4)令 1 ,表示月收入, 2 表示性别,则回归方程为: 35589064 1 41386 2 1 064 表示,在性别相同的从业人员中,月收入每增加 1 个单位,月支出将平均增加 064 个单位; 2 41386 表示,在收入相同的从业人员中,女性比男性平均多支出 41386 个单位。 月收人为 3000元的女性的平均支出是: )解析: