[考研类试卷]应用统计硕士(一元线性回归)模拟试卷1及答案与解析.doc

上传人:twoload295 文档编号:848538 上传时间:2019-02-22 格式:DOC 页数:15 大小:521KB
下载 相关 举报
[考研类试卷]应用统计硕士(一元线性回归)模拟试卷1及答案与解析.doc_第1页
第1页 / 共15页
[考研类试卷]应用统计硕士(一元线性回归)模拟试卷1及答案与解析.doc_第2页
第2页 / 共15页
[考研类试卷]应用统计硕士(一元线性回归)模拟试卷1及答案与解析.doc_第3页
第3页 / 共15页
[考研类试卷]应用统计硕士(一元线性回归)模拟试卷1及答案与解析.doc_第4页
第4页 / 共15页
[考研类试卷]应用统计硕士(一元线性回归)模拟试卷1及答案与解析.doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、应用统计硕士(一元线性回归)模拟试卷 1 及答案与解析一、单选选择题1 在线性回归模型中,预报变量( )。(A)由解释变量所惟一确定(B)惟一确定解释变量(C)是随机变量(D)不是随机变量2 在一元线性回归分析中,如果 F 检验的 p值为 03,则意味着( ) 。(A)预报变量与解释变量之间存在很强的线性关系(B)预报变量与解释变量之间存在较强的线性关系(C)预报变量与解释变量之间的线性关系较弱(D)预报变量与解释变量之间没有任何关系3 将一枚硬币重复投掷 n 次,用 X 和 Y 分别表示正面朝上和反面朝上的次数,则X 和 Y 的相关系数等于( )。(A)1(B) 0(C) 12(D)14 某

2、研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为06,则( )。(A)举重能力的 60归因于其体重(B)平均来说,运动员能举起其体重 60的重量。(C)如果运动员体重增加 10 公斤,则可多举 6 公斤的重量(D)运动员体重和能举起的重量之间有正相关关系5 已知变量 与 y 之间的关系,如图 2 一 18 所示,则其相关系数可能为( )。(A)01 0(B) 090(C) 090(D)0106 设有 4 组容量相同的样本数据,即 n8,相关系数分别为:r10 65,r 2074,r 3089,r 4092,若取显著性水平 005 进行显著性检验,哪一个相关系数在统计上是不显著的?

3、( )(A)r 1(B) r2(C) r3(D)r 47 在线性回归模型中,随机误差 被假定服从( )。(A)正态分布(B)二项分布(C)指数分布(D)t 分布8 设 Ly ,则样本相关系数与回归系数的数量关系是( )。(A)(B)(C)(D)9 下列回归方程中肯定错误的是( )。(A) 15048 ,r 065(B) 15135,r081(C) 25085,r042(D) 120356 ,r09610 某校统计学院的学生学习统计学的时间()与考试成绩(y)之间建立线性回归方程ab。经计算,方程为 20008,该方程参数的计算( )。(A)a 值是明显不对的(B) b 值是明显不对的(C) a

4、 值和 b 值都是不对的(D)a 值和 b 值都是正确的11 在用回归方程进行估计推算时,( )。(A)只能用因变量推算自变量(B)只能用自变量推算因变量(C)不须考虑因变量和自变量问题(D)自变量和因变量可相互推算12 利用最小平方法配合回归方程的数学依据是:令观察值和估计值之间( )。(A)所有离差皆为零(B)离差之和为零(C)离差的平方和为零(D)离差平方和为最小13 一元线性回归模型 yi 0 1i i 的残差平方和 SSE100,样本容量 n27,则回归模型的方差( 2 的无偏估计量为( )。(A)400(B) 417(C) 425(D)50014 对于一元线性回归模型,以 se 表

5、示估计标准误差,r 表示样本相关系数,则有( )。(A)s e0 时,r1(B) se0 时,r1(C) se0 时,r0(D)s e0 时,r1 或 r115 根据样本资料得受教育年数 (年) 与年薪(万元)的回归方程为:20100732 ,这意味着 ( )。(A)受教育年数与年薪之间是负相关(B)受教育年数为 5 年时,年薪为 165 万元(C)受教育年数每增加 1 年,年薪 0732 万元(D)受教育年数每增加 1 年,年薪平均增加 0 732 万元16 某汽车生产商欲了解广告费用()对销售量(y)的影响,收集了过去 12 年的有关数据。通过计算得到方差分析表,如表 265 所示(005

6、)。则方差分析表中空格的数据分别为( ) 。(A)4015807;3991(B) 4015807;00025(C) 09755;3991(D)00244;0002517 在一元线性回归中,检验 H0: 10,下面结论正确的是( )。(A)相关系数检验、t 检验、F 检验三种方法不等价(B)相关系数检验、t 检验、F 检验三种方法是等价的(C)相关系数检验法只能用统计量检验,不能用 F 统计量检验(D)检验只能用 F 统计量检验,而不能用 t 统计量检验18 在回归估计中,自变量的取值 f,越远离其平均值 ,求得的 y 的预测区间( )。(A)越宽(B)越窄(C)越准确(D)越接近实际值19 可

7、决系数 R2( )。(A)是对相关关系显著性检验所运用的统计量(B)是衡量回归模型的拟合优良程度的指标(C)其定义是在回归模型为非线性模型、回归系数是用最小平方法下给出(D)其定义是在回归模型为线性模型、回归系数是用极大似然估计法下给出的二、简答题20 一元线性回归模型中有哪些基本的假定?21 若回归模型用于预测,影响预测精度的因素有哪些?22 什么是置信区间估计和预测区间估计?二者有何区别?三、计算与分析题23 设人均收入 X 为自变量,人均消费 y 为因变量。现根据某地 12 个住户的有关资料计算出以下数据:(单位:元)要求:(1)拟合简单线性回归方程,并解释方程中回归系数的经济意义; (

8、2)计算可决系数和回归估计的标准误差; (3)对 X 的回归系数进行显著性检验 (显著性水平为005,t 0.025(10)2228) ; (4) 假定人均收入为 800 元,利用拟合的回归方程预测相应的人均消费水平。并给出置信度为 95的预测区间。24 东华股份公司的广告费与销售收入资料如表 274 所示。要求:(1)以广告费为解释变量,销售收入为被解释变量,利用最小二乘法拟合两个变量的直线方程;(2)评价拟合优度;(3) 检验广告费与销售收入之间的相关性;(4)做残差分析,并说明从残差分析中可以得到什么结论。对此你有什么建议? 注:显著性水平 005; 2786,y17016,y 9384

9、047, 2 1631350,y 254725232; t0.05(6)19432,t 0.05(8)18595,t 0.05(6)24469,t 0.05(8)23060,F 0.05(1,6)599,F 0.05(1,8)532,F 0.05(1,6)881,F 0.05(1,8)757。应用统计硕士(一元线性回归)模拟试卷 1 答案与解析一、单选选择题1 【正确答案】 D【试题解析】 预报变量即自变量,相当于通常函数关系中的自变量,对这样的变量能够赋予一个需要的值或者能够取到一个可观测但不能人为控制的值。【知识模块】 一元线性回归2 【正确答案】 C【试题解析】 在一元线性回归分析中,F

10、 检验、t 检验和相关系数的检验是等价的。由于 F 检验的 p值为 03 相对较大,则不能拒绝原假设 H0: 10。在相关系数的检验中,等价于不拒绝原假设 H0:p0。即认为预报变量与解释变量之间的线性关系较弱。【知识模块】 一元线性回归3 【正确答案】 A【试题解析】 将一枚硬币重复投掷 n 次,正面朝上和反面朝上的次数关系为XYn,即 Xn Y,X 与 Y 为完全负线性相关关系,所以相关系数为1。【知识模块】 一元线性回归4 【正确答案】 D【试题解析】 若运动员举重能力关于其体重的回归模型中,若回归系数为 06,则可认为:平均来说,运动员能举起其体重 60的重量;如果运动员体重增加 10

11、公斤,则平均可多举 06106 公斤的重量。但是,相关系数并不是回归系数,举重运动员的体重与他能举起的重量之间的相关系数为 06,仅意味着两者之间有正相关关系。【知识模块】 一元线性回归5 【正确答案】 C【试题解析】 图中变量的大体趋势是 y 随着 的增加而减少,说明是负相关,相关系数为负数;并且直线的斜率绝对值大体等于 1,所以相关系数最有可能的是09。【知识模块】 一元线性回归6 【正确答案】 A【试题解析】 该检验的原假设为:H 0:p0,与样本相关系数 r 有关的 t 统计量服从自由度为 n28 26 的 t 分布: 在给定显著性水平005 下,查 t 分布表的自由度 n2826 的

12、临界值为 2447。 当r1065 时, t 2095 2447,所以不拒绝原假设; 当 r2074 时,t 2 6952447,所以拒绝原假设; 同理,当 r3089 ,r 4092 时,同样要拒绝原假设。【知识模块】 一元线性回归7 【正确答案】 A【试题解析】 随机误差 满足六个假定条件: i 是一个随机变量; i 的均值为 0;在每一个时期中, i 的方差为一个常量;各个 i 间相互独立; i 与自变量无关; i 服从正态分布。【知识模块】 一元线性回归8 【正确答案】 A【试题解析】 样本相关系数 所以回归系数【知识模块】 一元线性回归9 【正确答案】 A【试题解析】 回归系数和相关

13、系数的符号是一致的。A 项,回归系数0,即两个变量负相关,则相关系数必然为负数。【知识模块】 一元线性回归10 【正确答案】 C【试题解析】 根据方程,若自变量取值为 0,则 200,即学习统计学的时间为0 时,估计考试成绩为 200 分,这显然是不符合实际的;根据方程还可知,自变量的系数为(08) ,其统计学意义为学习的时间和考试成绩成负相关,即学习时间越长,学习成绩越差,这显然也是不符合实际的。所以,该方程参数 a 值和 b 值都是不对的。【知识模块】 一元线性回归11 【正确答案】 B【试题解析】 回归模型中自变量是给定的,即自变量是非随机的,因变量是随机的,所以在用回归方程进行估计推算

14、时,只能用自变量推算因变量。【知识模块】 一元线性回归12 【正确答案】 D【试题解析】 最小平方法,又称为最小二乘法,是通过使因变量的观察值与估计值之间的离差平方和达到最小来估计参数 0 和 1 的方法。【知识模块】 一元线性回归13 【正确答案】 A【试题解析】 2 的无偏估计量 。【知识模块】 一元线性回归14 【正确答案】 D【试题解析】 估计标准误 se 0 即 yi ,模型与样本观测值完全拟合,自变量与因变量是完全正相关或者完全负相关的,即r1 或 r1。【知识模块】 一元线性回归15 【正确答案】 D【试题解析】 回归系数 07320,即受教育年数与年薪之间是正相关关系;当受教育

15、年数为 5 年时,平均年薪为: 201007325165(万元) 。【知识模块】 一元线性回归16 【正确答案】 A【试题解析】 均方(MS)是平方和(SS)除以其相应的自由度(df),即MSSSdf;所以MSE SSEdf4015807104015807;FMSR MSE1602708640158073991。【知识模块】 一元线性回归17 【正确答案】 B【试题解析】 对一元线性回归这三种检验的结果是完全一致的。回归系数的显著性 t 检验与相关系数显著性检验是完全等价的,而 F 统计量则是这两个 t 统计量的平方。【知识模块】 一元线性回归18 【正确答案】 A【试题解析】 对因变量 yf

16、 的区间预测有如下特点:对 yf 的预测区间不是常数,是随 f 的变化而变化的,当 f 时,( f )20,此时预测区间最窄, f 越是远离 越大,预测区间越宽。因此用回归模型作预测时, f,不宜离过远,否则预测精度会降低,甚至使预测失效。预测区间与样本量有关,样本容量 n,越大, 越大,预测误差的方差越小,预测区间也越窄。而样本容量过小时,预测精度将较差。【知识模块】 一元线性回归19 【正确答案】 B【试题解析】 可决系数是衡量自变量对因变量变动解释程度的指标,它取决于回归方程所解释的),的总离差的百分比。可决系数的计算公式为:可决系数 R2 越大,模型拟合的越好,其定义是在回归模型为线性

17、模型、回归系数是用最小二乘估计法下给出的。【知识模块】 一元线性回归二、简答题20 【正确答案】 一元线性回归模型中基本的假定: (1)因变量 y 与自变量 之间具有线性关系; (2)在重复抽样中,自变量 的取值是固定的,即假定 是非随机的;(3)误差项 是一个期望值为 0 的随机变量,即 E()0; (4)对于所有的 值, 的方差 2 都相同; (5)误差项 是一个服从正态分布的随机变量,且独立,即N(0, 2)。【知识模块】 一元线性回归21 【正确答案】 影响预测精度的因素有:预测的信度要求。同样情况下,要求预测的把握度越高,则相应的预测区间就越宽,精度越低。总体 y 分布的离散程度 2

18、。 2 越大,相应的预测区间就越宽,预测精度越低。 样本观测点的多少n。n 越大,相应的预测区间就越窄,预测精度越高。样本观测点中,解释变量 分布的离散度。 分布越离散,预测精度越高。预测点 0 离样本分布中心 的距离。预测点越远离样本分布中心 ,预测区间越宽,精度越低,越接近样本分布中心 ,区间越窄,精度越高。【知识模块】 一元线性回归22 【正确答案】 (1)置信区间估计,它是对 的一个给定值 0,求出 y 的平均值的估计区间,这一区间称为置信区间; 预测区问估计,它是对 的一个给定值 0,求出 y 的一个个别值的估计区间,这一区间称为预测区间。 (2)置信区间估计和预测区间估计的区别:置

19、信区间估计是求 y 的平均值的估计区间,而预测区间估计是求 y 的一个个别值的估计区间;对同一个 0,这两个区间的宽度也是不一样的,预测区间要比置信区间宽一些。【知识模块】 一元线性回归三、计算与分析题23 【正确答案】 (1)由最小二乘法,5498078636478840372 简单线性回归方程为: 4037207863X 07863 表示当人均收入增加 1 元时,人均消费平均增加 07863 元。 40372 表示当人均收入是 0 时,人均消费平均为 40372 元。 (2)可决系数为: R 29998 由SSTSSRSSE,R 2 可得,SST(1 R 2)。因此回归估计的标准误差为:

20、Se 029 (3)提出假设: H0:0,H 1:0 计算检验的统计量 t:由于 t22389t 0.0255(10)2228,所以拒绝原假设,即认为 X 的回归系数显著不为 0。 (4)当 X0800 时,40372078638006694(元) 。 对于给定的 X0,Y 的一个个别值 Y0在 95的置信水平下的预测区间可表示为:所以置信度为 95的预测区间是(6640,6748)。【知识模块】 一元线性回归24 【正确答案】 (1)令 表示广告费,y 表示销售收入。设直线方程为:ab。据已知资料,由最小二乘法可得:故直线方程为:305305231 。 (2)由于 故可决系数 R2 9761

21、。表明在该销售收入变动中,有 9761是由广告费增加量所决定的,即销售收入与广告费之间有很强的线性关系。 (3)由于直线方程的回归系数 b0,则广告费与销售收入之间的相关系数为: r0988 建立原假设与备择假设:H 0:0,H 0:0。 检验统计量的值为: 由于 t1567t 0.05/2(6)24469,故拒绝原假设,即广告费与销售收入之间确实存在线性相关关系。 (4)残差计算表,如表 275 所示。绘制标准化残差图如图 221 所示。 如果误差项服从正态分布这一假定成立,那么标准化残差的分布也应服从正态分布。因此,在标准化残差图中,大约有 95的标准化残差在22 之间。从图中可以看出,所有的标准化残差都在22 之间,因而初步判定误差项服从正态分布。但从图中又可以看出,随着 的变化,残差表现一定的规律,可认为存在异方差,因而可以采用加权最小二乘法消除异方差性的影响。【知识模块】 一元线性回归

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 考试资料 > 大学考试

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1