ImageVerifierCode 换一换
格式:DOC , 页数:18 ,大小:493KB ,
资源ID:848530      下载积分:2000 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
如需开发票,请勿充值!快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
注意:如需开发票,请勿充值!
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【http://www.mydoc123.com/d-848530.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文([考研类试卷]应用统计硕士历年真题试卷汇编2及答案与解析.doc)为本站会员(deputyduring120)主动上传,麦多课文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文库(发送邮件至master@mydoc123.com或直接QQ联系客服),我们立即给予删除!

[考研类试卷]应用统计硕士历年真题试卷汇编2及答案与解析.doc

1、应用统计硕士历年真题试卷汇编 2 及答案与解析一、单选选择题1 根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是( )。中央财经大学 2012 研(A)名义尺度(B)顺序尺度(C)差距尺度(D)比例尺度2 下面变量中属于顺序变量的是( )。中央财经大学 2012 研(A)职业(B)产品产量(C)年龄(D)产品等级3 对于 100 名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三分位数,以下哪种描述统计的办法更有效?( )中山大学 2012 研(A)直方图(B)茎叶图(C)饼图(D)点图4 若连续变量分组,第一组 4555,第二组 5565,第三组 6575,第

2、四组 75以上。则( )。江苏大学 2012 研(A)45 在第一组(B) 55 在第一组(C) 65 在第二组(D)75 在第三组5 由一组数据的最大值、最小值、中位数和两个四分位数绘制而成的反映原始数据分布的图形是( ) 。江苏大学 2012 研(A)散点图(B)箱线图(C)圆饼图(D)直方图6 雷达图的主要用途是( )。安徽财经大学 2012 研(A)反映一个样本或总体的结构(B)比较多个总体的构成(C)反映一组数据的分布(D)比较多个样本的相似性7 在一次问卷调查中要求被调查者直接填写出个人的民族、婚姻状况、居住地的邮政编码、年龄和收入。以下说法不正确的是( )。中央财经大学 2011

3、 研(A)民族是定性变量(B)邮政编码是定量变量(C)年龄的计量尺度是定比尺度(D)收入数据是定量数据8 一名研究人员希望通过图形来说明 4 月份以来北京地区二手房租金每天的变化,如下哪个图形最合适?( )中央财经大学 2011 研(A)直方图(B)散点图(C)折线图(D)茎叶图9 根据某地 6 至 16 岁学生近视情况的调查资料,反映患者的年龄分布可用( )。中山大学 2011 研(A)线图(B)散点图(C)直方图(D)条形图10 美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的 40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下

4、展示数据的图表中,哪一种不适合用来处理这一样本数据?( )中山大学 2011 研(A)散点图(B)饼图(C)条形图(D)频数图11 根据有关专家的建议,51 岁以下成年女性每日的铁摄入量应为 16 毫克;为了解这一人群铁摄入量的情况,有人抽取一个容量为 45 的样本并取得她们在 24 小时内的铁摄入量,所得数据如表 21 所示。以下图表,哪一种可以让我们迅速得到以上样本数据的中位数与两个四分位数?( )中山大学 2011 研(A)直方图(B)饼图(C)条形图(D)茎叶图12 上限是指( ) 。江苏大学 2009 研(A)每个组的最小值(B)每个组的最大值(C)每个组的中点数值(D)每个组的起点

5、数值12 统计学期中考试非常简单,为了评估简单程度,教师记录了 9 名学生交上考试试卷的时间如下(分钟)东北财经大学 2012 研33 29 45 60 42 19 52 38 3613 这些数据的极差为( )。(A)300(B) 300(C) 4100(D)410014 这些数据的除以样本自由度的方差为( )。(A)15000(B) 15000(C) 26000(D)2600015 这些数据的除以样本自由度的标准差为( )。(A)2960(B) 1225(C) 1225(D)296016 这些数据的离散系数为( )。(A)381(B) 031(C) 381(D)03117 影响简单算术平均数

6、大小的因素有( )。江苏大学 2012 研(A)变量的大小(B)变量值的大小(C)变量个数的多少(D)权数的大小18 一组数据包含 10 个观察值,则下四分位数的位置为( )。江苏大学 2012 研(A)2(B) 25(C) 275(D)319 已知总体的均值为 50,标准差为 8,从该总体中随机抽取样本量为 64 的样本,则样本均值的数学期望和抽样分布的标准误差分别为( )。安徽财经大学 2012 研(A)50,8(B) 50,1(C) 50,4(D)8,820 若总体服从均值为 标准差为 的正态分布;从中抽出一个容量为 10 简单随机样本,则样本平均的抽样分布为( )。中山大学 2011

7、研(A)N(, 210)(B) N(10, 2)(C) N(10, 2100)(D)N(, 2100)二、简答题21 统计中用以描述品质型数据频数分布的图形主要有哪些?各自有何特点? 东北财经大学 2012 研22 在盒子图(箱线图) 的作图中。会使用哪些描述指标?中央财经大学 2011 研23 简述统计分组的原则。首都经济贸易大学 2009 研、中南财经政法大学 2002 研24 说明条形图和直方图的区别和联系。中央财经大学 2009 研、中国人民大学2001 研25 简述标准化值的意义及计算公式。中央财经大学 2006 研26 简述均值、众数和中位数三者之间的关系及其在实际中的应用。中央财

8、经大学2005 研、北京林业大学 2005 研27 简述大数定律及其对统计推断应用的意义。浙江工商大学 2012 研三、计算与分析题28 某班学生统计学期末考试成绩数据如表 22 所示。要求: (1)绘制频数分布直方图; (2) 填制累积频数分布表; (3)绘制累积频数分布图; (4)计算均值、方差及标准差。东北财经大学 2012 研应用统计硕士历年真题试卷汇编 2 答案与解析一、单选选择题1 【正确答案】 A【试题解析】 名义尺度又称为定类尺度,是对个体进行类别划分的测度计量尺度。所使用的数值,用于表现它是否属于同一个人或物。B 项顺序尺度所使用的数值的大小,是与研究对象的特定顺序相对应的;

9、C 项差距尺度所使用的数值,不仅表示测定对象所具有的量的多少,还表示它们大小的程度即间隔的大小;D 项比例尺度测定值的差和比都是可以比较的。【知识模块】 数据的图表展示2 【正确答案】 D【试题解析】 顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。【知识模块】 数据的图表展示3 【正确答案】 B【试题解析】 直方图、饼图描述的是分组数值型数据,而茎叶图描述的是未分组的数值型数据,点图描述的是两个变量之间的关系。【知识模块】 数据的图表展示4 【正确答案】 A【试题解析】 绘制频数分布表,在统计各组频数时

10、,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内。【知识模块】 数据的图表展示5 【正确答案】 B【试题解析】 箱线图是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。A 项散点图是用二维坐标展示两个变量之间关系的一种图形;C 项圆饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体) 中各组成部分的数据占全部数据的比例;D 项直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(面积)来表示频数分布的。【知识模块】 数据的图表展示

11、6 【正确答案】 D【试题解析】 雷达图在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。此外,利用雷达图也可以研究多个样本之间的相似程度。【知识模块】 数据的图表展示7 【正确答案】 C【试题解析】 变量分为定性变量和定量变量:前者是指观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别的变量;后者是指可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异的变量。定距尺度也称等距尺度或区间尺度,是一种不仅能将变量(社会现象) 区分类别和等级,而且可以确定变量之间的数量

12、差别和间隔距离的方法。定比尺度也称比例尺度或等比尺度,是一种除有定距尺度的全部性质之外,还有测量不同变量(社会现象)之间的比例或比率关系的方法。由此可知,C 项年龄的计量尺度属于定距尺度。【知识模块】 数据的图表展示8 【正确答案】 C【试题解析】 直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积 )来表示频数分布的;散点图是用二维坐标展示两个变量之间关系的一种图形;茎叶图是反映原始数据分布的图形;如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图,线图主要用于反映现象随时间变化的特征。【知识模块】 数据的图表展示9 【正确答案】 C【试题解析】 直方图是

13、用来反映数据的分布直观形式,它的横坐标代表变量分组,纵坐标代表各变量值出现的频数,条形图是用来反映分类数据的,反映数值型数据一般用直方图。散点图反映两个变量间的关系;线图主要用来反映现象随时间变化的特征。【知识模块】 数据的图表展示10 【正确答案】 A【试题解析】 散点图是用二维坐标展示两个变量之间关系的一种图形。它是用坐标横轴代表变量 X,纵轴代表变量 Y,每组数据(X i,Y i)在坐标系中用一个点表示,n 组数据在坐标系中形成的 n 个点称为散点,由坐标及其散点形成的二维数据图称为散点图。它处理的是数值型数据。【知识模块】 数据的图表展示11 【正确答案】 D【试题解析】 直方图、饼图

14、、条形图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值型数据,且从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得。【知识模块】 数据的图表展示12 【正确答案】 B【试题解析】 组限是指数列中每个分组两端表示各组界限的变量值。每组有两个组限:数值最小的为组的下限;数值最大的为组的上限。【知识模块】 数据的图表展示【知识模块】 数据的概括性度量13 【正确答案】 C【试题解析】 数据按从小到大排序结果如下:19 29 33 36 38 42 45 52 60故,极差最大值最小值601941。【知识模块】 数据的概括性度量14 【正确答案】 A【试题解析】 设样本方差为

15、s2,根据未分组数据和分组数据计算样本方差的公式分别为: 未分组数据:s 2 ;分组数据: s2 。3933,本题为未分组数据,代人数据即得方差为 15000。【知识模块】 数据的概括性度量15 【正确答案】 B【试题解析】 标准差:是方差的算术平方根,即 s 1225。【知识模块】 数据的概括性度量16 【正确答案】 D【试题解析】 离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其计算公式为:v s 12253933031。【知识模块】 数据的概括性度量17 【正确答案】 B【试题解析】 简单算术平均数是将各单位的标志值 i 直接相加得出标志总量,再除以总体单位数 n,就

16、得到简单算术平均数。简单算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。【知识模块】 数据的概括性度量18 【正确答案】 C【试题解析】 四分位数是将数列等分成四个部分的数,一个数列有三个四分位数,设下四分位数、中位数和上四分位数分别为 Q1、 Q2、Q 3,则:Q 1、Q 2、Q 3 的位置可由下述公式确定: Q 1 的位置 ;Q 2 的位置 ;Q 3 的位置 式中,n 表示样本的容量。【知识模块】 数据的概括性度量19 【正确答案】 B【试题解析】 中心极限定理:设从均值为 方差为 2(有限)的任意一个总体中抽取样本量为 n 的样本,当 n

17、 充分大时,样本均值 的抽样分布近似服从均值为 方差为 2n 的正态分布。故样本均值的数学期望为 50,标准误差为8 1。【知识模块】 大数定律及中心极限定理20 【正确答案】 A【试题解析】 当总体分布为正态分布 N(, 2)时,根据中心极限定理,可以得到下面的结果: 的抽样分布仍为正态分布, 的数学期望为 ,方差为 2n,则N(, 2n) 。【知识模块】 大数定律及中心极限定理二、简答题21 【正确答案】 品质型数据包括分类数据和顺序数据。描述分类数据频数分布的图形主要有条形图、帕累托图、饼图等;描述顺序数据频数的图形除了以上几种,还有累计频数分布图。具体特点如下:(1)条形图(bar c

18、hart)是用宽度相同的条形的高度或长短来表示数据多少的图形。条形图可以横置或纵置,纵置时也称为柱形图(column chart)。此外,条形图有简单条形图、对比条形图等形式。(2)帕累托图 (Pareto chart)是按各类别数据出现的频数多少排序后绘制的柱形图。通过对柱形图的排序,容易看出哪类数据出现得多,哪类数据出现得少。帕累托图在质量控制研究中有广泛应用。对于不同类型的缺陷、失效方式和其他感兴趣的类,可以用帕累托图观察各个类的影响顺序。(3)饼图(pie chart)是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本(或总体) 中各组成部分的数据占全部数据的比例,对

19、于研究结构性问题十分有用。对于顺序数据,还可以计算累积频数和累积频率(百分比)。根据累积频数或累积频率,可以绘制累积频数分布或频率图。【知识模块】 数据的图表展示22 【正确答案】 盒子图(箱线图)是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数,然后,连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。由上面叙述可知,箱线图使用的描述指标有:最大值、最小值、中位数、两个四分位数。【知识模块】 数据的图表展

20、示23 【正确答案】 采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分:在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。为解决不重的问题,统计分组时习惯上规定“上组限不在内” 。即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根据“上组限不在内” 的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定。【知识模块】 数据的图表展示24 【正确答案】 (1)条形图和直方图的区别条形

21、图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。(2)条形图和直方图的联系两者都是用矩形表示数据分布情况;当矩形的宽度相等时,都是用矩形的高度来表示数据的分布情况。【知识模块】 数据的图表展示25 【正确答案】 变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或 z 分数。其计算公式为: zi ,式中 zi 为变量 i

22、的标准化值,是该组数据均值,s 为该组数据的标准差。 标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如,如果某个数值的标准分数为15,就知道该数值低于平均数 15 倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为 0,标准差为1。【知识模块】 数据的概括性度量26 【正确答案】 (1)众数、中位数和平均数的关系 从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一

23、组数据中间位置上的值,而平均数则是全部数据的算术平均。 对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系: 如果数据的分布是对称的,众数 (Mo)、中位数(M e)和平均数( )必定相等,即 MoM e ; 如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为: M e,M o; 如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则 MoM e 。 (2)众数、中位数和平均数在实际中的应用 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据

24、可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3 个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择

25、众数或中位数,这时它们的代表性要比平均数好。【知识模块】 数据的概括性度量27 【正确答案】 伯努力大数定律:设 nA 是 n 次独立重复试验中事件 A 发生的次数,p 是每次试验中 A 发生的概率,则 0 有伯努利大数定律的结果表明,对于任意 0,只要重复独立试验的次数 n 充分大,事件 是一个小概率事件,由实际推断原理知,这一事件实际上是几乎不发生的,即在 n 充分大时事件 实际上是必定要发生的,亦即对于给定的任意小的正数 ,在 n充分大时,事件“ 频率 与概率 p 的偏差小于 ”实际上几乎是必定要发生的。由实际推断原理,在实际应用中,当 n 足够大时,事件 A 出现的频率将几乎接近于其发生的概率,即频率的稳定性。在抽样调查中,用样本参数去估计总体参数,其理论依据即在于此。【知识模块】 大数定律及中心极限定理三、计算与分析题28 【正确答案】 (1)绘制频数分布直方图如图 21 所示。(2)完整的累积频数分布表如表 23 所示。(3)累积频数分布图如图 22 和图 23 所示。(4)均值计算过程如表 24 所示。由表 24 及均值计算公式可得: 方差计算过程如表25 所示。由表 25 和方差计算公式可得: 标准差 s 1067。【知识模块】 数据的图表展示

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1