1、应用统计硕士历年真题试卷汇编 3 及答案与解析一、单选选择题1 对一组数据的描述统计分析表明,样本均值1245 美元,中位数921 美元,方差2285。由此可以计算样本数据的离散系数为( )。中央财经大学 2012 研(A)038(B) 040(C) 054(D)2482 设 X1,X 2,X n 是随机样本,则哪个统计量能较好地反映样本值的分散程度?( )中山大学 2012 研(A)样本平均(B)样本中位数(C)样本方差(D)样本的四分之一分位数3 已知某变量分布属于钟形分布且 Mo900,M e930,则( )。浙江工商大学 2012研(A) 900(B) 900 930(C) 930(D
2、) 9154 现有一份样本,为 100 名中学生的 IQ 分数,由此计算得到以下统计量:样本平均(mean)95 ,中位数(median)100,下四分位数 (1ower quartile)70,上四分位数(upperquartile)120,众数(mode)75,标准差(standard deviation)30。则关于这 100 名中学生,下面哪一项陈述正确?( ) 中山大学 2011 研(A)有一半学生分数小于 95(B)有 25的学生分数小于 70(C)中间一半学生分数介于 100 到 120 之间(D)出现频次最高的分数是 955 两组数据的均值不等,但标准差相等,则( )。江苏大学
3、 2011 研(A)两组数据的差异程度相同(B)均值大的差异程度大(C)均值小的差异程度大(D)无法判断6 用表示算术平均数,M e 表示中位数,M o 表示众数。若己知某总体次数分布呈适度偏斜,则有( ) 式成立。江苏大学 2011 研(A)(B)(C)(D)7 己知三个数列的算术平均数依次为 40,50 和 60,但是三个数列的次数分布曲线草图顺序被打乱了,则正确的顺序为( )。江苏大学 2011 研(A)a,b, c(B) c,b,a(C) a,c ,b(D)c,a,b8 已知一组数据的算术平均数为 13,数据平方的平均数为 194,则标准差系数为( )。江苏大学 2011 研(A)31
4、(B) 12345(C) 3846(D)50009 在以下平均指标中,不受极端值影响的是( )。江苏大学 2011 研(A)算术平均数(B)几何平均数(C)调和平均数(D)众数10 哪种频数分布状态下平均数、众数和中位数是相等的?( )东北财经大学 2011研(A)对称的钟形分布(B)左偏的钟形分布(C)右偏的钟形分布(D)U 形分布11 某批产品的合格率为 90,从中抽出 n100 的简单随机样本,以样本合格率估计总体合格率 p,则 的期望值和标准差分别为( )。浙江工商大学 2011 研(A)09,009(B) 09,003(C) 09,03(D)009,0312 某企业 2010 年 1
5、4 月初的商品库存额如表 2 一 17 所示。则第一季度的平均库存额为( )。浙江工商大学 2011 研(A)(20 241822) 4(B) (202418)3(C) (10241811)3(D)(10 249) 313 已知数列1,3,3,5 ,5,7,7,9,122 ,下面说法错误的是 ( )。中央财经大学 2011 研(A)算数平均数是 18(B)中位数是 5(C)众数是 5(D)极差是 12114 把数据中的每个数值减去最小值然后除以极差是一种常用的数据预处理方法。对于经过这一变换之后的数据,以下说法不正确的是( )。中央财经大学 2011 研(A)服从正态分布(B)没有计量单位(C
6、)取值在 0 和 1 之间(D)是相对数15 平均差数值越小,则( )。江苏大学 2009 研(A)反映变量值越分散,平均数代表性越小(B)反映变量值越集中,平均数代表性越大(C)反映变量值越分散,平均数代表性越大(D)反映变量值越集中,平均数代表性越小16 有下列甲,乙两组工人工资数据:甲组工人工资 400,450,250,300。乙组工人工资 300,475,350,275。若要比较这两组工人平均工资差异程度大小,应选用的方法是( ) 。首都经济贸易大学 2006 研(A)全距法(B)标准差法(C)离散系数法(D)平均数法17 一位教授计算了全班 20 个同学考试成绩的均值、中数和众数,发
7、现大部分同学的考试成绩集中于高分段,下面哪句话不可能是正确的?( )西安交通大学 2006 研(A)全班 65的同学的考试成绩高于均值(B)全班 65的同学的考试成绩高于中位数(C)全班 65的同学的考试成绩高于众数(D)全班同学的考试成绩是负偏态分布二、简答题18 简述衡量数据离散程度的统计量有哪些,并说明各自的适用范围。中央财经大学 2013 研19 简述极差的定义、优缺点以及与标准差的关系。上海财经大学 2013 研20 为什么要计算变异系数?江苏大学 2012 研21 统计中用以描述数据频数分布集中趋势的统计量主要有哪些?各自有何特点? 东北财经大学 2012 研22 已知甲乙两个地区
8、的人均收入水平都是 5000 元。这个 5000 元对两个地区收入水平的代表性是否一样? 请说明理由。 安徽财经大学 2012 研23 简述标志变异指标的意义和作用。浙江工商大学 2011 研三、计算与分析题24 甲乙两个班级统计学考试成绩资料如下:甲班的平均分数为 75 分,标准差为 7分;乙班的考试成绩频数分布表如表 2 一 18 所示。要求:(1)计算乙班的平均考试分数。 (2) 计算乙班考试分数的方差及标准差。 (3)计算乙班考试分数的离散系数。 (4)比较甲乙两个班级考试分数的离散程度的大小。东北财经大学 2011 研25 随机抽取 25 个网络用户,得到他们的年龄数据如表 221
9、所示。要求:(1)计算众数、中位数;(2) 计算平均数和标准差;(3)计算偏态系数和峰态系数;(4)对网民年龄的分布特征进行综合分析。南京大学 2009 研26 某地区家庭按人均收入水平分组资料如表 222 所示。计算:(1)众数和中位数;(2) 平均差系数;(3)标准差系数。 首都经济贸易大学2007 研应用统计硕士历年真题试卷汇编 3 答案与解析一、单选选择题1 【正确答案】 A【试题解析】 离散系数也称为变异系数(coeffieient of variation) ,它是一组数据的标准差与其相应的平均数之比。其计算公式为:v s 。得到:vs 038。【知识模块】 数据的概括性度量2 【
10、正确答案】 C【试题解析】 集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在,其反映数据集中趋势的统计量有平均数、中位数、众数和四分位数;离散程度反映的是各变量值远离其中心值的程度,反映数据离散程度的统计量有异众比率、方差、标准差和四分位差等。【知识模块】 数据的概括性度量3 【正确答案】 C【试题解析】 在对称的钟形分布中,以算术平均数 为对称轴,两边的次数相等,因此有 M oM e 的关系。在非对称钟形分布时(亦称斜偏分布)中,众数、中位数与算术平均数之间就存在一定的差别。当次数分布右偏时有 MoM e 的关系;当次数分布左偏时有 M eM o 的关系。根据已知
11、条件 Mo900,M e930 可知该分布是右偏的钟形分布,即有 930。【知识模块】 数据的概括性度量4 【正确答案】 B【试题解析】 一半学生分数小于中位数,即 100;中间一半学生分数介于下四分位到上四分位之间,即介于 70 到 120 之间;出现频次最高的分数是众数,即 75。下四分位数是指该样本中所有数值由小到大排列后第 25的数字,从题干中可知有 25的学生分数小于 70。【知识模块】 数据的概括性度量5 【正确答案】 C【试题解析】 对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,此时需要计算离散系数,也称为变异系数。它是测度数据离散程度的相
12、对统计量,离散系数大说明数据的离散程度也大;离散系数小说明数据的离散程度也小。其计算公式为 vs ,通过比较可知在标准差相等的条件下,均值小的离散数大,即数据的差异程度大。【知识模块】 数据的概括性度量6 【正确答案】 A【试题解析】 不论如何偏斜,中位数总是在众数与算术平均数之间。经验表明,在适度偏斜的情况下,众数与中位数的距离约为中位数与算术平均数距离的 2 倍。有: 2( M e)M eM o 或 2(Me )M oM e,即:Mo3M e2 ;M e (Mo2 ); (3MeM o)。【知识模块】 数据的概括性度量7 【正确答案】 A【试题解析】 众数是一组数据分布的峰值,用 Mo 表
13、示。在对称的钟形分布中,以算术平均数 为对称轴,两边的次数相等,因此有 M oM e 的关系。在非对称钟形分布时(亦称斜偏分布)中,众数,中位数与算术平均数之间就存在一定的差别。当次数分布右偏时有 Mo Me 的关系;当次数分布左偏时有 M eM o 的关系。【知识模块】 数据的概括性度量8 【正确答案】 C【试题解析】 算术平均数 ,数据平方的平均数 M ,已知2 ,则标准差系数3846。【知识模块】 数据的概括性度量9 【正确答案】 D【试题解析】 众数是一组数据分布的峰值,不受极端值的影响。平均数是针对数值型数据计算的,而且利用了全部数据信息,因此对于偏态分布的数据,平均数易受数据极端值
14、的影响,此时平均数的代表性较差,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。【知识模块】 数据的概括性度量10 【正确答案】 A【试题解析】 在频数对称且单峰分布的状态下,平均数、众数、中位数相等。【知识模块】 数据的概括性度量11 【正确答案】 B【试题解析】 中心极限定理:设从均值为 方差为 2。(有限)的任意一个总体中抽取样本量为 n 的样本,当 n 充分大时,样本均值 的抽样分布近似服从均值为 方差为 2n 的正态分布。则 的期望值为 90,标准差为003。【知识模块】 数据的概括性度量12 【正确答案】 C【试题解析】 该企业 2010 年第一季度的平均库存额为:【知识模
15、块】 数据的概括性度量13 【正确答案】 C【试题解析】 众数是一组数据中出现次数最多的数值,有时众数在一组数中有好几个,由题干可知,众数是 3,5,7。【知识模块】 数据的概括性度量14 【正确答案】 A【试题解析】 经题干中的方法处理后,消除了量纲,数据没有计量单位了,并且数据仍保持原分布。【知识模块】 数据的概括性度量15 【正确答案】 B【试题解析】 平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之,则说明数据的离散程度越小。【知识
16、模块】 数据的概括性度量16 【正确答案】 B【试题解析】 由甲,乙两组工人工资数据可得:由于甲,乙两组工人的平均工资相同,所以可以通过标准差的方法比较这两组工人平均工资差异程度大小,标准差较大的平均工资差异程度较大。【知识模块】 数据的概括性度量17 【正确答案】 B【试题解析】 大部分同学的考试成绩集中于高分段,说明成绩分布时左偏分布。中位数是数据排序后,位置在最中间的数值。显然,中位数将数据分成两半,一半数据比中位数大,一半数据比中位数小。【知识模块】 数据的概括性度量二、简答题18 【正确答案】 衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。 (
17、1)极差是指一组数据的最大值与最小值之差。用尺表示,其计算公式为: Rmax( i)min( i) 极差是描述数据离散程度的最简单测度值,计算简单,易于理解,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。 (2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以
18、离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理解。 (3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号,然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。【知识模块】 数据的概括性度量19 【正确答案】 极差,也称全距,是指一组数据的最大值与最小值之差。用 R 表示,其计算公式为: Rmax( i
19、)min( i) 式中,maX( i)和 min(i)分别表示一组数据的最大值和最小值。 极差、标准差、方差都是测度数据型数据离散程度的方法,极差是总体标准差的有偏估计值,当乘以校正系数之后,可以作为总体标准差的无偏估计值。它的优点是计算简单,含义直观,运用方便,故在数据统计处理中仍有着相当广泛的应用。但是,它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。【知识模块】 数据的概括性度量20 【正确答案】 变异系数又称离散系数或者标准差率。它与均值和方差相同,是衡量统计资料离散程度的指标统计量。方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面受原变量值本
20、身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平小的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同。采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算变异系数。变异系数的计算方法是:均值与标准差的比。比值越大,说明样本离散程度越小。比值越小,说明样本离散程度越大。【知识模块】 数据的概括性度量21 【正确答案】 集中趋势(central tendency)
21、是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。描述数据频数分布集中趋势的统计量主要有两大类: (1)数值平均数,是根据全部数据计算得到的代表值,主要包括算数平均数、调和平均 数及几何平均数。 算术平均数也称为均值,是一组数据相加后除以数据的个数得到的结果,包括简单算数平均数和加权算数平均数。算术平均数是对数值型数据计算的,而且利用了全部数据信息,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,代表性较差。调和平均数也称为倒数平均数,是总体各单位标志值倒数的算术平均数的倒数。社会经济统计中使用的调和平均数往往具有特定(经济)意义,
22、通常是加权算术平坶数的变形。主要是用来解决在无法掌握总体单位数(频数)的情况下,只有每组的变量值和相应的标志总量,而需要求得平均数的实际问题。 几何平均数是指 n 个观察值连乘积的 n 次方根。计算几何平均数要求各观察值之间存在连乘积关系,主要适用于对比率、指数等进行平均,计算平均发展速度等。 (2)位置代表值,是根据数据所处位置直接观测或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数等。 众数 (mode)是一组数据中出现次数最多的变量值,用 Mo 表示。众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不惟一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没
23、有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数(median)是一组数据排序后处于中间位置上的变量值,用 Me 表示。中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。【知识模块】 数据的概括性度量22 【正确答案】 这要看情况而定。在平均收入水平相同的情况下,还要看地区收入水平的标准差。如果两个地区收入的标准差接近相同时,可以认为 5000 元对两个地区收入水平的代表性接近相同。如果标准差有明显不同,则标准
24、差小的对该地区收入水平的代表性就要好于标准差大的。【知识模块】 数据的概括性度量23 【正确答案】 标志变异指标又称为标志变动度,是反映总体各单位标志值之间差异程度大小的综合指标。标志变异指标说明的是变量的集中趋势。标志变异指标的作用是:(1)衡量平均指标代表性的尺度;(2)研究现象的稳定性和均衡性;(3)为科学确定抽样单位数提供依据。测量标志变异的主要指标有极差、平均差、方差、标准差和标志变动系数等。【知识模块】 数据的概括性度量三、计算与分析题24 【正确答案】 (1)乙班平均考试分数计算过程如表 219 所示。由表 219 中数据可得 7527 (2)方差计算过程如表 220所示。由表
25、220 中数据可得: (3)vs 乙 0156 (4)v s 甲 0093 v s 甲 v s 乙 ,说明两个班的统计学考试成绩相比较,甲班的成绩较集中,乙班的成绩较分散。【知识模块】 数据的概括性度量25 【正确答案】 (1)对表中数据按从小到大顺序排列: 15 16 17 18 19 19 19 20 20 21 22 22 23 23 23 24 24 25 27 29 30 31 34 38 41 由排序数据可知,年龄出现频数最多的是 19 和 23,都出现 3 次,所以有两个众数,即 Mo19 和 Mo23。 由于中位数位置 12,所以 M e23 (2)平均数:由平均数 24 可得
26、:665 (3)偏态系数:SK 108 峰态系数:(4)对网民年龄的分布特征进行综合分析的结果如下:从众数、中位数和平均数来看,网民年龄在2324 岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,并且偏态系数大于 1,所以偏斜程度很大。峰态系数为正值,所以为尖峰分布。【知识模块】 数据的概括性度量26 【正确答案】 (1)由表中数据可知,众数在 600800 这一组内。则由计算众数的公式可得: 7111 由计算中位数的公式可得:2007333 (2) 根据表 222 可得表 223。由表 223 可得: 平均差系数 100107 (3) 标准差为:所以标准差系数为:【知识模块】 数据的概括性度量
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1