1、应用统计硕士历年真题试卷汇编 10 及答案解析(总分:52.00,做题时间:90 分钟)一、单选选择题(总题数:17,分数:34.00)1.对一组数据的描述统计分析表明,样本均值1245 美元,中位数921 美元,方差2285。由此可以计算样本数据的离散系数为( )。中央财经大学 2012 研(分数:2.00)A.038B.040C.054D.2482.设 X 1 ,X 2 ,X n 是随机样本,则哪个统计量能较好地反映样本值的分散程度?( )中山大学2012 研(分数:2.00)A.样本平均B.样本中位数C.样本方差D.样本的四分之一分位数3.已知某变量分布属于钟形分布且 M o 900,M
2、 e 930,则( )。浙江工商大学 2012 研(分数:2.00)A.900B.900C.930D.9154.现有一份样本,为 100 名中学生的 IQ 分数,由此计算得到以下统计量:样本平均(mean)95,中位数(median)100,下四分位数(1ower quartile)70,上四分位数(upperquartile)120,众数(mode)75,标准差(standard deviation)30。则关于这 100 名中学生,下面哪一项陈述正确?( )中山大学2011 研(分数:2.00)A.有一半学生分数小于 95B.有 25的学生分数小于 70C.中间一半学生分数介于 100 到
3、 120 之间D.出现频次最高的分数是 955.两组数据的均值不等,但标准差相等,则( )。江苏大学 2011 研(分数:2.00)A.两组数据的差异程度相同B.均值大的差异程度大C.均值小的差异程度大D.无法判断6.用表示算术平均数,M e 表示中位数,M o 表示众数。若己知某总体次数分布呈适度偏斜,则有( )式成立。江苏大学 2011 研(分数:2.00)A.B.C.D.7.己知三个数列的算术平均数依次为 40,50 和 60,但是三个数列的次数分布曲线草图顺序被打乱了,则正确的顺序为( )。江苏大学 2011 研 (分数:2.00)A.a,b,cB.c,b,aC.a,c,bD.c,a,
4、b8.已知一组数据的算术平均数为 13,数据平方的平均数为 194,则标准差系数为( )。江苏大学 2011 研(分数:2.00)A.31B.12345C.3846D.50009.在以下平均指标中,不受极端值影响的是( )。江苏大学 2011 研(分数:2.00)A.算术平均数B.几何平均数C.调和平均数D.众数10.哪种频数分布状态下平均数、众数和中位数是相等的?( )东北财经大学 2011 研(分数:2.00)A.对称的钟形分布B.左偏的钟形分布C.右偏的钟形分布D.U 形分布11.某批产品的合格率为 90,从中抽出 n100 的简单随机样本,以样本合格率 估计总体合格率p,则 (分数:2
5、.00)A.09,009B.09,003C.09,03D.009,0312.某企业 2010 年 14 月初的商品库存额如表 2 一 17 所示。 (分数:2.00)A.(20241822)4B.(202418)3C.(10241811)3D.(10249)313.已知数列1,3,3,5,5,7,7,9,122,下面说法错误的是( )。中央财经大学 2011 研(分数:2.00)A.算数平均数是 18B.中位数是 5C.众数是 5D.极差是 12114.把数据中的每个数值减去最小值然后除以极差是一种常用的数据预处理方法。对于经过这一变换之后的数据,以下说法不正确的是( )。中央财经大学 201
6、1 研(分数:2.00)A.服从正态分布B.没有计量单位C.取值在 0 和 1 之间D.是相对数15.平均差数值越小,则( )。江苏大学 2009 研(分数:2.00)A.反映变量值越分散,平均数代表性越小B.反映变量值越集中,平均数代表性越大C.反映变量值越分散,平均数代表性越大D.反映变量值越集中,平均数代表性越小16.有下列甲,乙两组工人工资数据:甲组工人工资 400,450,250,300。乙组工人工资300,475,350,275。若要比较这两组工人平均工资差异程度大小,应选用的方法是( )。首都经济贸易大学 2006 研(分数:2.00)A.全距法B.标准差法C.离散系数法D.平均
7、数法17.一位教授计算了全班 20 个同学考试成绩的均值、中数和众数,发现大部分同学的考试成绩集中于高分段,下面哪句话不可能是正确的?( )西安交通大学 2006 研(分数:2.00)A.全班 65的同学的考试成绩高于均值B.全班 65的同学的考试成绩高于中位数C.全班 65的同学的考试成绩高于众数D.全班同学的考试成绩是负偏态分布二、简答题(总题数:6,分数:12.00)18.简述衡量数据离散程度的统计量有哪些,并说明各自的适用范围。中央财经大学 2013 研(分数:2.00)_19.简述极差的定义、优缺点以及与标准差的关系。上海财经大学 2013 研(分数:2.00)_20.为什么要计算变
8、异系数?江苏大学 2012 研(分数:2.00)_21.统计中用以描述数据频数分布集中趋势的统计量主要有哪些?各自有何特点?东北财经大学 2012 研(分数:2.00)_22.已知甲乙两个地区的人均收入水平都是 5000 元。这个 5000 元对两个地区收入水平的代表性是否一样?请说明理由。安徽财经大学 2012 研(分数:2.00)_23.简述标志变异指标的意义和作用。浙江工商大学 2011 研(分数:2.00)_三、计算与分析题(总题数:3,分数:6.00)24.甲乙两个班级统计学考试成绩资料如下:甲班的平均分数为 75 分,标准差为 7 分;乙班的考试成绩频数分布表如表 2 一 18 所
9、示。 (分数:2.00)_25.随机抽取 25 个网络用户,得到他们的年龄数据如表 221 所示。 (分数:2.00)_26.某地区家庭按人均收入水平分组资料如表 222 所示。 (分数:2.00)_应用统计硕士历年真题试卷汇编 10 答案解析(总分:52.00,做题时间:90 分钟)一、单选选择题(总题数:17,分数:34.00)1.对一组数据的描述统计分析表明,样本均值1245 美元,中位数921 美元,方差2285。由此可以计算样本数据的离散系数为( )。中央财经大学 2012 研(分数:2.00)A.038 B.040C.054D.248解析:解析:离散系数也称为变异系数(coeffi
10、eient of variation),它是一组数据的标准差与其相应的平均数之比。其计算公式为:v s 。得到:v s 2.设 X 1 ,X 2 ,X n 是随机样本,则哪个统计量能较好地反映样本值的分散程度?( )中山大学2012 研(分数:2.00)A.样本平均B.样本中位数C.样本方差 D.样本的四分之一分位数解析:解析:集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在,其反映数据集中趋势的统计量有平均数、中位数、众数和四分位数;离散程度反映的是各变量值远离其中心值的程度,反映数据离散程度的统计量有异众比率、方差、标准差和四分位差等。3.已知某变量分布属于钟形
11、分布且 M o 900,M e 930,则( )。浙江工商大学 2012 研(分数:2.00)A.900B.900C.930 D.915解析:解析:在对称的钟形分布中,以算术平均数 为对称轴,两边的次数相等,因此有 M o M e 的关系。在非对称钟形分布时(亦称斜偏分布)中,众数、中位数与算术平均数之间就存在一定的差别。当次数分布右偏时有 M o M e 的关系;当次数分布左偏时有 M e M o 的关系。根据已知条件 M o 900,M e 930 可知该分布是右偏的钟形分布,即有 4.现有一份样本,为 100 名中学生的 IQ 分数,由此计算得到以下统计量:样本平均(mean)95,中位
12、数(median)100,下四分位数(1ower quartile)70,上四分位数(upperquartile)120,众数(mode)75,标准差(standard deviation)30。则关于这 100 名中学生,下面哪一项陈述正确?( )中山大学2011 研(分数:2.00)A.有一半学生分数小于 95B.有 25的学生分数小于 70 C.中间一半学生分数介于 100 到 120 之间D.出现频次最高的分数是 95解析:解析:一半学生分数小于中位数,即 100;中间一半学生分数介于下四分位到上四分位之间,即介于 70 到 120 之间;出现频次最高的分数是众数,即 75。下四分位数
13、是指该样本中所有数值由小到大排列后第 25的数字,从题干中可知有 25的学生分数小于 70。5.两组数据的均值不等,但标准差相等,则( )。江苏大学 2011 研(分数:2.00)A.两组数据的差异程度相同B.均值大的差异程度大C.均值小的差异程度大 D.无法判断解析:解析:对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,此时需要计算离散系数,也称为变异系数。它是测度数据离散程度的相对统计量,离散系数大说明数据的离散程度也大;离散系数小说明数据的离散程度也小。其计算公式为 v s 6.用表示算术平均数,M e 表示中位数,M o 表示众数。若己知某总体次数
14、分布呈适度偏斜,则有( )式成立。江苏大学 2011 研(分数:2.00)A. B.C.D.解析:解析:不论如何偏斜,中位数总是在众数与算术平均数之间。经验表明,在适度偏斜的情况下,众数与中位数的距离约为中位数与算术平均数距离的 2 倍。有: 2( M e )M e M o 或 2(M e )M o M e ,即:M o 3M e 2 ;M e (M o 2 ); 7.己知三个数列的算术平均数依次为 40,50 和 60,但是三个数列的次数分布曲线草图顺序被打乱了,则正确的顺序为( )。江苏大学 2011 研 (分数:2.00)A.a,b,c B.c,b,aC.a,c,bD.c,a,b解析:解
15、析:众数是一组数据分布的峰值,用 M o 表示。在对称的钟形分布中,以算术平均数 为对称轴,两边的次数相等,因此有 M o M e 的关系。在非对称钟形分布时(亦称斜偏分布)中,众数,中位数与算术平均数之间就存在一定的差别。当次数分布右偏时有 M o M e 的关系;当次数分布左偏时有 8.已知一组数据的算术平均数为 13,数据平方的平均数为 194,则标准差系数为( )。江苏大学 2011 研(分数:2.00)A.31B.12345C.3846 D.5000解析:解析:算术平均数 ,数据平方的平均数 M ,已知 2 ,则标准差系数 9.在以下平均指标中,不受极端值影响的是( )。江苏大学 2
16、011 研(分数:2.00)A.算术平均数B.几何平均数C.调和平均数D.众数 解析:解析:众数是一组数据分布的峰值,不受极端值的影响。平均数是针对数值型数据计算的,而且利用了全部数据信息,因此对于偏态分布的数据,平均数易受数据极端值的影响,此时平均数的代表性较差,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。10.哪种频数分布状态下平均数、众数和中位数是相等的?( )东北财经大学 2011 研(分数:2.00)A.对称的钟形分布 B.左偏的钟形分布C.右偏的钟形分布D.U 形分布解析:解析:在频数对称且单峰分布的状态下,平均数、众数、中位数相等。11.某批产品的合格率为 90,从中
17、抽出 n100 的简单随机样本,以样本合格率 估计总体合格率p,则 (分数:2.00)A.09,009B.09,003 C.09,03D.009,03解析:解析:中心极限定理:设从均值为 方差为 2 。(有限)的任意一个总体中抽取样本量为 n 的样本,当 n 充分大时,样本均值 的抽样分布近似服从均值为 方差为 2 n 的正态分布。则 的期望值为 90,标准差为 12.某企业 2010 年 14 月初的商品库存额如表 2 一 17 所示。 (分数:2.00)A.(20241822)4B.(202418)3C.(10241811)3 D.(10249)3解析:解析:该企业 2010 年第一季度的
18、平均库存额为:13.已知数列1,3,3,5,5,7,7,9,122,下面说法错误的是( )。中央财经大学 2011 研(分数:2.00)A.算数平均数是 18B.中位数是 5C.众数是 5 D.极差是 121解析:解析:众数是一组数据中出现次数最多的数值,有时众数在一组数中有好几个,由题干可知,众数是 3,5,7。14.把数据中的每个数值减去最小值然后除以极差是一种常用的数据预处理方法。对于经过这一变换之后的数据,以下说法不正确的是( )。中央财经大学 2011 研(分数:2.00)A.服从正态分布 B.没有计量单位C.取值在 0 和 1 之间D.是相对数解析:解析:经题干中的方法处理后,消除
19、了量纲,数据没有计量单位了,并且数据仍保持原分布。15.平均差数值越小,则( )。江苏大学 2009 研(分数:2.00)A.反映变量值越分散,平均数代表性越小B.反映变量值越集中,平均数代表性越大 C.反映变量值越分散,平均数代表性越大D.反映变量值越集中,平均数代表性越小解析:解析:平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之,则说明数据的离散程度越小。16.有下列甲,乙两组工人工资数据:甲组工人工资 400,450,250,300
20、。乙组工人工资300,475,350,275。若要比较这两组工人平均工资差异程度大小,应选用的方法是( )。首都经济贸易大学 2006 研(分数:2.00)A.全距法B.标准差法 C.离散系数法D.平均数法解析:解析:由甲,乙两组工人工资数据可得:17.一位教授计算了全班 20 个同学考试成绩的均值、中数和众数,发现大部分同学的考试成绩集中于高分段,下面哪句话不可能是正确的?( )西安交通大学 2006 研(分数:2.00)A.全班 65的同学的考试成绩高于均值B.全班 65的同学的考试成绩高于中位数 C.全班 65的同学的考试成绩高于众数D.全班同学的考试成绩是负偏态分布解析:解析:大部分同
21、学的考试成绩集中于高分段,说明成绩分布时左偏分布。中位数是数据排序后,位置在最中间的数值。显然,中位数将数据分成两半,一半数据比中位数大,一半数据比中位数小。二、简答题(总题数:6,分数:12.00)18.简述衡量数据离散程度的统计量有哪些,并说明各自的适用范围。中央财经大学 2013 研(分数:2.00)_正确答案:(正确答案:衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。 (1)极差是指一组数据的最大值与最小值之差。用尺表示,其计算公式为: Rmax( i )min( i ) 极差是描述数据离散程度的最简单测度值,计算简单,易于理解,但它容易受极端值
22、的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。 (2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理解。 (3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是
23、通过平方的办法消去离差的正负号,然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。)解析:19.简述极差的定义、优缺点以及与标准差的关系。上海财经大学 2013 研(分数:2.00)_正确答案:(正确答案:极差,也称全距,是指一组数据的最大值与最小值之差。用 R 表示,其计算公式为: Rmax( i )min( i ) 式中,maX( i )和 min( i )分别表示一组数据的最大值和最小值。
24、极差、标准差、方差都是测度数据型数据离散程度的方法,极差是总体标准差的有偏估计值,当乘以校正系数之后,可以作为总体标准差的无偏估计值。它的优点是计算简单,含义直观,运用方便,故在数据统计处理中仍有着相当广泛的应用。但是,它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。)解析:20.为什么要计算变异系数?江苏大学 2012 研(分数:2.00)_正确答案:(正确答案:变异系数又称离散系数或者标准差率。它与均值和方差相同,是衡量统计资料离散程度的指标统计量。 方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面受原变量值本身水平高低的影响,也就是与变量的平均数
25、大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平小的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同。采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算变异系数。变异系数的计算方法是:均值与标准差的比。比值越大,说明样本离散程度越小。比值越小,说明样本离散程度越大。)解析:21.统计中用以描述数据频数分布集中趋势的统计量主要有哪些?各自有何特点?东北财经大学 2012 研(分数:2.00)_正确
26、答案:(正确答案:集中趋势(central tendency)是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。描述数据频数分布集中趋势的统计量主要有两大类: (1)数值平均数,是根据全部数据计算得到的代表值,主要包括算数平均数、调和平均 数及几何平均数。 算术平均数也称为均值,是一组数据相加后除以数据的个数得到的结果,包括简单算数平均数和加权算数平均数。算术平均数是对数值型数据计算的,而且利用了全部数据信息,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,代表性较差。 调和平均数也称为倒数平均数,是总体各单位标志值倒数的算术平均数
27、的倒数。社会经济统计中使用的调和平均数往往具有特定(经济)意义,通常是加权算术平坶数的变形。主要是用来解决在无法掌握总体单位数(频数)的情况下,只有每组的变量值和相应的标志总量,而需要求得平均数的实际问题。 几何平均数是指 n 个观察值连乘积的 n 次方根。计算几何平均数要求各观察值之间存在连乘积关系,主要适用于对比率、指数等进行平均,计算平均发展速度等。 (2)位置代表值,是根据数据所处位置直接观测或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数等。 众数(mode)是一组数据中出现次数最多的变量值,用 M o 表示。众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不
28、惟一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数(median)是一组数据排序后处于中间位置上的变量值,用 M e 表示。中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。)解析:22.已知甲乙两个地区的人均收入水平都是 5000 元。这个 5000 元对两个地区收入水平的代表性是否一样?请说明理由。安徽财经大学 2012 研(分数:2.00)_正
29、确答案:(正确答案:这要看情况而定。在平均收入水平相同的情况下,还要看地区收入水平的标准差。如果两个地区收入的标准差接近相同时,可以认为 5000 元对两个地区收入水平的代表性接近相同。如果标准差有明显不同,则标准差小的对该地区收入水平的代表性就要好于标准差大的。)解析:23.简述标志变异指标的意义和作用。浙江工商大学 2011 研(分数:2.00)_正确答案:(正确答案:标志变异指标又称为标志变动度,是反映总体各单位标志值之间差异程度大小的综合指标。标志变异指标说明的是变量的集中趋势。 标志变异指标的作用是:(1)衡量平均指标代表性的尺度;(2)研究现象的稳定性和均衡性;(3)为科学确定抽样
30、单位数提供依据。测量标志变异的主要指标有极差、平均差、方差、标准差和标志变动系数等。)解析:三、计算与分析题(总题数:3,分数:6.00)24.甲乙两个班级统计学考试成绩资料如下:甲班的平均分数为 75 分,标准差为 7 分;乙班的考试成绩频数分布表如表 2 一 18 所示。 (分数:2.00)_正确答案:(正确答案:(1)乙班平均考试分数计算过程如表 219 所示。 由表 219 中数据可得 7527 (2)方差计算过程如表 220 所示。 由表 220 中数据可得: (3)v s 乙 0156 (4)v s 甲 )解析:25.随机抽取 25 个网络用户,得到他们的年龄数据如表 221 所示
31、。 (分数:2.00)_正确答案:(正确答案:(1)对表中数据按从小到大顺序排列: 15 16 17 18 19 19 19 20 20 21 22 22 23 23 23 24 24 25 27 29 30 31 34 38 41 由排序数据可知,年龄出现频数最多的是 19 和 23,都出现3 次,所以有两个众数,即 M o 19 和 M o 23。 由于中位数位置 12,所以 M e 23 (2)平均数: 由平均数 24 可得: 665 (3)偏态系数: SK 108 峰态系数: )解析:26.某地区家庭按人均收入水平分组资料如表 222 所示。 (分数:2.00)_正确答案:(正确答案:(1)由表中数据可知,众数在 600800 这一组内。则由计算众数的公式可得:7111 由计算中位数的公式可得: 2007333 (2)根据表 222 可得表 223。由表 223 可得: 平均差系数 100107 (3)标准差为: 所以标准差系数为: )解析: