1、应用统计硕士(数据的概括性度量)模拟试卷 1 及答案与解析一、单选选择题1 现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( )。(A)算术平均数(B)调和平均数(C)中位数(D)众数2 由 8 位销售员一个月销售某产品的数量制作的茎叶图如图 213 所示,则销售量的中位数为( ) 。(A)5(B) 65(C) 45 (D)56.53 某幼儿园有 58 名小朋友,其年龄(单位:周岁)的直方图如图 2 一 14 所示,则小朋友年龄的众数为( ) 。(A)4(B) 5(C) 25(D)584 某班共有 60 名学生,在期末的统计学考试中,男生的平均考试成绩为 75
2、分,标准差为 6 分;女生的平均考试成绩为 80 分,标准差为 6 分。如果该班的男女学生各占一半,则全班的平均考试成绩为( )分。(A)75(B) 76(C) 77.5(D)805 假如各个标志值都增加 5 个单位,那么算术平均数会( )。(A)增加到 5 倍(B)增加 5 个单位(C)不变(D)不能预期平均数的变化6 在加权算术平均数公式中,若各个变量值都扩大 3 倍,而频数都减少为原来的13,则平均数( ) 。(A)不变(B)减少 3 倍(C)扩大 3 倍(D)扩大 4 倍7 某市场青菜价格,早市为 025 元斤,中市为 05 元斤,晚市为 05 元斤,那么青菜全天平均价格为( )元斤。
3、(A)025(B) 0375(C) 0417(D)058 有三批产品,废品率分别为 2、25、15,废品数量相应为 20 件、15件、30 件,则这三批产品平均废品率的计算式应为( )。(A)(B)(C)(D)9 某公司下属 12 个企业,共有 7500 名职工。若已知每一个企业月计划产值和计划完成百分数,要计算该公司月平均计划完成百分数,应该采用( )。(A)简单算术平均数(B)加权算术平均法计算,权数是职工人数(C)加权算术平均法计算,权数是计划产值(D)加权调和平均法计算,权数是计划产值10 6,7,8 三个数的几何平均数( )。(A)大于算术平均数(B)小于算术平均数(C)等于算术平均
4、数(D)等于 611 加权平均数的大小取决于( )。(A)频数绝对量的大小和变量值的大小(B)频数之间的比率(C)频数绝对量的大小和频数之间的比率(D)频数之间的比率和变量值的大小12 如果一组数值中有一项为 0,则不能计算( )。(A)算术平均数和调和平均数(B)调和平均数和几何平均数(C)算术平均数和几何平均数(D)无法确定13 算术平均数、调和平均数和几何平均数的数量关系为( )。(A)调和平均数几何平均数算术平均数(B)几何平均数调和平均数算术平均数(C)调和平均数几何平均数算术平均数(D)几何平均数算术平均数调和平均数14 在某公司进行的英语水平测试中,新员工的平均得分是 80 分,
5、标准差是 5 分,中位数是 85 分,则新员工得分的分布形状是( )。(A)对称的(B)左偏的(C)右偏的(D)无法确定15 某研究人员于 2013 年发表的一篇文章讨论了男性和女性硕士应届毕业生起薪的差别。文章称,从某重点大学前 20 名统计学院毕业的女性的平均起薪是 3500 元,中位数是 3600 元,标准差是 550 元。根据这些数据可以判断,女性起薪的分布形状是( )。(A)对称(B)右偏(C)左偏(D)均匀16 某组数据的四分之一分位数是 45,中位数是 85,四分之三分位数是 105,则该组数据的分布是( ) 。(A)右偏的(B)对称的(C)左偏的(D)无法判定17 某班学生的统
6、计学平均成绩是 70 分,最高分是 95 分,最低分是 65 分,根据这些信息,可以计算的测度离散程度的统计量是( )。(A)方差(B)极差(C)标准差(D)中位数18 在离散程度的测度中,最容易受极端值影响的是( )。(A)极差(B)平均差(C)标准差(D)标准差系数19 设一组数据的茎叶图如图 2-15 所示,此数据组的极差为( )。(A)1(B) 6(C) 7(D)2120 计算方差时,如果从每个数据中减去常数 a,则计算结果与原方差相比( )。(A)变大(B)不变(C)变小(D)无法确定21 某数列变量值平方的平均数等于 9,而变量值平均数的平方等于 5,则标准差为( )。(A)(B)
7、 4(C)(D)222 如果所有数据都增加常数 a(a0),则重新计算的标准差系数 ( )。(A)下降(B)上升(C)不变(D)无法确定23 一组数据的离散系数为 06,平均数为 10,则方差为( )。(A)04(B) 4(C) 6(D)3624 用标准差比较分析两个同类总体平均指标的代表性,其基本的前提条件是( )。(A)两个总体的标准差应相等(B)两个总体的平均数应相等(C)两个总体的单位数应相等(D)两个总体的离差之和应相等25 甲、乙两班同学参加了统计学期末考试,结果两班的平均成绩 ,标准差 s 甲 s 乙 则统计学成绩离散程度较大的是( )。(A)甲班(B)乙班(C)一样大(D)无法
8、判断26 如果一组数据不是对称分布的,根据切比雪夫不等式,对于 k4,其意义是( )。(A)至少有 75的数据落在平均数加减 4 个标准差的范围之内(B)至少有 89的数据落在平均数加减 4 个标准差的范围之内(C)至少有 94的数据落在平均数加减 4 个标准差的范围之内(D)至少有 99的数据落在平均数加减 4 个标准差的范围之内27 某班学生的平均成绩是 80 分,标准差是 5 分。如果已知该班学生的考试分数为对称分布,可以判断成绩在 7090 分之间的学生大约占( )。(A)68(B) 89(C) 95(D)9928 对某个高速路段行驶过的 120 辆汽车的车速进行测量后发现,平均车速是
9、 85 公里小时,标准差:是 4 公里小时,下列哪个车速可以看作是异常值?( )(A)78 公里小时(B) 82 公里小时(C) 91 公里小时(D)98 公里小时29 如果峰态系数 K0,表明该组数据是( )。(A)尖峰分布(B)扁平分布(C)左偏分布(D)右偏分:布30 现有一数列:5,10,39,85,236,812,2356,反映其平均水平最好用( )。(A)算术平均数(B)调和平均数(C)几何平均数(D)众数31 对于分组数据,计算其偏态系数的公式为( )。(A)(B)(C)(D)二、简答题32 一组数据的分布特征可以从哪几个方面进行测度?33 简述异众比率、四分位差、方差或标准差的
10、适用场合。三、计算与分析题34 一家汽车零售店的 10 名销售人员 5 月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数 o(2)根据定义公式计算四分位数 o(3)计算销售量的标准差。(4)说明汽车销售量分布的特征。35 一家网吧想了解上网人员的年龄分布状况,随机抽取 25 人,得到他们的年龄数据如表 224 所示。(1)画出该组数据的茎叶图。 (2) 画出该组数据的箱线图。 (3)根据茎叶图和箱线图说明上网者年龄分布的特征。36 某企业职工的月奖金额资料,如表 225 所示。要求:计算职工月奖金额的
11、偏度系数和峰度系数。37 甲、乙两单位职工的工资资料如表 227 所示。要求:比较哪个单位的职工工资差异程度小?应用统计硕士(数据的概括性度量)模拟试卷 1 答案与解析一、单选选择题1 【正确答案】 C【试题解析】 此数列的特点是数据分散,不适合用众数;存在极大值和极小值,不适合用易受极端值影响的算术平均数和调和平均数;中位数受极端值的影响相对算术平均数和调和平均数小,故中位数比均值稳健,因而此数列最好用中位数。【知识模块】 数据的概括性度量2 【正确答案】 D【试题解析】 由茎叶图可知 8 个数值分别为:45,45,58,57,56,52,60,63,由小到大的排序为45,45,52,56,
12、57,58,60,63,所以中位数为 Me 565。【知识模块】 数据的概括性度量3 【正确答案】 A【试题解析】 由直方图可以直观地看到 4 周岁的小朋友有 25 人,人数最多,因此 4 为众数。【知识模块】 数据的概括性度量4 【正确答案】 C【试题解析】 设男生成绩为 ,女生成绩为 y,男女各 30 人,故全班的平均考试成绩为:【知识模块】 数据的概括性度量5 【正确答案】 B【试题解析】 假设标志值为 ,其次数是 y,其算术平均数为 ,若各个标志值都增加 5 个单位,即变为 5,那么算术平均数为:【知识模块】 数据的概括性度量6 【正确答案】 C【试题解析】 假设原来的加权算术平均数为
13、 ,若变量值都扩大 3 倍,而频数都减少为原来的 13,那么, 。【知识模块】 数据的概括性度量7 【正确答案】 B【试题解析】 简单调和平均数是各单位标志值 倒数的简单算术平均数的倒数,所以青菜全天平均价格为:【知识模块】 数据的概括性度量8 【正确答案】 D【试题解析】 平均废品率是某一段时期内同一总体中的废品数量与总体产品数量的比值。其计算公式为:废品率 100,而总体产品数量为各批产品数量总和,因此,应利用调和平均数计算,即三批产品平均废品率【知识模块】 数据的概括性度量9 【正确答案】 C【试题解析】 已知每一个企业月计划产值和计划完成百分数,则: 月平均计划完成百分数 每个企业计划
14、完成百分数 所以,应采用加权算术平均法计算,权数是计划产值。【知识模块】 数据的概括性度量10 【正确答案】 B【试题解析】 几何平均数是分布数列中 n 个变量值的连乘积的 n 次方根。公式为G 。本题由于 6, 7,8 三个数相乘开立方,可观察 684877 ,则其几何平均值一定小于 7(算术平均数)。【知识模块】 数据的概括性度量11 【正确答案】 D【试题解析】 加权平均数适用于原始资料已经分组,并得出次数分布的场合。计算公式为: 根据公式可知,加权平均数的大小取决于频数之间的比率 f和变量值 的大小。【知识模块】 数据的概括性度量12 【正确答案】 B【试题解析】 调和平均数是根据标志
15、值的倒数来计算的平均数,如果数值中有一项为 0,则由于分母为 0 而无法计算;几何平均数一般是个标志值连乘积的 n 次方根,如果数值中有一项为 0,则计算出的几何平均数为 0,结果没有意义。【知识模块】 数据的概括性度量13 【正确答案】 A【试题解析】 幂平均数 M(k) 是关于 k 的递增函数,即幂平均数 M(k)值随着 k 的增大而增大,随着 k 的减少而减少。而算术平均数 、几何平均数G、调和平均数 H 是幂平均数的 k 阶数由 1 递减为趋于 0 又降至1 的特例,因此三者的关系是日G 。【知识模块】 数据的概括性度量14 【正确答案】 B【试题解析】 如果数据的分布是对称的,众数、
16、中位数和平均数必定相等;如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:平均数中位数众数;如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,众数中位数平均数。【知识模块】 数据的概括性度量15 【正确答案】 C【试题解析】 女性起薪的均值3500中位数3600,所以女性起薪的分布形状为左偏。【知识模块】 数据的概括性度量16 【正确答案】 C【试题解析】 记中位数为 Me,第一个四分位数为 Q1,第三个四分位数为 Q3,若Me (Q1Q 3)2,则数据为对称分布;若 Me(Q 1
17、Q 3)2,则数据为左偏分布;若 Me(Q 1Q 3)2,则数据为右偏分布。则已知中位数 Me85(Q 1Q 3)2(45 105)275,故该组数据的分布是左偏的。【知识模块】 数据的概括性度量17 【正确答案】 B【试题解析】 测度数值型数据离散程度的方法主要有极差、平均差、方差和标准差。其中极差是一组数据的最大值与最小值之差。由于题中只给了最低分和最高分,所以只能计算极差。【知识模块】 数据的概括性度量18 【正确答案】 A【试题解析】 众数和中位数不受极端值的影响,而 ABCD 项都会受到极端值的影响,但是由于极差是一组数据最大值与最小值之差,故最容易受极端值影响。【知识模块】 数据的
18、概括性度量19 【正确答案】 D【试题解析】 根据茎叶图,可知原数据组为 3,13,17,19,21,24,故其极差R24321。【知识模块】 数据的概括性度量20 【正确答案】 B【试题解析】 设原始数据为 1, 2, 1n,均值为 ,则该组数据的方差为2 。若令 1 1a, 2 2a, 2n na,则新数据组的均值 ,所以新数据组的方差为: 2 2【知识模块】 数据的概括性度量21 【正确答案】 D【试题解析】 设数列为 i,i1,2,n,则由已知得:5。所以标准差 2。【知识模块】 数据的概括性度量22 【正确答案】 A【试题解析】 设原始数据为 1, 2, n,均值为 ,则该数据的方差
19、为 2。若令 1 1a, 2 2a, 2n na,则新数据组的均值,而新数据组的方差为: 2 2。则重新计算的标准差系数 v ,即重新计算的标准差系数下降。【知识模块】 数据的概括性度量23 【正确答案】 D【试题解析】 离散系数是一组数据的标准差与其相应的平均数之比,其计算公式为: 则标准差 s 10066,所以方差 s236。【知识模块】 数据的概括性度量24 【正确答案】 B【试题解析】 标准差是绝对数变异指标,其数值大小与标志值绝对水平的高低有直接关系。当两总体平均数相等时,可直接用标准差比较平均数的代表性:标准差大的,平均数代表性小。当两总体平均数不相等时,不能利用标准差直接比较,而
20、应计算变异系数。【知识模块】 数据的概括性度量25 【正确答案】 B【试题解析】 为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算标准差系数,其计算公式为: ,标准差系数越大,离散程度越大。由于 v 甲 v 乙 所以乙班学生统计学成绩离散程度较大。【知识模块】 数据的概括性度量26 【正确答案】 C【试题解析】 根据切比雪夫不等式,至少有(11k 2)数据落在 k 个标准差之内。其中 k 是大于 1 的任意值。对于 k2、3、4,该不等式的含义是:至少有 75的数据落入平均数2 个标准差的范围内;至少有 89的数据落人平均数3 个标准差的范围之内;至少有 94的数据落入平均
21、数4 个标准差的范围之内。【知识模块】 数据的概括性度量27 【正确答案】 C【试题解析】 成绩在 7090 分之间的学生位于平均数两个标准差范围内,且学生成绩为对称分布,根据经验法则可知,成绩在 7090 分之间的学生大约占95。【知识模块】 数据的概括性度量28 【正确答案】 D【试题解析】 根据经验法则可知,约有 99的数据在平均数3 个标准差的范围之内,在 3 个标准差以外的数据是离群点。98 公里小时不在均值的 3 个标准差范围之内,即 8534(73,97),可以看作为是异常值。【知识模块】 数据的概括性度量29 【正确答案】 A【试题解析】 峰态系数用 K 表示。峰态通常是与标准
22、正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值等于 0;若峰态系数的值明显不等于 0,则表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布。K0,表明该组数据是尖峰分布;K0,表明该组数据是扁平分布。【知识模块】 数据的概括性度量30 【正确答案】 C【试题解析】 此数列的特点是数据分散,不适合用众数;存在极大值和极小值,不适合用易受极端值影响的算术平均数和调和平均数;几何平均数受极端值的影响相对算术平均数和调和平均数小,故稳健,因而此数列最好用几何平均数。【知识模块】 数据的概括性度量31 【正确答案】 A【试题解析】 D 项是峰态系数的计算公式。【知识模块】 数据
23、的概括性度量二、简答题32 【正确答案】 数据分布的特征可以从三个方面进行测度和描述:(1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;(2)分布的离散程度,反映各数据远离其中心值的趋势;(3)分布的形状,反映数据分布的偏态和峰态。【知识模块】 数据的概括性度量33 【正确答案】 (1)异众比率主要用于衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。异众比率主要适合测度分类数据的离散程度,当然,对于顺序数据以及数值型数据也可以计算异众比率。(2)四分位差主要用于
24、测度顺序数据的离散程度。对于数值型数据也可以计算四分位差,但不适合分类数据。(3)方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。方差开方后即得到标准差。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。【知识模块】 数据的概括性度量三、计算与分析题34 【正确答案】 (1)10 名销售人员 5 月份销售的汽车数量中,销售 10 台汽车的人数最多,为 3 人,因此众数 Mo10。 中位数位置10(台)。 平均数96(台) (2) 由题中数据可得: Q L 位置 25 即 QL 在第
25、2 个数值(4)和第 3 个数值 (7)之间 05 的位置上。因此 QL 55(台) 由于 QU 位置 75,即 QU 在第 7 个数值(12)和第 8 个数值(12) 之间 05 的位置上,因此 Q U 12(台) (3)由平均数96 可得: (4)由于平均数小于中位数和众数( M eM o),所以汽车销售量为左偏分布。【知识模块】 数据的概括性度量35 【正确答案】 (1)该组数据的茎叶图如图 2 一 16 所示。(2)由表中数据可得: 最大值41,最小值15 中位数的位置 13,所以中位数23。 下四分位数 QL 的位置 625,即 QL 在第 6 个数值(19)和第 7 个数值(19)
26、 之间 025 的位置上,因此 QL190751902519。 上四分位数 QU 的位置 1875,即 QU 在第 18 个数值(25)和第 19 个数值(27)之间 075 的位置上,因此 QU2502527075265。 由以上数据可得箱线图,如图2 一 17 所示。 (3)由茎叶图和箱线图可以看出,上网者年龄大多在 20 岁左右,其分布为右偏分布。【知识模块】 数据的概括性度量36 【正确答案】 由表 225 中数据可得如表 226 所示的计算表。其中, 122(元)。则曲耠 2-26 得:所以该企业职工奖金的偏度和峰度系数分别为: 偏度系数 0,说明该企业职工的奖金分配为正偏分布,偏态系数在 051 之间,可以认为是中等偏态分布;峰度系数 0,故该企业职工奖金分布曲线为尖峰分布。【知识模块】 数据的概括性度量37 【正确答案】 甲单位职工工资的均值和标准差分别为:14028( 元) 乙单位职工工资的均值和标准差分别为:12917 所以甲单位职工工资的离散系数为: V 甲 1001711 乙单位职工工资的离散系数为: V 乙 1001456 因为 V 甲 V 乙 ,所以乙单位职工的工资差异程度小。【知识模块】 数据的概括性度量