1、11.5 用样本估计总体教学目标1、知识与技能(1) 理解样本标准差的意义和作用,学会计算数据的标准差。(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数、标准差) ,并作合理的解释。2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学思想方法。3、情感态度价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。教学重点、难点教学重点:利用样本估计总体的数字特征。教学难点: 样本标准差的计算。教学过程:统计的基本思想就是用样本估计总
2、体,如何能更合理、更直观,这里有两种估计手段:用样本的频率分布估计总体的分布用样本的数字特征(平均数、标准差等)估计总体的数字特征。下面我们先来看第一种:(一)课题引入1895 年,在英国伦敦有 106 块男性头盖骨被挖掘出土。经考证,头盖骨的主人死于16651666 年之间的大瘟疫。人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位 mm): 146 141 139 140 145 141 142 131 142 140 144 140138 139 147 139 141 137 141 132 140 140 141 143134 146 134 142 133 149 140 14
3、0 143 143 149 136141 143 143 141 138 136 138 144 136 145 143 1372142 146 140 148 140 140 139 139 144 138 146 153148 152 143 140 141 145 148 139 136 141 140 139158 135 132 148 142 145 145 121 129 143 148 138149 146 141 142 144 137 153 148 144 138 150 148138 145 145 142 143 143 148 141 145 141请大家思考:用什
4、么统计图可以直观表示上述数据的分布状况?你能根据上述估计在16651666 年之间英国男性头盖骨宽度的分布情况吗?(二)探求新知问题 1、我们学习了哪些统计图?不同的统计图适合描述什么样的数据?问题 2、这道题目,我们用什么统计图描述比较合适?问题 3、如何画频数分布条形图? 关键:确定组距和组数组距:把所有数据等距离地分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)纵坐标表示频数,横坐标表示组距问题 4、你能不能画出给定数据的频率分布直方图?基本步骤是什么?1、计算最大值和最小值的差;2、决定组距和组数,通常第一组起点稍微减小一点;组距:把所有数据等距离地分成若干组,每个小组的
5、两个端点之间的距离(组内数据的取值范围)3、列频率分布表对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫做频数) ,再计算出每一组出现的频率,整理可得频率分布表;4、画频率分布直方图纵坐标表示频率与组距的比值,小长方形的面积=组距 =频率。频 率组 距由于各组频率之比等于小矩形的面积之比,也等于各矩形的高度之比,所以我们画频率分布直方图的时候,通常先确定高度最低的矩形,然后再按比例画其它矩形。频率分布直方图中的每个小矩形的面积代表数据落在这个区域的频率,所有小矩形的面积之和=1。3频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律,可以
6、让我们更清楚地看到整个样本数据的频率分布情况(原有的具体数据信息就被抹掉了) 。问题 5、你能根据上述数据估计在 16651666 年之间英国男性头盖骨宽度的分布情况吗?解:如果把总体看作是 16651666 年之间英国男性头盖骨的宽度,就要通过上面出土得到的样本信息来估计总体的分布情况。但从上面的数据很难直接估计出总体的分布情况,为此,先将以上数据按每个数据出现的频数和频率绘成表。宽度/mm 频数 频率 宽度/mm 频数 频率121 1 0.009 142 7 0.066129 1 0.009 143 10 0.094131 1 0.009 144 5 0.047132 2 0.019 14
7、5 8 0.075133 1 0.009 146 5 0.047134 2 0.019 147 1 0.009135 1 0.009 148 8 0.075136 4 0.038 149 3 0.028137 3 0.028 150 1 0.009138 7 0.066 152 2 0.019139 7 0.066 153 1 0.009140 12 0.113 158 1 0.009141 12 0.113从表格中,我们就能估计出总体大致的分布情况了,但是,这些关于分布情况的描述仍不够形象,为了得到更为直观的信息,可以再将表中的数据按照下面的方式分组:频率分布表宽度分组 频数 频率 频率/组
8、距120125mm 1 0.009 0.0018125130mm 1 0.009 0.0018130135mm 6 0.057 0.0114135140mm 22 0.208 0.04164140145mm 46 0.434 0.0868145150mm 25 0.236 0.0472150155mm 4 0.038 0.0076155160mm 1 0.009 0.0018从而得到频数分布条形图、频率分布直方图观察直方图,回答问题:(1)头盖骨的宽度位于哪个范围的最多?140145mm(2)头盖骨的宽度位于 140145mm 的频率约是多少?43.4%(3)头盖骨的宽度小于 140mm 的频
9、率约是多少?28.3%(4)头盖骨的宽度位于 137142mm 的频率约是多少?20.28.430.984.%5。归纳总结:1、频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度来01020304050120 125 130 135 140 145 150 155160频 数宽 度 /mm120125mm125130mm130135mm135140mm140145mm145150mm150155mm155160mm5表示数据分布的规律,可以让我们更清楚地看到整个样本数据的频率分布情况,但是,原有的具体数据信息就被抹掉了。2、画频率分布直方图的步骤:(1) 、计算一组数据
10、中最大值与最小值的差,即求极差;(2) 、决定组距与组数;(3) 、将数据分组;(4) 、列频率分布表;(5) 、画频率分布直方图。问题 6、当数据的样本量发生变化的时候,会对频率分布直方图有什么样的影响?用什么方法能减少样本容量对数据分布的影响?3、频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间。从所加左边区间的中点开始,用线段依次连接频率分布直方图中各小长方形上段的中点,直至所加的右边区间的中点就得到频率分布折线图。样本容量越大,用样本的频率分布去估计总体的分布就越精确。当样本容量增大时,为使所得的频率分布直方图更好地反映总体的分布情况,我们往往将划分的区间数相
11、应增多,每个区间的长度则会相应减少,这样得到的频率折线图也会越来越接近一条光滑的曲线总体密度曲线,这条曲线就反映了总体的分布情况。总体密度曲线与横轴围成的区域面积=1,并且总体在任意区间取值的概率等于该区域的面积。(三)知识应用6例 1、为了了解高二学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二组频数为 12.(1)第二组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,试估计该学校全体高二学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数
12、落在哪个组内?请说明理由。解:(1)由于频率分布直方图以面积的形式反映了数据落在各组内的频率大小,因此第二组的频率为:40.8217593;因为第二组频率=第二组频数样本容量,所以样本容量为0.8;(2)由图可估计该学校高二学生的达标率约为17593%4;(3)由已知可得各组的频数依次为 6,12,51,45,27,9,所以前三组的频数之和为 69,前四组的频数之和为 114,所以跳绳次数的中位数落7在第四组内。例 2、某种产品的质量以其质量指标值衡量,质量指标越大表明质量越好,且质量指标值大于或等于 102 的产品为优质品现用两种新配方(分别称为 A 配方和 B 配方)做试验,各生产了 10
13、0 件这种产品,并测量了每产品的质量指标值,得到时下面试验结果:A 配方的频数分布表指标值分组 90,94) 94,98) 98,102) 102,106) 106,110频数 8 20 42 22 8B 配方的频数分布表指标值分组 90,94) 94,98) 98,102) 102,106) 106,110频数 4 12 42 32 10(1)分别估计用 A 配方,B 配方生产的产品的优质品率;(2)已知用 B 配方生产的一种产品利润 y(单位:元)与其质量指标值 t 的关系式为,94102,tyt,计算生产 100 件 B 产品获得的利润。解析:(1)由试验结果知,用 A 配方生产的产品中
14、优质的平率为28=0.31,所以用 A 配方生产的产品的优质品率的估计值为 0.3。由试验结果知,用 B 配方生产的产品中优质品的频率为320.41,所以用 B 配方生产的产品的优质品率的估计值为 0.42。(2)用 B 配方生产的 100 件产品中,其质量指标值落入区间90,4,120,的频数分别为 4,54,42,因此生产 100件 B 产品获得的利润为 4(-2)+542+424=268。(五)课堂小结1、这节课进一步学习了频率分布直方图的画法,并利用频率分布直方图估计数据的总体分布。总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。2、总体密度曲线。8