1、ICS 0312030A 41 囝亘中华人民共和国国家标准GBT 33581-2009IS0 3534-1:2006代替GBq33581 1993统计学词汇及符号第1部分:一般统计术语与用于概率的术语Statistics-Vocabulary and symbols-Part 1:General statistical terms and terms used in probability20091015发布(IS0 35341:2006,IDT)2010-02-01实施丰瞀髅零瓣訾箍警瞥星发布中国国家标准化管理委员会厘11目 次前言引言-范围1一般统计术语2用于概率的术语附录A(资料性附录)
2、符号附录B(资料性附录)统计概念图附录C(资料性附录)概率概念图附录D(资料性附录) 定义标准中的术语所使用的方法参考文献索引-汉语拼音索引英文对应词索引GBT 33581-2009ISO 35341:2006M弘u蛎堪曲跎刖 罱GBT 33581-2009IS0 3534-1:2006GBT 3358统计学词汇及符号分为以下部分:第1部分:一般统计术语与用于概率的术语;第2部分:应用统计;第3部分:实验设计。本部分为GBT 3358的第1部分,等同采用1S0 3534 1:2006统计学词汇及符号第1部分:一般统计术语与用于概率的术语。与ISO 3534 1:2006相比,订正了原文的错误,
3、修正原文中概念表述不够准确的部分,主要变化如下:删去了124原文中的注1; 。238示例中变异系数的计算式“09909950994 97”更正为“0995091105 56”;269中“事件o-代数砖”中,要求满足的性质a)“属于始”修订为“0属于捧”。为便于使用,本部分作了下列编辑性修改:删去了Iso前言;为术语的简练起见,在少数术语中,使用中括号表示其中可省略部分。例如:25中,事件A的概率(probabilityof an event A),表示此术语实际定义的是“概率(probability)”,其中“事件A的”在许多场合可省略。又如234“r阶原点矩 (moment of order
4、 r)”表示原文的“r阶矩(moment of order r)”也称为“r阶原点矩”。本部分代替GBT 33581 1993统计学术语 第一部分 一般统计术语,与GBT 33581-1993相比,主要变化如下:名称改为统计学词汇及符号第1部分:一般统计术语与用于概率的术语;对术语条目作了较大的调整:增加了一般统计术语及用于概率的术语;将GBT 335811993中第4章“观测和测试结果的一般术语”及第5章“抽样方法的一般术语”中的内容移至GBT 3358的第2部分;增加了大量的示例及注释;增加了术语概念图(附录B、附录c)及定义标准中的术语所使用的方法的附录D,并将关于符号的附录A改为资料性
5、附录。本部分的附录A、附录B、附录c和附录D均为资料性附录。本部分由全国统计方法应用标准化技术委员会提出并归口。本部分主要起草单位:中国科学院数学与系统科学研究院、中国标准化研究院、北京师范大学、中国科学技术大学、苏州大学。本部分主要起草人:冯士雍、陈敏、于丹、崔恒建、吴耀华、丁文兴、汪仁官、于振凡。本部分于1993年首次发布,本次为第一次修订。GBT 33581-2009150 35341:2006引 言目前版本的GBT 33581和GBT 33582是兼容的,其共同目标是在一致、准确而简洁的前提下,将定义所需的数学程度限制在最低水平。由于GBT 33581是概率和统计的基础术语,所以有必要
6、用相对严格而复杂的数学语言来表述。考虑到GBT 33582及其他统计方法应用标准的使用者有时需要查询GBT 33581中术语的定义,因此本部分的术语尽可能用通俗的方式来描述,并辅以注释及示例。尽管这些非正式的描述并不能取代正式的定义,但为统计专业以外的人员提供了有效的概念性的定义,能满足这些术语标准的大多数用户的需要。为了进一步适应经常使用GBT 33582或GBT 6379等标准的用户,通过注释和示例使GBT 33581更易于理解。一套明确定义的,且相对完整的概率统计术语对统计标准的编制及有效使用是必需的。定义必须足够准确、且具备数学意义上的严格性,使在编制其他统计标准时避免出现概念模糊。当
7、然,对概念的更详细的解释、背景和应用领域可在初等概率统计教材中找到。资料性附录B与附录c分别为一般统计术语与用于概率的术语提供了系列概念框图。其中一般统计术语包含六个概念图;用于概率的术语包含四个概念图。某些术语同时出现在几个不同的框图中,从而起到一组概念与另一组概念的联系作用。附录D提供了关于概念图的简要介绍及其解释。这些框图有助于本次修订,因为它们有助于描述不同术语之间的相互联系。这些框图也有助于标准文本的翻译。除非另有说明,本标准中大部分术语均在一维(单变量)场合下定义。这避免了许多术语在类似条件下进行重复定义。范围GBT 335812009Is0 35341:2006统计学词汇及符号第
8、1部分:一般统计术语与用于概率的术语GBT 3358的本部分规定了用于标准起草的一般统计术语、用于概率的术语的定义及部分术语的符号。本部分中的术语分为:a)一般统计术语(第1章);b)用于概率的术语(第2章)。附录A列出了本部分推荐使用的符号。附录B和附录C是本部分所有术语条目的概念框图。1一般统计术语11总体population所考虑对象的全体。注1:总体可是真实有限或无限的,也可是完全虚构的。有时,特别是在调查抽样中也使用“有限总体”;在一些流程性物质抽样中也使用“无限总体”。在第2章中,从概率的角度,总体在一定意义上可看作是样本空间(21)。注2:对于虚构的总体,允许人们想象在不同假定条
9、件下的数据所具有的属性。因此,虚构总体在统计研究的设计阶段,特别是确定适宜样本量时非常有用。虚构总体所含对象数目可以是有限的也可以是无限的。在统计推断中,这是一个对评价统计研究证据强度特别有用的概念。注3:下面的例子能帮助理解总体这一概念:若有三个村庄被选中作人口统计或健康研究,总体即由这三个村庄的全体居民构成;若这三个村庄是从某个特定区域中的所有村庄中随机抽选出来的,则总体由该区域中的所有居民构成。1 21314抽样单元sampling unit总体(11)划分成若干部分中的每一部分。注:抽样单元依赖于具体问题中所感兴趣的最小部分。抽样单元可以是一个人、一个家庭、一个学校或个行政单位等。样本
10、sample由一个或者多个抽样单元(12)组成的总体(11)的子集。注l:根据所研究总体的情况,样本中的每个单元可是真实或抽象的个体,也可是具体的数值。注2:在GBT 3358 2关于样本的定义中,包括一个抽样框的示例。抽样框在从有限总体中抽取随机样本时是必须的。观测值observed value由样本(13)中每个单元获得的相关特性的值。注1:常用的同义词是“实现”和“数据”。GHT 33581-2009IS0 35341:2006注2:本定义并没有指明值的来源或如何被获得。观测值可表示某随机变量(2 10)的一次实现,但并不一定如此。它可以是相继用于统计分析的若干值中的一个。正确的推断需要
11、一定的统计假定,但首先要做的是对观测值的计算概括或图形描述。仅当需要解决进一步的问题,如确定观测值落人某一指定集合的概率,统计机制才是重要而本质的。观测值分析的初始阶段通常称为数据分析。1描述性统计量descriptive statistics观测值(14)的图形、数值或其他概括性描述。示例1:数值描述包括样本均值(1 15)、样本极差(1 10)、样本标准差(1 17)等。示例2:图形描述包括箱线图、示意图、Q Q图、正态分位图、散点图、多元散点图和直方图等。16随机样本random sample由随机抽取的方法获得的样本(13)。注1:本定义比GBi 3358 2给出的定义限制要少,样本允
12、许来自无限总体。注2:当从有限样本空间(2 1)中抽取”个抽样单元组成样本时,N个抽样单元的任意一种组合都会必特定的概率(2 5)被抽中。对于调查抽样方案而言,每一种可能组合被抽中的概率可事先计算。注3:对有限榉卒空间的调查抽样,随机样本可以通过不同的抽样方法得到,如分层随机抽样、随机起点的系统抽样、整群抽样、与辅助变量的大小成比例的概率抽样以及其他可能的抽样。注4:本定义一般是指实际观测值(14)。这些观测值被认为是随机变量(2 10)的实现,其中每个观测值都对应于一个随机变量。当由随机样本构造估计量(1 12)、统计检验(148)的检验统计量或置信区间(128)时,本定义是指从样本中的抽象
13、个体得到的随机变量而不是这些随机变量的实际观测值。注5:无限总体中的随机样本一般是从样本空间中重复抽取产生的。根据注4的解释,此时样本由独立同分布的随机变量组成。17简单随机样本simple random sample(有限总体给定样本量的每个子集都有相等的被抽选概率的随机样本(16)。注:此处的定义与GBT 33582中的定义是一致的,仅在措辞上稍有不同。18统计量statistic由随机变量(210)完全确定的函数。注1:在1 6注4的意义下,统计量是随机样本(16)中随机变量的函数。沣2:按注1。若X,x:。,x,)是来自未知均值(235)和未知标准差(2 37)一的正态分布(2 50)
14、的随机样本,则样本均值(1 15)(X,+Xz+x。)n是一个统计量;而(X。+X z-一X。)”一F不是统计量,因为它包含了未知参数(29)F。注3:相应于数理统计中的表述,此处给出的是统计量的一种技术性定义。英语中,统计量(statistic)的复数形式就是统计学(statistics),它是一门包括了统计方法应用标准中所叙述的分析方法的技术学科。19次序统计量order statistic由随机样本(16)中的随机变量(210)的值,依非降次序排列所确定的统计量(18)。示例:假设样本观测值为9,13,7,6,13,7,19,6,10,7,则次序统计照的观测值为:6,6,7,7,7,9,
15、lo,1 3,1 3,1 0。这些值是x,x。的一次实现。注l:假设随机样本(16)的观测值(1 4)为,z:,按非降的次序排列为zzz,则(-,r,z。)是次序统计量(x,xt,x)的观测值,。为第k个次序统计量的观测值。注2:在实际应用中,为获得一组数据的次序统计量,即是将数据按照注1中所述方式进行排序。将一组数据按上述方法排序后,还可获得其他几个术语定义的有用的统计量,如1 1 0、1 11等。注3:次序统计量涉及按照非降次序排列后的位置来识别的样本值。正如示例所示,将样本值(随机变量的实现)排序比将未观测的随机变量排序更容易理解。它可以通过按照非降次序排列的随机样本(1 6)来理解随机
16、变2GBT 33581-2009ISO 3534-1:2006量;比如”个随机变量的最大值可以先于它的实现值来研究。沣4:单个次序统计量是随机变量的个特定函数。这个函数可以简单地由其在随机变量排序集合中的位置或序状【称为秩)来确定。注5:结点值会引起一些潜在的问题特别屉对丁二离散随机变量或者是低分辨的实现。用“非降”而不是“递增”的说法可解决这个问题。需要强捌的是结点值都要保留而不能合并成一个。在上面的示例中,“6”有两个实现,所以“6”是结点值。注6:排序按照随机变量的实数值进行而小足按照其绝对值进行。注7:次序统计量(X,x,X。,)组成”维随机变量”是样本中观测值的个数。注8:次序统计量
17、的分量也是次序统汁量,而且保持其在原样本排序中的位置标识。注9:最小值,摄大值咀及样本量为奇数时的样本中位数(1 13)都是特殊的次序统计量。比如样本量为lI,那幺x是最小值,x、是最大值x是样本中位数。110样本极差sample range最大次序统计量(19)与最小次序统汁量的差;示例:在l 9中的示例中样本极差的观测值为196一l 3。沣:在统计过程控制中尤其当样本萱相对比较小刚,样本极差通常用来监测过程的离散程度随时问的变化。111中程数midrange最大和最小次序统计量(19)的平均值(115)。示例:l 9的示例巾中程数的观测值为(6+19)2=l 2 j。沣:中程数能够对较小数
18、据集的中心提供一种快捷而简单的估计。1 12估计量estimator日用于对参数0估计(136)的统计量(18)。沣j:样本均值t1 15)是总体均值L2 35)p的一个估计量。例如对于正态分布L2 50),样本均值是总体均值p的估计甚。注2:要估计总体的特征(如一维(元)分布(2 16)的众数(2 27)个合适的估计鼍可以足分布参数估计量时函数,也可以是随机样本(1 6)的复杂函数。注3:此处所讲的“估计量”是一个宽泛的概念。它包括某参数的点估h也包括用十预测的区间估计。估计量也包括该估计量和其他特殊形式的统计量。另见136注的训论。113样本中位数sample median若样本量(见GB
19、T 33582 20091 226)”为奇数,则是第(”+1)2个次序统计量(19);若样本量”是偶数则是第n2与第(n2)+1个次序统计量之和除以2。月i例:续1 9的示例8为样本中位数的一个实现,此时样本量为10(偶数),第5和第6个次序统计量分别为7和9,其甲均值为8。尽管严格来说样本中位数是作为一个随机变量来定义的,但在实际中也说“样本中位数为8”。注I:财十样本量为”的随机样本(1 6)其随机变量(2 10)按照非降顺序从l到”排列,如果样本量为奇数,则样本中位数为第(”】)2个随机变量,如果样本量为偶数则样本中忙数为第(n2)个与第(”+1)2个随机变董的平均值。注2:从概念上讲对
20、 个没有观测到的随机变量进行排序似乎是不可能的。但不经观测也可理解次序统计量的结构。在实际中通过获得观测值并对其进行排序,从而得到次序统计量的实现。这些实现值可用于解释次序统计量的结构。注3:样本中位数是分布中间位置的一个估计各有一半的样本单元大于等于或小于等于它。注1:样本中位数在实际问题中是有用的,它提供r一个对数据极端值不敏感的估计量。例如,中位收入和中位房价都是常用的统计指标。3GBT 33581-2009IS0 3534-1:2006114k阶样本矩sample moment of order k随机样本(16)中随机变量(210)的次幂的和除以和中的项数。注1:对于样奉量为n的随机
21、样本x,XX,阶样本矩为:上y搿 “j注2:本术语也称为女阶样本原点矩。注3:一阶样本矩即为样本均值(1 15)。注4:虽然本定义中女可取任意值,但在实际中常用的是一l样本均值(115),=2与样本方差(1 16)和样本标准差(1 17)有关女一3与样本偏度系数(120)有关和k=4 L与样本峰度系数(1 21)有关的情形。115样本均值sample mean平均数average算术平均值arithmetic mean随机样本(16)中随机变量(210)的和除以和中的项数。示例:续l 9中的示例,观测值的和为97,样本量为10,样本均值的实现为9 7。注1:在1 8中注3的意义下,样本均值作为
22、统计量是随机样本中随机变量的函数。必须区分统计量与由随机样本中观测值(14)计算得出的样本均值的数值。注2:样本均值作为统计量,常用作总体均值(235)的估计量。算术平均值是它的同义词。注3:对样本量为”的随机样本x,x:,墨,样本均值为:贾=1Y,。i一1注4:样本均值就是一阶样本矩。注5:样本量为2时,样本均值、样本中位数(1 1 3)和中程数“11)皆相同。116样本方差sample varianceS2随机样本(16)中随机变量(210)与样本均值(115)差的平方和用和中项数减1除。示例:续19中的示例,样本观测值与样本均值差的平方和为15810,样本量10减1为9,计算得样本方差为
23、1 7 57。注1:样本方差S2作为统计量(8),是随机样本中随机变量的函数。必须区分这个统计量与根据随机样本观测值(1 4)计算得出的样本方差的数值,该值称为经验样本方差或观测样本方差,通常记作52。注2:对样本量为”的随机样本x、,x。,x。,样奉均值为x,则s2一i与(x,叉)2。注3:样本方差作为一个统计量“差不多”等于该随机变量(2 1 0)与样本均值(1 15)差的平方的平均数(其中“差不多”是指这里平均用”一1而不是用”作分母),用” 1作分母是为总体方差(2 36)提供一个无偏估计量(134)。注4:”一1称为自由度(254)。注5:样本方差可以近似认为是中,b化样本随机变量(
24、2 31)的二阶样本矩(仅以”一l代替”)。117样本标准差sample standard deviationS样本方差(116)的非负平方根。示例:续1 9中的示例,观测样本方差为1 7 57,观测样本标准差为41 92。注1:实际中样本标准差用来估计总体标准差(2 37)。再次强调S也是一个随机变量(2 10),而并不是随机样本(16)的实现。注2:样本标准差是分布(2 11)离散程度的一个度量。GBT 33581i2009IS0 3534-1:2006118样本变异系数sample coefficient of variation样本标准差(117)除以非零样本均值(115)的绝对值。注
25、:变异系数通常表示成百分数。119标准化样本随机变量standardized sample random variable随机变量(210)与其样本均值(115)的差除以样本标准差(117)。示例:续1 9中的示例,观测样本均值为9 7,观测样本标准差为4192,观测标准化随机变量(表示为两位小数)为:0 17;0 79;一064;0 88;079;一064;2 22,088;0 07;一0 62。注l:标准化样本随机变量应区别于理论上的标准化随机变量(2 33)。将随机变量标准化的目的在于使得其均值为0、标准差为1,便于解释和比较。注2:标准化样本观测值的观测样本均值为0,观测样本标准差为1
26、。120样本偏度系数sample coefficient of skewness随机样本(16)的标准化样本随机变量(119)三次幂的算术平均值。示例:续1 9中的示例,观测样本偏度系数的计算结果为0971 88。如本例中的样本量为lO的情形,样本偏度系数不够稳定,因此应谨慎使用。根据注1给出的另一公式计算出的值为l_349 83。注1:对应于定义中公式为:i1塞(孚)。有些统计软件里使用下面的公式修正样本偏度系数的偏倚(133):百东杀历霉其中:z一掣3当样本量很大时,两个公式的差别可以忽略。当”一10,100,l 000时,修偏估计值与定义中的估计值之比分别为I 389,1 031,100
27、3。注2:偏度系数是对分布不对称性的度量,如果偏度系数接近0意味着真实分布近似对称。偏度系数不为零时意味着在某一侧尾部可能有极端值。有偏的数据也会在样本均值(115)与样本中位数(113)的差异上体现出来。正偏(右偏)数据表明可能有少数大的极端值。同样,负偏(左偏)数据表明可能有少数小的极端值。注3:样本偏度系数也是标准化样本随机变量(119)的三阶样本矩。121样本峰度系数sample coefficient of kurtosis随机样本(16)的标准化样本随机变量(119)四次幂的算术平均值。示例:续1 9中的示例,观测样本峰度系数的计算结果为2674 19。如本例中的样本量为10的情形
28、,样本峰度系数极不稳定,因此应谨慎使用。统计软件包在计算样本峰度系数时常进行了各种修正(参见240中的注3)。应用注1中的另一公式计算的值为0436 05。不能直接比较2 674 19和0436 05这两个数值。为此,应将2 674 19减去3(正态分布的峰度系数为3),其差为一0 325 8l,这个数值可与0 436 05进行比较。注l:与定义对应的公式是: 宝(学)4一些统计软件包使用下面公式来修正样本峰度系数的偏倚(133),它表示对正态分布峰度系数(等于3)的偏离:(”+1) z; 一GBT 33581-2009ISO 35341:2006其中:。 x。一叉,一r。当”充分大时,上式第
29、二项近似为3。有时为r强调与正态分布的比较峰度表不为如2 40中定义的值减去3。显然,实际应用者需要注意到统计软件包中是否包含任何修止。注2:峰度描述了(单峰)分布的重尾程度。对正态分布(2 50)由于抽样随机性,样本峰度系数一般只近似,而不是恰好为3。在实际应用中正态的峰度提供了一个基准值:峰度值小于3的分布(2 11j有比正态轻的尾部;峰度值大干3的分布有比正态重的尾部。注3:对于峰度观测值大于3很多的情形一种可能是因为真实分布的尾部比正态尾部重另一可能是分布中存在潜在的离群值。注4:样本峰度系数可认为是标准化随机变量的四阶样本矩。122样本协方差ow随机样本(11除。sample cov
30、ariance6)中两个随机变量(210)对各自样本均值(115)的离差的乘积之和被求和项数减示例1:考虑下列三个变量的10组观测值。在这个示例中只考虑r和。表1示例1的观测结果1 2 3 4 6 7 8 9 1038 41 24 60 4】 j1 58 50 65 3373 74 43 107 65 73 9) 72 100 4834 31 40 28 35 Z8 32 27 27 3lx的观测样本均值是46 1,】7的观测样本均值是75 4,f与的样本协方差等于:(38461)(73754)+(4146 1)x(7475 4)。+(33 46 1)(48 75 4)佃=25 7 178示例
31、2:在上例的表中,考虑y和z,z的观测样本均值是3l 3,Y与z的样本m方差等于:(73754)(3431 3)+(7475 4)(74313)+_(48 75 4)(31 31 3)J954 356注1:作为统计量(1 8),样本协方差是样本量为的随机变量对:(x,H)(Xz,Y,),(XY。)在(1 6)注3意义下的函数。这个统计量需要与随机样本中由抽样单元(1 2)(z,弘),(r:,弛),(y)的观测值计算得到样本协方差的数值卡u区别。后者称为经验样本协方差或观测样本协方差。注2:样本协方差sn由下式给出:i兰1(x, x)(y; F)注3:用”一1除是为总体协方差(243)提供一个无
32、偏估计量(1 34)。注4:表I的示例包含3个变量,而协方差定义中只涉及2个变量。在实际应用中经常会遇到多个变量的情况。123样本相关系数sample correlation coefficiento。样本协方差(122)用相应样本标准差(117)的乘积来除。示例1:续1 22中的示例1。x的观测标准差为12 945,y的观测标准差为21329。从而X和y的观测样本相关系数为:面畿拦面_o。3l z示例2:继续122的示例2,Y的观测标准差为21329,z的观测标准差为4 165。从而】7和z的观测样本相关系数为:54356GBT 335812009ISO 35341:2006注l!样本相关系
33、数的计算公式如F:(x: i)(y。 F)f】(x x)2(y, 可)2V J】 J=】这个表达式等价于样本协方差与两方差乘积的平方根的比。有时用h表示样本相关系数。观测样本相关系数是基于实现值(T。)(,Y。),(,弘)的。注2:观测样本相关系数取值在一1,1之间。取值接近于1表示强的正相关;取值接近于一1表示强的负相关。取值接近于1或一l表明数据点近似在一条直线上。124标准误差standard error估计量(112)目的标准差(237)。示例:如果以样本均值(115)作为总体均值(235)的一个估计,且随机变量(2 10)的标准差为d,则样本均值的标准误差为di其中”是样本中观测值的
34、个数。标准误差的一个估计是S百,其中s是样本标准差(1 17)。注:不存在反义词“非标准”误差。通常在应用中,标准误差特指样本均值的标准差,记为昨,此时也常简称为“标准误”。1 25区间估计 interval estimator由一个上限统计量和一个下限统计量(18)所界定的区间。注1:区间的个端点可以是+一或是参数值的一个自然界限。如0是总体方差(2 36)区间估计的一个自然下限。在此情形,区间称为是单侧的。注2:区间估计可结合参数(2 9)估计(1 36)给出。区间估计通常是以假定在蘑复抽样下区间包含所估计的参数确定比例或其他某种概率意义下给出的。洼3:区间估计通常有三种:参数的置信区间(
35、128)对未来观测的预测区间(1 30)和分布(211)被包含一个确定比例的统计容忍区间(126)。126统计容忍区间statistical tolerance interval在规定置信水平下,由随机样本(16)确定的至少覆盖抽样总体(11)的指定比例的区间。注:这里“置信”一词是指在大量重复意义下所构造区间应至少包含抽样总体的指定比例。127统计容忍限statistical tolerance limit表示统计容忍区间(126)端点的统计量(18)。注:统计容忍限可为以下两种情况的一种:单侧容忍限,即单侧的统计容忍上限或单侧的统计容忍下限,此时另一个容忍限为随机变量的自然界限;双侧容忍限
36、,此时有两个统计容忍限。128置信区间 confidence interval参数(29)目的区间估计(125)(T。,T。),其中作为区间限的统计量(18)To,T,满足PT。3(1一户)7关于声的图形进一步验证。示例2:对正态分布(2 50),可以证明,当标准差(237)已知时,似然函数在卢等于样本均值时达到最大值。139剖面似然函数profile likelihood function其余参数取使其极大化,而仅作为一个单参数(29)的似然函数(138)。140假设hypothesisH关于总体(11)的陈述。注:通常这个命题与分布族(2 8)中的一个或几个参数(2 9)或与此分布族本身有
37、关。GBT 33581-2009IS0 35341:2006141原假设null hypothesisH用统计检验(148)方法来检验的假设(140)。示例l:在独立同分布正态随机变量(2 1 0)的随机样本(1 6)中,均值(2 35)和标准差(2 37)未知,对均值p的一个原假设是:“均值小于或等丁某给定值胁”。上述原假设一般写成形式:H户户示例2:原假设也可为:“总体(1 1)的统计模型是正态分布”。对此原假设,均值和标准差可以不确定。示例3:原假设也可为:“总体的统计模型是对称分布”。对此原假设,分布形式可以不确定。注1:显然,原假设可以由所有可能的概率分布的子集组成。注2:本定义应与
38、备择假设(142)和统计检验(1 48)联合考虑。注3:在实际中,从不说“让明”了原假设,而是说在给定条件下,不足以拒绝原假设。进行假设检验的原始目的很可能是对于当前问题,希望检验结果支持一个指定的备择假设。注4:不拒绝原假设并不是“证明”了它真的成立,而只是说没有足够的证据拒绝它。此时原假设也许真的成立(或近似成立);也许由于样本的原因(如样本量不够大)而未能检出其中的差异。注5:有时,最初的兴趣是原假设,但对原假设的偏离也有意义。适当的样本量和检验指定的偏离或备择假设的功效能用来构造出合适评估原假设的检验方法。注6:与”不能拒绝原假设”相反,“接受备择假设”是一个肯定的结果它支持所感兴趣的
39、猜测。与诸如“这次不能拒绝原假设”之类的结论相比“拒绝原假设接受备择假设”更为明确。注7:原假设是构造相应的检验统计量(1 52)的出发点该统计量用于对原假设的评估。注8:原假设通常记为H。注9:若有可能,原假设与备择假设的命题应互斥参见I 48的注2和1 49的示例。142备择假设alternative hypothesisH,H1对从所有不属于原假设(141)的可能容许概率分布(211)中选择的一个集合或其子集的陈述。示例】:在1 41示例1中,对应原假设的备择假设是“均值(2 35)大于该给定值”,表币为:H、:pp示例2:在1 4I示例2中,对应原假设的备择假设是“总体的统计模型不是正
40、态分布(2 50)”。示例3:在1 41示例3中,对应原假设的备择假设为“总体的统计模型是由非对称分布构成的”。对这个备择假设非对称分布的具体形式没有确定。注1:在需要特别指定备择假设时,一般将原假设的补作为备择假设。注2:备择假设既可以记为Ha,也可以记为H,不存在优先选用的问题。注3:备择假设是与原假设相对立的一种陈述。对应的检验统计量(1 52)用十在原假设和备择假设之间进行抉择。注4:不能脱离原假设和统计检验(148)来考虑备择假设。注5:与“不能拒绝原假设”相比,“接受备择假设”是一个肯定的结果,它支持感兴趣的猜测。143简单假设simple hypothesis在一个分布族(28)
41、中,指定了某单个分布(211)的假设(140)。注l:简单假设是选定的子集只由单个概率分布(211)组成的原假设(141)或备择假设(1 42)。注2:根据从均值(2 35)未知、标准差口已知的正态分布(2 50)总体中独立抽取的随机样本(1 6),对均值F的简单假设是均值等于一个给定值户。,通常表示为如下形式:Hpp注3:简单假设完全确定了概率分布(211)。144复合假设composite hypothesis在一个分布族(28)中,指定了多于一个分布(211)的假设(140)。示例1:141和1 42给出的原假设(1 41)和备择假设(142)都是复合假设的例。月i例2:l 48示例3中
42、情形3的原假设是,简单假设,示例4中的原假设也是简单假设1 48中其他假设都是复合GBT 33581-2009ISO 3534-1:2006假设。注:复合假设是所选定的于集由一一个以上的概率分布组成原假设或备择假设。145显著性水平significance level(统计检验原假设(141)为真,而被拒绝的最大概率(25)。注:如果原假设是一个简单假设(143),剐当原假设为真时,拒绝它的概率是一个确定的值。146第一类错误Type I error拒绝事实上为真的原假设(141)的错误。注1:事实上,第一类错误是一种不正确的判定。网此,要使这种不正确判定的概率(2 5)尽可能小。要使犯第一类
43、错误的概率为0,只有水不拒绝原假设,而不管证据如何。当然,这是不可能的。注2:在有些情况下(如检验二项参数卢),由于结果的离散性有可能达不到预先设定的显著性水平,如0 05。147第二类错误Typeerror没有拒绝事实上不为真的原假设(141)的错误。注:事实上,第二类错误是一种不正确的判定。因此要使这种不正确判定的概率(2 5)尽可能小。第二类错误通常足在当样本量不够大,因而不足以揭示与原假设的偏离时发生。148统计检验statistical test显著性检验significance test判断是否拒绝原假设(14”,支持备择假设(142)的方法。示例1:作为例子,如果一个实际的连续随
44、机变量(2 29)在到一之间取值怀疑它的真实的概率分布不是正态分布(2 50),则町以按以下步骤构造假设:一考虑所有在 到一30上取值的连续概率分布(2 23);猜测真实的概率分布不是正态分布;原假设为:概率分布是正态分布;一备择假设为:概率分布不是正态分布。示例2:如果随机变量服从正态分布,标准差(237)已知,怀疑它的期望值,z与给定的值。有偏离,则可以按示例3中的情形3的步骤构造假设。示例3:本例考虑统计检验的三种町能情形。情形1:猜测过程均值大于目标均值u。这个猜测导致如卜假设:原假设: H1户。备择假设:H。:F心情形2:猜测过程均值小于目标均值心。这个猜测导致如Iv假设:原假设:
45、H口一备择假设:tt:口来自样本(13)的某些个体的集合。1552类class有序尺度下一个或者多个相邻类别的集合。155 3组class(定量特性)实数轴上的区间。156组限 class limits;class boundaries组(1553)的上限减去其下限。159频数frequency给定类(组)(155)中,特定事件发生的次数或观测值(14)的个数。1 3GBT 33581-2009IS0 3534-1:2006160频数分布frequency distribution类(组)(155)与其中特定事件发生的次数或观测值(14)的个数之间的经验关系。161直方图histogram频数
46、分布(160)的一种图形表示,由一些相邻的长方形组成,每个长方形的底宽等于组距(158),面积与组的频数成比例。注:要注意从不等组距的组中产生数据的情况。162条形图bar chart由一组宽度相同、高度与频数(159)成比例的长方形组成的,表示名义特性频数分布(160)的图形。注1:有时为了美观,将长方形画成三维图形,但这并不会增加任何信息,所以不推荐使用。条形图中的长方形并不需要相邻。注2:由于现成软件大都没有按此处的定义绘制,现在直方图和条形图的差别越来越模糊。163累积频数cumulative frequency给定界限以下所有类(组)的频数(159)之和。往:本定义只适用于对应于组限
47、(1 56)的给定界限值。164频率relative frequency用事件或者观测值(14)发生的总数日除频数(159)。165累积频率cumulative relative frequency用事件或者观测值(14)发生的总数目除累积频数(163)。2用于概率的术语21样本空间sample spacen所有可能结果的集合。示例1:考虑某消费者所购买电池的寿命(失效时间)。若电池开始使用时就失效,其寿命为0;若电池开始能工作,则有个以小时表示的寿命。因此,样本空间包含电池一开始就失效和电池寿命为1-小时,0)两类结果。本例在本章中经常会用到,在2 68还将对它作进一步的讨论。示例2:一个盒子里装有标着l,2,