1、DEUTSCHE NORM Januar 2004 DIN IS0 5479 ICs 03.120.30 Statistische Auswertung von Daten - Tests auf Abweichung von der Normalverteilung (IS0 5479:1997) Statistical interpretation of data - Tests for departure from the normal distribution (IS0 5479:1997) Interprtation statistique des donnes - Tests po
2、ur les carts la distribution normale (IS0 5479:1997) Gesamtumfang 75 Seiten Normenausschuss Qualittsmanagement, Statistik und Zertifizierungsgrundlagen (NQSZ) im DIN IlIl II 111 111 II II II I11111 O Alleinverkauf der Normen durch Beuth Verlag GmbH, 10772 Berlin DIN Deutsches Institut fr Normung e.V
3、. - Jede Art der Vervielfltigung, auch auszugsweise, nur mit Genehmigung des DIN Deutsches Institut fr Normung e. V., Berlin, gestattet. Preisgruppe 23 www.din.de www.beuth.de 9520923 DIN IS0 5479:2004-O1 Die Internationale Norm IS0 5479:1997 ,Statistical interpretation of data - Tests for departure
4、 from the normal distribution“ ist unverndert in diese Deutsche Norm bernommen worden. Nationales Vorwort Die vorliegende Norm hat das ISO/TC 69, Anwendung statistischer Methoden, unter Mitwirkung des Normenausschusses Qualittsmanagement, Statistik und Zertifizierungsgrundlagen (NQSZ) im DIN erarbei
5、tet. In dieser Norm werden statistische Tests behandelt, mit denen ermittelt wird, ob Messergebnisse einer Stichprobe als aus einer normalverteilten Grundgesamtheit stammend angesehen werden knnen. Mit den beschriebenen Tests wird die Nullhypothese geprft, nach der die Messergebnisse der Grundgesamt
6、heit normalverteilt sind. Die dargestellten Methoden unterscheiden sich durch ihre Zielsetzung. Allgemeine Anpassungstests (z. B. Kolmogorow-Smirnow) kommen nicht in Betracht. Es werden gerichtete Tests behandelt, die entweder allein die Schiefe oder allein die Wlbung bewerten (Begriffe siehe DIN 55
7、350-21). Ferner wird ein mehrfach gerichteter Test beschrieben, der gleichzeitig Schiefe und Wlbung bewertet. Schlielich werden ,Omnibus-Tests“ angegeben, die bei beliebiger Abweichung von der Normalverteilung angewendet werden. (,Omnibus“ lateinisch: ,fr alle“, hier im Sinne von ,fr alle, zumindest
8、 fr mehrere Parameter der betrachteten Verteilung“.) Einige Beispiele dienen der Veranschaulichung. 2 DIN IS0 5479:2004-O1 - Leerseite - 3 DIN IS0 5479:2004-O1 Deutsche bersetzung Statistische Auswertung von Daten Tests auf Abweichung von der Normalverteilung In halt Seite Vorwort . 6 Einleitung . 8
9、 1 Anwendungsbereich 10 2 Normative Verweisungen . 10 3 Begriffe und Formelzeichen 12 4 Allgemeines 14 5 Grafische Analyse 16 6 Gerichtete Tests . 30 7 Verbundener Test. bei dem und b2 gemeinsam angewendet werden (mehrfach gerichteter Test) . 38 8 Omnibus-Tests . 40 9 Verbundener Test. bei dem mehre
10、re voneinander unabhngige Stichproben angewendet werden . 52 10 Statistische Tabellen 56 Anhang A (informativ) Unbenutztes Wahrscheinlichkeitsnetz 72 Anhang B (informativ) Literaturhinweise . 74 4 DIN IS0 5479:2004-O1 Statistical interpretation of data Tests for departure from the normal distributio
11、n Contents Page Foreword 7 In trod uction . 9 1 Scope . 11 2 Normative references . 11 3 Definitions and symbols 13 4 General 15 5 Graphical method . 17 6 Directional tests . 31 7 Joint test using e.g. asymmetry or kurtosis. Generally the test used is designed to correspond to a predetermined a prio
12、ri risk that the hypothesis of normality is rejected even if it is true (error of the first kind). On the other hand, the probability that this hypothesis is not rejected when it is not true (error of the second kind) cannot be determined unless the alternative hypothesis (.e. that which is opposed
13、to the hypothesis of normality) can be precisely defined. This is not possible in general and, furthermore, it requires computational effort. For a distinct test, this risk is particularly large if the sample size is small. 9 DIN IS0 5479:2004-O1 1 Anwendungsbereich 1.1 Diese Internationale Norm gib
14、t eine Anleitung fr Methoden und Tests, die bei Anwendung dafr ausschlaggebend sind, ob die Hypothese Normalverteilung zu verwerfen ist oder nicht, und zwar unter der Voraussetzung, dass die Messwerte voneinander unabhngig sind. 1.2 Falls Zweifel bestehen, ob die Messwerte normalverteilt sind, kann
15、die Anwendung eines Tests auf Abweichung von der Normalverteilung zweckmig oder erforderlich sein. Bei robusten Methoden jedoch (also bei solchen, bei denen die Ergebnisse nur wenig beeinflusst werden, wenn die tatschliche Wahrscheinlichkeitsverteilung der Messwerte keine Normalverteilung ist) ist e
16、in Test auf Abweichung von der Normalverteilung weniger ntzlich. Das ist beispielsweise der Fall, wenn der Mittelwert einer einzelnen Zufallsstichprobe von Messwerten mit einem gegebenen theoretischen Wert mittels eines t-Tests (Student- Tests) verglichen werden soll. 1.3 Es ist nicht unbedingt erfo
17、rderlich, einen derartigen Test jedes Mal anzuwenden, wenn man auf statistische Methoden zurckgreift, die auf der Annahme der Normalverteilung beruhen. Es kann durchaus zweifelsfrei feststehen, dass die Messwerte normalverteilt sind, entweder weil theoretische (zum Beispiel physikalische) Grnde vorl
18、iegen, die diese Hypothese rechtfertigen, oder weil diese Hypothese aufgrund von in der Vergangenheit gewonnenen Informationen als annehmbar gilt. 1.4 Die in dieser Internationalen Norm ausgewhlten Tests auf Abweichung von der Normalverteilung sind in erster Linie gedacht fr einzeln ermittelte Messw
19、erte, nicht fr klassierte Messwerte. Die Tests sind ungeeignet fr zensorisierte Messwerte. 1.5 Die in dieser Internationalen Norm ausgewhlten Tests auf Abweichung von der Normalverteilung sind anwendbar entweder auf die Messwerte selbst oder auf Funktionen der Messwerte, zum Beispiel auf deren Logar
20、ithmen oder deren Quadratwurzeln. 1.6 Tests auf Abweichung von der Normalverteilung sind fast wirkungslos bei einem Stichprobenumfang von weniger als acht. Folglich ist diese Internationale Norm eingeschrnkt auf Stichprobenumfnge von acht oder mehr. 2 Normative Verweisungen Die folgenden normativen
21、Dokumente enthalten Festlegungen, die durch Verweisung in diesem Text Bestandteil dieser Internationalen Norm sind. Bei datierten Verweisungen gelten sptere nderungen oder berarbeitungen dieser Publikationen nicht. Anwender dieser Internationalen Norm werden jedoch gebeten, die Mglichkeit zu prfen,
22、die jeweils neuesten Ausgaben der nachfolgend angegebenen normativen Dokumente anzuwenden. Bei undatierten Verweisungen gilt die letzte Ausgabe des in Bezug genommenen normativen Dokuments. Mitglieder von IEC und IS0 fhren Verzeichnisse der gltigen Internationalen Normen. IS0 3534-1 :I 993, Statisti
23、k - Begriffe und Formelzeichen - Teil I: Wahrscheinlichkeit und allgemeine statistische Begriffe. 10 DIN IS0 5479:2004-O1 1 Scope 1.1 This International Standard gives guidance on methods and tests for use in deciding whether or not the hypothesis of a normal distribution should be rejected, assumin
24、g that the observations are independent. 1.2 Whenever there are doubts as to whether the observations are normally distributed, the use of a test for departure from the normal distribution may be useful or even necessary. In the case of robust methods, however (i.e. where the results are only altere
25、d very slightly when the real probability distribution of the observations is not a normal distribution), a test for departure from the normal distribution is not very helpful. This is the case, for example, when the mean of a single random sample of observations is to be checked against a given the
26、oretical value using a t-test. 1.3 It is not strictly necessary to use such a test whenever one refers to statistical methods based on the hypothesis of normality. It is possible that there is no doubt at all as to the normal distribution of the observations, whether theoretical (e.g. physical) reas
27、ons are present which confirm the hypothesis or because this hypothesis is deemed to be acceptable according to prior information. 1.4 The tests for departure from the normal distribution selected in this International Standard are primarily intended for complete data, not grouped data. They are uns
28、uitable for censored data. 1.5 The tests for departure from the normal distribution selected in this International Standard may be applied either to observed values or to functions of them, such as the logarithm or the square root. 1.6 Tests for departure from the normal distribution are very ineffe
29、ctive for samples of size less than eight. Accordingly, this International Standard is restricted to samples of eight or more. 2 Normative reference The following standard contains provisions which, through reference in this text, constitute provisions of this International Standard. At the time of
30、publication, the edition indicated was valid. All standards are subject to revision, and parties to agreements based on this International Standard are encouraged to investigate the possibility of applying the most recent edition of the standard indicated below. Members of IEC and IS0 maintain regis
31、ters of currently valid International Standards. IS0 3534-1 :1993, Statistics - Vocabulary and symbols - Part i: Probability and general statistical terms. 11 DIN IS0 5479:2004-O1 3 Begriffe und Formelzeichen 3.1 Begriffe Fr die Anwendung dieser Norm gelten die in IS0 3534-1 angegebenen Begriffe. 3.
32、2 ak A b2 Jbl B E GI h HO Hl k mJ n P P pk s T TEP UP VI W w, X x XO) xk) - X a Formelzeichen Koeffizient fr den Shapiro-Wilk-Test Hilfsgre fr den Epps-Pulley-Test empirische Wlbung empirische Schiefe Hilfsgre fr den Epps-Pulley-Test Erwartungswert Hilfsgre fr den verbundenen Test, bei dem mehrere v
33、oneinander unabhngige Stichproben angewendet werden Anzahl der aufeinander folgenden Proben Null hypothese Alternativhypothese Nummer des Messwertes x innerhalb der in nicht-absteigender Folge geordneten Stichproben- Messwerte zentrales Moment der Ordnung j der Stichprobe Stich probenumfang zum p-Qu
34、antil einer Verteilung gehrende Wahrscheinlichkeit Wahrscheinlichkeit zu x gehrende Wahrscheinlichkeit Hilfsgre fr den Shapiro-Wilk-Test Prfgre Prfgre fr den Epps-Pulley-Test p-Quantil der standardisierten Normalverteilung Hilfsgre fr den verbundenen Test, bei dem mehrere voneinander unabhngige Stic
35、hproben angewendet werden Prfgre fr den Shapiro-Wilk-Test Hilfsgre fr den verbundenen Test, bei dem mehrere voneinander unabhngige Stichproben angewendet werden Messwert von X Zufallsvaria ble Messwertj innerhalb der in nicht-absteigender Folge geordneten Stichproben-Messwerte Messwert k innerhalb d
36、er in nicht-absteigender Folge geordneten Stichproben-Messwerte arithmetischer Mittelwert Signifikanzniveau 12 DIN IS0 5479:2004-O1 3 Definitions and symbols 3.1 Definitions For the purposes of this International Standard, the definitions given in IS0 3534-1 apply 3.2 ak A b2 JbT B E Gj h HO Hl k mi
37、 n P P Pk s T TEP UP v. W wj X X x(ii x(k - x a Symbols coefficient of the Shapiro-Wilk test auxiliary quantity for the Epps-Pulley test empirical kurtosis empirical skewness auxiliary quantity for the Epps-Pulley test expectation auxiliary quantity for the joint test using several independent sampl
38、es number of consecutive samples null hypothesis alternative hypothesis within the sample, arranged in non-decreasing order, the number of the observed value x central moment of orderj of the sample sample size probability associated with the p-quantile of a distribution proba bi I ity probability a
39、ssociated with x(k) auxiliary quantity for the Shapiro-Wilk test test statistic test statistic of the Epps-Pulley test p-quantile of the standardized normal distribution auxiliary quantity for the joint test using several independent samples test statistic of the Shapiro-Wilk test auxiliary quantity
40、 for the joint test using several independent samples value of X random variable jth value in the sample, arranged in non-decreasing order kth value in the sample, arranged in non-decreasing order arithmetic average significance level 13 DIN IS0 5479:2004-O1 Wahrscheinlichkeit des Fehlers 2. Art Wlb
41、ung der Grundgesamtheit Exzess der Grundgesamtheit Schiefe der Grundgesamtheit Hilfsgre fr den verbundenen Test, bei dem mehrere voneinander unabhngige Stichproben angewendet werden Koeffizient fr den verbundenen Test, bei dem mehrere voneinander unabhngige Stichproben angewendet werden Hilfsgre fr
42、den verbundenen Test, bei dem mehrere voneinander unabhngige Stichproben angewendet werden Koeffizient fr den verbundenen Test, bei dem mehrere voneinander unabhngige Stichproben angewendet werden Hilfsgre fr den verbundenen Test, bei dem mehrere voneinander unabhngige Stichproben angewendet werden
43、Koeffizient fr den verbundenen Test, bei dem mehrere voneinander unabhngige Stichproben angewendet werden Erwartungswert (der Grundgesamtheit) Varianz der Grundgesamtheit zentrales Moment der Ordnung 3 der Grundgesamtheit zentrales Moment der Ordnung 4 der Grundgesamtheit Standardabweichung der Grun
44、dgesamtheit (= ) 4 Allgemeines 4.1 Es gibt verschiedene Kategorien von Tests auf Abweichung von der Normalverteilung. In dieser Internationalen Norm werden grafische Analysen, Momenten-Tests, Regressions-Tests und Tests mittels der charakteristischen Funktion betrachtet. Chi-Quadrat-Tests sind nur f
45、r klassierte Messwerte geeignet; diese Tests werden in dieser Internationalen Norm jedoch nicht betrachtet, weil durch die Klassierung ein Verlust an Informationen entsteht. 4.2 Falls keine zustzlichen Informationen ber die Stichprobe vorliegen, wird empfohlen, zuerst die Messwerte im Wahrscheinlich
46、keitsnetz grafisch darzustellen, d. h. die Verteilungsfunktion der Messwerte im Wahrscheinlichkeitsnetz (mit linear geteilter Abszisse) aufzuzeichnen. Das Wahrscheinlichkeitsnetz besteht aus einem Koordinatensystem, in dem die Verteilungsfunktion der Normalverteilung durch eine Gerade wiedergegeben
47、ist. Diese in Abschnitt 5 beschriebene Analyse ermglicht es, unmittelbar zu ,sehen“, ob die beobachtete Verteilung (der Messwerte) in der Nhe der Normalverteilung liegt oder nicht. Mit dieser zustzlichen Information kann entschieden werden, ob ein gerichteter Test durchzufhren ist, oder ob ein Regre
48、ssions- Test oder ein Test mittels der charakteristischen Funktion, oder ob gar kein Test durchzufhren ist. Obwohl diese grafische Darstellung nicht als Test im strengen Sinne angesehen werden kann, ist die dadurch erhaltene zustzliche bersichtsinformation eine wichtige Ergnzung fr jeden Test auf Ab
49、weichung von der Normalverteilung. Falls die Nullhypothese verworfen wird, ist es oft mglich, aus dieser grafischen Darstellung Hinweise fr das geeignet erscheinende weitere Vorgehen zu entnehmen. NI) Nationale Funote: Die Varianz ist das zentrales Moment der Ordnung 2. 14 DIN IS0 5479:2004-O1 probability of an error of the second kind kurtosis of the population excess of the population skewness of the population auxiliary quantity for the joint test using several indepe