1、AFN1 NF XOb-073-1 90 LOL2372 0376888 T7T ISSN 0335-3931 X 06-073-1 Avril I990 Application de la statistique Tests non paramtriques Interprtation des statistiques dordre - Partie 1 : Test (ou essai) de comparaison par paires E : Application of statistics - Distribution free tests- Interpretation of o
2、rder D : Anwendung der Statistik- Nicht parametrische Tests -Auswertung der statistics- Part 1 :Test of comparison by pairs Ranggrssen -Teil 1 : Paarvergleichtest Norme franaise homologue par dcision du Directeur Gnral de Iafnor le 20 mars 1990 pour prendre effet le 20 avril 1990. correspondance A t
3、a date de publication de la prsente norme, il nexiste pas de Norme interna- tionale traitant du mme sujet. analyse Cette norme fournit une mthode Statistique qui permet de faire des (essais didentification) ou des (essais de prfrence) afin dinterprter le classement de deux objets. descripteurs Thsau
4、rus International Technique : analyse statistique, test statistique, com- paraison par paires, classement, table statistique. modifications correct ions dite et diffuse par lassociation franaise de normalisation (afnor), tour europe cedex 7 92049 paris la dfense - tl. : (1) 42 91 55 55 O - afnor1990
5、 - ler tirage 90-04 O afnor 1990 AFNL NF XO6-073-1 90 m 10L2372 0376889 926 m Mthodes statistiques AFNOR X6E Membres de la commission de normalisation chargs de ilaboration du prsent document Prsident : M BRUNSCHWIG Secrtaire : MME DEL CERRO-AFNOR M BRUNSCHWIG M DEYDIER M FERRE M LABOUZE M LEAUTIER
6、M LEGEAY M LETERME M MENDES MLE MONNET MME OUDIN-DARRIBERE M PERRUCHET M ROUET M SAPORTA M VESSEREAU M ZANKEVITCH Conseil Gnral des PONTS cet ordre est prcis par la nota- tion conventionnelle Y X. Dans un essai de Drfrence, laffectation des lettres X,Y lun ou lautre des deuxtermes est indiffrente. A
7、FNL NF XOb-073-3 90 = 3032372 0376893 584 M X 06-073-1 -4- 6.1 Hypothse teste et hypothse aiternative a) Dans un essai didentification (ordre prtabli), lhypothse soumise au test (hypothse nulle) est que, dans leur ensemble, les sujets nont pas reconnu lordre dfini par Y X. Cette hypothse est rejete
8、si le nombre k de sujets ayant correctement reconnu cet ordre est suffisamment plus lev que le nombre de sujets qui nont pas reconnu cet ordre. La plus petite valeur de k (suprieure 42) permettant de rejeter lhypothse nulle est la valeur critique du test, note k,. Si donc k 2 k, on rejetera lhypoths
9、e nulle (ordre non reconnu) et on adoptera lhypothse alternative ordre reconnu). Le test didentification est un test unilatral. b) Dans un essai de prfrence, lhypothse soumise au test (hypothse nulle) est que, dans leur ensemble, les sujets nont manifest aucune prfrence. Cette hypothse est rejete si
10、 le nombre k de prfrences pour celui des deux termes, X ou Y qui a t le plus souvent prfr est suffisamment lev. La plus petite valeur de k (suprieure n/2), permettant de rejeter lhypothse nulle est la valeur critique du test note k,. Si donc k2 k, lhypothse nulle pas de prfrence) est rejete et on ad
11、optera lhypothse alternative : (prfrence pour celui des deux termes qui a reu le plus grand nombre de suffrages). Le test de prfrence est un test bilatral. 6.2 Risques derreur La conclusion nonce, sous lune des formes qui viennent detre dites, nest pas une conclusion certaine. Dans un essai didentif
12、ication, il nest pas exclu que les sujets ayant reconnu lordre correct, laient fait par hasard). II en est de mme dans un essai de prfrence. Le risque associ ces ventualits, not a et appel risque de premire espce, doit tre fix lavance et faible ; les valeurs communment associes sont a= 005 (5 %), a
13、= 001 (1 %) et parfois a = 0,001 (1 %). La signification du risque est la suivante : Si lon choisit a = 0,05, cela signifie que lon a au maximum 5 chances sur 100 de se tromper lorsquon conclut une identification reconnue (ou une prfrence relle) alors que le seul hasard est lorigine des rsultats obt
14、enus. Avec a = 0,01, on na quune chance sur 100 au maximum de se tromper, et avec a = 0,001, une chance sur 1 000. Le rejet de lhypothse nulle est dit significatif pour a = 005, trs significatif pour a = 0,01, hautement significatif pour a= 0,001. Les valeurs critiques, k, ou k, sont dautant plus lo
15、ignes de n/2 (donc proche de n) que lon a choisi pour a une valeur plus faible. Si lon veut ne courir aucun risque de se tromper (a = O), on ne concluera jamais : tout essai et toute tentative dinterprtation statistique sont inutiles. II rsulte aussi de ce qui prcde quune interprtation statistique e
16、st impossible si lon ne dispose pas dun nombre minimum de sujets. En raison des difficults de formulation dune hypothse alternative pour la plupart des tests non paramtriques, le risque de deuxime espce nest pas calcul. Le risque est le risque quune diffrence effective ne soit pas identifie ou quune
17、 prfrence relle dans le population ne soit pas dcele. 7 DOMAINE DE VAUDIT DE LA CONCLUSION DU TEST STATISTIQUE En toute rigueur cette conclusion ne sapplique quau groupe de sujets ayant particip lessai ; elle ne peut tre tendue qu des sujets ayant un niveau de qualification comparable. Si les sujets
18、 qui ont particip lessai ont un haut niveau de qualification, ou ont fait lobjet dun entrane- ment trs pouss, une lgre diffrence (prfrence) quils auront statistiquement reconnue, ne sera sans doute pas perue par des personnes sans qualification. A linverse, si avec un risque derreur faible, les (exp
19、erts) nont pas peru de faon significative une diffrence - ou manifest une prfrence - il est trs peu probable que diffrence ou prfrence soient sensibles au (grand public). AFNL NF XOb-073-1 70 1012372 0376872 410 -5- X 06-073-1 0 8 TABLE DES VALEURS CRITIQUES Pour les risques a= 0,05, a= 0,01, a= 0,0
20、01, les tables figurant en annexe donnent en fonction du nombre n de sujets, les valeurs critiques k, dans un essai didentification (test unilatral) et k, dans un essai de prf- rence (test bilatral). Note: le nombre R didentifications correctes ou de prfrences ne pouvant prendre que des valeurs enti
21、res, il est impossible dobtenir pour le risque a la valeur choisie ; dune faon gnrale, les valeurs k, ou k, contenues dans les tables correspondent des risques rels a Sa. 9 EXEMPLES Exemple 1 -Essai didentification 40 sujets qualifis ont t invits dsigner quel est le plus sal de deux produits X, Y, q
22、ui leur sont prsen- ts aprs codage ; on sait que Y ne diffre de X que par une lgre addition de sel. On choisit pour a (risque) la valeur 0,05. 27 sujets ont dsign Y comme tant le plus sal. La table A.1 donne la valeur critique k, = 26. On conclut donc que la diffrence de salure a t significativement
23、 perue au risque 5 % (au risque 1 %, o k, = 28, lidentification naurait pas t significative). 0 Exemple 2 -Essai de prfrence Un professeur, aprs avoir corrig les copies de deux lves, X et Y, les trouve toutes les deux excellentes et trs voisines, avec une trs lgre prfrence pour Y. Hsitant sur les no
24、tes donner, il sen remet au jugement de 12 de ses collgues. Ayant confront leurs notes, il constate que Y a eu 8 fois une note un peu suprieure celle de X, et 4 fois une note un peu infrieure. Aprs consultation de la table A.2, qui pour n = 12, donne des valeurs critiques k, =IO pour a = 0,05 (ke= 1
25、1 pour a= 0,OI et k,= 12 pour a= 0,001), il dcide sagement de donner la mme note aux deux lves. 10 GENERALISATION Pour la gnralisation plus de deux (objets) des tests didentification et de prfrence, voir NF X 06-073-Partie 2. 11 BIBLIOGRAPHIE Rfrences tests non paramtriques : - Traitement des donnes
26、 statistiques (Lebart L., Morineau A., Fenelon J.P. - Dunod, 1982) (ne traite que des tests des signes et de Friedman, trs abordable mais succinct) - Statistiques non paramtriques (Piednoir J.L- Revue du CETHEDEC, 2,l-233,1977) (sur les procdures non paramtriques, assez thorique) - Non paramtres (Le
27、hmann E.L.- Mc Graw Hill, 1975) (une rfrence sur les tests de rang) gaiement : - Practical non parametric statistics (Conover W.J.- J. Wiley, 1971) - Non parametric statistical methods (Hollander M., Wolfe D.A. -J. Wiley, - Distribution free statistical tests (Bradley J.V. Prentice Hall, 1968) 979)
28、- Statistique non paramtrique et robustesse (Lecoutre J.P., Tassi P. - Economica, 1987) (tableaux trs complets) - Mthodes et modles en statistique non paramtrique Tome I : Expos fondamental Tome II : Exercices et complments (Baille A., Caperaa Ph.,Van Custen B.-Dunod, 1988) O _- _- AFNL NF XOb-073-1
29、 90 m LO12372 037b873 357 m X 06-073-1 -6- ANNEXEA (cette annexe fait partie intgrante de la norme) Table A.l- Essai didentification -Test unilatral Nombre Valeurs critiques kU de sujets n a10,05 I a10,OI I a10,001 7 I 7 7 I - 8 7 8 - Table A.2 - Essai de prhfrence - Test bilatral Nombre Valeurs cri
30、tiques kg de sujets n - - 7 7 8 8 8 9 8 9 - 10 9 10 - 11 10 11 11 12 10 11 12 13 11 12 13 14 12 13 14 15 12 13 14 16 13 14 15 17 13 15 16 18 14 . 15 17 19 15 16 17 20 15 17 18 c AFNL NF XOb-073-3 90 3032372 0376894 293 = -7- X 06-073-1 Notes 1 : les valeurs donnes dans les tables ont t calcules part
31、ir de la loi binomiale de paramtre p = 0,50 avec n rptitions (sujets). 2 : lorsque le nombre de sujets est suprieur 100, on utilise lapproximation de la loi binomiale par une loi normale avec une erreur au plus gale 1 unit : n+l 2 k, =valeur entire la plus proche de -+Au$ n+l 2 kB =valeur entire ia
32、plus proche de -+A, 6 Test unilatral as 0.05 au = 0,822 al 0,Ol au = 1,163 a5 0,001 a, = 1,545 Exemple : n = 120, a= 0,05 ku =- 12 +0,822-=70 2 kB=- +0,980$%=71 2 Exemple : n = 120, a= 0,Ol 121 2 kU=-+ 1,163-=73 121 =-+ 1,288m=75 kB 2 * lest bilatral a 0,05 hB = 0,980 al 0,Ol hg e 1,288 al 0.001 hB = 1,645