1、 Rec. UIT-R BS.1387-1 1 RECOMMANDATION UIT-R BS.1387-1 Mthode de mesure objective de la qualit du son peru (1998-2001) LAssemble des radiocommunications de lUIT, considrant a) que les mthodes objectives traditionnelles (par exemple de mesure du rapport signal/bruit et de la distorsion) ne sont plus
2、adaptes la mesure de la qualit du son peru de systmes qui utilisent des schmas de codage faible dbit binaire ou un traitement des signaux analogiques ou numriques; b) que les schmas de codage faible dbit binaire sont rapidement mis en service; c) que les ralisations conformes une spcification ou une
3、 norme ne garantissent pas toutes la meilleure qualit possible avec cette spcification ou cette norme; d) que les mthodes formelles dvaluation subjective ne sont pas adaptes au contrle continu de la qualit du son, par exemple en conditions dexploitation; e) que la mesure objective de la qualit du so
4、n peru peut ventuellement complter ou remplacer les mthodes dessai objectives traditionnelles dans tous les domaines de mesure; f) que la mesure objective de la qualit du son peru peut utilement complter les mthodes dvaluation subjective; g) que, pour certaines applications, une mthode qui puisse tr
5、e applique en temps rel est ncessaire, recommande 1 que pour les applications dont on trouvera la liste en Annexe 1, la mthode explique dans lAnnexe 2 soit utilise pour la mesure objective de la qualit du son peru. Avant-propos Cette Recommandation dfinit une mthode de mesure objective de la qualit
6、du son peru dun systme test, par exemple un codec faible dbit binaire. Elle est compose de deux Annexes. LAnnexe 1 offre lutilisateur un aperu gnral de la mthode et comporte quatre Appendices. LAppendice 1 dcrit les applications et les signaux de test. LAppendice 2 est une liste des variables de sor
7、tie de modle; on y trouvera galement les limites dutilisation et de prcision. LAppendice 3 est une description rapide du modle et lAppendice 4 dcrit les principes et les caractristiques gnrales des mthodes de mesure objective de la qualit du son peru. LAnnexe 2 offre au ralisateur une description dt
8、aille de la mthode avec les deux versions du modle psychoacoustique dveloppes pendant la phase dintgration lors de laquelle six modles ont t associs. On trouvera dans lAppendice 1 de lAnnexe 2 la description du processus de validation de la mthode de mesure objective. LAppendice 2 de lAnnexe 2 survo
9、le toutes les bases de donnes utilises pour le dveloppement et la validation de la mthode. 2 Rec. UIT-R BS.1387-1 TABLE DES MATIRES Page Avant-propos 1 Table des matires 2 Annexe 1 Aperu gnral 7 1 Introduction. 7 2 Applications 7 3 Versions 8 4 Le domaine subjectif. 8 5 Rsolution et prcision 10 6 Ex
10、igences et limitations 10 Appendice 1 lAnnexe 1 Applications 10 1 Gnralits 10 2 Applications principales 11 2.1 Evaluation des ralisations 11 2.2 Alignement qualit perceptuelle . 11 2.3 Contrle en ligne. 11 2.4 Etat des quipements ou des connexions 12 2.5 Identification des codecs. 12 2.6 Dveloppeme
11、nt des codecs . 12 2.7 Planification des rseaux. 12 2.8 Aides lvaluation subjective 13 2.9 Rsum des applications . 13 3 Les signaux dessais 13 3.1 Slection de signaux dessais naturels. 14 3.2 Dure. 15 4 Synchronisation 15 5 Droits de reproduction 15 Appendice 2 lAnnexe 1 Variables de sortie. 15 1 In
12、troduction. 15 2 Les variables de sortie de modle . 15 3 Qualit audio de base 16 4 Marge de codage. 17 5 Exigences des utilisateurs . 17 Rec. UIT-R BS.1387-1 3 Page Appendice 3 lAnnexe 1 Prsentation du modle . 17 1 Traitement du son . 18 1.1 Paramtres dfinis par lutilisateur 18 1.2 Modle psychoacous
13、tique . 18 1.3 Modle cognitif. 19 Appendice 4 lAnnexe 1 Principes et caractristiques des mthodes de mesure objective de la qualit perceptuelle du son. 20 1 Introduction et historique 20 2 Structure gnrale des mthodes de mesure objective de mesure de la qualit perceptuelle du son . 21 3 Considrations
14、 psychoacoustiques et cognitives 21 3.1 Caractristique de transfert par loreille externe et par loreille moyenne. 22 3.2 Echelles perceptuelles des frquences 22 3.3 Excitation 23 3.4 Dtection . 24 3.5 Masquage 25 3.6 Intensit acoustique et masquage partiel. 25 3.7 Acuit 25 3.8 Traitement cognitif 26
15、 4 Les modles intgrs. 27 4.1 DIX 27 4.2 NMR 28 4.3 OASE 28 4.4 PAQM (perceptual audio quality measure) 29 4.5 PERCEVAL 30 4.6 POM 30 4.7 Lapproche Toolbox 31 Annexe 2 Description du modle 32 1 Gnralits 32 1.1 Version de base . 33 1.2 Version avance 33 2 Modle auditif priphrique 34 2.1 Modle auditif
16、TFR. 34 2.1.1 Aperu gnral . 34 2.1.2 Traitement temporel . 35 2.1.3 TFR. 35 2.1.4 Oreille externe et oreille moyenne . 36 4 Rec. UIT-R BS.1387-1 Page 2.1.5 Regroupement en bandes critiques. 36 2.1.6 Ajout de bruit interne . 43 2.1.7 Etalement 43 2.1.8 Etalement dans le domaine temporel 45 2.1.9 Seui
17、l de masquage 45 2.2 Modle auditif fond sur un banc de filtres 46 2.2.1 Aperu gnral . 46 2.2.2 Sous-chantillonnage 47 2.2.3 Rglage au niveau de reproduction 47 2.2.4 Filtre de rjection DC . 47 2.2.5 Banc de filtres. 48 2.2.6 Filtrage par loreille externe et par loreille moyenne. 50 2.2.7 Etalement d
18、ans le domaine frquentiel 51 2.2.8 Rectification . 53 2.2.9 Dgradation dans le domaine temporel (1) Prmasquage . 53 2.2.10 Ajout de bruit interne . 53 2.2.11 Dgradation dans le domaine temporel (2) Postmasquage 53 3 Prtraitement des caractristiques dexcitation . 54 3.1 Adaptation des niveaux et des
19、caractristiques. 54 3.1.1 Adaptation des niveaux 54 3.1.2 Adaptation des caractristiques 55 3.2 Modulation 56 3.3 Intensit acoustique. 56 3.4 Calcul du signal derreur . 57 4 Calcul des variables de sortie de modle 57 4.1 Aperu gnral 57 4.2 Diffrence de modulation 58 4.2.1 RmsModDiffA58 4.2.2 WinModD
20、iff1B. 59 4.2.3 AvgModDiff1Bet AvgModDiff2B59 4.3 Intensit acoustique du bruit . 59 4.3.1 RmsNoiseLoudA. 60 4.3.2 RmsMissingComponentsA. 60 4.3.3 RmsNoiseLoudAsymA. 60 4.3.4 AvgLinDistA. 60 4.3.5 RmsNoiseLoudB. 60 4.4 Largeur de bande. 60 4.4.1 Pseudo-code 61 4.4.2 BandwidthRefBet BandwidthTestB. 61
21、 Rec. UIT-R BS.1387-1 5 Page 4.5 Rapport bruit/masque (NMR) . 62 4.5.1 Total NMRB. 62 4.5.2 Segmental NMRB. 62 4.6 Relative Disturbed FramesB62 4.7 Probabilit de dtection. 62 4.7.1 Probabilit de dtection maximum filtre (MFPDB) . 64 4.7.2 Bloc distordu moyen (ADBB) 64 4.8 Structure harmonique de lerr
22、eur. 64 4.8.1 EHSB65 5 Moyennes 65 5.1 Calcul de la moyenne spectrale. 65 5.1.1 Moyenne linaire 65 5.2 Calcul de la moyenne temporelle 65 5.2.1 Moyenne linaire 66 5.2.2 Moyenne quadratique . 66 5.2.3 Moyenne avec fentrage. 66 5.2.4 Slection des trames . 67 5.3 Moyenne sur les canaux audio 67 6 Estim
23、ation de la qualit audio de base perue 67 6.1 Rseau neuronal artificiel 68 6.2 Version de base . 68 6.3 Version avance 70 7 Conformit des mises en uvre 71 7.1 Gnralits 71 7.2 Slection 71 7.3 Rglages pour les tests de conformit. 71 7.4 Intervalle de tolrance acceptable . 72 7.5 Elments de tests. 72 A
24、ppendice 1 lAnnexe 2 Processus de validation . 73 1 Gnralits 73 2 Phase de comptition 74 3 Phase de collaboration 75 4 Vrification . 75 4.1 Comparaison des valeurs de SDG et de ODG 76 4.2 Corrlation 76 4.3 Valeurs de lerreur abosolue (AES). 79 4.4 Comparaison des ODG et de lintervalle de confiance .
25、 80 4.5 Comparaison des ODG et de lintervalle de confiance (tolrance) . 84 6 Rec. UIT-R BS.1387-1 Page 5 Slection des versions optimales du modle. 86 5.1 Critres de prslection fonds sur la corrlation . 86 5.2 Analyse du nombre dlments non conformes. 87 5.3 Analyse de la gravit des non-conformits . 8
26、8 6 Conclusion 89 Appendice 2 lAnnexe 2 Description des bases de donnes de rfrence 89 1 Introduction. 89 2 Elments par base de donnes. 91 3 Conditions exprimentales 91 3.1 MPEG90 92 3.2 MPEG91 92 3.3 ITU92DI 92 3.4 ITU92CO 92 3.5 ITU93 92 3.6 MPEG95 93 3.7 EIA95 93 3.8 DB2 . 93 3.9 DB3 . 93 3.10 CRC
27、97. 94 4 Elments par condition pour DB2 et DB3 94 4.1 DB2 . 94 4.2 DB3 . 97 Glossaire. 97 Abrviations . 98 Rfrences Bibliographiques 99 Bibliographie 100 Rec. UIT-R BS.1387-1 7 ANNEXE 1 Aperu gnral 1 Introduction La qualit du son est lun des facteurs clefs prendre en compte lors de la conception dun
28、 systme numrique de radiodiffusion. Lintroduction rapide de divers schmas de rduction du dbit binaire a conduit des efforts significatifs pour dfinir et affiner des procdures dvaluations subjectives, tout simplement parce que les tests dcoute formels taient la seule mthode pertinente pour juger de l
29、a qualit du son. Lexprience acquise a servi de base la Recommandation UIT-R BS.1116, qui son tour a servi de fondement la plupart des tests dcoute de ce type. Les valuations subjectives de la qualit tant la fois longues et coteuses, il est ncessaire de dvelopper une mthode de mesure objective pour o
30、btenir une estimation de la qualit du son. Les mthodes de mesure objective traditionnelles, comme le rapport signal/bruit (S /N) ou la distorsion harmonique totale (THD) nont jamais apport la preuve de leur fiabilit pour ce qui est de leur rapport la qualit du son peru. Les problmes sont encore plus
31、 vidents lorsque les mthodes sont appliques aux codecs modernes qui sont la fois non linaires et non stationnaires. Ces dix dernires annes ont vu lapparition dun certain nombre de mthodes de mesure objective de la qualit du son peru. Mais aucune de ces mthodes na t totalement valide, ni, en consquen
32、ce, normalise ou accepte sur une grande chelle. En 1994, lUIT-R a identifi le besoin urgent dtablir une norme dans ce domaine, et les travaux ont t lancs. Un appel propositions a t pass et les six mthodes de mesure proposes suivantes ont t retenues; Indice de perturbation (DIX), Rapport bruit/masque
33、 (NMR), Mesure perceptuelle de la qualit du son (PAQM), Evaluation perceptuelle PERCEVAL, Mesure perceptuelle objective (POM) et la Toolbox Approach. Ces mthodes sont dcrites dans lAppendice 4 lAnnexe 1. La mthode de mesure propose dans cette Recommandation est le rsultat dun processus au cours duqu
34、el on a tudi les performances des six mthodes ci-dessus, et extrait les outils les plus prometteurs pour les intgrer une mthode unique. La mthode recommande a t soigneusement valide sur un certain nombre de sites dessais. Elle sest avre gnrer des informations fiables et utiles pour de nombreuses app
35、lications. Il ne faut cependant pas oublier que la mthode de mesure objective propose dans cette Recommandation ne remplace pas, de faon gnrale, un test dcoute formel. 2 Applications Le concept fondamental des mesures objectives avec la mthode recommande est illustr par la Fig. 1 ci-dessous. 1387-01
36、Systme testSignal testSignal de rfrenceMthodede mesureobjectiveEstimation de la qualitdu sonFIGURE 1Concept fondamental des mesures objectives8 Rec. UIT-R BS.1387-1 La mthode de mesure propose dans cette Recommandation est applicable la plupart des types dquipement de traitement de signaux audio, nu
37、mriques et analogiques. Nanmoins, il est probable que beaucoup dapplications seront fondes sur des codecs audio. On a identifi les 8 classes dapplications dcrites dans le Tableau 1: TABLEAU 1 Applications 3 Versions Afin de parvenir la meilleure adquation possible avec les diffrentes exigences de co
38、t et de performances, la prsente Recommandation propose deux versions de la mthode de mesure objective recommande. La version de base permet une ralisation en temps rel dun bon rapport cot/performances, la version avance vise obtenir la plus grande prcision possible. Selon la ralisation, cette prcis
39、ion supplmentaire augmente la complexit selon un facteur denviron quatre par rapport la version de base. Le Tableau 1 aidera au choix de la version utiliser pour chacune des applications. 4 Le domaine subjectif Les essais formels dcoute subjective, par exemple ceux fonds sur la Recommandation UIT-R
40、BS.1116, sont prcisment conus pour parvenir une estimation aussi fiable que possible de la qualit du son. On ne peut cependant pas esprer que le rsultat dun essai dcoute subjectif soit le parfait reflet de la perception relle. La Fig. 2 illustre les imperfections invitables, aussi bien dans le domai
41、ne subjectif que dans le domaine objectif. Il est videmment impossible de valider directement une mthode objective. Les mthodes de mesure objectives sont donc valides par rapport des essais dcoute subjective. Application Description rapide Version 1 Evaluation de ralisations Procdure qui permet de c
42、aractriser diffrentes ralisations dquipements de traitement audio, dans de nombreux cas des codecs audio Base/ Avance 2 Alignement qualit perceptuelle Procdure rapide prcdant la mise en service dune partie dquipement ou dun circuit Base 3 Contrle en ligne Processus en continu pour surveiller une tra
43、nsmission audio en service Base 4 Etat des quipements ou des connexions Analyse dtaille dune partie dquipement ou dun circuit Avance 5 Identification de codec Procdure permettant didentifier le type et la ralisation dun codec donn Avance 6 Dveloppement de codec Procdure qui permet de caractriser les
44、 performances du codec aussi prcisment que possible Base/ Avance 7 Planification de rseau Procdure qui permet doptimiser le cot et les performances dun rseau de transmission selon des contraintes donnes Base/ Avance 8 Aide lvaluation subjective Outil de slection des matriaux critiques intgrer un tes
45、t dcoute Base/ Avance Rec. UIT-R BS.1387-1 9 1387-02FIGURE 2Concepts de validationPerceptionrelleMesuresobjectivesEvaluationssubjectivesLa mthode de mesure objective propose dans la prsente Recommandation est centre sur des applications qui sont normalement values dans le domaine subjectif en appliq
46、uant la Recommandation UIT-R BS.1116. On peut rapidement dcrire le principe fondamental de cette mthode dessai particulire de la faon suivante: lauditeur a le choix entre trois sources (A, B, C). La source A est toujours le Signal de rfrence connu. Le Signal de rfrence masqu et le Signal test sont d
47、isponibles simultanment mais sont, selon lessai, affects de faon alatoire B ou C. On demande lauditeur dvaluer les dgradations en B par rapport A, et en C par rapport A, selon lchelle de dgradations continue cinq notes. Une des sources, B ou C, ne doit pas pouvoir tre discerne de la source A; lautre peut rvler des dgradations. Toute diffrence perue entre la rfrence et lautre source doit tre interprte comme tant une dgradation. On nutilise normalement quun seul attribut, la Qualit audio de base, dfini comme un attribut global qui intgre to