1、 UNIN INTERNACIONAL DE TELECOMUNICACIONES UIT-T P.835SECTOR DE NORMALIZACIN DE LAS TELECOMUNICACIONES DE LA UIT (11/2003) SERIE P: CALIDAD DE TRANSMISIN TELEFNICA, INSTALACIONES TELEFNICAS Y REDES LOCALES Mtodos de evaluacin objetiva y subjetiva de la calidad Metodologa de prueba subjetiva para eval
2、uar los sistemas de comunicacin vocal que utilizan un algoritmo de cancelacin de ruido Recomendacin UIT-T P.835 RECOMENDACIONES UIT-T DE LA SERIE P CALIDAD DE TRANSMISIN TELEFNICA, INSTALACIONES TELEFNICAS Y REDES LOCALES Vocabulario y efectos de los parmetros de transmisin sobre la opinin de los cl
3、ientes Serie P.10 Lneas y aparatos de abonado Serie P.30 P.300 Patrones de transmisin Serie P.40 Aparatos para mediciones objetivas Serie P.50 P.500 Medidas electroacsticas objetivas Serie P.60 Medidas relativas a la sonoridad vocal Serie P.70 Mtodos de evaluacin objetiva y subjetiva de la calidad S
4、erie P.80 P.800 Calidad audiovisual en servicios multimedios Serie P.900 Para ms informacin, vase la Lista de Recomendaciones del UIT-T. Rec. UIT-T P.835 (11/2003) i Recomendacin UIT-T P.835 Metodologa de prueba subjetiva para evaluar los sistemas de comunicacin vocal que utilizan un algoritmo de ca
5、ncelacin de ruido Resumen En esta Recomendacin se describe una metodologa para evaluar la calidad subjetiva de la voz en presencia de ruido y, en particular, para la evaluacin de los algoritmos de cancelacin de ruido. En la metodologa se utilizan escalas de puntuacin diferentes para estimar por sepa
6、rado la calidad subjetiva de la seal de voz, el ruido de fondo y la calidad global. Orgenes La Recomendacin UIT-T P.835 fue aprobada el 13 de noviembre de 2003 por la Comisin de Estudio 12 (2001-2004) del UIT-T por el procedimiento de la Recomendacin UIT-T A.8. Palabras clave Algoritmo de supresin d
7、e ruido, evaluacin de la calidad vocal, preprocesador de ruido, pruebas subjetivas, voz codificada en presencia de ruido de fondo. ii Rec. UIT-T P.835 (11/2003) PREFACIO La UIT (Unin Internacional de Telecomunicaciones) es el organismo especializado de las Naciones Unidas en el campo de las telecomu
8、nicaciones. El UIT-T (Sector de Normalizacin de las Telecomunicaciones de la UIT) es un rgano permanente de la UIT. Este rgano estudia los aspectos tcnicos, de explotacin y tarifarios y publica Recomendaciones sobre los mismos, con miras a la normalizacin de las telecomunica-ciones en el plano mundi
9、al. La Asamblea Mundial de Normalizacin de las Telecomunicaciones (AMNT), que se celebra cada cuatro aos, establece los temas que han de estudiar las Comisiones de Estudio del UIT-T, que a su vez producen Recomendaciones sobre dichos temas. La aprobacin de Recomendaciones por los Miembros del UIT-T
10、es el objeto del procedimiento establecido en la Resolucin 1 de la AMNT. En ciertos sectores de la tecnologa de la informacin que corresponden a la esfera de competencia del UIT-T, se preparan las normas necesarias en colaboracin con la ISO y la CEI. NOTA En esta Recomendacin, la expresin “Administr
11、acin“ se utiliza para designar, en forma abreviada, tanto una administracin de telecomunicaciones como una empresa de explotacin reconocida de telecomunicaciones. La observancia de esta Recomendacin es voluntaria. Ahora bien, la Recomendacin puede contener ciertas disposiciones obligatorias (para as
12、egurar, por ejemplo, la aplicabilidad o la interoperabilidad), por lo que la observancia se consigue con el cumplimiento exacto y puntual de todas las disposiciones obligatorias. La obligatoriedad de un elemento preceptivo o requisito se expresa mediante las frases “tener que, haber de, hay que + in
13、finitivo“ o el verbo principal en tiempo futuro simple de mandato, en modo afirmativo o negativo. El hecho de que se utilice esta formulacin no entraa que la observancia se imponga a ninguna de las partes. PROPIEDAD INTELECTUAL La UIT seala a la atencin la posibilidad de que la utilizacin o aplicaci
14、n de la presente Recomendacin suponga el empleo de un derecho de propiedad intelectual reivindicado. La UIT no adopta ninguna posicin en cuanto a la demostracin, validez o aplicabilidad de los derechos de propiedad intelectual reivindicados, ya sea por los miembros de la UIT o por terceros ajenos al
15、 proceso de elaboracin de Recomendaciones. En la fecha de aprobacin de la presente Recomendacin, la UIT no ha recibido notificacin de propiedad intelectual, protegida por patente, que puede ser necesaria para aplicar esta Recomendacin. Sin embargo, debe sealarse a los usuarios que puede que esta inf
16、ormacin no se encuentre totalmente actualizada al respecto, por lo que se les insta encarecidamente a consultar la base de datos sobre patentes de la TSB. UIT 2004 Reservados todos los derechos. Ninguna parte de esta publicacin puede reproducirse por ningn procedimiento sin previa autorizacin escrit
17、a por parte de la UIT. Rec. UIT-T P.835 (11/2003) iii NDICE Pgina 1 Alcance . 1 2 Referencias . 1 3 Definiciones 2 4 Acrnimos 2 5 Diseo experimental . 2 5.1 Material vocal. 2 5.2 Sesin de escucha. 5 5.3 Anlisis de datos. 6 5.4 Presentacin e interpretacin de los resultados 7 Apndice I Procedimiento p
18、ara mezclar correctamente muestras de voz y de ruido . 7 I.1 Consideraciones generales 7 I.2 Parmetros 7 I.3 Archivos de voz y de ruido de fondo 8 I.4 Filtros de entrada de voz y de ruido . 8 I.5 Ajuste de nivel de voz P.56 8 I.6 Ajuste de nivel de ruido bsico 8 Apndice II Ejemplo de instrucciones p
19、ara los participantes en la prueba. 9 Rec. UIT-T P.835 (11/2003) 1 Recomendacin UIT-T P.835 Metodologa de prueba subjetiva para evaluar los sistemas de comunicacin vocal que utilizan un algoritmo de cancelacin de ruido 1 Alcance Normalmente, los algoritmos de cancelacin de ruido (NSA, noise suppress
20、ion algorithms) se aplican a una forma de onda de voz con ruido con objeto de reducir la componente de ruido o el ruido de fondo sin afectar negativamente la componente de voz o de seal de la forma de onda. Por lo general, esto se consigue cuando el nivel de ruido que se desea suprimir es relativame
21、nte bajo. Sin embargo, cuando el nivel es ms alto, los NSA afectan negativamente la componente de voz y su efecto es mayor cuanto ms ruido se suprime: normalmente la degradacin de la componente de voz o de la seal es mayor cuanto ms componente de ruido o ruido de fondo se suprime. En este caso, es p
22、osible que las personas que llevan a cabo la evaluacin subjetiva no sepan qu responder al evaluar la “calidad“ global de las formas de onda: aunque quiz se haya reducido la componente de ruido de fondo en la forma de onda, la seal vocal puede haberse degradado en el proceso. En los mtodos de puntuac
23、in basados en una sola escala, por ejemplo la ACR (evaluacin por categoras absolutas), cada persona asigna un coeficiente de ponderacin a las componentes seal y ruido de fondo al puntuar la calidad de la voz global. Este proceso de ponderacin introduce una varianza del error adicional en las puntuac
24、iones subjetivas de la calidad global, lo que las hace menos fiables. La metodologa que se describe en esta Recomendacin reduce la incertidumbre del oyente dado que a ste se le exige que preste atencin y punte por separado cada componente de la forma de onda: la seal de voz, el ruido de fondo, y el
25、efecto global: voz + fondo. Esta metodologa ha demostrado ser fiable y vlida para la evaluacin de los NSA, y debera utilizarse en otras aplicaciones. Podra utilizarse siempre que se desee evaluar la voz en presencia de ruido de fondo. Su aplicacin es especialmente adecuada cuando no se sabe si el si
26、stema incluye un preprocesador de ruido. 2 Referencias Las siguientes Recomendaciones UIT-T y otras referencias contienen disposiciones que, mediante su referencia en este texto, constituyen disposiciones de la presente Recomendacin. Al efectuar esta publicacin, estaban en vigor las ediciones indica
27、das. Todas las Recomendaciones y otras referencias son objeto de revisiones por lo que se preconiza que los usuarios de esta Recomendacin investiguen la posibilidad de aplicar las ediciones ms recientes de las Recomendaciones y otras referencias citadas a continuacin. Se publica peridicamente una li
28、sta de las Recomendaciones UIT-T vigentes. En esta Recomendacin, la referencia a un documento en tanto que autnomo, no le otorga el rango de una Recomendacin. Recomendacin UIT-T G.191 (2000), Herramientas de soporte lgico para la normalizacin de la codificacin de seales vocales y de audio. Recomenda
29、cin UIT-T P.56 (1993), Medicin objetiva del nivel vocal activo. Recomendacin UIT-T P.800 (1996), Mtodos de determinacin subjetiva de la calidad de transmisin. Recomendacin UIT-T P.810 (1996), Aparato de referencia para ruido modulado. Recomendacin UIT-T P.830 (1996), Evaluacin subjetiva de la calida
30、d de funcionamiento de los cdecs digitales de banda telefnica y de banda ancha. 2 Rec. UIT-T P.835 (11/2003) 3 Definiciones En esta Recomendacin se define el trmino siguiente. 3.1 dBov: dB con respecto a la sobrecarga. 4 Acrnimos En esta Recomendacin se utilizan las siguientes siglas. ACR Evaluacin
31、por categoras absolutas (absolute category rating) ANOVA Anlisis de la varianza (analysis of variance) D/A Digital a analgico (digital-to-analogue) MANOVA Anlisis mltiple de la varianza (multiple analysis of variance) MOS Nota media de opinin (mean opinion score) NSA Algoritmo de cancelacin de ruido
32、 (noise suppression algorithm) RMS Valor cuadrtico medio (root mean square) SNR Relacin seal/ruido (signal-to-noise ratio) SPL Nivel de presin sonora (sound pressure level) 5 Diseo experimental 5.1 Material vocal 5.1.1 Material vocal fuente El material vocal que se utilice como fuente debe consistir
33、 en frases con sentido representativas del idioma en que se est realizando la prueba y debe constar de varias muestras de voz, tanto de hombre como de mujer. 5.1.2 Procesamiento Se deben aplicar los procedimientos de laboratorio normalizados para garantizar que las muestras de tipo voz y ruido proce
34、sadas se mezclan y filtran adecuadamente la Rec. UIT-T G.191 (Librera de herramientas de soporte lgico) y el apndice I. 5.1.3 Condiciones de referencia Las condiciones de referencia se seleccionarn para variar por separado las puntuaciones de la seal y del ruido de fondo en toda su gama de valores d
35、e escala. Por ejemplo, la voz en presencia de ruido de fondo debera variarse en dos dimensiones: variar la relacin seal/ruido (SNR, signal-to-noise ratio) para obtener diferentes puntuaciones de ruido de fondo, y variar el MNRU para obtener distintas puntuaciones de la seal. En la figura 1 se ilustr
36、a la independencia relativa de la nota asignada a la seal, y la correlacin existente entre la nota global y la del ruido de fondo, cuando se vara el MNRU manteniendo constante la SNR. En la figura 2 se ilustra la independencia relativa de la nota asignada al ruido de fondo, y la correlacin existente
37、 entre la nota global y la de la seal, cuando se vara la SNR manteniendo constante el MNRU. En la figura 3 se muestra que la combinacin de estas condiciones de referencia proporciona un contexto ntegro en este espacio preceptual de dos dimensiones (seal/ruido de fondo). Rec. UIT-T P.835 (11/2003) 3
38、P.835_F01SNR = 40 dB, MNRU vara12345816243240MNRU (dBQ)PuntuacinSealRuido de fondoSeal globalFigura 1/P.835 Condicin de referencia: SNR constante, MNRU vara P.835_F02MNRU = 40 dB, SNR vara12345010203040SNR (dB)PuntuacinSealRuido de fondoSeal globalFigura 2/P.835 Condicin de referencia: MNRU constant
39、e, SNR vara 4 Rec. UIT-T P.835 (11/2003) P.835_F03SNR y MNRU varan1234510/16SNR (dB)/MNRU (dBQ)PuntuacinSealRuido de fondoSeal global20/24 30/32 40/40Figura 3/P.835 Condicin de referencia: SNR y MNRU varan 5.1.4 Presentacin de las muestras de voz Cada prueba contiene una muestra de voz de tres frase
40、s dispuesta en el formato general ilustrado en el ejemplo de la figura 4. Cada muestra consta de tres submuestras, y despus de cada submuestra hay un periodo de silencio para emitir la votacin. En el ejemplo que se muestra en la figura, cada submuestra tiene una duracin aproximada de 4 s, de los cua
41、les hay 1 s en el que slo se escucha ruido de fondo, 2 s de voz + ruido y 1 s de ruido de fondo; despus de cada submuestra hay un intervalo de silencio para la votacin. En la prctica, las submuestras deben tener una duracin lo suficientemente larga para que las personas puedan emitir puntuaciones fi
42、ables. En las dos primeras submuestras los oyentes puntan la seal o el ruido de fondo, dependiendo del orden de los aspectos que se puntan especificado para esa prueba. Para la seal, se indica a las personas que presten atencin nicamente a la seal de voz y que la punten segn una escala de distorsin
43、de uno a cinco que se muestra en la figura 5. Para el ruido de fondo, se indica a las personas que presten atencin nicamente al ruido de fondo y que lo punten segn una escala de molestia de uno a cinco que se muestra en la figura 6. Para la tercera submuestra de cada prueba, se indica a las personas
44、 que presten atencin a la voz y al ruido de fondo y que punten segn una escala de calidad global de uno a cinco que se muestra en la figura 7; esta escala es igual a nota media de opinin (MOS, mean opinion score) que se utiliza en el ACR. Para que el orden de los aspectos que se puntan no afecte a l
45、a puntuacin, ste se variar a lo largo del experimento, es decir, la mitad de las pruebas se harn en el orden “seal, ruido de fondo, efecto global“ y la otra mitad “ruido de fondo, seal, efecto global“. Adems, el nmero total de pruebas para cada orden debe ser el mismo a lo largo de las series de esc
46、ucha. P.835_F04Frase 1Puntacinde la sealFrase 2Puntuacindel ruido defondoFrase 3Calidadglobal-Submuestra 1- Int. Vot. -Submuestra 2- Int. Vot. -Submuestra 3- Int. Vot.Figura 4/P.835 Ejemplo de la temporizacin del material vocal en una prueba P.835 NOTA 1 Los experimentos demuestran que la duracin de
47、 la secuencia puede ser de 4 segundos u 8 s, sin afectar a los resultados. La utilizacin de duraciones ms cortas reducen la duracin total de la prueba. Rec. UIT-T P.835 (11/2003) 5 NOTA 2 Los experimentos demuestran que las frases 1, 2 y 3 de la figura 4 pueden ser la misma en una secuencia completa
48、 o pueden ser diferentes. Este factor no influye en los resultados. 5.2 Sesin de escucha 5.2.1 Oyentes En las pruebas deben participar al menos 32 oyentes legos en la materia. Todos los oyentes tendrn como lengua materna el idioma utilizado en las pruebas y ninguno de ellos habr participado en un experimento de este tipo en los ltimos tres meses. 5.2.2 Presentacin del audio La presentacin del audio ser conforme con las directrices que figuran en la Rec. UIT-T P.800. Estas directrices tratan sobre los sistemas de escucha, los niveles de escucha, la duracin de las