1、 UNIN INTERNACIONAL DE TELECOMUNICACIONES UIT-T P.862SECTOR DE NORMALIZACIN DE LAS TELECOMUNICACIONES DE LA UIT (02/2001) SERIE P: CALIDAD DE TRANSMISIN TELEFNICA, INSTALACIONES TELEFNICAS Y REDES LOCALES Mtodos de evaluacin objetiva y subjetiva de la calidad Evaluacin de la calidad vocal por percep
2、cin: Un mtodo objetivo para la evaluacin de la calidad vocal de extremo a extremo de redes telefnicas de banda estrecha y cdecs vocales Recomendacin UIT-T P.862 (Anteriormente Recomendacin del CCITT) RECOMENDACIONES UIT-T DE LA SERIE P CALIDAD DE TRANSMISIN TELEFNICA, INSTALACIONES TELEFNICAS Y REDE
3、S LOCALES Vocabulario y efectos de los parmetros de transmisin sobre la opinin de los clientes Serie P.10 Lneas y aparatos de abonado Serie P.30 P.300 Patrones de transmisin Serie P.40 Aparatos para mediciones objetivas Serie P.50 P.500 Medidas electroacsticas objetivas Serie P.60 Medidas relativas
4、a la sonoridad vocal Serie P.70 Mtodos de evaluacin objetiva y subjetiva de la calidad Serie P.80 P.800 Calidad audiovisual en servicios multimedios Serie P.900 Para ms informacin, vase la Lista de Recomendaciones del UIT-T. UIT-T P.862 (02/2001) i Recomendacin UIT-T P.862 Evaluacin de la calidad vo
5、cal por percepcin: Un mtodo objetivo para la evaluacin de la calidad vocal de extremo a extremo de redes telefnicas de banda estrecha y cdecs vocales Resumen Esta Recomendacin describe un mtodo objetivo para predecir la calidad subjetiva de microtelfonos de 3,1 kHz (banda estrecha) y cdecs vocales d
6、e banda estrecha. Presenta una descripcin de alto nivel del mtodo, explica la forma de utilizar este mtodo y parte de los resultados de referencia obtenidos por la Comisin de Estudio 12 en el periodo 1999-2000. Se proporciona una implementacin de referencia escrita en el lenguaje de programacin ANSI
7、-C, descrita en el anexo A, en ficheros individuales, que es parte integrante de la Recomendacin. Asimismo, se especifica en el anexo A un procedimiento de prueba de conformidad, que permite al usuario validar como correcta una implementacin alternativa del modelo. En caso de discrepancias entre la
8、descripcin de alto nivel presentada en esta Recomendacin y la implementacin de referencia en ANSI-C, tiene precedencia la implementacin de referencia en ANSI-C. Esta Recomendacin incluye un fichero electrnico que contiene una implementacin de referencia en ANSI-C de evaluacin de la calidad vocal por
9、 percepcin y datos de pruebas de conformidad. Orgenes La Recomendacin UIT-T P.862, preparada por la Comisin de Estudio 12 (2001-2004) del UIT-T, fue aprobada por el procedimiento de la Resolucin 1 de la AMNT el 23 de febrero de 2001. ii UIT-T P.862 (02/2001) PREFACIO La UIT (Unin Internacional de Te
10、lecomunicaciones) es el organismo especializado de las Naciones Unidas en el campo de las telecomunicaciones. El UIT-T (Sector de Normalizacin de las Telecomunicaciones de la UIT) es un rgano permanente de la UIT. Este rgano estudia los aspectos tcnicos, de explotacin y tarifarios y publica Recomend
11、aciones sobre los mismos, con miras a la normalizacin de las telecomunica-ciones en el plano mundial. La Asamblea Mundial de Normalizacin de las Telecomunicaciones (AMNT), que se celebra cada cuatro aos, establece los temas que han de estudiar las Comisiones de Estudio del UIT-T, que a su vez produc
12、en Recomendaciones sobre dichos temas. La aprobacin de Recomendaciones por los Miembros del UIT-T es el objeto del procedimiento establecido en la Resolucin 1 de la AMNT. En ciertos sectores de la tecnologa de la informacin que corresponden a la esfera de competencia del UIT-T, se preparan las norma
13、s necesarias en colaboracin con la ISO y la CEI. NOTA En esta Recomendacin, la expresin “Administracin“ se utiliza para designar, en forma abreviada, tanto una administracin de telecomunicaciones como una empresa de explotacin reconocida de telecomunicaciones. PROPIEDAD INTELECTUAL La UIT seala a la
14、 atencin la posibilidad de que la utilizacin o aplicacin de la presente Recomendacin suponga el empleo de un derecho de propiedad intelectual reivindicado. La UIT no adopta ninguna posicin en cuanto a la demostracin, validez o aplicabilidad de los derechos de propiedad intelectual reivindicados, ya
15、sea por los miembros de la UIT o por terceros ajenos al proceso de elaboracin de Recomendaciones. En la fecha de aprobacin de la presente Recomendacin, la UIT ha recibido notificacin de propiedad intelectual, protegida por patente, que puede ser necesaria para aplicar esta Recomendacin. Sin embargo,
16、 debe sealarse a los usuarios que puede que esta informacin no se encuentre totalmente actualizada al respecto, por lo que se les insta encarecidamente a consultar la base de datos sobre patentes de la TSB. UIT 2001 Es propiedad. Ninguna parte de esta publicacin puede reproducirse o utilizarse, de n
17、inguna forma o por ningn medio, sea ste electrnico o mecnico, de fotocopia o de microfilm, sin previa autorizacin escrita por parte de la UIT. UIT-T P.862 (02/2001) iii NDICE Pgina 1 Introduccin 1 2 Referencias normativas 1 3 Abreviaturas . 2 4 Alcance . 2 5 Convenios . 4 6 Visin general de PESQ . 5
18、 7 Comparacin de notas objetivas con notas subjetivas 6 7.1 Coeficiente de correlacin 7 7.2 Errores residuales . 7 8 Preparacin de material vocal procesado . 7 8.1 Material fuente 8 8.1.1 Eleccin del material fuente 8 8.1.2 Estructura temporal y duracin del material fuente 8 8.1.3 Filtrado y calibra
19、cin de nivel. 9 8.2 Adicin de ruido de fondo 9 8.3 Procesamiento a travs del sistema sometido a prueba 9 9 Seleccin de los parmetros experimentales 10 10 Descripcin del algoritmo PESQ 10 10.1 Procesamiento previo de la alineacin de nivel y tiempo (figura 3) 14 10.1.1 Clculo de la ganancia total del
20、sistema. 14 10.1.2 Filtrado IRS. 14 10.1.3 Alineacin de tiempo 15 10.2 Modelo por percepcin (figuras 4a y 4b) . 16 10.2.1 Clculo previo de los valores atribuidos a las constantes . 16 10.2.2 Filtrado IRS en recepcin 17 10.2.3 Clculo del intervalo de tiempo de habla activo . 17 10.2.4 Transformada rp
21、ida de Fourier a corto plazo 17 10.2.5 Clculo de las densidades de potencia de la altura del sonido 18 10.2.6 Compensacin parcial de la densidad de potencia de la altura del sonido inicial para la ecualizacin de la funcin de transferencia 18 10.2.7 Compensacin parcial de la densidad de potencia de l
22、a altura del sonido distorsionada para tener en cuenta variaciones de la ganancia en funcin del tiempo entre la seal inicial y la distorsionada 18 10.2.8 Clculo de las densidades de sonoridad 18 10.2.9 Clculo de la densidad de perturbacin. 19 iv UIT-T P.862 (02/2001) Pgina 10.2.10 Multiplicacin clul
23、a a clula por un factor de asimetra . 19 10.2.11 Suma de las densidades de perturbacin en funcin de la frecuencia y acentuacin sobre las partes dbiles de la seal inicial. 20 10.2.12 Puesta a cero de la perturbacin de trama en las tramas durante las cuales el retardo aument apreciablemente 20 10.2.13
24、 Realineacin de intervalos malos 20 10.2.14 Suma de la perturbacin dentro de los intervalos de fraccin de segundo 20 10.2.15 Suma de la perturbacin por la duracin de la seal vocal (unos 10 s), incluido un factor de hecho reciente . 21 10.2.16 Clculo de la nota PESQ . 21 Anexo A Implementacin de refe
25、rencia de PESQ y pruebas de conformidad. 21 Fichero electrnico adjunto: Implementacin de referencia en ANSI-C de evaluacin de la calidad local por percepcin y datos de pruebas de conformidad UIT-T P.862 (02/2001) 1 Recomendacin UIT-T P.862 Evaluacin de la calidad vocal por percepcin: Un mtodo objeti
26、vo para la evaluacin de la calidad vocal de extremo a extremo de redes telefnicas de banda estrecha y cdecs vocales11 Introduccin El mtodo objetivo descrito en esta Recomendacin se conoce por “evaluacin de la calidad vocal por percepcin“ (PESQ, perceptual evaluation of evaluation of speech quality).
27、 Es el resultado de varios aos de trabajos de desarrollo y es aplicable no slo a los cdecs vocales sino tambin a las mediciones de extremo a extremo. Los sistemas reales pueden incluir filtrado y retardo variable, as como distorsiones debidas a errores de canal y a cdecs de baja velocidad binaria. E
28、l mtodo medida de la calidad vocal por percepcin (PSQM, perceptual speech quality measure), descrito en UIT-T P.861 (febrero de 1998), slo se recomend para uso en la evaluacin de cdecs vocales, y no pudo tener debidamente en cuenta el filtrado, el retardo variable y las distorsiones cortas localizad
29、as. El mtodo PESQ trata estos efectos mediante la ecualizacin de la funcin de transferencia, la alineacin de tiempo y un nuevo algoritmo para promediar distorsiones en funcin del tiempo. La validacin de PESQ inclua un nmero de experimentos que probaban especficamente su calidad de funcionamiento par
30、a combinaciones de factores tales como filtrado, retardo variable, distorsiones de codificacin y errores de canal. Se recomienda que el mtodo PESQ se utilice para la evaluacin de la calidad vocal de microtelfonos de 3,1 kHz (banda estrecha) y cdecs vocales de banda estrecha. 2 Referencias normativas
31、 Las siguientes Recomendaciones del UIT-T y otras referencias contienen disposiciones que, mediante su referencia en este texto, constituyen disposiciones de la presente Recomendacin. Al efectuar esta publicacin, estaban en vigor las ediciones indicadas. Todas las Recomendaciones y otras referencias
32、 son objeto de revisiones, por lo que se preconiza que los usuarios de esta Recomendacin investiguen la posibilidad de aplicar las ediciones ms recientes de las Recomendaciones y otras referencias citadas a continuacin. Se publica peridicamente una lista de las Recomendaciones UIT-T actualmente vige
33、ntes. UIT-T P.800 (1996), Mtodos de determinacin subjetiva de la calidad de transmisin. UIT-T P.810 (1996), Aparato de referencia para ruido modulado. UIT-T P.830 (1996), Evaluacin subjetiva de la calidad de funcionamiento de los cdecs digitales de banda telefnica y de banda ancha. UIT-T serie P Sup
34、lemento 23 (1998), Bases de datos del UIT-T de voces codificadas. _ 1Esta Recomendacin incluye un fichero electrnico que contiene una implementacin de referencia en ANSI-C de evaluacin de la calidad vocal por percepcin y datos de pruebas de conformidad. 2 UIT-T P.862 (02/2001) 3 Abreviaturas En esta
35、 Recomendacin se utilizan las siguientes siglas. ACR Evaluacin por categoras absolutas (absolute category rating) CELP Prediccin lineal con excitacin por cdigo (code excited linear prediction) DMOS Nota media de opinin sobre las degradaciones (degradation mean opinion score) HATS Simulador de cabeza
36、 y torso (head and torso simulator) IRS Sistema intermedio de referencia (intermediate reference system) LQ Calidad de escucha (listening quality) MIC Modulacin por impulsos codificados MOS Nota media de opinin (mean opinion score) PESQ Evaluacin de la calidad vocal por percepcin (perceptual evaluat
37、ion of speech quality) PSQM Medida de la calidad vocal por percepcin (perceptual speech quality measure) 4 Alcance Sobre la base de los resultados de referencia presentados en el seno de la Comisin de Estudio 12 se ofrece, en los cuadros 1 a 3, una sinopsis de los factores de prueba, tecnologas de c
38、odificacin y aplicaciones en que se utiliza esta Recomendacin. El cuadro 1 presenta las relaciones de los factores de prueba, tecnologas de codificacin y aplicaciones para las que se ha encontrado que el mtodo especificado en esta Recomendacin ofrece una exactitud aceptable. El cuadro 2 presenta una
39、 lista de condiciones para las cuales, o bien se sabe que el mtodo especificado en la Recomendacin da predicciones inexactas, o no se tiene el propsito de utilizarlo por otro motivo. El cuadro 3 indica los factores, tecnologas y aplicaciones para las cuales el mtodo PESQ no ha sido evaluado todava.
40、Aunque las correlaciones entre las notas objetivas y las subjetivas en los resultados de referencia giraron en torno a 0,935 para los datos conocidos y los desconocidos, el algoritmo PESQ no puede emplearse para remplazar pruebas subjetivas. Debe observarse tambin que el algoritmo PESQ no proporcion
41、a una evaluacin exhaustiva de la calidad de transmisin. Mide solamente los efectos del ruido y la distorsin de voz unidireccionales sobre la calidad vocal. Los efectos de prdida de sonoridad, retardo, efecto local, eco y otros factores de degradacin relacionados con la interaccin bidireccional (por
42、ejemplo, recorte en el centro) no se reflejan en las notas PESQ. Por lo tanto, es posible tener notas PESQ altas aunque la calidad de la conexin global sea pobre. Cuadro 1/P.862 Factores para los cuales se ha demostrado que PESQ tiene una exactitud aceptable Factores de prueba Niveles de entrada de
43、la seal vocal a un cdec Errores del canal de transmisin Prdida de paquetes y ocultacin de la prdida de paquetes con cdecs CELP Velocidades binarias, si un cdec tiene ms de un modo de velocidad binaria Transcodificaciones UIT-T P.862 (02/2001) 3 Cuadro 1/P.862 Factores para los cuales se ha demostrad
44、o que PESQ tiene una exactitud aceptable (fin) Factores de prueba Ruido ambiental en el lado emisor (vase la nota) Efecto de la variacin del retardo en las pruebas de slo escucha Alabeo de la seal de audio en funcin del tiempo, a corto plazo Alabeo de la seal de audio en funcin del tiempo, a largo p
45、lazo Tecnologas de codificacin Cdecs de forma de onda, por ejemplo, G.711; G.726; G.727 CELP y cdecs hbridos 4 kbit/s, por ejemplo, G.728, G.729, G.723.1 Otros cdecs: GSM-FR, GSM-HR, GSM-EFR, GSM-AMR, CDMA-EVRC, TDMA-ACELP, TDMA-VSELP, TETRA Aplicaciones Evaluacin de cdec Seleccin de cdec Prueba de
46、red en vivo mediante una conexin digital o analgica a la red Pruebas de redes emuladas y de redes prototipo NOTA En presencia de ruido ambiental, la calidad puede medirse aplicando a PESQ la seal inicial limpia sin ruido, y la seal degradada con ruido. Cuadro 2/P.862 Se sabe que PESQ da predicciones
47、 inexactas cuando se usa en combinacin con estas variables, o no se tiene el propsito de utilizarlo con estas variables por otros motivos Factores de prueba (vase la nota) Prdida de sonoridad Efecto del retardo en pruebas conversacionales Eco para la persona que habla Efecto local Tecnologas de codi
48、ficacin Reemplazo, por silencio, de secciones continuas de la seal vocal que representan ms del 25% de la seal vocal activa (recorte temporal extremo) Aplicaciones Dispositivos de medicin en servicio no intrusivos Calidad de funcionamiento de comunicaciones bidireccionales NOTA PESQ presupone un nivel de escucha estndar de 79 dB SPL y compensa los niveles de seal no ptimos en los ficheros de entrada. Por lo tanto, no se tiene en cuenta el efecto subjetivo de la desviacin con respecto al nivel de escucha ptimo. 4 UIT-T P.862 (02/2001) Cuadro 3/P.862 (