ITU-T P 862 SPANISH-2001 Perceptual evaluation of speech quality (PESQ) An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech co.pdf

上传人:outsidejudge265 文档编号:800693 上传时间:2019-02-04 格式:PDF 页数:32 大小:318.63KB
下载 相关 举报
ITU-T P 862 SPANISH-2001 Perceptual evaluation of speech quality (PESQ) An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech co.pdf_第1页
第1页 / 共32页
ITU-T P 862 SPANISH-2001 Perceptual evaluation of speech quality (PESQ) An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech co.pdf_第2页
第2页 / 共32页
ITU-T P 862 SPANISH-2001 Perceptual evaluation of speech quality (PESQ) An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech co.pdf_第3页
第3页 / 共32页
ITU-T P 862 SPANISH-2001 Perceptual evaluation of speech quality (PESQ) An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech co.pdf_第4页
第4页 / 共32页
ITU-T P 862 SPANISH-2001 Perceptual evaluation of speech quality (PESQ) An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech co.pdf_第5页
第5页 / 共32页
点击查看更多>>
资源描述

1、 UNIN INTERNACIONAL DE TELECOMUNICACIONES UIT-T P.862SECTOR DE NORMALIZACIN DE LAS TELECOMUNICACIONES DE LA UIT (02/2001) SERIE P: CALIDAD DE TRANSMISIN TELEFNICA, INSTALACIONES TELEFNICAS Y REDES LOCALES Mtodos de evaluacin objetiva y subjetiva de la calidad Evaluacin de la calidad vocal por percep

2、cin: Un mtodo objetivo para la evaluacin de la calidad vocal de extremo a extremo de redes telefnicas de banda estrecha y cdecs vocales Recomendacin UIT-T P.862 (Anteriormente Recomendacin del CCITT) RECOMENDACIONES UIT-T DE LA SERIE P CALIDAD DE TRANSMISIN TELEFNICA, INSTALACIONES TELEFNICAS Y REDE

3、S LOCALES Vocabulario y efectos de los parmetros de transmisin sobre la opinin de los clientes Serie P.10 Lneas y aparatos de abonado Serie P.30 P.300 Patrones de transmisin Serie P.40 Aparatos para mediciones objetivas Serie P.50 P.500 Medidas electroacsticas objetivas Serie P.60 Medidas relativas

4、a la sonoridad vocal Serie P.70 Mtodos de evaluacin objetiva y subjetiva de la calidad Serie P.80 P.800 Calidad audiovisual en servicios multimedios Serie P.900 Para ms informacin, vase la Lista de Recomendaciones del UIT-T. UIT-T P.862 (02/2001) i Recomendacin UIT-T P.862 Evaluacin de la calidad vo

5、cal por percepcin: Un mtodo objetivo para la evaluacin de la calidad vocal de extremo a extremo de redes telefnicas de banda estrecha y cdecs vocales Resumen Esta Recomendacin describe un mtodo objetivo para predecir la calidad subjetiva de microtelfonos de 3,1 kHz (banda estrecha) y cdecs vocales d

6、e banda estrecha. Presenta una descripcin de alto nivel del mtodo, explica la forma de utilizar este mtodo y parte de los resultados de referencia obtenidos por la Comisin de Estudio 12 en el periodo 1999-2000. Se proporciona una implementacin de referencia escrita en el lenguaje de programacin ANSI

7、-C, descrita en el anexo A, en ficheros individuales, que es parte integrante de la Recomendacin. Asimismo, se especifica en el anexo A un procedimiento de prueba de conformidad, que permite al usuario validar como correcta una implementacin alternativa del modelo. En caso de discrepancias entre la

8、descripcin de alto nivel presentada en esta Recomendacin y la implementacin de referencia en ANSI-C, tiene precedencia la implementacin de referencia en ANSI-C. Esta Recomendacin incluye un fichero electrnico que contiene una implementacin de referencia en ANSI-C de evaluacin de la calidad vocal por

9、 percepcin y datos de pruebas de conformidad. Orgenes La Recomendacin UIT-T P.862, preparada por la Comisin de Estudio 12 (2001-2004) del UIT-T, fue aprobada por el procedimiento de la Resolucin 1 de la AMNT el 23 de febrero de 2001. ii UIT-T P.862 (02/2001) PREFACIO La UIT (Unin Internacional de Te

10、lecomunicaciones) es el organismo especializado de las Naciones Unidas en el campo de las telecomunicaciones. El UIT-T (Sector de Normalizacin de las Telecomunicaciones de la UIT) es un rgano permanente de la UIT. Este rgano estudia los aspectos tcnicos, de explotacin y tarifarios y publica Recomend

11、aciones sobre los mismos, con miras a la normalizacin de las telecomunica-ciones en el plano mundial. La Asamblea Mundial de Normalizacin de las Telecomunicaciones (AMNT), que se celebra cada cuatro aos, establece los temas que han de estudiar las Comisiones de Estudio del UIT-T, que a su vez produc

12、en Recomendaciones sobre dichos temas. La aprobacin de Recomendaciones por los Miembros del UIT-T es el objeto del procedimiento establecido en la Resolucin 1 de la AMNT. En ciertos sectores de la tecnologa de la informacin que corresponden a la esfera de competencia del UIT-T, se preparan las norma

13、s necesarias en colaboracin con la ISO y la CEI. NOTA En esta Recomendacin, la expresin “Administracin“ se utiliza para designar, en forma abreviada, tanto una administracin de telecomunicaciones como una empresa de explotacin reconocida de telecomunicaciones. PROPIEDAD INTELECTUAL La UIT seala a la

14、 atencin la posibilidad de que la utilizacin o aplicacin de la presente Recomendacin suponga el empleo de un derecho de propiedad intelectual reivindicado. La UIT no adopta ninguna posicin en cuanto a la demostracin, validez o aplicabilidad de los derechos de propiedad intelectual reivindicados, ya

15、sea por los miembros de la UIT o por terceros ajenos al proceso de elaboracin de Recomendaciones. En la fecha de aprobacin de la presente Recomendacin, la UIT ha recibido notificacin de propiedad intelectual, protegida por patente, que puede ser necesaria para aplicar esta Recomendacin. Sin embargo,

16、 debe sealarse a los usuarios que puede que esta informacin no se encuentre totalmente actualizada al respecto, por lo que se les insta encarecidamente a consultar la base de datos sobre patentes de la TSB. UIT 2001 Es propiedad. Ninguna parte de esta publicacin puede reproducirse o utilizarse, de n

17、inguna forma o por ningn medio, sea ste electrnico o mecnico, de fotocopia o de microfilm, sin previa autorizacin escrita por parte de la UIT. UIT-T P.862 (02/2001) iii NDICE Pgina 1 Introduccin 1 2 Referencias normativas 1 3 Abreviaturas . 2 4 Alcance . 2 5 Convenios . 4 6 Visin general de PESQ . 5

18、 7 Comparacin de notas objetivas con notas subjetivas 6 7.1 Coeficiente de correlacin 7 7.2 Errores residuales . 7 8 Preparacin de material vocal procesado . 7 8.1 Material fuente 8 8.1.1 Eleccin del material fuente 8 8.1.2 Estructura temporal y duracin del material fuente 8 8.1.3 Filtrado y calibra

19、cin de nivel. 9 8.2 Adicin de ruido de fondo 9 8.3 Procesamiento a travs del sistema sometido a prueba 9 9 Seleccin de los parmetros experimentales 10 10 Descripcin del algoritmo PESQ 10 10.1 Procesamiento previo de la alineacin de nivel y tiempo (figura 3) 14 10.1.1 Clculo de la ganancia total del

20、sistema. 14 10.1.2 Filtrado IRS. 14 10.1.3 Alineacin de tiempo 15 10.2 Modelo por percepcin (figuras 4a y 4b) . 16 10.2.1 Clculo previo de los valores atribuidos a las constantes . 16 10.2.2 Filtrado IRS en recepcin 17 10.2.3 Clculo del intervalo de tiempo de habla activo . 17 10.2.4 Transformada rp

21、ida de Fourier a corto plazo 17 10.2.5 Clculo de las densidades de potencia de la altura del sonido 18 10.2.6 Compensacin parcial de la densidad de potencia de la altura del sonido inicial para la ecualizacin de la funcin de transferencia 18 10.2.7 Compensacin parcial de la densidad de potencia de l

22、a altura del sonido distorsionada para tener en cuenta variaciones de la ganancia en funcin del tiempo entre la seal inicial y la distorsionada 18 10.2.8 Clculo de las densidades de sonoridad 18 10.2.9 Clculo de la densidad de perturbacin. 19 iv UIT-T P.862 (02/2001) Pgina 10.2.10 Multiplicacin clul

23、a a clula por un factor de asimetra . 19 10.2.11 Suma de las densidades de perturbacin en funcin de la frecuencia y acentuacin sobre las partes dbiles de la seal inicial. 20 10.2.12 Puesta a cero de la perturbacin de trama en las tramas durante las cuales el retardo aument apreciablemente 20 10.2.13

24、 Realineacin de intervalos malos 20 10.2.14 Suma de la perturbacin dentro de los intervalos de fraccin de segundo 20 10.2.15 Suma de la perturbacin por la duracin de la seal vocal (unos 10 s), incluido un factor de hecho reciente . 21 10.2.16 Clculo de la nota PESQ . 21 Anexo A Implementacin de refe

25、rencia de PESQ y pruebas de conformidad. 21 Fichero electrnico adjunto: Implementacin de referencia en ANSI-C de evaluacin de la calidad local por percepcin y datos de pruebas de conformidad UIT-T P.862 (02/2001) 1 Recomendacin UIT-T P.862 Evaluacin de la calidad vocal por percepcin: Un mtodo objeti

26、vo para la evaluacin de la calidad vocal de extremo a extremo de redes telefnicas de banda estrecha y cdecs vocales11 Introduccin El mtodo objetivo descrito en esta Recomendacin se conoce por “evaluacin de la calidad vocal por percepcin“ (PESQ, perceptual evaluation of evaluation of speech quality).

27、 Es el resultado de varios aos de trabajos de desarrollo y es aplicable no slo a los cdecs vocales sino tambin a las mediciones de extremo a extremo. Los sistemas reales pueden incluir filtrado y retardo variable, as como distorsiones debidas a errores de canal y a cdecs de baja velocidad binaria. E

28、l mtodo medida de la calidad vocal por percepcin (PSQM, perceptual speech quality measure), descrito en UIT-T P.861 (febrero de 1998), slo se recomend para uso en la evaluacin de cdecs vocales, y no pudo tener debidamente en cuenta el filtrado, el retardo variable y las distorsiones cortas localizad

29、as. El mtodo PESQ trata estos efectos mediante la ecualizacin de la funcin de transferencia, la alineacin de tiempo y un nuevo algoritmo para promediar distorsiones en funcin del tiempo. La validacin de PESQ inclua un nmero de experimentos que probaban especficamente su calidad de funcionamiento par

30、a combinaciones de factores tales como filtrado, retardo variable, distorsiones de codificacin y errores de canal. Se recomienda que el mtodo PESQ se utilice para la evaluacin de la calidad vocal de microtelfonos de 3,1 kHz (banda estrecha) y cdecs vocales de banda estrecha. 2 Referencias normativas

31、 Las siguientes Recomendaciones del UIT-T y otras referencias contienen disposiciones que, mediante su referencia en este texto, constituyen disposiciones de la presente Recomendacin. Al efectuar esta publicacin, estaban en vigor las ediciones indicadas. Todas las Recomendaciones y otras referencias

32、 son objeto de revisiones, por lo que se preconiza que los usuarios de esta Recomendacin investiguen la posibilidad de aplicar las ediciones ms recientes de las Recomendaciones y otras referencias citadas a continuacin. Se publica peridicamente una lista de las Recomendaciones UIT-T actualmente vige

33、ntes. UIT-T P.800 (1996), Mtodos de determinacin subjetiva de la calidad de transmisin. UIT-T P.810 (1996), Aparato de referencia para ruido modulado. UIT-T P.830 (1996), Evaluacin subjetiva de la calidad de funcionamiento de los cdecs digitales de banda telefnica y de banda ancha. UIT-T serie P Sup

34、lemento 23 (1998), Bases de datos del UIT-T de voces codificadas. _ 1Esta Recomendacin incluye un fichero electrnico que contiene una implementacin de referencia en ANSI-C de evaluacin de la calidad vocal por percepcin y datos de pruebas de conformidad. 2 UIT-T P.862 (02/2001) 3 Abreviaturas En esta

35、 Recomendacin se utilizan las siguientes siglas. ACR Evaluacin por categoras absolutas (absolute category rating) CELP Prediccin lineal con excitacin por cdigo (code excited linear prediction) DMOS Nota media de opinin sobre las degradaciones (degradation mean opinion score) HATS Simulador de cabeza

36、 y torso (head and torso simulator) IRS Sistema intermedio de referencia (intermediate reference system) LQ Calidad de escucha (listening quality) MIC Modulacin por impulsos codificados MOS Nota media de opinin (mean opinion score) PESQ Evaluacin de la calidad vocal por percepcin (perceptual evaluat

37、ion of speech quality) PSQM Medida de la calidad vocal por percepcin (perceptual speech quality measure) 4 Alcance Sobre la base de los resultados de referencia presentados en el seno de la Comisin de Estudio 12 se ofrece, en los cuadros 1 a 3, una sinopsis de los factores de prueba, tecnologas de c

38、odificacin y aplicaciones en que se utiliza esta Recomendacin. El cuadro 1 presenta las relaciones de los factores de prueba, tecnologas de codificacin y aplicaciones para las que se ha encontrado que el mtodo especificado en esta Recomendacin ofrece una exactitud aceptable. El cuadro 2 presenta una

39、 lista de condiciones para las cuales, o bien se sabe que el mtodo especificado en la Recomendacin da predicciones inexactas, o no se tiene el propsito de utilizarlo por otro motivo. El cuadro 3 indica los factores, tecnologas y aplicaciones para las cuales el mtodo PESQ no ha sido evaluado todava.

40、Aunque las correlaciones entre las notas objetivas y las subjetivas en los resultados de referencia giraron en torno a 0,935 para los datos conocidos y los desconocidos, el algoritmo PESQ no puede emplearse para remplazar pruebas subjetivas. Debe observarse tambin que el algoritmo PESQ no proporcion

41、a una evaluacin exhaustiva de la calidad de transmisin. Mide solamente los efectos del ruido y la distorsin de voz unidireccionales sobre la calidad vocal. Los efectos de prdida de sonoridad, retardo, efecto local, eco y otros factores de degradacin relacionados con la interaccin bidireccional (por

42、ejemplo, recorte en el centro) no se reflejan en las notas PESQ. Por lo tanto, es posible tener notas PESQ altas aunque la calidad de la conexin global sea pobre. Cuadro 1/P.862 Factores para los cuales se ha demostrado que PESQ tiene una exactitud aceptable Factores de prueba Niveles de entrada de

43、la seal vocal a un cdec Errores del canal de transmisin Prdida de paquetes y ocultacin de la prdida de paquetes con cdecs CELP Velocidades binarias, si un cdec tiene ms de un modo de velocidad binaria Transcodificaciones UIT-T P.862 (02/2001) 3 Cuadro 1/P.862 Factores para los cuales se ha demostrad

44、o que PESQ tiene una exactitud aceptable (fin) Factores de prueba Ruido ambiental en el lado emisor (vase la nota) Efecto de la variacin del retardo en las pruebas de slo escucha Alabeo de la seal de audio en funcin del tiempo, a corto plazo Alabeo de la seal de audio en funcin del tiempo, a largo p

45、lazo Tecnologas de codificacin Cdecs de forma de onda, por ejemplo, G.711; G.726; G.727 CELP y cdecs hbridos 4 kbit/s, por ejemplo, G.728, G.729, G.723.1 Otros cdecs: GSM-FR, GSM-HR, GSM-EFR, GSM-AMR, CDMA-EVRC, TDMA-ACELP, TDMA-VSELP, TETRA Aplicaciones Evaluacin de cdec Seleccin de cdec Prueba de

46、red en vivo mediante una conexin digital o analgica a la red Pruebas de redes emuladas y de redes prototipo NOTA En presencia de ruido ambiental, la calidad puede medirse aplicando a PESQ la seal inicial limpia sin ruido, y la seal degradada con ruido. Cuadro 2/P.862 Se sabe que PESQ da predicciones

47、 inexactas cuando se usa en combinacin con estas variables, o no se tiene el propsito de utilizarlo con estas variables por otros motivos Factores de prueba (vase la nota) Prdida de sonoridad Efecto del retardo en pruebas conversacionales Eco para la persona que habla Efecto local Tecnologas de codi

48、ficacin Reemplazo, por silencio, de secciones continuas de la seal vocal que representan ms del 25% de la seal vocal activa (recorte temporal extremo) Aplicaciones Dispositivos de medicin en servicio no intrusivos Calidad de funcionamiento de comunicaciones bidireccionales NOTA PESQ presupone un nivel de escucha estndar de 79 dB SPL y compensa los niveles de seal no ptimos en los ficheros de entrada. Por lo tanto, no se tiene en cuenta el efecto subjetivo de la desviacin con respecto al nivel de escucha ptimo. 4 UIT-T P.862 (02/2001) Cuadro 3/P.862 (

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国际标准 > 其他

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1