1、 UNIN INTERNACIONAL DE TELECOMUNICACIONES SECTOR DE NORMALIZACIN DE LAS TELECOMUNICACIONES DE LA UIT (09/99) SERIE G: SISTEMAS Y MEDIOS DE TRANSMISIN, SISTEMAS Y REDES DIGITALES Sistemas de transmisin digital Equipos terminales Codificacin de seales analgicas mediante modulacin por impulsos codifica
2、dos (MIC) Recomendacin UIT-T G.711 Apndice I (Anteriormente Recomendacin del CCITT) RECOMENDACIONES UIT-T DE LA SERIE G SISTEMAS Y MEDIOS DE TRANSMISIN, SISTEMAS Y REDES DIGITALES Para ms informacin, vase la Lista de Recomendaciones del UIT-T.CONEXIONES Y CIRCUITOS TELEFNICOS INTERNACIONALES G.100G.
3、199 SISTEMAS INTERNACIONALES ANALGICOS DE PORTADORAS CARACTERSTICAS GENERALES COMUNES A TODOS LOS SISTEMAS ANALGICOS DE PORTADORAS G.200G.299 CARACTERSTICAS INDIVIDUALES DE LOS SISTEMAS TELEFNICOS INTERNACIONALES DE PORTADORAS EN LNEAS METLICAS G.300G.399 CARACTERSTICAS GENERALES DE LOS SISTEMAS TEL
4、EFNICOS INTERNACIONALES EN RADIOENLACES O POR SATLITE E INTERCONEXIN CON LOS SISTEMAS EN LNEAS METLICAS G.400G.449 COORDINACIN DE LA RADIOTELEFONA Y LA TELEFONA EN LNEA G.450G.499 EQUIPOS DE PRUEBAS CARACTERSTICAS DE LOS MEDIOS DE TRANSMISIN SISTEMAS DE TRANSMISIN DIGITAL EQUIPOS TERMINALES G.700G.7
5、99 Generalidades G.700G.709 Codificacin de seales analgicas mediante modulacin por impulsos codificados (MIC) G.710G.719 Codificacin de seales analgicas mediante mtodos diferentes de la MIC G.720G.729 Caractersticas principales de los equipos mltiplex primarios G.730G.739 Caractersticas principales
6、de los equipos mltiplex de segundo orden G.740G.749 Caractersticas principales de los equipos mltiplex de orden superior G.750G.759 Caractersticas principales de los transcodificadores y de los equipos de multiplicacin de circuitos digitales G.760G.769 Caractersticas de operacin, administracin y man
7、tenimiento de los equipos de transmisin G.770G.779 Caractersticas principales de los equipos mltiplex de la jerarqua digital sncrona G.780G.789 Otros equipos terminales G.790G.799 REDES DIGITALES G.800G.899 SECCIONES DIGITALES Y SISTEMAS DIGITALES DE LNEA G.900G.999 Recomendacin G.711/apndice I (09/
8、99) i RECOMENDACIN UIT-T G.711 MODULACIN POR IMPULSOS CODIFICADOS DE FRECUENCIAS VOCALES APNDICE I Algoritmo de baja complejidad y alta calidad para el ocultamiento de prdida de paquetes con la Recomendacin G.711 Resumen Los algoritmos de ocultamiento de prdida de paquetes (PLC), conocidos tambin co
9、mo algoritmos de ocultamiento de borraduras de tramas, ocultan prdidas de transmisin en un sistema audio cuando la seal de entrada es codificada y empaquetada en el transmisor, enviada por una red y recibida en el receptor que decodifica el paquete y reproduce la salida. Muchos de los codificadores
10、vocales basados en la prediccin lineal con excitacin por cdigo (CELP), tienen algoritmos PLC incorporados en sus normas. El algoritmo descrito en este apndice proporciona un mtodo para la Recomendacin G.711. Orgenes El apndice I a la Recomendacin UIT-T G.711 ha sido preparado por la Comisin de Estud
11、io 16 (1997-2000) del UIT-T y fue aprobado por el procedimiento de la Resolucin N. 1 de la CMNT el 30 de septiembre de 1999. ii Recomendacin G.711/apndice I (09/99) PREFACIO La UIT (Unin Internacional de Telecomunicaciones) es el organismo especializado de las Naciones Unidas en el campo de las tele
12、comunicaciones. El UIT-T (Sector de Normalizacin de las Telecomunicaciones de la UIT) es un rgano permanente de la UIT. Este rgano estudia los aspectos tcnicos, de explotacin y tarifarios y publica Recomendaciones sobre los mismos, con miras a la normalizacin de las telecomunicaciones en el plano mu
13、ndial. La Conferencia Mundial de Normalizacin de las Telecomunicaciones (CMNT), que se celebra cada cuatro aos, establece los temas que han de estudiar las Comisiones de Estudio del UIT-T, que a su vez producen Recomendaciones sobre dichos temas. La aprobacin de Recomendaciones por los Miembros del
14、UIT-T es el objeto del procedimiento establecido en la Resolucin N. 1 de la CMNT. En ciertos sectores de la tecnologa de la informacin que corresponden a la esfera de competencia del UIT-T, se preparan las normas necesarias en colaboracin con la ISO y la CEI. NOTA En esta Recomendacin, la expresin e
15、mpresa de explotacin reconocida (EER) designa a toda persona, compaa, empresa u organizacin gubernamental que explote un servicio de correspondencia pblica. Los trminos Administracin, EER y correspondencia pblica estn definidos en la Constitucin de la UIT (Ginebra, 1992). PROPIEDAD INTELECTUAL La UI
16、T seala a la atencin la posibilidad de que la utilizacin o aplicacin de la presente Recomendacin suponga el empleo de un derecho de propiedad intelectual reivindicado. La UIT no adopta ninguna posicin en cuanto a la demostracin, validez o aplicabilidad de los derechos de propiedad intelectual reivin
17、dicados, ya sea por los miembros de la UIT o por terceros ajenos al proceso de elaboracin de Recomendaciones. En la fecha de aprobacin de la presente Recomendacin, la UIT no ha recibido notificacin de propiedad intelectual, protegida por patente, que puede ser necesaria para aplicar esta Recomendaci
18、n. Sin embargo, debe sealarse a los usuarios que puede que esta informacin no se encuentre totalmente actualizada al respecto, por lo que se les insta encarecidamente a consultar la base de datos sobre patentes de la TSB. UIT 2000 Es propiedad. Ninguna parte de esta publicacin puede reproducirse o u
19、tilizarse, de ninguna forma o por ningn medio, sea ste electrnico o mecnico, de fotocopia o de microfilm, sin previa autorizacin escrita por parte de la UIT. Recomendacin G.711/apndice I (09/99) iii NDICE Pgina Apndice I Algoritmo de baja complejidad y alta calidad para el ocultamiento de prdida de
20、paquetes con la Recomendacin G.711 . 1 I.1 Introduccin 1 I.2 Descripcin del algoritmo. 1 I.2.1 Tramas intactas 1 I.2.2 Primera trama no intacta 2 I.2.3 Deteccin de tono 2 I.2.4 Generacin de seal sinttica durante los primeros 10 ms 2 I.2.5 Generacin de seal sinttica despus de 10 ms . 3 I.2.6 Atenuaci
21、n. 3 I.2.7 Primera trama intacta despus de una borradura. 3 I.2.8 Ejemplos 4 I.3 Descripcin del algoritmo con cdigo C+ anotado 5 I.3.1 Definiciones de tipo y constantes 6 I.3.2 Declaracin de clase 6 I.3.3 Bucle principal. 8 I.3.4 Funciones de miembros de servicio. 8 I.3.5 Constructor 9 I.3.6 Funcion
22、es addtohistory y savespeech 10 I.3.7 Dofe . 11 I.3.8 Deteccin de tono 14 I.3.9 Generacin y atenuacin de la seal sinttica . 16 I.3.10 Operadores de adicin con superposicin . 17 I.4 Complejidad y retardo 19 Recomendacin G.711/apndice I (09/99) 1 Recomendacin G.711 MODULACIN POR IMPULSOS CODIFICADOS D
23、E FRECUENCIAS VOCALES APNDICE I Algoritmo de baja complejidad y alta calidad para el ocultamiento de prdida de paquetes con la Recomendacin G.711 (Ginebra, 1999) I.1 Introduccin Los algoritmos de ocultamiento de prdida de paquetes (PLC, packet loss concealment), conocidos tambin como algoritmos de o
24、cultamiento de borraduras de tramas, ocultan prdidas de transmisin en un sistema audio cuando la seal de entrada es codificada y empaquetada en el transmisor, enviada por una red y recibida en el receptor que decodifica el paquete y reproduce la salida. Muchos de los codificadores vocales basados en
25、 la prediccin lineal con excitacin por cdigo (CELP, code-excited linear-prediction), tales como los de las Recomendaciones G.723.1 1, G.728 2, y G.729 3, tienen algoritmos PLC incorporados en sus normas. El algoritmo descrito en este apndice proporciona un mtodo para la Recomendacin G.711. El objeti
26、vo de PLC es generar una seal vocal sinttica para cubrir los datos omitidos (borraduras) en un tren de bits recibido. Idealmente, la seal sintetizada tendr las mismas caractersticas de timbre y espectrales que la seal omitida, y no crear perturbaciones artificiales. Como a menudo las seales vocales
27、son estacionarias localmente, es posible utilizar los datos histricos de las seales para generar una aproximacin razonable del segmento que falta. Si las borraduras no son demasiado grandes, y no estn en una regin donde la seal cambia rpidamente, pueden ser inaudibles despus del ocultamiento. I.2 De
28、scripcin del algoritmo Para aadir el algoritmo PLC a un sistema G.711 que normalmente no oculta las prdidas, slo hay que efectuar cambios en el receptor. Los datos de audio codificados segn la Recomendacin G.711 son muestreados a 8 kHz. En este apndice se supone que los datos estn divididos en trama
29、s de 10 ms (80 muestras). Mediante el ajuste de algunos parmetros, es posible acomodar otras tamaos de paquetes o velocidades de muestreo. I.2.1 Tramas intactas Durante el funcionamiento normal (paquetes o tramas intactos), el receptor decodifica el paquete recibido y enva su salida al puerto de aud
30、io. Para soportar el algoritmo PCL, slo hay que efectuar dos pequeos cambios en el receptor: 1) Se guarda una copia de la salida decodificada en una memoria tampn circular de datos histricos, cuya capacidad es de 48,75 ms (390 muestras). Esta memoria de datos histricos se utiliza para calcular el pe
31、riodo de tono vigente y extraer formas de onda durante una borradura. Este almacenamiento en memoria tampn no introduce retardo en la seal de salida. 2) La salida es retardada 3,75 ms (30 muestras) antes de ser enviada al puerto de audio. Este retardo del algoritmo, utilizado para una adicin con sup
32、erposicin (OLA, overlap add) al comienzo de la borradura, permite que el cdigo PLC efecte una transicin uniforme entre la seal real y la sintetizada. 2 Recomendacin G.711/apndice I (09/99) I.2.2 Primera trama no intacta Al comenzar la borradura, la memoria tampn circular de datos histricos es copiad
33、a a una memoria, denominada la memoria tampn de tono, con la cual es ms fcil trabajar. El contenido de la memoria tampn de tono se utiliza durante la borradura. Si sta dura ms de 10 ms, se hace una copia adicional de 1/4 del periodo de tono ms reciente, que se denomina memoria tampn lastq. I.2.3 Det
34、eccin de tono El periodo de tono se estima primero hallando la cresta de la correlacin cruzada normalizada de los 20 ms ms recientes de seales vocales en la memoria tampn de datos histricos con las seales vocales previas en derivaciones de 5 (40 muestras) a 15 ms (120 muestras). Esto corresponde a f
35、recuencias de 200 a 66 Hz. La gama de tonos se ha elegido basada en una gama utilizadas en el posfiltro de la Recomendacin G.728. Aunque la Recomendacin G.728 utiliza un lmite inferior de 2,5 ms (20 muestras), en este caso se aumenta a 40 muestras, de modo que el mismo periodo de tono no se repita m
36、s de dos veces en una trama borrada de 10 ms. Para reducir la complejidad, la estimacin del tono se calcula en dos fases. En primer lugar, se efecta una bsqueda en una seal diezmada de 2:1, y despus se efecta una bsqueda ms afinada en la vecindad de la cresta de la bsqueda inicial. Es posible reduci
37、r la complejidad con una ligera degradacin de la calidad omitiendo la bsqueda ms afinada. En lo que sigue, el trmino longitud de onda se utiliza tambin para hacer referencia al valor de salida de este clculo, pues la seal que falta puede contener voz o no. A partir de la adicin con superposicin de d
38、esplazamiento de forma de onda (WSOLA, waveform shift overlap add), se sabe que la funcin de correlacin cruzada normalizada puede ser sustituida con una correlacin cruzada no normalizada, o una funcin de diferencia de magnitud media cruzada (AMDF, average magnitude difference function) y se obtendrn
39、 resultados globales similares. I.2.4 Generacin de seal sinttica durante los primeros 10 ms Durante los primeros 10 ms de la borradura, los mejores resultados se obtienen generando la seal sintetizada a partir del ltimo periodo de tono sin atenuacin. Slo se utilizan los periodos de tono de 1,25 ms r
40、ecientes de la memoria tampn de tono durante los primeros 10 ms. Con el fin de asegurar una transicin uniforme entre la seal real y la sinttica, y se considera que la transicin es uniforme si el periodo de tono es repetido mltiples veces, se aplica una OLA utilizando una ventana triangular en 1/4 de
41、l periodo de tono entre los periodos de tono ltimo y penltimo. Para 1/4 de longitud de onda, la seal que comienza en periodos de tono de 1,25 a partir del final de la memoria tampn de tono es multiplicada por una rampa de pendiente ascendente y se aade al ltimo periodo de tono de 0,25 en la memoria
42、tampn lastq multiplicada por una rampa de pendiente descendente. Si la complejidad no es un problema, las ventanas triangulares puede ser sustituidas con ventanas de Hamming en todas las operaciones de OLA. El resultado de OLA sustituye la cola de la memoria tampn de tono y la cola de la memoria tam
43、pn de datos histricos. Es tambin la salida del receptor durante la cola de la ltima trama intacta, en sustitucin de la seal original. Esto introduce el retardo del algoritmo, no se puede dar salida a la cola de la ltima trama hasta saber si la siguiente trama est borrada. Si se produce una borradura
44、, la seal en la cola de la ltima trama intacta es modificada por OLA para asegurar una transicin uniforme a la seal sintetizada. La seal sintetizada durante los 10 ms que dura la borradura es generada colocando un puntero en un periodo de tono desde el final de la memoria tampn de tono y copiando la
45、s muestras a la salida. Si el periodo de tono es inferior a 10 ms, cuando el puntero imprime el final de la memoria tampn de tono, el punto es fijado de nuevo exactamente un periodo de ton antes de continuar. Si el periodo de tono es corto (la frecuencia es alta), el ltimo periodo de tono en la memo
46、ria tampn de tono se repite mltiples veces durante la borradura de 10 ms. Recomendacin G.711/apndice I (09/99) 3 Mientras progresa la borradura, la memoria tampn de datos histricos es actualizada con la salida sintetizada. De esta manera, la memoria tampn de datos histricos tiene siempre una seal co
47、ntinua y uniforme. Esta continuidad es importante si se produce la secuencia “una trama no intacta, una trama intacta, una trama no intacta“. I.2.5 Generacin de seal sinttica despus de 10 ms Si la trama siguiente es borrada tambin, la borradura durar por lo menos 20 ms, y se requiere ejecutar otra a
48、ccin. Aunque la repeticin de un periodo de tono funciona bien para borraduras cortas (por ejemplo, 10 ms), en borraduras largas introduce perturbaciones armnicas artificiales (sonidos agudos cortos). Esto es especialmente perceptible si la borradura se produce en una regin sin voz de la seal vocal, o en una regin de transicin rpida, como una parada. Se ha descubierto gracias a la experimentacin que estas perturbaciones se reducen considerablemente aumentando el nmero de periodos de tono utilizados para sintetizar la seal