ITU-T G 722 2 SPANISH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf

上传人:appealoxygen216 文档编号:796373 上传时间:2019-02-02 格式:PDF 页数:78 大小:882.13KB
下载 相关 举报
ITU-T G 722 2 SPANISH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第1页
第1页 / 共78页
ITU-T G 722 2 SPANISH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第2页
第2页 / 共78页
ITU-T G 722 2 SPANISH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第3页
第3页 / 共78页
ITU-T G 722 2 SPANISH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第4页
第4页 / 共78页
ITU-T G 722 2 SPANISH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第5页
第5页 / 共78页
点击查看更多>>
资源描述

1、 UNIN INTERNACIONAL DE TELECOMUNICACIONES UIT-T G.722.2SECTOR DE NORMALIZACIN DE LAS TELECOMUNICACIONES DE LA UIT (07/2003) SERIE G: SISTEMAS Y MEDIOS DE TRANSMISIN, SISTEMAS Y REDES DIGITALES Equipos terminales digitales Codificacin de seales analgicas mediante mtodos diferentes de la MIC Codificac

2、in en banda ancha de voz a unos 16 kbit/s utilizando banda ancha multivelocidad adaptativa Recomendacin UIT-T G.722.2 RECOMENDACIONES UIT-T DE LA SERIE G SISTEMAS Y MEDIOS DE TRANSMISIN, SISTEMAS Y REDES DIGITALES CONEXIONES Y CIRCUITOS TELEFNICOS INTERNACIONALES G.100G.199 CARACTERSTICAS GENERALES

3、COMUNES A TODOS LOS SISTEMAS ANALGICOS DE PORTADORAS G.200G.299 CARACTERSTICAS INDIVIDUALES DE LOS SISTEMAS TELEFNICOS INTERNACIONALES DE PORTADORAS EN LNEAS METLICAS G.300G.399 CARACTERSTICAS GENERALES DE LOS SISTEMAS TELEFNICOS INTERNACIONALES EN RADIOENLACES O POR SATLITE E INTERCONEXIN CON LOS S

4、ISTEMAS EN LNEAS METLICAS G.400G.449 COORDINACIN DE LA RADIOTELEFONA Y LA TELEFONA EN LNEA G.450G.499 EQUIPOS DE PRUEBAS G.500G.599 CARACTERSTICAS DE LOS MEDIOS DE TRANSMISIN G.600G.699 EQUIPOS TERMINALES DIGITALES G.700G.799 Generalidades G.700G.709 Codificacin de seales analgicas mediante modulaci

5、n por impulsos codificados (MIC) G.710G.719 Codificacin de seales analgicas mediante mtodos diferentes de la MIC G.720G.729 Caractersticas principales de los equipos mltiplex primarios G.730G.739 Caractersticas principales de los equipos mltiplex de segundo orden G.740G.749 Caractersticas principale

6、s de los equipos mltiplex de orden superior G.750G.759 Caractersticas principales de los transcodificadores y de los equipos de multiplicacin de circuitos digitales G.760G.769 Caractersticas de operacin, administracin y mantenimiento de los equipos de transmisin G.770G.779 Caractersticas principales

7、 de los equipos mltiplex de la jerarqua digital sncrona G.780G.789 Otros equipos terminales G.790G.799 REDES DIGITALES G.800G.899 SECCIONES DIGITALES Y SISTEMAS DIGITALES DE LNEA G.900G.999 CALIDAD DE SERVICIO Y DE TRANSMISIN - ASPECTOS GENRICOS Y ASPECTOS RELACIONADOS AL USUARIO G.1000G.1999 CARACT

8、ERSTICAS DE LOS MEDIOS DE TRANSMISIN G.6000G.6999 EQUIPOS TERMINALES DIGITALES G.7000G.7999 REDES DIGITALES G.8000G.8999 Para ms informacin, vase la Lista de Recomendaciones del UIT-T. Rec. UIT-T G.722.2 (07/2003) i Recomendacin UIT-T G.722.2 Codificacin en banda ancha de voz a unos 16 kbit/s utiliz

9、ando banda ancha multivelocidad adaptativa Resumen Esta Recomendacin describe un codificador y decodificador de banda ancha multivelocidad adaptativa (AMR-WB) de alta calidad destinado principalmente a las seales vocales de 7 kHz de anchura de banda. El AMR-WB funciona a numerosas velocidades binari

10、as, que van de 6,6 kbit/s a 23,85 kbit/s. La velocidad binaria puede cambiarse en cualquier frontera de trama de 20 ms. El anexo C incluye un lote integrado de soporte lgico del cdigo fuente C que contiene la aplicacin del codificador y decodificador de la presente Recomendacin y de sus anexos A y B

11、 y apndice I. En el anexo D se da un conjunto de vectores de prueba digitales destinado a los diseadores. Dichos vectores constituyen la herramienta que proporciona una indicacin del xito en la implementacin del cdec. El cdec AMR-WB G.722.2 es el mismo que el AMR-WB 3GPP. Las especificaciones 3GPP c

12、orrespondientes son la TS 26.190 para el cdec de voz y la TS 26.194 para el detector de actividad vocal. Orgenes La Recomendacin UIT-T G.722.2 fue aprobada el 29 de julio de 2003 por la Comisin de Estudio 16 (2001-2004) del UIT-T por el procedimiento de la Recomendacin UIT-T A.8. ii Rec. UIT-T G.722

13、.2 (07/2003) PREFACIO La UIT (Unin Internacional de Telecomunicaciones) es el organismo especializado de las Naciones Unidas en el campo de las telecomunicaciones. El UIT-T (Sector de Normalizacin de las Telecomunicaciones de la UIT) es un rgano permanente de la UIT. Este rgano estudia los aspectos

14、tcnicos, de explotacin y tarifarios y publica Recomendaciones sobre los mismos, con miras a la normalizacin de las telecomunica-ciones en el plano mundial. La Asamblea Mundial de Normalizacin de las Telecomunicaciones (AMNT), que se celebra cada cuatro aos, establece los temas que han de estudiar la

15、s Comisiones de Estudio del UIT-T, que a su vez producen Recomendaciones sobre dichos temas. La aprobacin de Recomendaciones por los Miembros del UIT-T es el objeto del procedimiento establecido en la Resolucin 1 de la AMNT. En ciertos sectores de la tecnologa de la informacin que corresponden a la

16、esfera de competencia del UIT-T, se preparan las normas necesarias en colaboracin con la ISO y la CEI. NOTA En esta Recomendacin, la expresin “Administracin“ se utiliza para designar, en forma abreviada, tanto una administracin de telecomunicaciones como una empresa de explotacin reconocida de telec

17、omunicaciones. La observancia de esta Recomendacin es voluntaria. Ahora bien, la Recomendacin puede contener ciertas disposiciones obligatorias (para asegurar, por ejemplo, la aplicabilidad o la interoperabilidad), por lo que la observancia se consigue con el cumplimiento exacto y puntual de todas l

18、as disposiciones obligatorias. La obligatoriedad de un elemento preceptivo o requisito se expresa mediante las frases “tener que, haber de, hay que + infinitivo“ o el verbo principal en tiempo futuro simple de mandato, en modo afirmativo o negativo. El hecho de que se utilice esta formulacin no entr

19、aa que la observancia se imponga a ninguna de las partes. PROPIEDAD INTELECTUAL La UIT seala a la atencin la posibilidad de que la utilizacin o aplicacin de la presente Recomendacin suponga el empleo de un derecho de propiedad intelectual reivindicado. La UIT no adopta ninguna posicin en cuanto a la

20、 demostracin, validez o aplicabilidad de los derechos de propiedad intelectual reivindicados, ya sea por los miembros de la UIT o por terceros ajenos al proceso de elaboracin de Recomendaciones. En la fecha de aprobacin de la presente Recomendacin, la UIT ha recibido notificacin de propiedad intelec

21、tual, protegida por patente, que puede ser necesaria para aplicar esta Recomendacin. Sin embargo, debe sealarse a los usuarios que puede que esta informacin no se encuentre totalmente actualizada al respecto, por lo que se les insta encarecidamente a consultar la base de datos sobre patentes de la T

22、SB. UIT 2004 Reservados todos los derechos. Ninguna parte de esta publicacin puede reproducirse por ningn procedimiento sin previa autorizacin escrita por parte de la UIT. Rec. UIT-T G.722.2 (07/2003) iii NDICE Pgina 1 Alcance . 1 2 Referencias . 2 3 Definiciones, smbolos y abreviaturas 2 3.1 Defini

23、ciones 2 3.2 Smbolos. 4 3.3 Abreviaturas . 7 4 Descripcin resumida . 9 4.1 Descripcin funcional de las partes audio 9 4.2 Preparacin de muestras de voz . 10 4.3 Principios del codificador de banda ancha multivelocidad adaptativa para voz 10 4.4 Principios del decodificador de multivelocidad adaptati

24、va para voz . 16 4.5 Secuencia e importancia subjetiva de los parmetros codificados. 16 5 Descripcin funcional del codificador 16 5.1 Preprocesamiento . 17 5.2 Anlisis y cuantificacin de la prediccin lineal 17 5.3 Ponderacin perceptual 23 5.4 Anlisis de la altura de tono en bucle abierto. 23 5.5 Clc

25、ulo de la respuesta en tren de impulsos. 25 5.6 Clculo de la seal objetivo 25 5.7 Libro de cdigos adaptativo . 26 5.8 Libro de cdigos algebraico . 28 5.9 Cuantificacin de las ganancias de libros de cdigos adaptativo y fijo . 39 5.10 Actualizacin de la memoria 40 5.11 Generacin de ganancia de banda a

26、lta 41 6 Descripcin funcional del decodificador 41 6.1 Decodificacin y sntesis de la voz 41 6.2 Filtrado paso alto, escalaje en sentido ascendente e interpolacin. 44 6.3 Banda de altas frecuencias 45 7 Atribucin detallada de bits del cdec de banda ancha multivelocidad adaptativa 47 8 Secuencias del

27、retorno a la posicin inicial 55 8.1 Descripcin funcional. 55 8.2 Definiciones 56 8.3 Retorno a la posicin inicial del codificador 56 8.4 Retorno a la posicin inicial del decodificador 57 9 Detector de actividad vocal (VAD) 57 9.1 Smbolos VAD . 57 9.2 Descripcin funcional. 59 iv Rec. UIT-T G.722.2 (0

28、7/2003) Pgina 10 Modos de codificacin/decodificacin AMR-WB obligatorios para el servicio de telefona vocal 3GPP 67 Bibliografa 68 Rec. UIT-T G.722.2 (07/2003) 1 Recomendacin UIT-T G.722.2 Codificacin en banda ancha de voz a unos 16 kbit/s utilizando banda ancha multivelocidad adaptativa 1 Alcance Es

29、ta Recomendacin describe de forma detallada el establecimiento de la correspondencia entre bloques de entrada de 320 muestras de voz en formato MIC uniforme de 16 bits y bloques codificados de 132, 177, 253, 285, 317, 365, 397, 461 y 477 bits y entre bloques codificados de 132, 177, 253, 285, 317, 3

30、65, 397, 461 y 477 bits y bloques de salida de 320 muestras de voz reconstruidas. La velocidad de muestreo es de 16 000 muestras/s lo que da lugar a una velocidad binaria del tren binario codificado de 6,60, 8,85, 12,65, 14,25, 15,85, 18,25, 19,85, 23,05 o 23,85 kbit/s. El esquema de codificacin de

31、los modos de codificacin multivelocidad es el llamado codificador de prediccin lineal excitado por cdigo algebraico, al que en adelante se har referencia como ACELP. El codificador ACELP de banda ancha multivelocidad se denomina AMR-WB. El cdec descrito en esta Recomendacin utiliza adems un detector

32、 de actividad vocal (VAD, voice activity detector) integrado. Las aplicaciones previstas de la presente Recomendacin son las siguientes: protocolo de transmisin de la voz sobre el protocolo Internet (VoIP, voice over Internet protocol) y aplicaciones Internet, comunicaciones mviles, aplicaciones RTP

33、C, telefona de banda ancha RDSI y videotelefona y videoconferencia RDSI. Adems del algoritmo especificado en el cuerpo principal de esta Recomendacin, los anexos A y B y el apndice I proporcionan funcionalidades suplementarias que permiten la interoperabilidad con sistemas inalmbricos del sistema gl

34、obal para comunicaciones mviles (GSM, global system for mobile communications) y del proyecto de asociacin de tercera generacin (3GPP, third generation partnership project). Esas funcionalidades se concibieron en principio para estos sistemas, pero su utilizacin no est limitada a aplicaciones mviles

35、. En los anexos D y E, se describen los vectores de prueba y la estructura de trama, respectivamente. Estos anexos se pueden implementar con independencia del cuerpo principal de la presente Recomendacin, de acuerdo con los distintos requisitos de los sistemas que emplean el algoritmo AMR-WB: El ane

36、xo A describe aspectos del ruido de confort para la utilizacin del algoritmo AMR-WB en funcionamiento a velocidad controlada por la fuente. La implementacin del anexo A es esencial para la interoperabilidad con sistemas inalmbricos GSM y 3GPP. El anexo B describe el funcionamiento a velocidad contro

37、lada por la fuente para el algoritmo AMR-WB. La implementacin del anexo B es esencial para la interoperabilidad con sistemas inalmbricos GSM y 3GPP. El anexo D describe las secuencias de prueba digitales, que constituyen una herramienta de verificacin indicadora del xito en la implementacin del cdec

38、 AMR-WB. El anexo E describe la estructura de trama que se recomienda utilizar con los diferentes modos de funcionamiento del algoritmo AMR-WB. El apndice I da un ejemplo de cmo ocultar los errores de tramas AMR-WB errneas o perdidas. Para facilitar su utilizacin, los cdigos C ANSI con la descripcin

39、 de bajo nivel de todas estas funcionalidades se han agrupado en un solo anexo, el anexo C. Si se produce alguna discrepancia entre cualquiera de las diferentes partes de la presente Recomendacin y la implementacin de esas descripciones del anexo C, prevalecern las descripciones del anexo C. 2 Rec.

40、UIT-T G.722.2 (07/2003) En la clusula 8 se describe un procedimiento de reinicio especfico, llamado de retorno a la posicin inicial. Se trata de una caracterstica muy til que sirve para llevar el cdec a un estado inicial conocido (por ejemplo, a efectos de prueba). La clusula 9 especifica el detecto

41、r de actividad vocal (VAD) utilizado en este cdec as como en el funcionamiento a velocidad controlada por la fuente (DTX) que se especifica en el anexo B. En la clusula 10 se proporciona informacin sobre los requisitos mnimos para el soporte de la banda ancha multivelocidad adaptativa (AMR-WB) en el

42、 servicio de telefona vocal 3GPP. 2 Referencias Las siguientes Recomendaciones UIT-T y otras referencias contienen disposiciones que, mediante su referencia en este texto, constituyen disposiciones de la presente Recomendacin. Al efectuar esta publicacin, estaban en vigor las ediciones indicadas. To

43、das las Recomendaciones y otras referencias son objeto de revisiones por lo que se preconiza que los usuarios de esta Recomendacin investiguen la posibilidad de aplicar las ediciones ms recientes de las Recomendaciones y otras referencias citadas a continuacin. Se publica peridicamente una lista de

44、las Recomendaciones UIT-T actualmente vigentes. En esta Recomendacin, la referencia a un documento, en tanto que autnomo, no le otorga el rango de una Recomendacin. 1 Recomendacin UIT-T G.722 (1988), Codificacin de audio de 7 kHz dentro de 64 kbit/s. 2 RFC 3267 (2002), Real-Time Transport Protocol (

45、RTP) Payload Format and File Storage Format for the Adaptive Multi-Rate (AMR) and Adaptive Multi-Rate Wideband (AMR-WB) Audio Codecs. 3 Definiciones, smbolos y abreviaturas 3.1 Definiciones En esta Recomendacin se definen los trminos siguientes. 3.1.1 libro de cdigos adaptativo: El libro de cdigos a

46、daptativo contiene los vectores de excitacin adaptados a cada subtrama. El libro de cdigos adaptativo se obtiene a partir del estado del filtro a largo plazo. El valor del retardo puede considerarse como un ndice libro de cdigos adaptativo. 3.1.2 libro de cdigos algebraico: Libro de cdigos fijo en e

47、l que se utiliza un cdigo algebraico para poblar los vectores de excitacin (vectores de renovacin). La excitacin contiene un pequeo nmero de impulsos distintos de cero con conjuntos entrelazados predefinidos de posiciones posibles. Las amplitudes y las posiciones de los impulsos del k-simo vector-cd

48、igo de excitacin se pueden derivar del ndice k aplicando una regla que no exige almacenamiento fsico, ni siquiera mnimo, al contrario de lo que ocurre con los libros de cdigos estocsticos en donde el trayecto desde el ndice al vector-cdigo implica la existencia de cuadros de consulta. 3.1.3 procedimiento antidispersin: Procedimiento de posprocesamiento adaptativo aplicado al vector de libro de cdigos fijo para reducir los artefactos perceptuales de un vector de libro de cdigos fijo disperso. 3.1.4 anlisis de altura de tono en bucle cerrado: Se trata de la bsqueda en el libro de cdigos ada

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国际标准 > 其他

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1