ITU-T G 722 2 FRENCH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf

上传人:appealoxygen216 文档编号:796371 上传时间:2019-02-02 格式:PDF 页数:76 大小:878.42KB
下载 相关 举报
ITU-T G 722 2 FRENCH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第1页
第1页 / 共76页
ITU-T G 722 2 FRENCH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第2页
第2页 / 共76页
ITU-T G 722 2 FRENCH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第3页
第3页 / 共76页
ITU-T G 722 2 FRENCH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第4页
第4页 / 共76页
ITU-T G 722 2 FRENCH-2003 Wideband coding of speech at around 16 kbit s using Adaptive Multi-rate Wideband (AMR-WB)《使用自适应多速率宽带(AMR-WB)的在约16 kbit s 的语言宽带编码 16号研究组》.pdf_第5页
第5页 / 共76页
点击查看更多>>
资源描述

1、 UNION INTERNATIONALE DES TLCOMMUNICATIONS UIT-T G.722.2SECTEUR DE LA NORMALISATION DES TLCOMMUNICATIONS DE LUIT (07/2003) SRIE G: SYSTMES ET SUPPORTS DE TRANSMISSION, SYSTMES ET RSEAUX NUMRIQUES Equipements terminaux numriques Codage des signaux analogiques par des mthodes autres que la MIC Codage

2、vocal large bande 16 kbit/s environ par codage adaptatif multidbit large bande (AMR-WB) Recommandation UIT-T G.722.2 RECOMMANDATIONS UIT-T DE LA SRIE G SYSTMES ET SUPPORTS DE TRANSMISSION, SYSTMES ET RSEAUX NUMRIQUES CONNEXIONS ET CIRCUITS TLPHONIQUES INTERNATIONAUX G.100G.199 CARACTRISTIQUES GNRALE

3、S COMMUNES TOUS LES SYSTMES ANALOGIQUES COURANTS PORTEURS G.200G.299 CARACTRISTIQUES INDIVIDUELLES DES SYSTMES TLPHONIQUES INTERNATIONAUX COURANTS PORTEURS SUR LIGNES MTALLIQUES G.300G.399 CARACTRISTIQUES GNRALES DES SYSTMES TLPHONIQUES INTERNATIONAUX HERTZIENS OU SATELLITES ET INTERCONNEXION AVEC L

4、ES SYSTMES SUR LIGNES MTALLIQUES G.400G.449 COORDINATION DE LA RADIOTLPHONIE ET DE LA TLPHONIE SUR LIGNES G.450G.499 EQUIPEMENTS DE TEST G.500G.599 CARACTRISTIQUES DES SUPPORTS DE TRANSMISSION G.600G.699 EQUIPEMENTS TERMINAUX NUMRIQUES G.700G.799 Gnralits G.700G.709 Codage des signaux analogiques en

5、 modulation par impulsions et codage G.710G.719 Codage des signaux analogiques par des mthodes autres que la MIC G.720G.729 Principales caractristiques des quipements de multiplexage primaires G.730G.739 Principales caractristiques des quipements de multiplexage de deuxime ordre G.740G.749 Caractris

6、tiques principales des quipements de multiplexage dordre plus lev G.750G.759 Caractristiques principales des quipements de transcodage et de multiplication numrique G.760G.769 Fonctionnalits de gestion, dexploitation et de maintenance des quipements de transmission G.770G.779 Caractristiques princip

7、ales des quipements de multiplexage en hirarchie numrique synchrone G.780G.789 Autres quipements terminaux G.790G.799 RSEAUX NUMRIQUES G.800G.899 SECTIONS NUMRIQUES ET SYSTMES DE LIGNES NUMRIQUES G.900G.999 QUALIT DE SERVICE ET DE TRANSMISSION - ASPECTS GNRIQUES ET ASPECTS LIS LUTILISATEUR G.1000G.1

8、999 CARACTRISTIQUES DES SUPPORTS DE TRANSMISSION G.6000G.6999 EQUIPEMENTS TERMINAUX NUMRIQUES G.7000G.7999 RSEAUX NUMRIQUES G.8000G.8999 Pour plus de dtails, voir la Liste des Recommandations de lUIT-T. Rec. UIT-T G.722.2 (07/2003) i Recommandation UIT-T G.722.2 Codage vocal large bande 16 kbit/s en

9、viron par codage adaptatif multidbit large bande (AMR-WB) Rsum La prsente Recommandation dcrit le codeur et le dcodeur dadaptation de haute qualit des dbits multiples en large bande (AMR-WB), qui sont principalement destins traiter des signaux de parole dune largeur de bande de 7 kHz. Ladaptation AM

10、R-WB fonctionne une multitude de dbits binaires compris entre 6,6 kbit/s et 23,85 kbit/s. Le dbit peut tre modifi toute limite de trame de 20 ms. Lannexe C contient un paquetage logiciel intgr en code source C qui permet limplmentation du codec conforme la prsente Recommandation avec ses Annexes A e

11、t B et son Appendice I. Son Annexe D offre aux dveloppeurs un ensemble de vecteurs numriques dessai formant un outil de vrification et dindication du fait que ce codec a t correctement implment. Le codec G.722-2 AMR-WB est le mme que le codec 3GPP AMR-WB. Les spcifications 3GPP correspondantes sont

12、les normes TS 26.190 pour le codec de parole et TS 26.194 pour le dtecteur dactivit vocale. Source La Recommandation G.722.2 de lUIT-T a t approuve le 29 juillet 2003 par la Commission dtudes 16 (2001-2004) de lUIT-T selon la procdure dfinie dans la Recommandation UIT-T A.8. ii Rec. UIT-T G.722.2 (0

13、7/2003) AVANT-PROPOS LUIT (Union internationale des tlcommunications) est une institution spcialise des Nations Unies dans le domaine des tlcommunications. LUIT-T (Secteur de la normalisation des tlcommunications) est un organe permanent de lUIT. Il est charg de ltude des questions techniques, dexpl

14、oitation et de tarification, et met ce sujet des Recommandations en vue de la normalisation des tlcommunications lchelle mondiale. LAssemble mondiale de normalisation des tlcommunications (AMNT), qui se runit tous les quatre ans, dtermine les thmes dtude traiter par les Commissions dtudes de lUIT-T,

15、 lesquelles laborent en retour des Recommandations sur ces thmes. Lapprobation des Recommandations par les Membres de lUIT-T seffectue selon la procdure dfinie dans la Rsolution 1 de lAMNT. Dans certains secteurs des technologies de linformation qui correspondent la sphre de comptence de lUIT-T, les

16、 normes ncessaires se prparent en collaboration avec lISO et la CEI. NOTE Dans la prsente Recommandation, lexpression “Administration“ est utilise pour dsigner de faon abrge aussi bien une administration de tlcommunications quune exploitation reconnue. Le respect de cette Recommandation se fait titr

17、e volontaire. Cependant, il se peut que la Recommandation contienne certaines dispositions obligatoires (pour assurer, par exemple, linteroprabilit et lapplicabilit) et considre que la Recommandation est respecte lorsque toutes ces dispositions sont observes. Le futur dobligation et les autres moyen

18、s dexpression de lobligation comme le verbe “devoir“ ainsi que leurs formes ngatives servent noncer des prescriptions. Lutilisation de ces formes ne signifie pas quil est obligatoire de respecter la Recommandation. DROITS DE PROPRIT INTELLECTUELLE LUIT attire lattention sur la possibilit que lapplic

19、ation ou la mise en uvre de la prsente Recommandation puisse donner lieu lutilisation dun droit de proprit intellectuelle. LUIT ne prend pas position en ce qui concerne lexistence, la validit ou lapplicabilit des droits de proprit intellectuelle, quils soient revendiqus par un Membre de lUIT ou par

20、une tierce partie trangre la procdure dlaboration des Recommandations. A la date dapprobation de la prsente Recommandation, lUIT avait t avise de lexistence dune proprit intellectuelle protge par des brevets acqurir pour mettre en uvre la prsente Recommandation. Toutefois, comme il ne sagit peut-tre

21、 pas de renseignements les plus rcents, il est vivement recommand aux responsables de la mise en uvre de consulter la base de donnes des brevets du TSB. UIT 2004 Tous droits rservs. Aucune partie de cette publication ne peut tre reproduite, par quelque procd que ce soit, sans laccord crit pralable d

22、e lUIT. Rec. UIT-T G.722.2 (07/2003) iii TABLE DES MATIRES Page 1 Domaine dapplication 1 2 Rfrences normatives 2 3 Dfinitions, symboles et abrviations. 2 3.1 Dfinitions 2 3.2 Symboles 4 3.3 Abrviations . 7 4 Description gnrale . 8 4.1 Description fonctionnelle des parties audio . 9 4.2 Prparation de

23、s chantillons vocaux 9 4.3 Principes du codeur de parole adaptatif des dbits multiples en large bande. 9 4.4 Principes du dcodeur de parole adaptatif des dbits multiples 14 4.5 Squence et importance subjective des paramtres cods 15 5 Description fonctionnelle du codeur. 15 5.1 Prtraitement. 15 5.2 A

24、nalyse par prdiction linaire et quantification 16 5.3 Pondration perceptive . 21 5.4 Analyse en boucle ouverte du dlai tonal. 22 5.5 Calcul de la rponse aux impulsions 24 5.6 Calcul du signal cible . 24 5.7 Rpertoire adaptatif 24 5.8 Rpertoire algbrique . 27 5.9 Quantification des gains de rpertoire

25、 adaptatif et de rpertoire fixe 38 5.10 Mise jour de la mmoire 39 5.11 Production du gain dans la bande des hautes frquences. 40 6 Description fonctionnelle du dcodeur. 40 6.1 Dcodage et synthse de parole 40 6.2 Filtrage passe-haut, renormalisation multiplicatrice et interpolation. 43 6.3 Bande des

26、hautes frquences 44 7 Rpartition dtaille des bits du codec adaptatif multidbit en large bande 46 8 Squences de retour ltat dorigine 54 8.1 Description fonctionnelle . 54 8.2 Dfinitions 55 8.3 Retour ltat dorigine du codeur 55 8.4 Retour ltat dorigine du dcodeur 55 9 Dtecteur dactivit vocale (VAD, vo

27、ice activity detector) 56 9.1 Symboles du dtecteur VAD 56 9.2 Description fonctionnelle . 58 iv Rec. UIT-T G.722.2 (07/2003) Page 10 Modes de codage AMR-WB pour le service tlphonique vocal dans les systmes 3GPP . 66 Bibliographie 67 Rec. UIT-T G.722.2 (07/2003) 1 Recommandation UIT-T G.722.2 Codage

28、vocal large bande 16 kbit/s environ par codage adaptatif multidbit large bande (AMR-WB) 1 Domaine dapplication La prsente Recommandation dcrit le mappage de blocs dentre de 320 chantillons vocaux en format MIC uniforme de 16 bits dans des blocs cods de 132, 177, 253, 285, 317, 365, 397, 461 et 477 b

29、its, ainsi que des blocs cods de 132, 177, 253, 285, 317, 365, 397, 461 et 477 bits dans des blocs de sortie de 320 chantillons vocaux reconstruits. La frquence dchantillonnage est de 16 000 chantillons par seconde, ce qui se traduit par un dbit du train de bits cod de 6,60, 8,85, 12,65, 14,25, 15,8

30、5, 18,25, 19,85, 23,05 ou 23,85 kbit/s. Le schma de codage est, pour les modes de codage dbits multiples, le codeur dit prdiction linaire excitation par squence code structure algbrique, ci-aprs appel codeur ACELP (ACELP, algebraic code excited linear prediction coder). Le codeur ACELP adaptatif des

31、 dbits multiples en large bande est appel codeur AMR-WB. Le codec dcrit dans la prsente Recommandation utilise galement un dtecteur dactivit vocale (VAD, voice activity detector) intgr. Les applications prvues pour la prsente Recommandation sont les suivantes: voix sur IP (VoIP) et Internet, communi

32、cations mobiles, RTPC, tlphonie large bande sur RNIS, vidophonie et tlconfrence sur RNIS. En plus de lalgorithme spcifi dans le corps de la prsente Recommandation, ses Annexes A et B ainsi que son Appendice I offrent des fonctionnalits supplmentaires qui permettent linteroprabilit avec les systmes s

33、ans fil GSM et 3GPP. Ces fonctionnalits ont t initialement mises au point pour ces systmes mais leur usage nest pas limit aux applications mobiles. Les Annexes D et E dcrivent respectivement les vecteurs dessai et la structure de trame. Ces annexes peuvent tre implmentes indpendamment de la prsente

34、spcification principale, selon les diffrentes exigences des systmes dployant lalgorithme AMR-WB: lAnnexe A dcrit les aspects de bruit de confort utiliser avec lalgorithme AMR-WB en fonctionnement dbit de source contrl. Limplmentation de lAnnexe A est essentielle pour linteroprabilit avec les systmes

35、 sans fil GSM et 3GPP; lAnnexe B dcrit le fonctionnement dbit de source contrl avec lalgorithme AMR-WB. Limplmentation de lAnnexe B est essentielle pour linteroprabilit des systmes sans fil GSM et 3GPP; lAnnexe D dcrit les squences numriques dessai qui constituent un outil de vrification donnant une

36、 indication de succs lors de limplmentation du codec AMR-WB; lAnnexe E dcrit la structure de trame dont lusage est recommand avec les diffrents modes de fonctionnement de lalgorithme AMR-WB; lAppendice I dcrit un exemple de solution pour le masquage derreur de trames AMR-WB errones ou perdues. Afin

37、damliorer lergonomie, le code ANSI-C a t regroup dans une seule annexe, lAnnexe C avec la description de bas niveau de toutes ces fonctionnalits. En cas de divergence entre les descriptions figurant dans une des diffrentes parties de la prsente Recommandation et limplmentation de ces descriptions da

38、ns lAnnexe C, cest celle-ci qui prvaut. Le paragraphe 8 dcrit une procdure spcifique de rinitialisation, dite “retour ltat dorigine“. Il sagit dun lment de service utile pour mettre le codec dans un tat initial connu (par exemple aux fins des essais). Le paragraphe 9 spcifie le dtecteur dactivit voc

39、ale (VAD, voice activity detector) utilis dans ce codec ainsi que lors du fonctionnement dbit de source contrl (DTX) spcifi dans lAnnexe B. Dans le paragraphe 10 sont donnes des informations sur les prescriptions 2 Rec. UIT-T G.722.2 (07/2003) minimales relatives la prise en charge des modes multidb

40、its adaptatifs large bande (AMR-WB, adaptive multi-rate wideband) pour la fourniture du service tlphonique vocal dans les systmes du projet associ de troisime gnration (3GPP, third generation partnerships projet). 2 Rfrences normatives La prsente Recommandation se rfre certaines dispositions des Rec

41、ommandations UIT-T et textes suivants qui, de ce fait, en sont partie intgrante. Les versions indiques taient en vigueur au moment de la publication de la prsente Recommandation. Toute Recommandation ou tout texte tant sujet rvision, les utilisateurs de la prsente Recommandation sont invits se repor

42、ter, si possible, aux versions les plus rcentes des rfrences normatives suivantes. La liste des Recommandations de lUIT-T en vigueur est rgulirement publie. La rfrence un document figurant dans la prsente Recommandation ne donne pas ce document en tant que tel le statut dune Recommandation. 1 Recomm

43、andation UIT-T G.722 (1988), Codage audiofrquence 7 kHz un dbit infrieur ou gal 64 kbit/s. 2 RFC 3267 (2002), Real-Time Transport Protocol (RTP) Payload Format and File Storage Format for the Adaptive Multi-Rate (AMR) and Adaptive Multi-Rate Wideband (AMR-WB) Audio Codecs. 3 Dfinitions, symboles et

44、abrviations 3.1 Dfinitions La prsente Recommandation dfinit les termes suivants: 3.1.1 rpertoire adaptatif: dictionnaire contenant des vecteurs dexcitation qui sont adapts chaque sous-trame. Le rpertoire adaptatif est dduit de ltat du filtre long terme. La valeur de dlai peut tre considre comme un p

45、ointeur sur le rpertoire adaptatif. 3.1.2 rpertoire algbrique: dictionnaire fixe dans lequel un code algbrique sert construire les vecteurs dexcitation (vecteurs dinnovation). Lexcitation contient un petit nombre dimpulsions non nulles avec des ensembles entrelacs de positions possibles. Les amplitu

46、des et les positions des impulsions du kevecteur de code dexcitation peuvent tre dduites de son pointeur k par lapplication dune rgle exigeant une mmorisation physique minimale ou nulle, contrairement aux rpertoires stochastiques dans lesquels le trajet entre le pointeur et le vecteur de code associ

47、 implique des tables dexploration. 3.1.3 traitement antidispersion: procdure de post-traitement adaptatif applique au vecteur du rpertoire fixe afin de diminuer les artfacts perceptuels provoqus par la dispersion dun vecteur du rpertoire fixe. 3.1.4 analyse du dlai tonal en boucle ferme: recherche dans le rpertoire adaptatif, cest-dire processus destimation de la valeur de la hauteur (ou du dlai) daprs le signal vocal dentre pondr et ltat du filtre long terme. Lors de l

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国际标准 > 其他

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1