1、ICS 35.040 L 71 中华人民共和国电子行业标准SJ/T 11368-2006 多声道数字音频编解码技术规范Specification for multichannel digital audio coding technology 2007-01-04发布2007-01-04实施回中华人民共和国信息产业部发布SJ/T 11368-2006 目次前言. . . .III .N I范围.a. . . 2术语和定义. . . . . . . . . . . . . .1 3概述. . . . . . . . . . . . . . . . . . .3 3.1编码器. . . . . .
2、 . . . . . . . . . . . . .3 3.2解码器. . . . . . . . . . . . . . . . .4 4句法结构.,. . . . . . . .6 4.1函数. . . . . . . . . . . . . . . . .,. . . . . . .6 4.2码流. . 0-. . . . . . .,. . . . . .7 4.3帧.o. . . . . . . . . . . . . . . . .8 4.4帧头. .o.o. . . . . . . . . .,. . . . . . . . . . . . . .9 4.5窗口序列.o. . .
3、 . . . .10 4.6码书选择及应用范围.HH-HH.11 4.7子带样本的量化指数. . . . . . . . . . .12 4.8量化步长指数. . . . . . . . . . . . . . . . .14 4.9和差编码决定.;.,.144.10联合强度编码比例因子.o. . . . . . . . . . . . . . . .15 4.11误码检测. . . . . .15 4.12辅助数据. . . . . . . . . . . . . .16 5语义.o.o. . . . . . . . . . . . . 16 川码流. . . . . . . . . . .
4、16 5.2 I帧. . . . . .16 5.3帧头.o. .o . . . . .17 5.4窗口序列. . . . . . . . . . . . . . . . .四5.5码书选择与应用范围. ., . . . . . . . . . .20 5.6子带样本的量化指数.,. . . . . . . . . . . . 0 . . .21 5.7量化步长指数. .o. . . . . .22 5.8和差编码决定. . .o. . . . . . . . . . . . . .22 5.9联合强度编码比例因子.o. . . . . . HH-Hau-HH-HH-HH-.23 5.10误码
5、检测. . .o. .,.o. . . . . . .,. . . . . .23 5.11辅助数据. . . . . . . . . . .,.23 6解码. . . . . . . .o. . .23 6.1声道排放与设置. . . . ., . . . . .23 6.2解交叉重组. . . . . . . . . . . .25 6.3重建量化单元的个数. . . . . ., .o. . . . . . .27 6.4逆量化器. ., .0-. . . . . . .27 6.5联合强度ffJ平码. . . . . . . . . . .o. . . . . . . . .28 SJ
6、/T 11368-2006 6.6和/是制n玛.,. . . ,. . .,. . . . . . . .29 6.7可变分辨率的合成滤波器组. . . ,. . .30 6.8重建短/暂窗口函数序列. . . .,.34 附录A(资料性附录)相关编码技术.,., . . .38 A .1 I瞬态分析.,. . . . . . . . . .38 A.2人耳听觉模型. . . ., .0. . . . . . . .38 A.3全局比特分配. . .司. . . . .38 A.4 Huffman码的问书的选择. .,. . . .38 A.5和/差编码. . . . . . .40 A.6联
7、合强度编码. .,. . . . ., . .41 附录B(规范性附录)表. . . . . . . . . B.l量化步长表. .,. . . . . . . .,. . .4 B.2 I恼界频带表.,. . , . . . . 1. . . . .44 B.3解码瞬态段的氏度用的Huffman码表.,.,.,.:i(5 BA解码码书选择与应用范围用的Huffman码表. . . .57 B.5解码量:化步长指数用的Huffman码表. . . .61 B.6解码量化指数商数宽度用的Huffman码表.o.o. .o. . .68 B.7解码稳态量化指数用的Huffman码表. . .,.
8、. . .69 B.8解码瞬态量化指数用的Huffman码表. . 0 .o. _. . 105 参考文献. . . . .o. . . . 143 II 目IJ吕本标准由全国音频、视频及多媒体系统与设备标准化技术委员会归口。本标准的附录A为资料性附录,附录B为规范性附录。SJ/T 11368-2006 本标准起草单位:广州广属数码技术有限公司、中国华录集团有限公司、中国电子技术标准化研究所。本标准主要起草人z游余立、张尉雄、徐茂、张素兵。田SJ/T 11368-2006 寻|为了适应我国日益发展的数字音视频产业的需求,满足不同应用领域对高品质的多声道数字音频信号的编码需要,特制定本标准。本标
9、准是在自主研究开发音频编解码算法的基础上,经过算法的优化、软件及硬件的实现、测试验证等过程,确保了技术方案能支持不同码率、不同声道的应用要求。本标准规定的多声道数字音频编解码技术可在有限容量的存储介质或有限带宽的信道上保存或传送高质量的多声道数字音频信号。本标准的应用包括但不仅限予以下领域:数字音频广擂;数字电视(卫星、地固和有线广播); 家庭影院:数字影院;激光视盘机:网络流媒体:个人音频播放设备。本标准的发布机构提请注意如下事实,声明符合本标准时,可以使用涉及以下相关专利。本标准的发布机构对于专利的范围、有效性和验证资料不提出任何看法。专利持有人己向本标准的发布机构保证,他愿意同任何申请人
10、在合理和非歧视的条款和条件下,就使用授权许可证进行谈判。在这方面,该专利持有人的声明己在本标准的发布机构备案。有关资料可从以下地址获得z专利名称:多声道数字音频编码设备及其方法(美国专利申请号US1I!029722,中国专利申请号200510095898.6) : 专利持有人:广州广是数码技术有限公司;联系人:王先文:地址:广州市天河区能源路华南理工大学七区科技园2号楼6楼:邮政编码:510640; 电话:020-22237078; 传真:020-222371890 请注意除上述已经识别出的专利外,本标准的某些内容有可能涉及专利。本标准的发布机构不应承担识别这些专利的责任。IV SJ/T 11
11、368-2006 多声道数字音频编解码技术规范1 范围本标准规定了多声道数字音频压缩编解码技术方案:包括码流格式(句法结构与语义、解码过程以及各个解码技术模块的技术要求,并对采用该技术的编码部分提供了资料性的建议和实现方法。本标准规定的数字音频编解码技术方案的信号通道能保持24bit以上的精度(除了因量化而有意舍弃的精度外)。可支持的声道设置除了常见的立体声、5.1环绕声、6.1环绕声和7.1环绕声之外,还为未来的音频技术发展预留了空间(最多可支持64.3环绕声。本标准可支持从8kHz到192kHz间的标准采样频率,包括44.1胁和48KHz0本惨剧嗣叫怦喃道没有明确限制,在具体应用时可根据信
12、道带宽和音质要求等因素来、本标准适用于各种数字瞬樨数制袖是f巍巍喝阳黯附体以及个人媒体播放器等应用领域。2 术语和定义下列术语和2. 1 2.2 2.3 音频数据编码后用音频样本输辅助数据包括诸如2.4 2. 5 暂窗口函数总长度为256临界棚、带critical 人耳对声音分辨的数学模而成近似的指数上升。此滤波器组2. 6 码流或比特流bit stream 由符合本标准的编码器产生的表示原始音频信号的比特序列。2. 7 0点frame波器组的带宽随频率的上升由符合本标准的编码器产生的表示一帧音频信号的音频数据。它是构成本标准的码流的基本单位。本标准的一个帧可涵盖128、256、512、或10
13、24个音频样本。2. 8 帧头frame header 本标准的一个帧的开头部分的音频数据,包括同步字和描述音频信号的特性的字,比如采样率、正常声道的数目、LFE声道数目等。SJ/T 11368-2006 2. 9 LFE低频效应声道low frequency effect channel 带宽有限( 0 ) unBits = unBitsO ) UnpackJicSca1e() ; for (nCh=nNumNorma1Ch; nCh= 2 ) e1se nLast = 0; for (nCluster=O; nC1uster8 ) k -= 8; else k一=9; k += nLast
14、; 11 SJ/T 11368-2006 mnHSnClusternBand = k; nLast = k; 4. 7 子带样本的最化指数12 子带样本的量化指数如下:UnpackQIndex 0 ResetHuffIndex(pQuotientWidthBook) ; for (nCluster=O; nClusterO ) SJ/T 11368-2006 nQuotientWidth = HuffDecDiff(pQuotientWidthBook)+l; for (nBin=nStart; nBin 0 ) nMaxCb = _min(nJicCb, nMaxCb); i f ( nMa
15、xCbO ) 4.10联合联合强度编UnpackJi anSumDffAIIOffnCluster = Unpack(l); if ( anSumDffAIIOffnCluster = 0 ) for (nBand=O; nBand 0 ) nMaxCb = _ min(nJcCb, nMaxCb); 5. 8. 1 和差编码全不用决定nSumDffAl1nSumDffAIIOffnClust 5.8.2 刁亏。mnQSteplndex 指数。与量化步长表B.1)即可获得比例因在以上的解码过程中,化单元的个数。5.10 误码检测1比特用和差编码,如表27所示。,如表28所编码比例因子的,查量化
16、步长表的第nCluster个瞬态段的量为了协助检测当前帧的音频数据是否有误码,编码器打包完所有音频数据后,把最后一个32比特的字的未用的比特全部设为一(1)。在解码时,如果这些未用的比特不是全为一(1),则意味着当前中贞的音频数据有误码,需要启动错误处理程序。5. 11 辅助数据由于辅助数据放置在误码检测之后,故解码器可以在完成误码检测后就停止解码并等待下一帧音频数据。因此,辅助数据是否存在不影响正常解码,解码器也完全可以不处理辅助数据。这意味着对辅助数据的定义和理解完全由用户约定。6 解码6. 1 声道排放与设置23 SJ/T 11368-2006 常规帧头最多可支持8个正常声道。表29列出
17、了正常声道数CnNumNormalCh)的值与缺省CDefault)正常声道设置的映射关系。表30列出了一些常见声道设置的表示方法。如果表29的缺省正常声道设置不适用,则应把bAuxChCfg设为一(1),然后在辅助数据中嵌入声道设置信息。此时,对声道设置的理解完全由用户设定。表29缺省正常声道设置正常声道数(nNurnNormalCh)声道设置前左2 前左、前右3 前左、前右、后中4 前左、前右、后左、后右5 前左、前右、后左、后右、前中6 前左、前右、后左、后右、后中、前中7 前左、前右、后左、后右、旁左、旁右、前中8 前左、前右、后左、后右、旁左、旁右、前中、顶上表30常见声道设置的表示
18、方法声道设置正常F街道数CnNumNormalCh)低颇效应声道(nNumLfeCh)单声道。立体声2 。2. 1 2 l 3. 1 3 5. 1 5 6. 1 6 l 7. 1 7 1 表31列出了以上各个声道的音频数据在一个音频帧中的排放顺序。其中,声道OU8C正常声道由nNumNormalCh表示,声道9(低颇效应声道)由nNumLfeCh表示。如果正常声道中有些声道不出现,则后面的声道自动往前移。例如,5.1环绕声的各个声道的音频数据按表32的方式在一个音频帧中排放o表31各个声道的音师、数据在音频帧中的排放顺序序号声道。前左前右2 后左3 后右4 旁左5 旁右6 后中7 顶上8 前中
19、9 低颇效应24 SJ/T 11368-2006 表325.1环绕的音频数据在音频帧中的排放顺序序号声道。前左l 前右2 后在3 后右4 前中5 低颇效应扩展帧头最多可支持64个正常声道和3个低频效应声道。此时的声道设置需由具体的应用另行约定。必要时,可把bAuxChCfg设为一(1),然后在辅助数据中嵌入声道设置信息。由于和/差编码和联合强度编码都耐应脚惯贺带赞用响棒现括准对各个声道的处理与编码完全相互独立。因此,用户可自由约定6.2 解交叉重组如表33所示,当带1023。这是MDCT的J当一个帧由序是按频率上升子带样本又按时假定的瞬态瞬态段MDCT 。2 3 4 5 1 l脂f6 界|7
20、频l带|86 87 n 127 214 255 5 。383 511 639 767 次由子带0排列到子本的自然排放次此排列的一块。此表还示出了7 896 897 895 1023 25 SJ/T 11368-2006 但是,编码器对子带样本进行了交叉重组,把每个瞬态段内频率相同的样本排在一起,然后按频率上升的J顶序排队,如表34所示:表34按交叉重组)1顺序排列的子带样本瞬态段。2 MDCT 。2 3 4 5 6 7 。256 257 258 640 641 642 2 3 259 300 301 643 644 645 。4 5 302 303 6 7 205 8 9 10 11 |陆12
21、 界14 频。带。172 173 174 。n 。254 255 637 638 639 |1024j 1022 _1 1023 解交叉重组器的任务是把子带样本的排列顺序由交叉顺序转换成自然排列顺序。以下程序示出了一个比较直接的实现方法:26 p=0; for (nCluster=O; nClusternNumCluster; nCluster+十)nBinO = anClusterBinOnCluster; nNumB locksPerFrm = anNumBlocksPerFrmPerClusternCluster; for CnBlock=O; nBlocknNumB locksPerF
22、rm; nBlock+) q = nBinO; for (n=O; n128; n+) afBinNaturalp = afBinlnterleavedq ; q += nNumBlocksPerFrm; p+; nBinO+; SJ/T 11368-2006 其中进行解交叉重组用到的变量见表350表35解交叉重组用到的变量解释变量以上表为例的值nNumCluster 瞬态段的个数I 3 每个瞬态段的氏度| 每个瞬态段的第一个子带样本的位置1 0、肌创按交叉重组顺序排列的子带样本按自然顺序排列的子带样本r-FU-nE u-J l-r 户U-OM-d-h?问r-FU甲AUFnr-nFe甲1ldr
23、-riL-v-p enua-LPAne-A S-la kBrr Creu -+Lna BSIN munn ul-i d由四aaaa 6.3 重建量化单元的个数量化单元由临本都属于同一个量化单元本的序号会不同,但本0、1、2、3、128、1、2、3、4、5、6量化单元的for ,所有在此矩形内的子带样) ,故表示这些样单元由子带样序号却变成了。、luster+) 007 anMaxActCb 其中重建量化单元的变量pnCBEdgenBand 心理声学临界颇带nBand的上限,根据来样频率和MDCT的长短由第B.2章的表中查出瞬态段nCluster的量化单元的个数anMaxActCbnCluste
24、r 6.4 逆量化器逆量化器利用每个量化单元的量化步长从量化指数中重建子带样本z子带样本=量化步长*量化指数其中,量化步长由量化步长的指数由表B.1中查出。由于一个量化单元内的所有子带样本共享一个量化步长,故子带样本的重建过程如下:for (nCluster=O; nClusternNumCluster; nCluster+) 27 SJ/T 11368-2006 nBinO = anClusterBinOnCluster; for (nBand=O; nBandanMaxActCbnCluster; nBand+) nNumB locks = anNumB locksPerFrrnPerCl
25、usternCluster; nStart = nBinO + nNumB locks * pnCBEdgenBand-l; nEnd = nBinO + nNumB locks * pnCBEdgenBand ; nQStepSelect = rnnQSteplndexnCluster nBand; nStepSize = aunStepSizenQStepSelect; for (nBin=nStart; nBinnEnd; nBin+) afBinReconstnBin = anQlndexnBin * nStepSize; 其中逆量化器用到的变量见表370表37逆量化器用到的变量变量解
26、释pnCBEdge nBand 心理声学l临界颜带nBand的上限,根据来样频率和MDCT的长短由第B.2章的表中查出anMaxActCbnCluster 瞬态段nCluster的量化单兀的个数aunStepSize 量化步长表,见表B.1 afBinReconst 重建的子带样本6. 5 联合强度解码如果比特流指示编码器中用了联合强度编码,则联合强度解码器从源声道复制子带样本井将其乘以比例因予以重建联合声道的子带样本:联合声道样本=比例因子*源声道样本由于一个量化单元内的所有子带样本共事一个比例因子,故子带样本重建过程如下:for (nCluster=O; nClusternNumCluster; nCluster+) nBinO = anClusterBinOnCluster; for (nBand=nJicCb; nBandsrcCh. anMaxActCbnCluster; nBand+) nStart = nBinO + anNumB lcksPerFrrnPerClusternCluster * pnCBEdgenBand-l; 而nd= nB