1、E ICS 13.310 A 91 GB 和国国家标准-tf: /、中华人民GB/T 25724-2010 安全防范监控数字视音频编解码技术要求Technical specification of surveillance video and audio coding 2010-12-23发布2011-05-01实施她码防;19:tll.lWJIJ/ 中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会发布-GB/T 25724一2010目次前言.田引言N1 范围2 规范性引用文件-3 术语、定义和缩略语13.1 术语和定义-3.2 缩略语104 约定114. 1 算术运算符114.
2、 2 逻辑运算符114. 3 关系运算符4. 4 位运算符4. 5 赋值运算符4. 6 数学函数124. 7 语法元素、变量和表-4.8 逻辑运算符的文字描述144. 9 过程5 视频部分5.1 编码比特流和输出数据的格式155. 2 语法和语义205. 3 解码过程.5.4 解析过程796 音频部分. 97 6.1 总体描述-6.2 编码器功能描述1006. 3 解码器功能描述1416. 4 比特分配描述1486. 5 存储、传输接口格式150附录A(规范性附录)假设参考解码器(HRD)156附录B(规范性附录)字节流的格式159附录c(规范性附录)视频档次与级别161附录D(规范性附录)视
3、频可用性信息(VUl) 166 附录E(规范性附录)补充增强信息(SEl)168附录F(规范性附录)变长码表17。附录G(规范性附录)音频档次和级别171附录H(规范性附录)异常声音事件类型定义173附录1(资料性附录)VAD检测附录J(资料性附录)噪声消除.参考文献186-GB/T 25724-2010 目。昌请注意,本标准的某些内容有可能涉及专利,本标准的发布机构不承担识别这些专利的责任。本标准的附录A附录H为规范性附录,附录I和附录J为资料性附录。本标准由中华人民共和国公安部提出。本标准由全国安全防范报警系统标准化技术委员会(SAC/TC100)归口。本标准起草单位:公安部第一研究所、北
4、京中星微电子有限公司、北京中盾安全技术开发公司、中星电子股份有限公司、清华大学、香港大学、大连理工大学、江苏东奇信息科技有限公司、中国传媒大学信息工程学院、国家多媒体软件工程技术研究中心、宁波艾利特科技发展有限公司、杭州恒生数字设备科技有限公司、公安部第三研究所、浙江大华技术股份有限公司、北京声迅电子有限公司、天津市亚安科技电子有限公司、深圳市艾立克电子有限公司、浙江大立科技股份有限公司、北京国通创安信息技术有限公司、天津天地伟业数码科技有限公司、金鹏电子信息机器有限公司、北京蛙视通信技术有限责任公司、杭州海康威视数字技术股份有限公司、中国科学院软件研究所、深圳中兴力维技术有限公司、北京汉邦高
5、科数字技术有限公司、宁波舜宇光电信息有限公司、数维科技(北京)有限公司、新太科技股份有限公司、星际控股集团有限公司、浙江警官职业学院、北京富盛星电子有限公司、杭州华三通信技术有限公司、广东志成冠军集团有限公司。本标准主要起草人:陈朝武、邓中翰、李晓峰、杨晓东、张跃、邱南、冯宇红、卢京辉、余子龙、袁丽蓉、费宝顶、高富、林冬、陈苗、钟兴业、王生进、杨磊、房子河、杨国胜、范京京、邹章彪、部晨、王耀辉、王浩、李鹏飞、王建勇、高磊、王晓、魏一、孙大瑞、闰建新、余和初、戴林、陈瑞军、于烨、黄膜麟、季鹏飞、韩大炜、刘蕾营、陈玉、周志文、向稳、新、吴参毅。阳山GB/T 25724-2010 sl 目前国内、国
6、际没有专门针对安全防范监控应用的视音频编解码标准,现有的视音频编解码标准,都是针对广播电视和大众娱乐方面的应用,在安全防范领域直接采用具有很大的不适应性。本标准专门针对安防监控领域应用的特殊性,如:视频图像的实时传输性、全天候24h监控环境的适应性、场景视音频信息的忠实还原性等要求制定。本标准主要技术特点有:a) 支持高精度视频数据编码,适应宽动态范围,保留更多的图像细节,满足忠实于场景的要求。视频支持8bit10 bit数据,并保留未来扩充到12bit16 bit的可能;b) 支持帧内4X4预测与变换量化、自适应帧一场编码(AFF)和上下文自适应二进制算术编码(CABAC)等技术,获得更好的
7、图像质量和更高的编码效率;c) 支持感兴趣区域(ROI)变质量编码,在传输网络带宽或数据存储空间有限的情况下,优先保证ROI图像质量,节省非ROI的开销,提供更符合监控需要的高质量视频编码,提高监控系统整体性能;d) 支持可伸缩性视频编码(SVC),对视频数据分层次编码,满足不同传输网络带宽和数据存储环境的需求;的支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,既保证对语音信号具有较好的编码效果,也保证环境(背景)声音的编码效果;f) 支持声音识别特征参数的编码,避免编码失真对语音识别和声纹识别的影响;g) 支持绝对时间参考信息、特殊监控事件等监控专用信息。监
8、控专用信息通过专门语法与视音频压缩编码数据一起传输和存储,便于快速检索、分类查询、视音频同步和监控数据的综合应用;h) 支持数据安全保护,规定加密和认证接口及数据格式,保证数据的安全性、完整性和非否认性。既保证格式的统一,便于互联互通,也保留足够的扩展灵活性,支持更高性能的加密和认证方式的增加和扩充。相关专利情况说明本文件的发布机构提请注意,声明符合本文件时,可能涉及与5.2. 3. 1、5.2. 3. 2、5.2. 3. 8、5.2.4.2、5.2.4.4、5.2.4.10、5.3.6.7、6.1.2、6.1.4、6.2. 6. 1. 3、6.2. 6. 1. 4. 10中有关内容相关的专利
9、的使用。本文件的发布机构对于该专利的真实性、有效性和范围无任何立场。该专利持有人已向本文件的发布机构表示,他愿意同任何申请人在合理且无歧视的条款和条件下,就专利授权许可进行谈判。该专利持有人的声明己在本文件的发布机构备案。相关信息可以通过以下联系方式获得:专利持有人名称联系地址北京中星微电子有限公司北京海淀学院路35号世宁大厦(100191)北京中盾安全技术开发公司北京海淀区首体南路1号(100048)p 中星电子股份有限公司天津经济技术开发区第四大街80号天大科技园A1座2层(300457)清华大学北京海淀区清华园(100084)数维科技(北京)有限公司北京海淀区中关村南大街2号(10008
10、6)武汉大学湖北武汉市武汉大学(430079)凹联系人:曾娟鹊通讯地址:北京海淀区学院路35号世宁大厦16层邮政编码:100191电子邮件: 电话:010-68948888-8950传真:010-68944075 联系人:马志江通讯地址:北京海淀区首体南路1号邮政编码:100048电子邮件:mzj76yahoo. com 电话:010-88513553-828传真:010-68454099 GB/T 25724-2010 请注意除上述专利外,本文件的某些内容仍可能涉及专利。本文件的发布机构不承担识别这些专利的责任。V -1 范围安全防范监控数字视音频编解码技术要求GB/T 25724-2010
11、 本标准规定了安全防范领域监控应用的数字视音频编码、解码过程的技术要求。本标准适用于安全防范领域的视音频实时压缩、传输、播放和存储等业务,对于其他需要视音频编解码的领域也可参考采用。2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准.然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的号|用文件.典最新版本适用于本标准。GB/T 20090. 2一2006信息技术先进音视频编码第2部分:视频3 术语、定义和捕略语下列术语、定义和缩略语适用于本标准。3. 1 术语
12、和定义3. 1. 1 Z字形扫描zig-zag scan 变换系数从较低的空域频率到较高全域频率(近似)的一个明确排列顺序。Z字形扫描用于帧宏块中的变换系数3. 1. 2 B条带B slice 根据同一条带内的己解码样点利用帧内预测进行解码,或者根据先前解码的参考图像利用双向预测进行解码的条带,对每个块进行帧间预测时最多使用两个运动矢量和参考索引。3. 1. 3 I条带1 slice 根据同一条带内的己解码样点利用帧内预测进行解码的条带。3.1.4 P条带P slice 根据同一条带内的已解码样点利用帧内预测进行解码,或者根据先前解码的参考图像利用前向预测进行解码的条带,对每个块进行帧间预测时
13、最多使用一个运动矢量和参考索引。3. 1.5 NAL单元NAL unit 一个语法结构,包含后续数据的类型指示和所包含的宇节数,数据以RBSP形式出现,必要时其中还包括认证数据及散布的防伪字节。3. 1. 6 NAL单元流NAL unit stream 由NAL单元组成的序列。GB/T 25724-2010 3. 1. 7 保留reserved 某些语法元素的特定取值,供中国安全防范监控数字视音频编解码技术标准工作组将来使用。符合本标准的比特流不应使用这些值,但是这些值将来可能在本标准的扩展版本中用到。3. 1. 8 闭环基音搜索closed-loop pitch search 即自适应码书搜
14、索,从加权输入信号和长时预测滤波器状态估计基音延迟的过程。3. 1.9 比特流bitstream 编码视音频及其相关数据,构成一个或多个编码视音频序列的比特序列。比特流既可用来表示NAL单元流,也可表示字节流。3. 1. 10 变换系数transform coefficient 频率域的标量,与解码过程的反变换部分中一个特定的一维或二维频率索引相关联的系数。3. 1. 11 变换系数幅值transform coefficient level 一个与特定二维频率索引相关联的整数量值,解码过程中用于计算变换系数的值。3. 1. 12 编码场coded field 一个场的编码表示。3. 1. 13
15、 编码过程encoding process 产生符合本标准的比特流的过程,本标准对视频编码过程不做规定。3. 1. 14 编码器encoder 实现编码过程的实体,包括软件及硬件。3. 1. 15 编码视频序列coded video sequence 按照解码顺序排列的IDR图像和紧随其后的零个或多个非IDR图像组成的图像序列。3. 1. 16 编码条带NAL单元coded slice NAL unit 包含编码图像的一个条带的NAL单元。,3. 1. 17 编码图像coded picture 一幅图像的编码表示。一个编码图像可以是一个编码场,也可以是一个编码帧。3. 1. 18 编码图像缓存
16、区coded picture buffer 一个先入先出缓存区,其存储方式按解码顺序排列。3. 1. 19 编码帧coded frame 一个帧的编码表示。3. 1. 20 残差residual 样点或数据元素预测值与解码值之间的差值。2 GB/T 25724-2010 3. 1.21 参考场reference field 一个标记为参考图像的场,用于编码场中P条带和B条带的解码过程中的帧间预测。3. 1. 22 参考索引reference index 参考图像的索引。3.1.23 参考图像reference picture 对解码顺序上后续图像的解码过程进行帧间预测的样点图像。3.1.24
17、参考帧reference frame 一个标记为参考图像的帧,用于编码帧中的P条带和B条带的解码过程中的帧间预测。3. 1. 25 参数parameter 序列参数集、图像参数集或安全参数集中的一个语法元素。参数也用于量化参数一词中。3. 1. 26 层layer没有分支等级关系中的一组句法结构。高层包含低层。编码层指编码图像序列层、图像层、条带层和宏块层。对于可伸缩性视频编码图像,不同层的图像具有不同的可伸缩性(如不同的空间分辨率)。3.1.27 土蜀field 一帧中的相隔行的集合。一帧由两场组成,包括一个顶场和一个底场。3. 1. 28 场宏块field macroblock 所包含的样
18、点仅来自一个编码场的宏块。一个编码场的所有宏块均为场宏块。3. 1. 29 场扫描field scan 变换系数的排列顺序。与Z字形扫描顺序不同的是,它对列的扫描快于对行的扫描。场扫描用于场宏块中的变换系数。3.1.30 代数码书algebraic codebook 脉冲幅度和位置组成的一个集合。通过码字索引k按照一定的规则得到第k个激励码矢量的脉冲幅度和位置。3. 1. 31 档次profile 本标准中的一个特定语法子集。3. 1. 32 底场bottom field 组成帧的两个场中的一个。底场的每一行在空间位置上均位于其对应的顶场行的下面。3. 1. 33 电导频谱对immittanc
19、e spectral pair 线性预测系数的变换称为电导频谱对。将逆滤波器传输函数A(z)分解为一个偶对称和一个奇对称多项式函数,该函数在单位圆上的根,即电导频谱对。3 GB/T 25724-2010 3.1.34 顶场top field 组成帧的两个场中的一个。顶场的每一行在空间位置上均位于其对应的底场行的上面。3.1.35 短时合成滤波器short term synthesis filter 对声道脉冲响应进行建模的滤波器。激励信号通过该滤波器可得到合成信号。3.1.36 二进制位bin 二进制位串中的1bit。3. 1. 37 二进制位串bin string 一串二进制位。二进制位串为
20、二值化的语法元素值的二进制表示。3. 1. 38 二值化binarization 语法元素所有可能值与一组二进制位串之间的唯一映射。3.1.39 反变换inverse transform 解码过程的一部分,将变换系数矩阵转换为空域样点矩阵的过程。3. 1. 40 防伪字节emulation prevention byte 一个字节,其值等于Ox03,可能在NAL单元中出现。|出伪字节的出现可以保证在NAL单元的后续宇节对齐的字节流中不会含有起始码前缀。3. 1. 41 非参考图像non-reference picture 不用于对任何其他图像进行帧间编码的图像。3. 1. 42 分量compo
21、nent 图像的三个样点矩阵(一个亮度矩阵,两个色度矩阵)中的一个矩阵或矩阵中的单个样点。在音频部分,也指矢量中的元素或信号中的某些频率成分。3.1.43 感知加权滤波perceptual weighting filter 利用共振峰处的噪声掩蔽特性,在共振峰区域分配比较大的失真,来减少峰谷主观感觉噪声的滤波。3.1.44 功率谱power spectrum 信号通过傅立叶变换后得到幅度谱的平方。3.1.45 光栅扫描raster scan 矩形二维图像到一维图像的映射过程,一维图像的第一组值来自于二维图像最上边一行的从左到右扫描,然后依次是第二行、第三行等。对于图像每行(由上到下)都是从左到
22、右扫描的。3. 1. 46 宏块macroblock 一个16X 16的亮度样点块和相应的两个色度样点块。4 G/T 25724-2010 3. 1. 47 宏块索引macroblock index 编码帧中,宏块索引为帧图像的宏块光栅扫描顺序的序号,起始序号为0。编码场中,宏块索引为场图像的宏块光栅扫描顺序的序号,起始序号为0。3.1.48 -后向预测backward prediction 使用显示顺序上在后的解码图像中的样点对当前图像中的样点进行预测。3.1.49 划分partitioning 将一个集合分为子集的过程。集合中的每个元素属于且只属于某千个子集。3. 1. 50 基本层图像b
23、ase layr picture 不需要参考其他图悻层信息即rlJ以解码的图像。3. 1.51 级别level 本标准中的一个特定档次巾的参数取值的限定集合。一个档次可以包含一个或多个级别。对所有档次定义了一姐相同的级别,不同档次的每个级别大部分忏件都是通用的。对于一个独立的实现,在一定的约束条件下.可以支持多个级别。3. 1. 52 即时解码刷新(IDR)图像instantaneous decoding refresh (IDR) picture 一幅编码图像,其中所有条带为I条情。II)R罔像解码之后,解码顺序上所有后续的编码图像都可以不用根据任何在IDR图像之前解码的图像来近行帧间预测解
24、码。每个编码视频序列的第一幅图像为IDR图像。3. 1. 53 假设参考解码器hypothetical reference decoder 一个假设的解码器模型,规定了对于符合本标准的NAL单元流或字节流的可变性的约束。3.1.54 解码过程decoding process 读入编码的比特流后产生解码图像或者音频数据的过程。3. 1. 55 解码器decoder 实现解码过程的实体,包括软件及硬件。3. 1. 56 解码顺序decoding order 解码过程中处理语法元素的顺序。3. 1. 57 解码图像decoded picture 通过解码一幅编码图像得到的图像。一幅解码图像既可以是一
25、个解码帧,也可以是一个解码场。一个解码场可以是顶场,也可以是底场。3. 1.58 解码图像缓存区decoded picture buffer 保存解码图像的缓存区,用于附录A中规定的预测参考、输出重排序或输出延时等。5 GBjT 25724-2010 3. 1. 59 开环基音搜索open-loop pitch search 直接从加权输入信号中估计最优基音延迟的过程。开环基音搜索简化了基音分析,并且将闭环基音搜索限定在开环基音搜索的延迟值附近。3.1.60 可变长度编码variable length coding 可逆的摘编码过程,为出现概率大的符号分配较短的码字,为出现概率小的符号分配较长
26、的码字。3. 1. 61 可伸缩性视频编码scalable video coding 编码序列中的图像具有一定的可伸缩性。具有可伸缩性的图像通常包含基本层图像和增强层图像。3. 1. 62 块block在视频信号空间中,指一个MXN(M列N行)的样点矩阵,或者一个MXN的变换系数矩阵。在音频信号空间中,指一个一维矢量。3.1.63 亮度luma 一个样点矩阵或单个样点,用于描述信号的单色表示。亮度所用符号为Y。3. 1. 64 量化参数quantization parameter 解码过程中对变换系数幅值进行反量化时使用的参数。3.1.65 零输入晌应zero input response 滤
27、波器当前输入为零时,由过去输入而产生的输出。3. 1. 66 美尔Mel 一种非线性的频率刻度,根据主观音高进行划分。3. 1. 67 美尔频率倒谱系数Mel-frequency cepstral coefficients 用FFT将时域信号转化到频域,对其对数能量谱依照Mel刻度分布的三角滤波器组进行卷积,对各个滤波器的输出构成的向量进行DCT得到的系数,即美尔频率倒谱系数。3. 1. 68 内部采样频率internal sampling frequency 音频编码器的采样频率,范围为12800 Hz38 400 Hz,采用F,表示。3. 1. 69 逆滤波器inverse filter
28、去除信号短时相关性的滤波器。3. 1. 70 频率索引frequency index 与解码过程中反变换之前的变换系数相关的一维或二维索引。3. 1. 71 起始码前缀start code prefix 字节流中唯一等于OxOOOOOl的3个字节的序列,作为每个NAL单元的前缀。解码器可以利用起6 GB/T 25724-2010 / 始码前缀的位置来确定一个新的NAL单元的开始和前一个NAL单元的结束。NAL单元中通过加入防伪字节来防止假冒的起始码前缀出现。3. 1. 72 前向预测forward prediction 使用显示顺序上在前的解码图像中的样点对当前图像中的样点进行预测。3. 1.
29、 73 前向帧间解码图像forward inter decoded picture p图像帧间预测中只使用前向预测解码的图像。3. 1. 74 色度chroma 一个样点矩阵或单个样点,用于描述代表两个相对于基色的色差信号中的一个。色度所用符号为Cb和Cr。3. 1. 75 上下文自适应二进制算术编码context adaptive binary arithmetic coding 一种情编码方法,根据上下文内容对二进制位进行编码,产生比特流。3. 1. 76 声纹i只别voiceprint recognition 根据语音的声学特征识别该段语音所对应的说话人的过程。3. 1. 77 数据比特
30、串string of data bits 语法元素的若干比特位的序列,出现在原始字节序列负载中原始宇节序列负载截止位之前。在SODB中,最左边的比特位表示第一位即最高位,最右边的比特位表示最后一位即最低位。3.1.78 双向预测bidirectional prediction 使用显示顺序上在前及在后的解码图像中的样点对当前图像中的样点进行预测。3. 1. 79 双向帧间解码图像bidirectional inter decoded picture B图像帧间预测中使用双向预测解码的图像。3. 1. 80 条带slice 特定区域内部按照光栅扫描顺序排列的整数个宏块。虽然一个条带包含区域内部按
31、照光栅扫描顺序排列的整数个宏块,但这些宏块在图像内部并不一定是按照光栅扫描顺序连续排列的。宏块索引可以通过条带的第一个宏块的索引以及宏块到条带的映射得到。3. 1. 81 条带头slice header 编码条带的一部分,包含与该条带中第一个或者全部宏块有关的数据元素。3. 1. 82 跳过宏块skipped macroblock 没有编码数据的宏块。3. 1. 83 图像picture 源、编码或重构的图像数据,场或帧的通称。对于逐行扫描视频,一幅图像指一帧;而对于隔行扫描GB/T 25724-2010 视频,一幅图像指一帧,或组成该帧的顶场或底场。3.1.84 图像参数集picture p
32、arameter set 一个语法结构,包含应用于零个或多个编码图像的语法元素,由每个条带头中的语法元素pic_pararneter_set_id确定。3.1.85 维纳滤波器wiener filter 根据最小均方误差准则,即滤波器的输出信号与期望信号之差的均方值最小,计算得到的最佳线性滤波器,称为维纳滤波器。3. 1. 86 线性预测系数LP coefficients 短时预测滤波器系数,也称为LPC系数。3.1.87 序列参数集sequence parameter set 一个语法结构,包含应用于零个或多个完整编码视频序列的语法元素,由条带头中的语法元素plC_pararneter_se
33、t_id确定所引用的图像参数集,由图像参数集中的语法元素seq_pararnet付set_id确定所引用的序列参数集。3. 1. 88 音频超帧audio superframe 由若干音频帧组成,目前本标准规定音频超帧中只包含一个音频帆。3. 1.89 音频子帧audio subframe 音频帧的一部分,在Fj2采样频率下,由64个样本构成的数据块。3. 1. 90 游程run 解码过程中连续出现的数据元素的数目。在某些t下文环境中植于程指Z字形扫描或场扫描后产生的变换系数数组中非0系数之前的0值变换系数的数目。3. 1.91 预测prediction 使用预测值来提供当前解码的样点值或数据
34、元素的估计。3. 1. 92 预测值predictor 以前解码的样点值或数据元素的线性组合。3.1.93 语法结构syntax structure 零个或多个语法元素按照规定顺序一起出现在比特流中。3. 1. 94 语法元素syntax element 比特流中表示数据的元素。3.1.95 语音识别speech recognition 根据语音的声学特征和语言模型,将该段语音翻译为文本的过程。8 GB/T 25724-2010 3. 1. 96 源source编码前视音频素材或者素材的某些属性。3. 1. 97 原始字节序列负载raw byte sequence payload 一个语法结构
35、,包含整数个封装于NAL单元中的字节。RBSP或者为空,或者包含具有数据比特串形式的语法元素,其后跟随RBSP截止位和零个或多个连续的0值比特。3. 1. 98 原始字节序列负载(RBSP)截止住raw byte sequence paylod (RBSP) stop bit 值为1的一个比特,出现在原始字节序列负载(RBSP)中的数据比特串之后。RBSP中数据比特串的结束位置可以通过搜索RBSP中的民BSP截止位得到。3. 1. 99 运动矢量motion V1i现吃。r/ / 二维矢量,用于帧问葫测,表示匹配对象在解码图像和参考罔像中的位置偏格。3. 1. 100 增强层图像enhance
36、 layer pictllre 需要参考其他图像层信息进行解码的图像。本标准11的一个增强层图像在解码时可以参考位于其下的相邻的图像层信,弘,同时该增强层图像的空间分辨率在水平和l垂直方向上均为位于其下的相邻的(用来参考的)图像层的二倍。3. 1. 101 帧frame在视频信号空间中由一个亮度样点拒阵(川和l两个口j能存在的色度样点矩14(Cb和Cr)构成。在音频信号空间中,作为音频处用的基本数据块。在F,采样频率下,512个样本构成)帧,在Fs/2采样频率下,256个样本构成一帧。3. 1. 102 帧宏块frame mactoblock 一个编码帧中的所有宏块均为帧宏块3.1.103 帧
37、间编码inter codin, 使用帧间预测对块、宏块、条带、或图像进行编码。3. 1. 104 帧间预测inter prediction 利用己解码的参考图像得到当前样点的预测值的过程。3. 1. 105 帧内编码intra coding 使用帧内预测对块、宏块、条带或图像进行编码。3.1. 106 帧内解码图像intra decoded pictllre I图像只使用帧内预测解码的图像。3. 1. 107 帧内预测intra prediction 利用同一图像中己解码的样点得到当前样点的预测值的过程。9 GB/T 25724-2010 3. 1. 108 字节byte 连续的8bit,读写
38、时左边第一位为最高位,右边第一位为最低位。表示为比特序列时,字节的最高有效位为第一位。3.1.109 字节对齐byte-aligned 从比特流的第一个比特开始的8的倍数的位置为字节对齐的位置。比特或字节或语法元素为字节对齐的,指它出现在比特流中字节对齐的位置上。3.1.110 字节流byte stream NAL单元流的封装,包含起始码前缀和附录B定义的NAL单元。3. 1. 111 自适应码书adaptive codebook 通过长时预测滤波器状态得到的码书,由每个子帧自适应的激励矢量构成。3. 1. 112 直流偏置DC-offset 音频信号的直流分量。3.2 缩略语ACELP Al
39、gebraic Code Excited Linear Prediction 代数码书激励线性预测BWE Bandwidth Extension 带宽扩展10 CABAC Context Adaptive Binary Arithmetic Coding 上下文自适应二进制算术编码CBR Constant Bit Rate 恒定比特率CPB Coded Picture Buffer 编码图像缓存区CRC Cyclic Redundancy Code 循环冗余校验码DCT Discrete Cosine Transform 离散余弦变换DFT Discrete Fourier Transform
40、 离散傅立叶变换DPB Decoded Picture Buffer 解码图像缓存区FFT Fast Fourier Transform 快速傅立叶变换FIR Finite Impulse Response 有限冲击响应HRD Hypothetical Reference Decoder 假设参考解码器IDCT Inverse Discrete Cosine Transform 离散余弦逆变换IDFT Inverse Discrete Fourier Transform 离散傅立叶逆变换IDR Instantaneous Decoding Refresh 即时解码刷新IFFT Inverse
41、Fast Fourier Transform 快速傅立叶逆变换ISF Immittance Spectral Frequency 电导谱频率ISP Immittance Spectral Pair 电导谱对LP Linear Prediction 线性预测LPC Linear Predictive Coding 线性预测编码LSB Least Significant Bit 最低有效位L TP Long Term Predictor 长时预测MA Moving A verage 滑动平均MB Macroblock 宏块MFCC Mel-Frequency Cepstral Coefficien
42、ts 美尔频率倒谱系数MSB Most Significant Bit 最高有效位MSVQ Multi-Stage Vector Quantization 多级矢量量化NAL Network Abstraction Layer 网络抽象层PCM Pulse Code Modulation 脉冲编码调制RBSP Raw Byt巳SequencePayload 原始字节序列负载ROI Region Of Interest 感兴趣区域SEI Supplement E出a盯ementInformation 补充增强信息SNR Signal Noise Ratio f言噪比SODB String Of
43、Data Bits 数据比特串SVC Scalable Video Coding 可伸缩性视频编码T AC Transform Audio Coding 变换域音频编码TVC Transform Vector Cding 变换域矢量编码VAD Voice Activity Detection 语音活动检测VBR Variable Bit Rate 可变比特率VCL Video Coding Layer 视频编码层VLC Variable Length Coding 可变长度编码VQ Vector Quantization 矢量量化VUI Video Usability Information
44、视频可用性信息4 约定4.1 算术运算符算术运算符定义见表10表1算术运算符定义编号符号1 + 加法运算说明2 减法运算(二元运算符)或取反(一元前缀运算符)3 乘法运算4 8 卷积运算G/T 25724-2010 5 .rV 指数运算,表示I的y次幕。在不是表示指数的情况下也可表示上标6 / 除法运算,不做截断或四舍五入7 除法运算,不做截断或四舍五入8 I 除法运算,不做截断或四舍五入y y 9 2:!( i) 自变量i取由I到y(含y)的所有整数值时,函数!(i)的累加和I=X 10 .r%y 模运算,.r除以y的余数,其中I与y都是正整数在没有以插入括号来明确指定运算优先次序的情况下,
45、遵守如下规则:乘法和除法运算先于加法和减法运算;一一一乘法和除法运算从左到右进行;一一加法和减法运算从左到右进行。4.2 逻辑运算符逻辑运算符定义见表2。11 GB/T 25724一2010表2逻辑运算符定义编号符号说明1 & 逻辑与运算2 11 逻辑或运算3 逻辑非运算4 x? y:z 如果z为真或非0值,则取值为y;否则取值为z4.3 关系运算符 关系运算符定义见表30表3关系运算符定义编号符号说明1 大于2 = 大子或等于3 y 将I以2的补码整数表示的形式向右移y位。仅当y取非负数时定义此运算。右移运算移入MSB的位应该等于移位运算前z的MSB的值4 工=O Abs(x) = i (-
46、x,xy Ix. x.-=v Max(x , y) = ( (y , x=O Sign(x)工- (-1 , xO) non_roi_skip_flag if(! non_roi_skip_flag & & svc_flag) scalable_non_roi_skip_flag pic_init_ qp_for_roi for(i=O;i) ( successive_hash_pictures_minusl signature_data_length_minusl rbsp_ trailing_ bits( ) 5.2.3.2.4 补充增强信息RBSP语法补充增强信息RBSP语法见表13。表13补充增强信息RBSP语法表24 描述符u(1) u(1) u(1) 描述符u(1) u(1) u(4) u(4) u(1) u(1) u(1) u(1) u(4) u(8) u(8) 描述符表13(续)sei_rbsp( ) while( more_rbsp_data( ) ) rbsp_trailing_bits( ) 补充增强信息消息语法见表1