1、中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频发布实施国家技术监督局发布前言本标准等同采用国际标准 信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 第 部分 视频在 信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 总标题下 目前包括以下 个部分第 部分 系统第 部分 视频第 部分 音频第 部分 一致性测试本标准的附录 附录 附录 是标准的附录 附录 附录 附录 是提示的附录本标准由中华人民共和国电子工业部提出本标准由电子工业部标准化研究所归口本标准起草单位 清华大学本标准主要起草人 钟玉琢 智西湖前言国际标准化组织 和
2、 国际电工委员会 是世界性的标准化专门机构 国家成员体 它们都是 或 的成员国 通过国际组织建立的各个技术委员会参与制定针对特定技术范围的国际标准 和 的各技术委员会在共同感兴趣的领域内进行合作 与 和 有联系的其他官方和非官方国际组织也可参与国际标准的制定工作对于信息技术 和 建立了一个联合技术委员会 即 由联合技术委员会提出的国际标准草案需分发给国家成员体进行表决 发布一项国际标准 至少需要 的参与表决的国家成员体投标赞成国际标准 是由 信息技术 联合技术委员会制定的在 信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 总标题下 目前包括以下 个部分第 部分 系统第 部分 视
3、频第 部分 音频第 部分 一致性测试附录 附录 附录 构成标准的一部分 附录 附录 附录 仅提供参考信息引言注 对 视频部分总貌感兴趣的读者应先读本引言 接着读附录 最后再回到第 章和第 章目的本标准是为了满足不断增长的对在各种存储媒体上压缩视频的一个统一的表达格式的需求而制定的 如 温盘和光盘驱动等 本标准的规定可用于位流速率在 附近的压缩视频序列的编码表示 使用本标准意味着运动视频可作为计算机数据进行操作 并可通过现有的和将来的网络进行传送和接收 编码表示可用于 线和 线电视系统 也为用于工作站和个人机的显示提供了灵活性本标准主要是按照能提供连续的 传输速率约 的存储媒体而制定的 但因采用
4、的方法是一般通用的 故可用于更广的范围内编码参数制定本标准的意图是定义一种具有很高灵活性的适用于多种不同应用的源编码算法 为此目的 位流中包含了许多定义编码位流和解码器特性的参数 对此可给出一个例子 算法对于图像来说适用于各种大小和长宽比 以及信道和设备可工作于很大的位速率范围内因本标准可表示的位流的特性范围很大 又定义了一个所谓的 约束参数 的这些编码参数的子集定义约束参数的目标是对一个广泛的有用参数范围提供指导 满足本子集的约束并不是本标准的要求位流中一个标志位用来指明位流是否是约束参数的约束参数汇总图片宽度 小于或等于 像素点图片高度 小于或等于 线图片范围 小于或等于 宏块像素速率 小
5、于或等于 宏块 秒图片速率 小于或等于运动矢量范围小于 像素 使用半像素矢量见表输入缓冲大小 在 模式下 小于或等于位速率 小于或等于 静态位速率算法概述本标准定义的编码表示可获得高的压缩比 同时可保持良好的图像质量 由于在编码过程中并不是保存精确的像素值 所以算法不是无损的 编码技术的选择是基于要求高质量的图片和高的压缩比与对编码位流的随机操作的需求之间的权衡 以比较满意的位速率达到良好的图片质量需要很高的压缩比对此仅用帧内编码是无法完成的 然而对随机操作的需求用纯粹的帧内编码却能获得最满意的结果 这需要在帧内和帧间编码之间 递归和非递归缩减时间冗余之间进行仔细的权衡为达到高压缩比采用了一系
6、列的技术 其中第一个几乎与本标准无关 就是为信号选择一个合适的分辨率 再一个就是利用基于块的运动补偿来减少时间冗余的算法 运动补偿用来根据前幅图对当前图进行因果预测 根据后继图对当前图的非因果预测 或者根据前序图和后继图对当前图进行插值预测 运动矢量是针对每一 像素 线 的图像区域定义的 差值信号 即预测差 利用离散余弦变换 作进一步压缩以消除空间相关性 然后进行量化 在量化过程中要丢掉一些不太重要的信息因而这是不可逆过程 最后 运动矢量与 信息相结合 用变长码进行编码时域处理因为对随机操作的要求和高效压缩的要求是相互冲突的 因而定义了三种主要的图类型 帧内编码图 图 编码时无需参考其他图 它
7、给编码序列的解码的起始提供操作点 但仅能获得中等的编码压缩比 预测编码图 图 利用根据过去的帧内和预测编码图的运动补偿预测 可作更有效的编码 图还可用作进一步预测的参考 双向预测编码图 图 能提供最大限度的压缩 然而需要过去和将来的参考图作为运动补偿 双向预测编码图不能用作预测的参考 序列中三种类型图的组织是非常灵活的 这个选择依赖于对应用的要求 留给编码器去作 图 说明了三种不同类型图之间的关系图 时域图结构示例本标准中定义的第四种图类型是 图 它提供一种简单而有有限质量的快放模式运动补偿 宏块选择 的宏块作为运动补偿单位是在使用运动信息所带来的编码效率的提高与其需要的附加存储开销之间折衷的
8、结果 每一宏块可以是多种不同类型中的一种 例如 帧内编码 向前预测编码向后预测编码以及双向预测编码宏块均允许存在于双向预测编码图中 依照宏块类型 运动矢量信息和其他附加信息同压缩的预测误差信号一样存储于每一宏块中 运动矢量的编码同上一个已编码的运动矢量不同 它使用变长码 矢量可表示的最大长度可以图 图为基础进行编程 以满足最迫切的应用从而在一般的情况下无需折衷系统的性能计算合适的运动矢量是编码器的任务 在本标准中没有规定如何去作减少空间冗余原始图像和预测差值信号都有很高的空间冗余 本标准使用一种基于块的视觉加权量化和行程编码的 方法 作为帧内编码宏块的原始图像以及作为预测编码宏块的预测误差的
9、块先变换到域并进行比例变换 然后进行量化 量化后许多系数值为 于是利用二维游程和变长码来对剩余的系数进行有效化编码编码本标准中设有规定编码过程 它规定了位流的语法和语义以及解码器中的信号处理 编码器必须在图像质量和编码效率上寻求速度和费用间的权衡上作许多选择 本章简明描述了一个编码器需要完成的功能 图 示出了主要的功能块其中 离散余弦变换离散余弦逆变换量化逆量化变长码图 简化的视频编码器框图输入的视频信号必须经数字化并表示成一个亮度信号和两个色彩差值信号 然后可进行预处理和格式转换以选择一合适的窗口 分辨率和输入格式 本标准要求色差信号 和 和亮度信号在垂直和水平方向上按 进行子采样 并在必要
10、时以非隔行扫描信号进行重格式化编码器必须为每幅图选择其类型 确定图类型之后 编码器需估计图中 宏块的运动矢量图中每一非帧内宏块需一个矢量 而 图中则需一个或两个矢量如果用 图 编码前有必要对图序列顺序做一些调整 因为 图的编码用到双向运动补偿预测 它只有在其后继的参考图 图或 图 解码之后才能够解码 因此 编码器对图像顺序重新做了调整 使得图像按解码器解码的顺序到达解码器 解码器之后又重新恢复正解的顺序一幅图内编码的基本单位是宏块 在每幅图中宏块按顺序编码 从左到右 从上到下 每一宏块包含 个 的块 个亮度块 个 色度块 一个 色度块 见图 注意 由 个亮度块覆盖的图像区域同每一色度块覆盖的区
11、域相重合 这是为满足人类视觉系统的灵敏度而进行的色度信息子采样造成的图 宏块结构首先对一给定宏块 选择编码模式 它取决于图像类型 局部的运动补偿预测的有效性 以及块内信号的性质 其次 按照编码模式 形成块内容运动补偿预测要依赖过去和 或将来的参考图 从当前宏块的实际值减去预测值形成差值信号 第三把这些差值信号分成 的块 个亮度块和 个色度块并对每一块进行离散余弦变换 对每一结果的 系数块进行量化 并对二维的块进行 字扫描 把其转化成一维量化的 系数串 第四 对宏块的附加信息 模式 运动矢量等 和量化的系数数据进行编码 为达最高的编码效率 对不同数据元素定义一些变长码表 对量化系数数据使用变长编
12、码使用不同的图像类型和变长码的一个后果是总的数据速率是可变的 在固定速率信道的应用中 可使用一个 的缓冲器来缓冲编码器对信道的输出 应监视该缓冲器的状态来控制编码器产生的位数 控制量化过程是控制位速率的最直接方法 本标准中规定了一个缓冲系统的抽象模型 视频缓冲检验器 用以约束用于一幅图的位数最大变化量 这样确保可用一个已知容量的缓冲器对位串流解码到此图像的编码表示已经完成 编码器的最后一步是通过解码再次产生 图和 图以用作后续图像编码的参考图 量化数据经逆量化 并对每块进行 逆变换 产生的预测误差信号再回加到预测信号上 并限制在要求的范围内 以产生解码参考图解码解码是编码的逆操作 它比编码要简
13、单许多 因为无需进行运动估值 所要的选择也很少 在本标准中定义了解码过程 下面是对位流的一种可能解码方法的简要概述 图 中示出了主要的功能块其中 离散余弦逆变换逆量化多路分解可变长解码图 基本视频解码器框图对于固定速率的应用 信道以恒定速率对 缓冲器填充位流 解码器读该缓冲器并依据定义的语法对位流中的数据元素进行解码解码器读位流过程中识别编码图像起始和图像的类型 它按顺序解码图像中的每一宏块 如果有宏块类型和运动矢量的话 则用解码器已存储的过去和将来的参考图作为基础构造当前宏块的预测 系数数据经过解码和逆量化 每一 的系数块经 逆变换 见附录 所述 结果加到预测信号上并限制在规定的范围内当图中
14、的所有宏块经处理之后 图像就重构起来了 如果它是 图或 图则它是后继图的参考图并加以存储 替代存储最久的参考图 在图像被显示前它们可能需要作从编码的顺序到自然的显示顺序的调整 调整顺序之后 图像以数字形式作为后处理之用 并以应用选定的任何方式进行显示编码视频位流的结构本标准规定了编码视频位流的语法 该语法含有 层 每层支持一个信号处理或者一个系统功能语义层 功 能序列层 随机存取单元 上下文图像组层 随机存取单元 视频图像层 初始编码单元片层 重同步单元宏块层 运动补偿单元块层 单元算法所支持的特性使用数字存储媒体上压缩视频的应用程序 除能进行正常的序列播放操作外 还要求能进行一系列的其他操作
15、 编码位流的设计支持这一系列的操作随机操作随机操作是存储媒体上视频的一个极重要的特征 它要求任一图像可在有限时间内进行解码 这意味着位流中存在操作点 即可识别的信息段 它不需参考其他段数据即可解码 每秒的空间内可有两个随机操作点 帧内图 而不会严重损害图像质量快速搜索依赖于存储媒体 有可能从编码位流中扫描操作点 在具体应用目录的帮助下或不在本标准范围内的其他信息的帮助下 以获得快速正放或快速倒放的效果反向播放一些应用可能要求视频信号能进行逆顺序播放 这可通过先用解码器的存储器存储解码后的整个图组 然后再按逆序进行播放 编码器可通过缩短图组长度使这一特征的实现更简单鲁棒性绝大多数的数字存储媒体和
16、信道都是会出错的 应该使用合适的信道编码方案 这已超出本标准的范围了 然而在本标准中定义的压缩方案对残差具有鲁棒性 子图的结构使得解码器可从数据错误恢复过来并对解码重新同步 因而压缩数据的错误会导致解码图像中的错误受到限制 解码器可使用隐含的策略来掩藏这些误差编辑对高效编码和容易编辑的要求是有冲突的 编码结构和语法的设计并没有以简化任何图像的编辑为主要目标 不过 编码中包含了一些特征从而能够对编码数据进行编辑中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频国家技术监督局批准实施概述范围本标准规定了数字存储媒体中视频的编码表示以及解码处理 表示方法除了支
17、持一些特殊功能 如随机操作 快速正放 快速倒放 常速倒放 停顿以及图像静止之外 也支持常速正放 本标准与标准线 线电视格式是兼容的 它给个人计算机 工作站的显示使用提供了灵活性主要适用于支持连续传送速率约 的数字存储媒体 比如 盘 数字音频磁带 以及硬磁盘等 因为其采用了一般化的手段 它可应用于更广的范围内 存储媒体可与解码器直接相连 或者通过通信方法 如总线 或电信链接 本标准使用约 线 每线 像素 图速率在约 范围的非间隔扫描视频格式引用标准下列标准所包含的条文 通过在本标准中引用而构成为本标准的条文 本标准出版时 所示版本均为有效 所有标准都会被修订 使用本标准的各方应探讨使用下列标准最
18、新版本的可能性信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 第 部分 系统信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 第 部分 音频信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 第 部分 一致性测试此标准正在制定中建议 演播室数字电视编码参数报告 单色和彩色电视系统特性建议 音频信号的录制报告 便携和移动式卫星接收器的声音信号广播 附录 中的先进数字系统 的综述建议 声音编程电路的预增强实现离散余弦逆变换的规范数字音频系统技术要素定义采用下列定义 如果仅针对某一部分 则在方括号内注明系数 视频在一个或两个方向上为非零的所有 系数存取单元
19、系统对压缩音频 存取单元是音频存取单元 对压缩视频 存取单元是一幅图像的编码表示自适应段 音频音频信号数字表示的一分段 其时间是可变的自适应位分配 音频根据心理声学模型 以时间和频率变化的方式对子带进行位分配自适应噪声分配 音频按照心理声学模型 以时间和频率变化的方式对频带赋以编码噪声混迭 音频奈奎斯特子采样所产生的镜像信号分量分析滤波器组 音频在编码器中把宽带 音频信号变换成一组子采样的子带样值音频存取单元 音频对层 和 音频存取单元定义为可由自身进行解码的编码位流的最小部分 其中解码是指 完全重构的声音 对层 音频存取单元是指利用以前获得的主要信息可以解码的一部分位流音频缓冲器 音频系统目
20、标解码器中用于存储压缩音频数据的缓冲器音频序列 音频一个不中断的音频帧序列 其中以下的参数保持不变标识符层采样频率对层 和 位速率索引向后运动矢量 视频按照显示顺序 利用后继图作为运动补偿的参考图中的运动矢量巴 音频临界频带速率单位 巴尺度是一个从频率尺度到与人耳的频率选择性相对应的音频范围的非线性映射双向预测编码图 图 视频使用根据过去和 或将来的参考图的运动补偿预测进行编码的图位速率压缩位流从存储媒体输入到解码器的速率块压扩 音频某一时间内音频信号数字表示的归一化块 视频一个 行 列的正交像素块边界 音频利用强度立体声编码的最低子带字节对齐在编码位流中 如果一位的位置 从位流的第一位开始
21、是 的倍数 则该位就称为字节对齐的字节位的序列信道存储和传输 流的数字媒体声道 音频立体声信号的左 右信道色度 分量 视频按照 建议 中定义的方式 用于表示与主色彩相关的两色差信号之一的矩阵 块或单个像素编码音频位流 音频按照 中规定的音频信号的编码表示编码视频位流 视频按照本标准的规定 一幅或多幅图像序列的编码表示编码顺序 视频图像存储和解码的顺序 该顺序未必与显示的顺序一样编码表示以编码形式表示的数据元素编码参数 视频表现编码视频位流特征的 可以由用户定义的参数的集合 由编码参数表征位流 由能够解码的位流表征解码器分量 视频组成一幅图的 个矩阵 亮度和两个色度 之一的矩阵 块或单个像素压缩
22、缩减表示数据项的位数恒位速率编码视频 视频具有恒定的平均位速率的压缩视频位流恒位速率压缩位流时从开始到结束的位速率是常数的操作约束参数 视频中定义的编码参数集中的值约束系统参数流 系统符合 的 中定义的约束的 多路流循环冗余码临界带速率 音频频率的心理声学函数 对一给定的可听频率 它正比于低于该频率的临界带的个数临界带 音频与人耳的频率选择性相对应的谱域的心理声学度量数据元素编码前或解码后的数据项的表示系数 视频在两个方向上频率均为零的 系数编码图 图 视频仅用其自身信息进行编码的图 在编码表示的 系数中 仅有 系数系数一给定的余弦基函数的幅值解码流压缩位流的解码重构解码器输入缓冲器 视频在视
23、频缓冲检验器中规定的先进先出 缓冲器解码器输入速率 视频在视频缓冲检验器中规定的且在编码视频位流中编码的数据速率解码器解码处理的实体解码 处理中定义的处理 即读入编码的位流并产生解码图像或音频采样值解码时标 系统可在数据包头中出现的一个域 它用于表明系统目标解码器解码一个存取单元的时间去矫 音频对存储或传输的音频信号所采取的一种滤波以消除因加重而引起的线性失真逆量化 视频量化 系数在对其位流中的表示进行解码之后和作 逆变换之前所进行的比例变换处理数字存储媒体数字存储或传输的器件或系统离散余弦变换 视频离散余弦正变换或离散余弦逆变换 是一种可逆的正交变换 本标准的附录 中定义了逆变换显示顺序 视
24、频解码图像进行显示的顺序 通常与输入编码器编码的顺序相同双声道模式 音频在一个位流中编码有两个相互独立节目内容 如两种语言 的音频信道模式 编码过程与立体声的相同编辑对一个或多个压缩位流进行操作 以产生一个新的位流 合格的编辑位流必须满足 规定的要求基本流 系统编码视频 音频或其他编码位流的统称加重 音频音频信号在进行存储或传输前所进行的滤波 以提高高频下的信噪比编码器编码处理的实体编码 处理在 中没有规定的一种处理 读入输入的图像或音频样值流 以产生一个符合中定义的有效的位流熵编码信号数字表示的一种变长无损编码 用以减少冗余快速正放 视频按显示顺序 以比真实时间快的速度播放一图像序列或图像序
25、列的一部分快速傅立叶变换 离散傅立叶变换的快速算法 一种正交变换滤波器组 音频覆盖全部音频范围的一组带通滤波器固定分段 音频分成固定时间段的音频信号数字表示的一段禁止定义编码位流的条款中用到的 禁止 表示某值决不能被使用 这常用于避免起始码的误判强迫更新 视频不时地对宏块进行帧内编码处理 以确保编码器和解码器间的 逆变换不匹配误差不至于过分积累向前运动矢量 视频用于运动补偿的运动矢量 它以显示顺序上在其前的图为其参考图帧 音频与从音频存取单元的音频 样值相对应的部分音频信号自由格式 音频对每层小于最大有效位速率且与所定的位速率不同的所有位速率将来参考图 视频依显示顺序在当前图之后的参考图区组
26、层 音频量化前被一起考虑的 个子带中连续 个子带样值的集合 它们对应于 个 样本区组 层 音频载有自身辅助信息的 频率线图组 视频支持随机操作的一幅或多幅编码图的序列汉宁窗口 音频傅立叶变换之前将逐个样值应用于音频样值块的时间函数哈夫曼编码一种熵编码方法混合滤波器组 音频子带滤波器组和 的串行组合音频改进的离散余弦逆变换强度立体声 音频基于在高频下仅保留左 右声道的能量包络以缩减立体声音频节目中的立体声不相关或冗余的一种方法隔行扫描 视频常规电视图像的一种性质 其中相间各行在时间上连续帧内编码 视频宏块或图像仅用其自身的信息进行编码帧内编码图 图 视频仅用其自身信息进行编码的图多路复用 流 系
27、统由零个或零个以上的基本流 按 的定义组成的 组成的位流联合立体声编码 音频缩减立体声不相关或立体声冗余的所有方法联合立体声模式 音频使用联合立体声编码的音频编码算法的一种模式层 音频中定义的音频系统编码层次的一个层次层 视频和系统本标准以及 中定义的视频和系统规范中数据层次中的一个层次亮度 分量 视频表示单色信号的矩阵 块或单个像素 符合 建议 定义的与基色差信号相联系 表示亮度的符号是宏块 视频从图像的亮度分量的一个 区域得到的 个 的亮度数据块和与之相对应的 个色度数据块 宏块有时指像素数据 有时指像素值的偏码表示 以及 所定义的其他宏块层语法中的数据元素 从上下文可明确具体用法映射 音
28、频通过子带滤波和 或 音频信号从时域到频域的转换屏蔽现象 音频人类听觉系统的一种性质 当存在另外一种音频信号时 一种音频信号不能被感知屏蔽阈值 音频是一个频率和时间的函数 在该值以下 音频信号不能被人类听觉系统所感知音频改进离散余弦变换运动补偿 视频利用运动矢量来改善像素值预测的效率 预测利用运动矢量提供相对过去或 和将来参考图的偏移 参考图中包含有用于形成预测差值信号的以前解码的像素值运动估值 视频编码过程中估算运动矢量的处理过程运动矢量 视频用于运动补偿的二维矢量 它提供从当前图像的坐标位置到参考图像坐标的偏移立体声 音频基于对和信号与差信号而不是左右声道进行编码来减小立体声音频节目中出现
29、的立体声不相关和或冗余的一种方法帧间编码 视频宏块或图像的编码不仅用到其自身的信息而且还用到其他时间的宏块或图像的信息非音调成分 音频音频信号中的一种类似噪声的分量奈奎斯特采样以大于或等于信号带宽的两倍的频率进行采样包 系统一个包由一个包头和跟随其后的一个或多个分组组成 它是 中描述的系统编码语法中的一层分组数据 系统分组中基本流的连续字节分组头 系统包含于分组数据中的载有基础流数据信息的数据结构分组 系统一个分组由一个头和其后面的一些基础数据流中的连续数据字节组成填充 音频通过有条件地在音频帧中加入一槽来调整音频帧的平均时间长度 使其与对应的 采样值的持续期相适应过去参考图 视频按显示次序出
30、现在当前图之前的参考图像素纵横比 视频显示像素的标称垂直高度与标称水平宽度之比像素 视频图元素图周期 视频图速率的倒数图速率 视频解码输出图的标称速率图 视频源 编码的或重构的图像数据 个源图或重构图由 个 位的矩阵组成 个矩阵分别代表一个亮度信号和两个色度信号 图层是本标准中定义的编码语法的一个层 注意 总是用 图这个词 而不是场或帧多相滤波器组 音频一组具有相等带宽的且相位之间有特殊关系的滤波器 它使滤波器组能有效地实现预测 视频利用预测值提供当前解码图像的像素值或数据元素的估计值预测编码图 图 视频利用从过去的参考图得到的运动补偿预测进行编码的图预测差值 视频像素或数据元素的实际值同预测
31、值的差预测值 视频以前解码的像素值或数据元素的线性组合演示时标 系统可出现在分组头中的一个域 它指示演示单元出现在系统目标解码器中的时间演示单元 系统解码的音频操作单元或解码的图心理声学模型 音频人类听觉系统屏蔽行为的一个数学模型量化矩阵 视频逆量化器使用的一组 位的 个数量化 系数 视频逆量化之前的 系数 量化 系数的变长编码表示作为压缩视频的一部分进行存储量化器比例因子 视频位流中的一个数据元素 解码过程中用其确定逆量化尺度随机操作在任一点上进行读取并对编码的数据流进行解码的处理过程参考图 视频按显示顺序与当前图最邻近的 图或 图顺序调整缓冲器 视频系统目标解码器中的缓冲器 用来存储重构的
32、 图或 图重量化 音频对编码子带样值进行解码以恢复原始量化值保留当在定义编码位流的条文中使用 保留 一词时 表明其值可用于国家标准将来定义的扩充中反向播放 视频以与正常播放顺序相反的顺序显示图像序列的过程比例因子带 音频层 中的一组频率线 它可通过一个比例因子进行缩放比例因子索引 音频比例因子的一个数值码比例因子 音频量化前对一组数值进行缩放的因子序列头 视频编码位流中的一种数据块 包含有一些数据元素的编码表示辅助信息位流中的控制解码器所需的信息空白宏块 视频没有存储数据的宏块子图 视频一系列的宏块 它是本标准中定义的编码语法的一层槽 音频槽是位流的一个基本部分 在层 中 一个槽为 个字节 在
33、层 中 一个槽为 个字节源流压缩编码前 一个单一的非多路复用的采样值流传播函数 音频描述屏蔽频率传播的函数起始码 系统和视频嵌入编码位流中的唯一的 位码 它可用于包括标识编码语法中的层在内的多种目的输入缓冲器 系统系统目标解码器输入时的一种先进先出缓冲器 用于存储解码前基础流的压缩数据立体声模式 音频是这样一种模式 形成一个立体声对 左和右 的两个音频信道编码在一个位流中 编码过程与双通道模式相同填充 位 填充 字节插入到压缩位流中的码字 但在解码过程中被丢弃 它用于增加流的位速率子带 音频音频频带的一部分子带滤波器组 音频覆盖全部音频频率范围的一组带滤波器 中子带滤波器组是一个多相滤波器组子
34、带样值 音频音频编码器中的子带滤波器组产生一输入音频流的滤波 子采样表示 其中滤波样值叫子带样值从输入的 个时间连续的音频样值中 在 个子带中每个子带产生 个时间连续的子带样值同步字 音频音频流中嵌入的一个 位码 它用于标识一帧的开始合成滤波器组 音频解码器中的用于从子带样值重构 音频信号的滤波器组系统头 系统中定义的一种数据结构 它载有概括 多路流系统特征的信息系统目标解码器 系统解码过程的一个假设的参考模型 它用于描述 多路流的语义时标 系统用来标明一个事件发生的时间三重组 音频一个子带中的三个连续的子带样值集合 个子带的三重组形成一个区组音调分量 音频音频信号的一个正弦波状的分量可变位速
35、率解码压缩位流过程中位速率随时间而变化的操作变长编码一种可逆的编码过程 对较常出现的事件赋予较短的码字 不常出现的事件赋予较长的码字视频缓冲检验器 视频概念上与编码器的输出相连接的一种假设的解码器 它用于约束编码器或编辑过程中生成的数据速率的变化量视频序列 视频一个或多个图组组成的序列 它是本标准所定义的编码语法的一个层字扫描顺序 视频系数的一种从 大约 最低空域频率到最高空域频率的顺序符号与缩略语用于描述本标准的数学运算符号与 程序设计语言中的类似 然而 关于整数除法的取位和舍入又有专门的规定 位运算符的定义假设整数是用补码表示的 数字和计数的循环一般从零开始算术运算符加减 作为二元运算符
36、或负 作为一元运算符增减乘乘方整数除法 结果取整 例如 和 取整结果为 和 取整结果为整数除法 结果四舍五入 若不特殊说明小数部分的 作进位处理 如整数除法 往负向取整 即取小于正常除法运算结果的最大整数绝对值取模运算 仅对正数有定义取整运算符 将其实参舍入成与它最接近的整数 小数部分的 作进位处理正弦余弦指数平方根以 为底的对数以 为底的对数以 为底的对数逻辑运算符逻辑 或逻辑 与逻辑 非关系运算符大于大于或等于小于小于或等于等于不等于取参数中的最大值取参数中的最小值位运算使用按位运算时 操作数均假设采用补码表示与或右移 带符号扩展左移 移后填赋值运算赋值运算符助记符下列助记符用于描述编码位
37、串流中的不同数据类型位串 左边位开始 规定位串从左开始书写 位串是单引号内的或 组成的串 如 位串当中的空白只是为了阅读方便 没有其他意义通道 如果 值是 是指立体声信号的左通道或两个独立信号中的第一个信号 音频通道号 等于 表示单通道模式 等于 表示其他模式 音频音频层 子带采样的粒度 音频层 子带采样中的粒度位串流的 部分包含比例因子 哈夫曼编码数据以及辅助信息 音频位于位串流中帧的 的开始处 具体位置是前帧 末端的位置再加上 位 它由前帧的 值计算出来 音频中比例因子所占的位数 音频余数多项式的系数 最高幂在前 音频子波段 音频没有分配位的最低子波段的个数 音频选择比例因子的信息 音频使
38、用了窗口开关上的点的长块比例因子波段的个数 音频使用了窗口开关上的点的短块比例因子波段的个数 音频无符号整数 最高位在前变长码 左边位开始 这里 左 指 码的书写顺序当 时 实际时间槽的个数 音频常量描述位流的语法规则中描述了解码器得到的位流 位流中的每一数据项用黑体字印刷 并描述了它们的名称 位长度 类型助记符以及传送顺序等 在位流中由解码数据元素所引起的动作与该数据元素的值以及前面解码的数据元素有关 中描述了数据元素的解码以及解码中所用的状态变量的定义 以下结构用于表述数据元素何时出现以及何时为正常类型的条件注意 本语法中使用了这样的 代码约定 一个非零的变量或表达式相当于一个为真的条件条
39、件 如条件为真 数据流中将出现数据元素组 直到条件为假为止数据元素至少出现一次条件 数据元素不停重复直到条件为假条件如果条件为真 则接下来数据流中出现第一组数据元素若条件为假 接下来在数据流中出现第二组数据元素是一个说明循环起始条件的表达式 通常它给出计数器的初始状态 是每次重复循环的测试条件 当条件为假时结束循环 是一个表达式 每循环一次 它发生一次作用 通常它是计数器的增量注意以下是本结构最普通的用法数据元素组出现 次数据元素组中的条件结构同循环控制变量有关 第一次出现时 被置 第二次被加 等等数据元素组中可含有嵌套的条件结构 为简短起见 若只有一个数据元素时 可以省略是一个数据数组 由上
40、下文指明数据元素的个数是数据数组中第 个元素是二维数据数组中第 个元素是三维数据数组中第 个元素的范围从 至若是用程序的方式表示语法 则 的解码程序是不能令人满意的 尤其 语法定义了一个正确无差错的输入位流 实际的解码器在解码过程中必须能检出起始码 以使其能正确地开始解码 识别错误 删除 插入等 至于识别这些状态的方法以及所采取的行动不必统一函数的定义如果当前位置处在字节的边界上 即位流中的下一个位是一个字节的第一位 则函数返回值为 否则返回值为函数的定义函数 允许一个位串同位流中下一个解码的位进行比较函数的定义函数除去所有零位和零字节填充位并定位下一个起始码 见表表语 法 位数 助记符该函数
41、检验当前位置是否是字节对准的 若不是 则加入零填充位 在起始码前可加入任意个零字节 因此 起始码总是字节对准的 在其前可有任意个数的零填充位要求编码结构和参数视频序列编码的视频序列从序列头开始 后接一个或多个图组 并以 结束 每一图组前可有一个序列头 序列内图形是连续可解码的在这些重复的序列头中 除了定义量化矩阵和可选择的 与 的数据元素之外 每一个数据元素的值都必须与第一个序列头中的值相同 位串流中序列头每出现一次 量化矩阵都可能被重新定义 因此 数据元素和可选择的 与 可具有所有的 非禁止的 值序列头的重复使得初始序列头的数据元素得以重复 从而使随机地对视频序列进行操作成为可能另外 需要时
42、视频序列中的量化矩阵可以改变序列头视频序列头以 码开始 后跟一系列的数据元素图组图组是一个由一个或多个有助于对序列随机操作的编码图组成的序列 存储的位流 位串流 中图组的第一个编码的图是 图 编码流中图的顺序就是在正常播放时解码器处理它们的顺序 应特别指出 编码流中相邻 图的顺序是依据它们的显示顺序 按照显示顺序 图组中最末一幅编码图或者是图或者是 图下面例子是一个视频序列中起始部位的图组 本例中第一个图组有 幅图形 后面的图组包含 幅图形 在两幅 图或一幅 图和一幅 图之间 有两幅 图 图用作对 图的预测 和两图用作对 和 图的预测 因此 编码图形序列中图的顺序是 然而 解码器显示它们的顺序
43、是编码器输入编码器输出的存储位串流以及解码器输入上面的垂直竖线是图组边界的标志 注意 本例中 第一个图组比后继图组少两幅图 这是因为视频编码的开始 图前没有 图 然而一般来说按照显示顺序在图组中首幅 图前可有 图 即使解码第一个图组也是如此解码器的输出图组的长度随意 可包含一个或多个 图 在要求能随机操作 快速播放 快速或常速逆放的应用场合 可使用相对较短的图组 图组亦可从景物剪裁处或其他运动补偿失效的地方启动相连的 图数目是变化的 图或 图均可以不出现在图组中由于编辑的结果 解码器读到的视频序列的图组可能与编码器输出的不同图源图或重构图由三个矩阵组成 矩阵中的数是 的 三个矩阵是 亮度矩阵
44、和两个色度矩阵和 矩阵需具有偶数的行和列 而 和 矩阵水平和垂直方向均为 矩阵大小的一半和 的元素同 建议 中描述的基色 模拟的 红 绿和蓝信号 有关这些主信号经过了灰度预校正 假定的灰度系数值在本标准中没作规定 但是典型地大约在 至的区域内 要求精确复制色彩的应用场合常更精确地表示灰度系数值 然而这已超出本标准的范围图 示出了亮度和色度样本的定位情况 其中 表示亮度 样本的位置 表示色度样本的位置图 亮度与色度样本的位置有四种类型的编码图 分别使用了不同的编码方法帧内编码图 图 的编码仅使用其自身的信息预测编码图 图 的编码使用过去的 图和 图的运动补偿预测双向预测编码图 图 的编码使用过去
45、和将来的 图和 图的运动补偿预测直流编码图 图 的编码也仅使用其自身的信息 仅直流 的 系数出现 在 图组成的序列中不含有其他类型的图子图子图是由一系列的随意个数的宏块组成的 宏块按照光栅扫描的顺序 从图的左上角的宏块开始自左至右 自顶部至底部 子图的第一个和最后一个宏块不应是跳跃宏块 见 每一子图应至少包含一个宏块 子图之间不能重叠也不能有间隙 子图的位置在图与图之间可以是不同的 第一个子图应由图的第一个宏块开始 最末一个子图的结尾应是图的最后一个宏块宏块宏块包含 像素 线 的亮度分量 空间上同 像素 线 的每一色度分量相对应 一个宏块有 个亮度块和 个色度块 宏块 可指源或重构的数据或者经
46、缩放 量化的系数 宏块中块的顺序是 对 左上 右上 左下 右下 后面跟 和 图 示出了这些块的安排 跳跃宏块中没有任何信息 见块块是一个 像素 线 的正交的亮度或色度分量的区域块 可指源或重构的数据或者指对应的编码数据元素保留位 禁止位和标记位保留 禁止 用于描述编码位串流中若干域的值保留 表明该值可作为将来扩充之用禁止 表明不能使用某个值 经常是为了避免与起始码相重标记位 表明一位的域其值禁止为 语法中有几处引入标记位以免与起始码相重图 在宏块中块的排列编码视频位串流的语法规范起始码起始码是一类不会在视频流中另外出现的保留位模式 所有起始码均是字节对齐的 见表表名称 二进制值包括到留用留用留
47、用系统开始码 见注到注 系统开始码在 中定义除 外 下列语法描述定义了起始码的使用情况 数字存储媒体接口使用 来表明在何处检测到了不可校正的错误视频序列层 见表表语 法 位数 助记符序列头 见表表语 法 位数 助记符图组层 见表表语 法 位数 助记符表 完语 法 位数 助记符图层 见表表语法 位数 助记符表 完语法 位数 助记符子图层 见表表语 法 位数 助记符宏块层 见表表语 法 位数 助记符表 完语 法 位数 助记符块层 见表表语 法 位数 助记符视频位流语法的语义视频序列层是位串 十六进制 它结束一个视频序列序列头是位串 十六进制 由它标识序列头的开始码是亮度分量的可显示部分的用像素表示
48、的宽度 宏块中编码亮度分量的宽度是 图中可显示部分在编码图像中是左边对齐的码是亮度分量可显示部分的用像素表示的高度 宏块中编码亮度分量的高是 图中可显示部分在编码图像中是向顶对齐的码是一个由表 定义的 整数表高 宽示例禁用的等线线线线留用的是一个由表 定义的 整数应用程序以及编码器应该注意到这样一个事实 和 并不准确代表标准的图速率 准确的图速率可从 报告 求得 它们在 和 当中这是一个说明位流的位速率的整数 位速率以 为单位 并向上取整 零值是不允许的 值 表示可变位速率操作是一位 应置成是一个 的整数 它定义了序列解码所需的 视频缓冲器 见附录 缓冲区的大小 它的定义是其中 是解码序列所需
49、的最小 缓冲区的位数 见附录是一个 的标志位 如果后面的数据元素满足下面的约束 则被置表图片每秒禁用的留用的留用的像素像素图片 秒见见如果 被置位 则 域应该给出一个小于或等于即 千字节 的 缓冲区若 被置位 则 域应该给出一个小于或等于的编码数据速率值是一个 的标志位 若后跟有 则其置若其置 则在下个序列头出现之前使用下面的按光栅扫描顺序定义的默认值是一个 个 无符号整数的列表 按 中 字扫描顺序排列的新值代替以上所示的默认值 零值是禁止的 的值总是 在下一个序列头出现之前 新值一直有效是 的标志位 若后跟有它被置 若它的值是 则在下个序列头出现之前使用下面定义的默认值是 个 无符号整数的表列 存储于 字形扫描 见中的新值替代上面所示的默认值 零值是禁止的 在下一序列头出现之前新值一直在起作用是位串 十六进制 它标志扩展数据的开始 当接收到另一个起始码时 扩展数据结束 这是为了正确分析扩展数据所必需的保留 是位串 十六进制 它标志用户数据的开始 当接收到另一起始码时 用户数据结束用户为其特殊应用
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1