GB T 17975.2-2000 信息技术 运动图象及其伴音信号的通用编码 第2部分 视频.pdf

上传人:testyield361 文档编号:244881 上传时间:2019-07-13 格式:PDF 页数:186 大小:10.32MB
下载 相关 举报
GB T 17975.2-2000 信息技术 运动图象及其伴音信号的通用编码 第2部分 视频.pdf_第1页
第1页 / 共186页
GB T 17975.2-2000 信息技术 运动图象及其伴音信号的通用编码 第2部分 视频.pdf_第2页
第2页 / 共186页
GB T 17975.2-2000 信息技术 运动图象及其伴音信号的通用编码 第2部分 视频.pdf_第3页
第3页 / 共186页
GB T 17975.2-2000 信息技术 运动图象及其伴音信号的通用编码 第2部分 视频.pdf_第4页
第4页 / 共186页
GB T 17975.2-2000 信息技术 运动图象及其伴音信号的通用编码 第2部分 视频.pdf_第5页
第5页 / 共186页
亲,该文档总共186页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、中华人民共和国国家标准信息技术运动图像及其伴音信号的通用编码第部分视频发布 实施国家质量技术监督局 发布前言年国际标准化组织 和国际电工委员会 联合成立了运动图像专家小组小组针对运动图像及其声音的压缩编码研究制定了若干个标准 如 标准 标准适用于高质量高码率的图像和声音的压缩编码应用 标准的第二部分涉及运动图像的视频编码称为信息技术 运动图像及其伴音信号的通用编码方法 视频部分 和 对视频标准的标准号为 相应的视频部分的标准号为 等同地采用了 其采标号为标准是数字电视广播数字视频存储和传送的基础标准运动图像压缩编码是数字电视及相关领域的关键技术之一 在 视频标准中 规定了视频数据的编码方法以及

2、重建图像所需的解码处理 它给出了应用于广泛领域内的通用视频编码方案比特率 图像分辨率和质量 它的基本编码算法是运动补偿预测与 的混合 编码的图像可以是隔行扫描也可以是逐行扫描 必需的算法要素综合在单一句法中 并依据型 功能度和 级 参数值 定义了有限数目的子集以便于此种通用编码标准的实际应用国际上 标准已在与图像与声音存储和传输相关的领域得到广泛的应用 例如数字电视广播标准清晰度和高清晰度和数字声音广播 数字视频光盘 电视节目和电影资料的数字保存在计算机中运动图像序列的压缩存储和传送等 标准已成为许多行业的国际通用标准如在数字电视广播方面美国 欧洲日本等已提出了数字电视广播标准的国家和地区 其

3、数字电视广播标准中的图像编码标准都采用 标准为使我国运动图像的通用编码标准与国际标准接轨方便电视节目和图像序列的国际交换 方便相应领域的技术交流 利于相关设备和产品的开发和生产在标准制定过程中决定等同采用国际标准信息技术运动图像及其伴音信号的通用编码方法 视频部分 并包括了年 月的两个修订本 及两个补充本还包括了 年 月的两个补充本在标准起草过程中起草人把国家标准草案与相应的国际标准进行了详细的对比 力争达到使该国家标准既忠实于国际标准原文 又符合中文的语言和技术名词的行业习惯用法 本标准在层次划分章 条设立编写格式和方法与等同采用的国际标准一致 本标准采用的术语 定义其全部技术内容与 一致

4、但本标准与等同采用的国际标准存在细微差别 一是在 引用标准 中 对应我国已有国家标准的国际标准已改成我国的国家标准 二是本标准取消了国际标准中的附录 附录 附录 这些变动对本标准无影响本标准的附录 附录 和附录 是标准的附录本标准的附录 和附录 是提示的附录本标准由广播电影电视总局提出本标准由全国信息标准化技术委员会归口本标准起草单位国家广播电影电视总局广播科学研究院 北京广播学院本标准主要起草人杨杰张颖辉 张永辉前言国际电信联盟 是联合国在电信领域的一个专门机构 电信标准部门 是国际电信联盟的一个常设机构 制定世界电信标准建议 个成员国 个电信运营机构 个科研和工业组织以及 个国际组织加入第

5、一号决议赫尔辛基 年确定了 成员对建议批准的程序 另外每四年召开一次的世界电信标准大会 对提交的建议进行讨论并确定以后的研究计划在 范围内的某些信息技术领域中 在与 和 合作的基础上制定一些必要的标准年 月 日通过了 建议 此建议与 国际标准等同引言目的本标准这部分的制定是为了响应于对各种应用 如数字存贮媒体 电视广播和通信 中活动图像和伴音的通用编码方法的日益增长的要求 使用本标准意味着活动视频可以作为一种计算机数据形式进行处理 并且可以存贮在各种存贮媒体上 可以在现有的和未来的网络中传输和接收 可以在现有的和将来的广播信道中分配应用本标准的应用包括下列领域但不限于此广播卫星业务 到户有线电

6、视分配 通过光纤网络 铜线等有线数字音频分配数字声音广播地面和卫星广播数字地面电视广播电子影院电子新闻采集 包括 卫星新闻采集固定卫星业务 例如到前端家庭电视影院个人间通讯会议电视可视电话等交互式存贮媒体 光盘等多媒体邮件新闻和时事网络数据库业务 通过 等远端视频监视串行存贮媒体 数字 等型和级本标准拟成为一个通用的应用于较广范围的比特率 分辨率质量和服务的标准 应用包括数字存贮媒体电视广播和通信 在制定本标准过程中已经考虑了典型应用的各种要求 建立了必要的算法要素 并且把它们集合成单一句法 因此 本标准便于不同应用之间的比特流交换考虑到实现本标准全部句法的实用性 我们通过型和 级来约定句法的

7、有限子集在本标准的第章中将正式定义这些术语和其他相关术语型是本标准定义的整个比特流句法的一个规定子集在一个 型规定的句法范围内由于比特流中参数的取值的不同对编码器和解码器的性能要求仍然可能有很大的差异 例如 可以规定帧幅的宽大约为 样点 高为 行 目前要求能实现处理所有可能帧幅的解码器是不现实和不经济的为了解决这个问题在每一型中又定义了级 级是对比特流中各参数进行限定的集合 这些限定可以是对数量的简单限制 也可以采用对参数算法组合加以约束的形式 例如帧宽乘帧高乘帧频遵循本标准的比特流是使用通用的句法 为获得完整句法的子集 比特流中包含标志和参数 它们指示后面的比特流中是否出现句法元素为了说明对

8、句法的约束因此要规定一种型 只需要约束用来说明后面出现的句法元素作出规定的标志和参数的值可分级和不可分级句法全部句法可以分成两大类一是不可分级句法 其结构为 定义的句法的一个超级集合 不可分级句法的主要特点是有隔行视频信号用的附加压缩工具 第二类为可分级句法其主要特性为能够从整个比特流的各部分中重建有用视频这一特性的获得是借助于以两层或多层构建比特流并从独立的低层开始再增加若干增强层 低层可以用不可分级句法或者在某些情况下遵循句法不可分级句法概述在不可分级句法中所定义的编码表示方法能获得高压缩比 同时保持好的图像质量算法不是无损的因为在编码中不能保留样点的精确值 在特定的比特率下要获得好的图像

9、质量 需要非常高的压缩比 而仅利用帧内图像编码是不能实现的 然而纯帧内图像编码可最佳地满足随机存取的要求 技术的选择要考虑兼顾高质量的图像和高压缩比以及对编码比特流进行随机存取方面的要求 需要在帧内编码和帧间编码之间在减少时间冗余度的因果和非因果方法之间仔细地加以平衡有许多种技术方法用于获得高压缩比 算法中首先使用基于块的运动补偿 以减少时间冗余 运动补偿既应用过去的图像对当前图像作因果预测 又应用过去和未来的图像对当前图像作非因果内插预测 为每个 样点乘 行的图像块定义一个运动矢量 在量化之前对预测误差做进一步压缩 利用离散余弦变换 去除空间相关性 量化是去除不重要信息的一个不可逆过程 最后

10、 运动矢量与预测误差的 信息组合在一起并且使用变字长码进行编码时间处理因为随机存取和高效率压缩之间的要求相互冲突所以定义了三种主要图像类型 帧内编码图像图像的编码不需参考其他图像 这种编码的图像在编码序列中提供解码开始的存取点 它们的编码只有中等程度的压缩 预测编码图像 图像编码的效率比较高它使用过去的帧内编码图像或预测编码图像作为参考进行运动补偿的预测 通常它作为进一步预测的参考 双向预测编码图像 图像提供最高程度的压缩但运动补偿需要过去的和未来的参考图像 双向预测编码图像永远不作为别的预测的参考 除非在空间分级增强层中将结果图作为参考 三种类型图像在序列中的组织是非常灵活的由编码器根据应用

11、的要求来选择 图 示明三种不同图像类型之间关系的一个例子图 时间上图像结构示例对隔行视频的编码隔行视频信号的每帧由两场组成彼此相隔一个场周期 本标准既允许一个帧按一幅图像进行编码 也允许按两幅图像对两场进行编码 可以在逐帧的基础上 自适应地选择帧编码或场编码 帧编码是特别适合于运动不快但细节丰富的视频场景能够从第一场中预测第二场的场编码 对有快速运动时会更有效运动表示 宏块如同在 中选择 宏块作为运动补偿单元 它是从运动信息得到编码增益和为表示它所需要开销两者之间平衡的结果 对每个宏块可以以许多不同的方法进行时间预测 例如 在帧编码中从前面参考图像进行预测既可以基于帧 也可以基于场依据宏块的类

12、型 对运动矢量信息和其他辅助信息与压缩过的预测误差在每一个宏块中是一起进行编码的将前面的编码运动矢量作基准对运动矢量进行差分编码并使用变字长码在逐幅图像的基础上 能表示运动矢量的最大长度是可以逐帧编程的 所以可以满足大多数需要的应用而不牺牲大多数正常情况下的系统性能计算合适的运动矢量是编码器的任务 本标准未规定对此应如何做空间冗余降低原始图像和预测误差信号都有很高的空间冗余度 本标准使用基于块的 方法并配合具有视觉加权的量化和游程编码 经运动补偿的预测或内插之后 得到的预测误差图像分成 的块 对这些块进行 变换 并在量化之前进行加权 量化之后许多 系数的值为零所以可使用二维游程编码和变字长编码

13、对剩下的 系数进行高效编码色度格式除了支持 的 格式外本标准还支持 和 色度格式可分级扩展在本标准中的可分级工具被设计用来支持那些单层视频所不能支持的应用系统 在值得注意的应用中 所涉及的领域有视频通信 异步转移模式 网络中视频的传送视频标准的交互工作 有多种空间时间和质量分辨率的分层视频业务含有常规电视的 允许向更高时间分辨率过渡的系统等虽然解决可分级视频的简单办法是同播技术 这项技术基于传输存贮多路独立的视频编码数据 但另一种更有效的是分级视频编码方法 是将分配给一定视频的带宽部分地再用于下一个视频的编码 在可分级视频编码中假设给定一个编码比特流不同复杂性的解码器都能够进行解码 并显示出合

14、适的重建图像 与单层编码器相比 可分级编码器可能会增加复杂性 不过 本标准提供几种不同形式的可分级方法 它们以相应的复杂性作不重叠的应用 所提供的基本可分级工具有数据分割可分级空间分级和时间分级 而且 也支持这些基本可分级工具的组合 称为混合可分级 在基本可分级的情况下允许有称之为较低层和增强层的两层视频 而在混合可分级中可以支持多达三层 下面的表 至 给出各种可分级的一些实例应用表 可分级的应用较低层 增强层 应用与较低层相同的分解力和格式两路标准质量电视 业务高清晰度与相同的分解力和格式两路质量业务高清晰度 色度同播视频制作分配表 空间分级的应用低 层 增强层 应用逐行 逐行 兼容或分级隔

15、行 隔行 可分级逐行 逐行 与本标准的兼容性隔行 逐行 向高分解力逐行 过渡表 时间分级的应用低 层 增强层 更高层 应用逐行 逐行 逐行 向高分辨率逐行 过渡隔行 隔行 逐行 向高分辨率逐行 过渡空间分级扩展空间分级是在下面的视频应用中使用的工具 这些应用包括电信视频标准的交互 视频数据库浏览 标准电视和高清晰度电视的交互工作等也就是 具有基本共性的视频系统必需最少有两种空间分解力的视频层 空间分级包括从单个视频源产生两个空间分解力的视频层 低层本身编码来提供基本空间分解力 而增强层应用经空间内插的低层 载有输入视频源的全空间分解力 较低层和增强层可以都使用本标准 或者较低层使用 标准增强层

16、使用本标准 后一种情况更有利于视频编码标准之间方便的交互工作 而且空间分级提供了对每层使用的视频格式选择的灵活性 空间分级的另外一个优点是能够提供对传输误码的抵御 因为可以用误码特性较好的信道传输较低层上较重要的数据 而可以用误码特性较差的信道传输较不重要的增强层数据分级扩展分级是在下面的视频应用中使用的工具 这些应用包括 电信多种质量的视频业务标准电视和高清晰度电视 也就是 具有基本共性的视频系统必须具有最少两种视频质量层 分级包括从单个视频源产生两个空间分解力相同但视频质量不同的视频层 低层本身编码来提供基本视频质量而增强层的编码是为了增强低层 在将增强层加到较低层上时重新产生输入视频的较

17、高质量数据 低层和增强层可以都使用本标准或者较低层使用 标准 增强层使用本标准 分级的另外一个优点是能够提供对传输误码的高度抵御能力因为可以用误码特性较好的信道传输较低层上较重要的数据 而可以用误码特性较差的信道传输较不重要的增强层数据时间分级扩展时间分级是在从电信到 的各种视频应用中使用的工具 对于这些应用 从较低时间分辨率系统向较高时间分辨率系统的过渡是必要的在许多情况中 较低时间分辨率视频系统可以是现存系统或低廉的早期系统逐渐地推进入更复杂的系统 时间分级包括将视频帧进行分层 低层本身编码以提供基本的时间率 增强层依据对较低层的预测进行编码 这些层在解码和时间复用后产生视频源的全时间分辨

18、率 较低时间分辨率系统只能对低层进行解码提供基本时间分辨率 而将来更复杂的系统可以对这两层进行解码提供高时间分辨率视频而且保持与早期系统交互工作 时间分级的另外一个优点是能够提供对传输误码的抵御能力 因为低层上较重要的数据可以通过误码特性较好的许多信道传输而较不重要的增强层可以通过误码特性较差的信道传输数据划分扩展数据划分是在两个信道用于传输或存储视频比特流情况下使用的工具例如是 网络 地面广播 磁媒体等情况 比特流划分给两个信道比特流的较重要部分诸如首标 运动矢量 低频 系数 在误码特性较好的信道中传输 较不重要的数据诸如高频 系数 在误码特性较差的信道中传输 这样由于比特流的重要部分得到了

19、较好的保护 使信道误码引起的劣化减到最小 不是专用于对数据划分的比特流进行解码的解码器 不能对任一信道来的数据进行解码中华人民共和国国家标准信息技术运动图像及其伴音信号的通用编码第部分 视频国家质量技术监督局 批准 实施范围本标准规定了数字存储媒体和数字视频通信用的图像信息的编码表示并且规定了解码过程 这种表示支持恒定码率传输可变码率传输 随机存取 信道跳换 可分级解码 比特流编辑 以及诸如快速正放 快速倒放 慢放暂停和静像等特殊功能 本标准与 前向兼容并与格式上兼容或下兼容本标准主要应用于数字存贮媒体 视频广播与通信 存贮媒体可以与解码器直接联接或是通过诸如总线 或电信链路等通信设施与解码器

20、联接引用标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文 本标准出版时 所示版本均为有效 所有标准都会被修订 使用本标准的各方应探讨使用下列标准最新版本的可能性演播室数字电视编码参数规范信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分系统信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分音频数字音频系统信息技术运动图像及其伴音信号的通用编码第部分系统视频磁带记录的时间和控制码连续影调静止图像的数字压缩和编码数据率的音视频业务的视频编解码建议窄带可视电话系统及终端设备建议书 音频

21、信号的数字记录建议书 对 范围内的移动 便携和固定接收机的卫星声音广播实现 离散余弦反变换的规范定义本标准采用下列定义系数任何在一维或二维上频率不为零的 系数场图像场结构的 图像帧图像帧结构的 图像大图像如 中定义的能引起 缓存下溢的编码图像 大图像只在 等于 的序列中出现有时用跳越图像这个术语描述同样的概念帧双向预测编码帧使用前后参考场或帧进行运动补偿的预测而编码的图像后向兼容如果按旧编码标准设计运行的解码器能够对按新编码标准制作的比特流继续进行全部或部分解码 那么新编码标准称为与旧编码标准是后向兼容的后向运动矢量用于按显示顺序由后面的参考帧或参考场进行运动补偿的运动矢量后向预测由未来的参考

22、帧场 进行的预测底层可分层结构中第一个可独立解码的层比特流形成数据的编码表示的一个有序比特串比特率编码的比特流从存贮媒体向解码器输入端传送的速率块 系数块一个 行乘 列的样点矩阵 或 个 系数 源的量化的或去量化的底场组成帧的两场中的一场 底场的每一行在空间上紧位于顶场相应行的下面字节对准字节同步编码比特流中的某一比特的字节对准 是指它的位置与比特流中第一比特起的距离是 比特的整倍数字节比特的序列信道存储或传送按照本标准构成的比特流的数字媒体色度格式定义一个宏块中的色度块的数目色度同播可分级的一种类型 可分级的一个子集 这里增强级只包含色差分量中 系数的编码细节数据和 系数的全部数据色度分量在

23、定义的比特流状态中表示与基色相关的两个色差之一的矩阵 块或单个样点 表示色差信号的符号是 和编码 帧一个 帧图像或一对 场图像编码帧编码帧是编码 帧 编码 帧或编码 帧编码 帧一个 帧图像或一对 场图像此处第一场图像是 图像第二场图像是 图像或 图像编码 帧一个 帧图像或一对 场图像编码图像编码图像由图像头紧随其后的可选扩展以及随后的图像数据组成 编码图像可以是编码帧或编码场编码视频比特流符合本标准规定的一幅或多幅图像的编码表示编码顺序图像传输和解码的顺序 这个顺序没有必要与显示顺序相同编码表示以其编码形式表示的数据元素编码参数用户可定义的参数集 这些参数确定编码视频比特流的特性 比特流的特性

24、由编码参数确定 解码器的特性由可解码的比特流确定分量组成图像的三个矩阵 一个亮度和两个色差 中的某个矩阵块或样点压缩减少用于表示一项数据的比特数恒定码率编码视频具有恒定的平均码率的编码视频比特流恒定码率编码比特流的码率从开始到结束都是恒定的操作数据元素一个数据项在编码之前和解码之后的表示数据划分为了对误码作纠错的需要将一个比特流分成两个单独比特流的方法 两个比特流在解码前必须重新组合起来图像一种图像类型只在 中使用系数频率在二维上都是零的 系数系数特定余弦函数的幅度解码器输入缓存视频缓存校验器中 规定的先入先出 缓存解码器解码过程的具体实现解码过程这个过程在本标准中定义为读入一个输入编码比特流

25、和输出解码图像或声音样本反量化在比特流中量化的 系数被解码以后以及被反向 处理之前对其进行重新标度过程数字存储媒体数字存贮或传输用的设备或系统离散余弦变换正向离散余弦变换或反向离散余弦变换 是可逆的 离散的正交变换 在本标准的附录 中对反向 做了定义显示幅型比预期显示的画面宽高比显示顺序解码图像显示的顺序 通常 它与输入编码器图像的顺序是一样的显示过程显示重建帧的非规范的 过程双基预测一种对两个基于场的前向预测进行平均的预测模式 预测块大小为 亮度样点 双基预测只用于隔行 图像编辑利用一个或多个编码比特流产生一个新的编码比特流的过程 被编辑比特流必须符合本标准的要求编码器编码过程的具体实现编码

26、过程读取输入图像或音频样本 产生一个符合本标准的有效的编码比特流的过程这个过程并未在本标准中定义增强层可分级的层次结构中相对高的一层 在底层之上 对于可分级的所有形式 其解码过程可由低层的解码过程和增强层本身适当的附加解码过程来说明快速正放视频以比实时要快的速度 按播放顺序播放图像的一个序列或序列的一部分的过程快速倒放以比实时要快的速度 按播放顺序相反的顺序播放图像序列的过程场对于隔行视频信号场是一帧中相隔行的集合 因此一个隔行帧图像由两场组成顶场和底场基于场的预测只使用一场做为参考帧的预测模式 预测块的大小为 亮度样点 基于场的预测不用在逐行扫描帧中场周期两倍帧频的倒数场图像 场结构图像场结

27、构图像是一种编码图像其 等于顶场 或底场标志一个变量 它只能在本标准规定的 和 中取值禁用当在定义编码比特流的节中使用术语禁用时表示该数值决不许使用 通常是为了避免与起始码相似强制刷新为保证编码器和解码器中的反向 处理的不匹配误差不能过大 而对宏块不时地进行帧内编码的过程前向兼容如果按新编码标准设计运行的编码器能够对旧编码标准的比特流进行解码那么新编码标准是与旧编码标准前向兼容的前向运动矢量用于以显示顺序上较早的参考帧或参考场进行运动补偿的运动矢量前向预测以过去的参考帧场 进行的预测帧帧包含视频信号的空间信息行 对于逐行扫描视频这些行从一个时刻开始 经过不间断的行扫描直到帧底的样点 对于隔行扫

28、描视频 一帧包括两场顶场和底场 两场中的一场将比另一场晚开始一个场周期基于帧的预测使用参考帧的两场的预测模式帧周期帧频的倒数帧图像 帧结构图像帧结构图像是一种编码图像其 等于帧帧频解码处理后帧输出的速率未来参考帧场未来参考帧场是在显示顺序上比当前图像出现晚的参考帧 场帧序重排当编码顺序与显示顺序不同时 重建帧的重新排序过程 在比特流中有 帧时进行帧序重排 在对低延时比特流解码时不进行帧序重排图像组只在 中定义的一个概念 在本标准中通过插入图像组头可以得到类似的功能头编码比特流中的一个数据块它包含许多用于描述了跟在它后面的编码数据的数据元素混合可分级性混合可分级性是两种或多种可分级性的组合隔行常

29、规电视帧的特性 一个帧的相邻行在时间上代表不同的时刻 在隔行帧中其中一场要先显示这一场称为第一场 第一场可以是一帧的顶场也可以是底场场图像场结构 图像帧图像帧结构 图像图像帧内编码图像只使用帧内信息编码的图像帧内编码只使用宏块或帧内信息的宏块或图像的编码反反离散余弦变换在附录 中定义级一个取值限定的确定集合 在特定的型中通过本标准的参数进行取值 一个型可以包含一个或多个级 在不同的场合级可以指非零系数的绝对值 见游程层在可分级的层次结构中表示比特流有序集合中的一个集合 以及有关的解码过程 隐性地包括比这一层低的所有层的解码层比特流与特定层相关的单一比特流总是与层修饰词联系使用 例如增强层比特流

30、低层指就处在比给定增强层之下相对低的层 隐性包括比这增强层低的所有层的解码亮度分量在定义的比特流状态中代表信号的亮度以及有关的基色表示的矩阵 块或样点 用于亮度的符号是兆比特比特宏块一幅图像亮度分量的 样点区域内由四个 亮度数据块和两个 色度数据块色度格式 或四个 色度数据块 色度格式或 个 色度数据块 色度格式组成的块 宏块有时指样点数据 有时指样值的编码表示和本标准定义的句法的宏块头中定义的其他数据元素 其用法从上下文中看是很清楚的运动补偿利用运动矢量改善样值的预测效率 预测是利用运动矢量提供出与过去和 或未来参考帧或参考场的偏置这些用于产生预测误差的参考帧或场有前面已解出的样值运动估计编

31、码过程中估计运动矢量的过程运动矢量用于运动补偿的两维矢量它提供当前图像帧或场中坐标位置与参考帧或参考场中坐标位置间的偏差非帧内编码不仅使用宏块或图像自身信息 而且使用其他时间出现的宏块或图像信息进行的宏块或图像编码奇偶性对立顶的奇偶性对立是底 反之亦然场图像场结构 图像帧图像帧结构 图像图像预测编码图像使用过去的参考场或帧作运动补偿预测编码的图像参数本标准句法中的变量 可以取数值范围中的一个值 只能取两个值中的一个值的变量称为标志场的 奇偶性场的奇偶性可以是顶场或底场过去参考帧场过去参考帧场是显示顺序中出现时间比当前图像早的参考帧 场图像源的编码的或重建的图像数据 源图像或重建图像包括代表一个

32、亮度和两个色差信号的三个 比特数据的矩阵 编码图像在 中予以定义 对于逐行视频图像与帧一致 而对于隔行视频 一幅图像可以是一帧也可以依据场合不同是一帧图像的顶场或底场图像数据在 操作中 图像数据定义为编码图像的全部比特 在它之前的全部头和用户数据 包括它们之间的任何填充 以及在它之后和下一个起始码 但不包括该码之前的所有填充 如果下一个起始码是序列结束码 这时 下一个起始码包括在图像数据内预测使用预测值提供出正在解码中当前的样点或数据元素的估计预测误差样点或数据元素实际值与预测值的差别预测值已解码样点值和数据元素的线性组合类型 简称型本标准句法中的一个已定义子集逐行影片帧的特性这里帧内的所有样

33、点在时间上代表同一时刻量化矩阵反量化器中使用的 个 比特值的集合量化的 系数反量化以前的 系数 量化的 系数的可变长编码做为编码视频比特流的一部分进行传输量化比例在比特流中的一个编码的比例系数在解码过程中用于放大反量化随机存取在任意点上对编码比特流进行读取和解码的过程重建帧一个重建帧由表示一个亮度和两个色差信号的三个矩阵组成 通过对一个编码帧进行解码 得到一个重建帧重建图像通过对一个编码图像进行解码 得到一个重建图像 一个重建图像可以是一个重建帧当解码帧图像时 或是一个重建帧的一场当解码场图像时 如果编码图像是场图像 那么重建图像是重建帧的顶场或底场参考场参考场是重建帧的一场 在对 图像和 图

34、像解码时参考场用于前向和后向预测 注意 当对场图像进行解码时编码帧第二场 图像的预测利用同一编码帧的第一个重建场做为参考场参考帧参考帧是以编码 帧或编码 帧形式编码的重建帧在对 图像和 图像解码时 参考帧用于前向和后向预测重排序延时在解码过程中由帧顺序重排引起的延时保留在定义编码比特流的节中使用术语 保留时 表明该值用于未来的扩展样点幅型比这规定了样点间的相对距离它定义为对于本标准 一帧中的亮度样点行的垂直位移与亮度样点的水平位移之比 单位为 米 行 米 样点分级层次结构包含超过一个视频比特流的有序集合的编码视频数据分级性分级性是解码器对有序集合比特流进行解码以产生重建序列的能力 而且当解码子

35、集时输出有用的视频 能够这样解码的最小子集是该集合中称为低层的第一个比特流 该集合中每一个其他比特流统称为增强层 当提到一个特定增强层时 低层是指一个增强层前面的比特流辅助信息比特流中控制解码器所必需的信息预测类似于场基预测的一种预测模式 预测块的大小是 个亮度样点游程在一个扫描顺序中非零系数前面的零系数的数目 非零系数的绝对值称为 量值饱和度通过设定范围适当的最大值和最小值 对超过规定范围的值加以限制跳过宏块没有编码数据的宏块条处于同一水平行内的一串连续的宏块分级分级的一种增强层只包含低层 系数的细节编码数据源输入用于描述编码前的视频素材或其某些属性的术语空间预测空间分级中使用的较低层解码器

36、的解码帧内得出的预测空间分级分级的一种增强层使用的预测是依据较低层样点数据进行的 不使用运动矢量 各层可以有不同的帧尺寸帧频或色度格式起始码 系统和视频嵌入在编码比特流中的独特的 比特码 它们有几种用途 包括识别编码句法的某些结构填充比特 填充 字节可以插入编码比特流内在解码过程中被弃掉的码字 目的是增加比特率否则比特率将比所需的比特率低时间预测依据参考帧或场得出的预测这些参考帧或场不是空间预测中所规定的那些时间分级分级的一种增强层使用的预测是依据较低层样点数据进行的 使用了运动矢量 各层具有相同的帧尺寸和色度格式但可以有不同的帧频顶场组成一帧的两场中的一场 顶场中每一行的位置在空间上紧位在底

37、场中相应行的上方顶层可分级层次结构中的最高层 具有最高的层识别符可变比特率在编码比特流的解码过程中比特率随时间而变化变字长编码一种可逆的编码方法 较短的码字分配给出现频度高的事件较长的码字分配给出现频度较低的事件视频缓存校验器在概念上与编码器输出相联接的假想解码器 其目的是对编码器或编辑过程中可能产生的数据率的变化加以约束视频序列编码视频比特流的最高句法结构 它包含一个或多个编码帧串列型解码器能够对顶层符合 型之规范的一个比特流或者一个可分级层次结构的比特流进行解码的解码器 是所规定的型名称中的任一个型可分级层次结构比特流的集合其顶层符合 型的规范型比特流可分级层次结构中对应于 型的比特流 注

38、意只有与所有较低级比特流一起 这个比特流才是可解码的除非它是底层比特流之 字形扫描顺序系数的特定排列顺序 空间频率大致是从最低到最高符号和缩略语用于描述本标准的数学运算符与 语言使用的运算符类似 但在整数除法的舍入有特定的规定计数循环通常从 开始算术运算符加减号 作为二进制运算符或负号作为一元算子递增即 等效于递减即 等效于或 乘幂截尾结果为 的整数除法 例如 和 结果都为 和 结果都为舍入到最近整数的整数除法 半整数值不作为 除非另有规定 例如 结果为结果为向负无穷大轴方向截尾的整数除法 例如 结果为 结果为没有舍入的除法模运算符只对正数作定义的和 为整数逻辑运算符逻辑或逻辑与逻辑非关系运算

39、符大于大于等于小于小于等于等于不等于变量表中的最大值变量表中的最小值位运算符与或带符号填充的右移带 填充的左移赋值赋值运算符助记符定义以下助记符用来描述编码比特流中不同的数据类型比特串 左边的比特在先 本标准中比特串的书写顺序从左边开始 比特串通常写成单引号内的一串 和 例如 比特串中的空格是为了便于阅读 没有任何意义 为了方便长的比特串偶尔用十六进制表示这时以常用方法转换成二进制可得到比特串的值于是 最左的十六进制数字在先每个十六年进制数字中 比特内的最高位在先无符号整数 最高位在先有符号整数 二的补码形式 最高位符号位 在先可变长码字 左边比特在先 左边指可变长码字的书写顺序 多字节的字节

40、顺序为最高字节在先在描述句法的章节中 仅取正值或无符号数的句法元素 如标志位可以取 或 由助记符来描述 可取负值的句法元素由助记符 来描述 如果句法元素为常数值例如则由助记符 来描述 如果句法元素代表一可变长码则由助记符 来描述常数协定描述比特流句法的方法由解码器恢复的比特流在 中描述 比特流中的每一数据项用黑体字 是用其名称比特长度类型的助记符和传输的顺序进行描述解码的比特流中数据元素引起的动作取决于数据元素的值和在此之前解码的数据元素 对数据元素的解码和在解码中使用的状态变量的定义在 中说明 下列结构用于表示当数据元素出现时的条件 并且是正常类型的如果条件为真那么数据元素组出现在随后的数据

41、流中 一直循环到条件不为真数据元素至少出现一次数据元素一直循环直到条件不为真如果条件为真 则数据元素的第一组出现在随后的数据流中如果条件不为真则数据元素的第二组出现在随后的数据流中数据元素组出现 次数据元素组内的有条件结构可能依赖于循环控制变量 的值这个值第一次出现时置 第二次出现时增量 如此往下注释 它可以全部删除 不对句法有任何影响本句法使用 码 协议 计算非零值的变量或表达式相当于条件为真计算零值的变量或表达式相当于条件为假 许多情况下在条件中使用字符串 例如在这种情况下字符串用于说明 中比特流元素的值 在本例中 可以看到 表 中定义的 空间分级由两位二进制数 表示如注释所述数据元素组可

42、以包含嵌套的条件结构 为了简练当后面只有一个数据元素时省略是数据矩阵的第 个元素是两维数据矩阵的第 个元素是三维数据矩阵的第个元素在用程序术语表示句法时 不应设想第 能实现令人满意的解码过程 它只是定义了一个正确的和无误码的输入比特流 为了能够正确地开始解码实际解码器必须包括寻找起始码的方法 并且在解码中要识别去除或插入误码 识别这些情况的方法和采取的措施没有制定标准函数的定义用于图像编码算法的几个实用函数定义如下函数的定义如果当前位置在字节的边界上 则准函数 返回 即比特流的下一个比特是一个字节的第一个比特 其他情况下函数返回函数的定义函数允许将比特流中一个比特串与待解码的下面一些比特进行比

43、较函数的定义函数去除所有 值的比特填充和字节填充 确定下一个起始码的位置比特数 助记符这个函数检验当前位置是否字节对准 如果不是 则提供 填充比特 其后在起始码之前可以有任意数目的 填充字节 因此 起始码总是字节对准的 在其之前可以有任意数目的 填充比特预留禁用和标记位在说明编码比特流中一些数据区的某些值时 使用术语 预留和禁用术语预留 是指该值可以用于未来标准所定义的扩展术语禁用 是指该值永远不能使用 通常为了防止与起始码混淆术语标记位 是指禁用 值的一个比特整数因而其值为 在句法的几处引入标记位以防与起始码混淆算术精度为了减少本标准实现中的矛盾 规定以下算术运算规则在算术精度没有规定时 例

44、如 的计算 精度应足够高 以使最终的整数值里没有大的误差在值的范围由冒号给出时 如果有括号就包括端点 如果使用小于 和大于 符号 则不包括端点 例如 表示从 到 包括 但不包括视频比特流句法和语义编码视频数据结构编码视频数据由称之为层的视频比特流序列组成 如果只有一层则编码视频数据称为不可分级视频比特流 如果有两层或者多层则编码数据称为可分级视频比特流第一层 按顺序 称之为底层它总能被单独解码 对底层解码过程的描述见本标准的 到及 中叙述的数据划分情形除外其他层称为增强层它仅能与所有底层按顺序中的先前层 一起解码 且从底层开始 可分级解码过程的描述见本标准的 到有关各层的复用方法 参见可分级层

45、次的底层可符合本标准或符合 等的其他标准详见 到 增强层应符合本标准除数据划分情况外 底层不包括 增强层总是包括通常视频比特流可理解为一个句法分层结构 其句法结构包括一个或多个从属的结构 例如 结构包括一个或多个句法结构 而 又包括一个或多个结构本结构非常类似于 中使用的结构视频序列编码视频比特流的最高句法结构是视频序列视频序列从序列头开始 序列头后可跟随图像组头然后是一个或多个编码帧 编码比特流中编码帧的顺序为解码器处理编码帧的顺序 而不必是正确显示的顺序 视频序列以 结束 在视频序列的各点处 特定的编码帧前面可以有重复的序列头或图像组头或是两者都有 在重复序列头和图像组头同时紧位于特定图像

46、之前的情况下图像组头应跟随在重复序列头之后逐行和隔行序列本标准对逐行和隔行序列的编码均可处理对隔行序列解码过程的输出由一系列时间上间隔一个场周期的一系列重建场组成一帧的两场可单独编码场图像 另外的方法 一帧的两场可组合在一起作为帧进行编码 帧图像 在单个视频序列中可以兼使用帧图像和场图像在逐行序列中序列中的每幅图像应为帧图像 在解码过程的输出端 序列由一系列时间上间隔一个帧周期的重建帧组成帧帧由三个整数矩阵组成一个亮度矩阵 和两个色度矩阵 和在比特流中规定了或由其他方法规定了 这些 分量与基色 模拟红绿蓝信号和 间的关系以及基色的色度学和源图像帧的传送特性 该信息不影响解码过程场一场是由代表一

47、帧的三个整数矩阵中的每隔一行的样点组成一帧由顶场和底场组成 顶场是包含三个矩阵中各自最高行的场 底场则是另一个场图像一编码图像由图像头 紧跟其后的可选的扩展及随后的图像数据组成 编码图像可以是编码帧或编码场一个 帧图像或一对场图像 其第一场图像是 图像 第二场图像是 图像或 图像 叫做一个编码帧一个 帧图像或一对 场图像叫做一个编码 帧一个 帧图像或一对 场图像叫做一个编码 帧编码 帧编码 帧或编码 帧叫做编码帧重建图像由解码一幅编码图像获得编码图像包括图像头图像头后面的可选扩充项和图像数据编码图像可以是帧图像或场图像 重建图像既可以是重建帧 当解码帧图像时 也可以是重建帧的一场当解码场图像时

48、场图像如果使用场图像则场图像应成对出现顶场后跟随底场 或是底场后跟随顶场 共同组成一编码帧 组成一编码帧的两场图像应按解码过程的输出顺序编码在比特流中当编码帧的第一幅图像为 场图像时编码帧的第二幅图像也应为 场图像 同样当编码帧的第一幅图像为 场图像时 编码帧的第二幅图像也应为 场图像当编码帧的第一幅图像为 场图像时 编码帧的第二幅图像应为 场图像或 场图像 如果第二幅图像为 场图像 则受到某些限制 见帧图像当使用帧图像编码隔行序列时帧的两场应相互交织然后整个帧作为单个帧图像进行编码图像类型有三类图像它们使用不同的编码方法帧内编码 图像只使用该帧本身的信息进行编码预测编码 图像 是用一个过去的

49、参考帧或参考场进行运动补偿预测的编码图像双向预测编码 图像是用一个过去和 或将来的参考帧进行运动补偿预测的编码图像序列头视频序列头从 码开始随后是一系列数据元素 在本标准中后应跟随 可包括超出 所使用之外的参数 当存在 时不适用 所定义的句法和语义 句法和语义应符合本标准在重复的序列头中除许可定义的量化矩阵和可选的 与 之外所有的数据元素应具有第一个序列头中的相同值 每次当序列头出现在比特流中时 量化矩阵可重新定义 注意 使用 也能改变量化矩阵跟在重复的 后的 中的所有数据元素应和第一个中的值相同如果第一个 之后有一个 出现则所有后续的序列头后都应有 且 中的所有数据元素都与第一个 中的数据元素相同 相反地如果第一个和第一个 间无 出现则不应出现在比特流中如果第一个 之后有一个 出现则所有后续的序列头后都应有 且 中的所有数据元素都与第一个 中的数据元素相同 相反地如果第一个和第一个 间无 出现则不应出现在比特流中使序列头重复允许重复初始序列头的数据元素 以便对视频序列进行随机访问在编码比特流中跟随在序列头或重复序列头后的第一幅图像可以是 图像或 图像 但不能是图像 在隔行帧

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1