1、中华人民共和国国家标准低比特率通信的视频编码发布 实施国家质量技术监督局 发布前言本标准是等效采用国际电信联盟 低比特率通信的视频编码 建议制定的其中考虑到我国通信网及具体应用业务情况作适当改动更适合于我国国情 标准中的章节依据的规定作适当改动原文中有关基于语法的算术编码模式改为 语义基算术编码模式 更适于国内应用低比特率通信的视频编码包括 个附录本标准的附录 为标准的附录本标准由中华人民共和国信息产业部提出本标准由信息产业部电信研究院归口本标准起草单位信息产业部电信传输研究所本标准主要起草人黄东霖杨淑京辛伟前言电信标准化部门 是国际电信联盟的一个常设机构 负责研究技术操作和资费问题并且为了实
2、现全世界的电信标准化对上述问题发布建议每 年召开一次的世界电信标准化会议 确定 研究组的研究课题并根据这些课题形成建议建议 由 研究组 年 月修订并由 批准中华人民共和国国家标准低比特率通信的视频编码国家质量技术监督局 批准 实施范围本标准定义一种以低比特率压缩视听业务的运动图像分量的编码表示法 视频信源编码算法的基本结构基于 并增加四个通用的编码选项以提高性能引用标准下列标准所包含的条文 通过在本标准中引用而构成为本标准的条文 本标准出版时所示版本均为有效 所有标准都会被修订使用本标准的各方应探讨使用下列标准最新版本的可能性建议 低比特率多媒体通信的复用协议建议 使用直至 的数字信道在视听终
3、端间建立通信的系统建议 多媒体通信的控制协议建议 视听业务的视频编解码器建议 运动图像和相关视听的通用编码建议 窄带 可视电话系统和终端设备建议 低比特率多媒体通信的终端主要指标编解码器框图见图图 视频编解码器方框图视频输入与输出为了使 行和 行两种电视标准的地区内和地区间的视听业务问题能以一个建议予以解决信源编码器对基于通用中间格式 的图像进行 本标准不涉及输入和输出电视信号的标准及完成来自或进入信源编码格式的必要转换方法 输入和输出电视信号可能是复合的或分量的 模拟的或数字的数字输入与输出视频编码器输出一个完整的数字比特流 可以包含其他多种方便工作的信号例如 建议中的规定 视频解码器完成相
4、反的过程抽样频率采用视频行速率的整数倍对图像抽样 该抽样时钟与数字网络时钟不同步信源编码算法采用画面之间预测和对剩余信号的变换编码这两者的混合方法 使用画面之间的预测是为了压缩其时域冗余量 使用变换编码是为了降低图像的空域冗余量 解码器具有运动补偿的能力 编码器可以根据用户的选择结合这种技术 与 中采用全像素精度和环形滤波器不同 采用半像素精度的运动补偿 发送信号用变长编码 除了 核心编码算法外在以下节中描述了 个通用的编码选项 所有选项可同时或独自出现不限制运动矢量模式本选项模式中 允许运动矢量出现在画面外 边缘像素可用于预测 不存在像素 本模式中 若有通过画面边缘的运动发生则可看到画面质量
5、的明显改善 尤其是较小画面格式见附录 而且 本模式扩展了运动矢量范围因此可用较大的运动矢量 本模式特别适用于摄像机运动的情况语义基算术编码模式本选项模式中用算术编码代替可变长编码 其信噪比与重建画面一样 但产生的比特数大大减少了 参见附录高级预测模式本选项模式中 画面的亮度部分用重叠运动补偿 见附录 画面的一些宏块中 用个 矢量代替一个 矢量 由编码器决定采用何种类型矢量 个矢量增加了所用比特数但预测效果得以改进 使用本模式使质量有了可观的改进 尤其是主观质量因为 会减少方块效应帧模式帧包括两个画面 作为一个单元进行编码 帧的命名来自于 中画面类型分为 画面和 画面 因此 帧包括一个 画面和一
6、个 画面 画面由前一已解码的 画面预测获得 画面由前一已解码的 画面和当前解码的 画面共同预测获得 称为 画面是因为部分 画面可由过去和将来的画面双向预测 本编码选项中 可大大提高帧速率而不过多增加比特率 见附录比特率传输时钟由外部提供 视频比特率可变视频比特率的限制不由本建议给出而由终端或网络给出缓冲器为了符合附录 定义的假想参考解码器的要求由编码器控制其输出比特率 在每一有效时钟周期都提供视频数据 这一点可由 填充比特来保证 见表 和表 或若采用前向纠错 则由前向纠错填充帧来保证见附录对任一画面编码所产生的比特数不能多于在 比特单元内测定的参数 所定义的最大值 参数所允许的最小值根据比特流
7、中协商的最大信源格式决定 见表 编码器可使用大于表 所定义的 值此值由外部方式协商 例如 建议传输的对称性本编解码器可以用于单向或双向可视通信表 每一信源画面格式的信源格式误码处理方式误码处理方式由外部方式提供 例如 建议 若不由外部方式提供 例如 建议 则采用附录 中所描述的可选纠错编码和定帧解码器能以 模式给编码器发送下帧图像的一个或多个 命令其中含有编码参数这样可避免缓冲器溢出 解码器也可发送一个非空 头的命令 此信号的传输方式由外部方式决定例如 建议多点操作附录 中包含支持交换型多点操作所需的各种性能信源编码器信源格式信源编码器工作于每秒出现 大约 次的非隔行扫描的画面中 每画面频率的
8、容差为画面按一个亮度和两个色差分量进行编码 和 这些分量和代表其抽样值的代码都与建议 所规定的相同黑电平白电平零色差峰值色差 和这些值都为标称值编码算法对 到 的输入值进行计算有 个标准画面格式 和 每一画面格式中亮度抽样结构为每行个像素垂直方向每画面 行 两个色差分量的抽样为每行 个像素垂直方向每画面 行每一画面格式都由表 给出其 的值对于每一画面格式色差抽样是固定的其块边界与图 所示的亮度块边界一致 每一画面格式中像素比例一致 且与 建议 和 的定义一致为 除子 画面格式外 所有标准画面格式覆盖的画面区域宽高比为 所有解码器可工作于 和 画面格式一些解码器也可工作于 和 编码器可工作于 和
9、 中的一种画面格式 由编码器决定采用何种格式但不能两种同时使用 一些编码器也可工作于 由外部方式决定具体使用何种画面格式例如 建议 对于可能出现的画面格式和视频编码算法的完整描述参考有关终端描述 例如 建议表 每一画面格式中每行像素数和行数画面格式 亮度的像素数 亮度的行数 色差的像素数 色差的行数 亮度抽样色差抽样块边缘图 亮度和色差抽样的位置注 对 而言 每行像素数与 行或 行信源的亮度和色差信号的有效部分的抽样兼容亮度和色差信号有效部分分别以 和 进行抽样 这些频率与 建议 的频率间有个简单对应关系编码器应该有办法限制其最大画面速率致使两个发送画面间有一个最少数目的非发送画面 这个最少数
10、目由外部方式决定 例如 建议 帧模式中为了计算非发送画面的最小数量 将帧单元的 画面和 画面作为两个独立画面视频信源编码算法信源编码器的一般形式见图 主要环节是预测块变换 量化宏块和块每一画面都可分为块组 由画面格式决定一个块组包含 行 和中 中 中 中每帧 数为 中 为中为 的计算是由 的垂直扫描实现的从最上 号开始结束于最下例如 画面格式的 排列见图 每个 数据包括 头可为空 其后有宏块数据 每个中的 数据以逐次增加 号的顺序来发送每一 可分为若干个宏块 每一宏块 分量为 在空域相应的 和 为 像素而且如图 所示每一宏块包含有 个亮度块 在空域对应有 个色差块每一亮度或色差块对应的或 为
11、对于 和 而言一个 包含有一个宏块组对于 而言包含 个宏块组 对于 而言包含 个宏块组变换 量化 具有运动补偿可变延迟的画面存储 编码控制 标志发送或不发送标志 量化器指示 变换系数的量化标志 运动矢量图 信源编码器宏块的计算是通过从左到右的水平扫描来实现的起始于上一宏块 结束于下一宏块 每个宏块按增长宏块号的顺序发送宏块数据 每个块按增长块号的顺序发送数据见图图 画面中 的排列图 宏块中块的排列本标准不涉及模式选择的原则和发送块的原则 这些内容随着编码控制策略的改变而改变 对发送的块进行变换 产生的系数被量化和熵编码预测预测为帧间预测并且加入了运动补偿见 提供预测的编码模式叫 若不提供预测则
12、为 编码模式由画面级 帧是 而 帧是 来标明或由 帧中的宏块级标明 在可选的 帧模式中 帧总为 模式 帧有一部分是双向预测 参见附录运动补偿解码器中每个宏块可接受一个矢量 或者采用高级预测模式时每个宏块可有一个或 个矢量 参见附录 若用 帧模式则每个宏块发送一个附加的 矢量以调整 宏块预测的运动矢量运动矢量的水平和垂直分量可为整数或半整数值在缺省预测模式时 范围限制在 对于 帧的前向和后向矢量分量而言有效 而在不限制矢量模式时 矢量分量的最大范围为这种限制下若预测模式范围在 之间 则每一运动矢量分量的预测值中仅能得到一个范围在 之间的值 若预测范围在 之外则可得到范围在 之间与预测值加零值标号
13、相同的所有值 见附录水平或垂直运动矢量分量为正表明预测是由空间位置中位于被预测像素的右边或下边的前一参考画面中的像素形成的运动矢量的限制条件是所参考的所有像素都位于编码画面区 除了采用不限制运动矢量模式和或高级预测模式之外见附录 和附录量化块第一个系数的量化器数目为 其余的量化器数目为 在同一宏块内除第一个块外 所有系数都用同一量化器 判决电平不作规定 块第一个系数通常称为直流值其统一的量化步长为 其余 个量化器中每一个使用等间隔的重建电平 围绕零有中心死区 步长为到 的偶数值 具体见注 量化步长较小时 不能表示变换系数的全动态范围编码控制为了控制所编码视频数据的产生速率采用了不同的几个参数
14、这些参数包括信源编码器的前处理 量化器块重要性判决和时域子抽样 本标准不涉及总体控制策略中对这些方法的提议一旦引用 通过丢弃整帧图像来进行时域子抽样解码器可标识视频信号时域和空域分辨率之间某种交替方式的性能 编码器可在呼叫时标出其缺省的交替方式 并指示是否可响应解码器的请求 以改变交替方式 此种信号的传输方法由外部控制 例如 建议强制更新此功能以强制使用编码算法的 模式来实现 更新模式不作规定 为了控制反变换失配误差的累积当发送 帧中宏块的系数时 每一宏块最多发送 次就以 模式编码一次起始码的字节组合通过在起始码前插入少于 个零比特的填充码可得到起始码的字节组合 起始码的第一比特是字节的第一比
15、特 最高有效位 若最高有效位的位置是从 比特流中第一比特开始 有整数倍的比特则起始码是字节组合 所有画面起始码都为字节组合 和 码可能为字节组合注某一画面所用比特数可变但为 的倍数需要 编码器来安排以逻辑信息单元开始的起始码 并将其通过适配层语法和语义视频复用被分为 层水平结构从上到下分别为图像层块组层宏块层块层语法结构见图 其缩略语和语义的定义下一节给出图 视频比特流的语法框图除非特别说明否则最高有效位首先发送为 比特 并位于本标准码表的最左比特 除非特别说明否则所有未用比特或空闲比特置为 除非 中定义其功能否则空闲比特不用图像层每帧图像的数据由图像头及其随后的 数据构成 并伴随有序列结束码
16、和填充比特 图像结构示于图 若 指示 则 出现 若 指示使用 帧模式则 和 出现和 的合并可不出现 可不出现 而若 出现 则 可能出现 丢弃图像的图像头不发送图 图像层结构图像起始码 比特为 比特的码 值为 所有图像起始码都为字节组合 这一点可通过在起始码前插入 来实现 由此起始码的第一比特为字节的第一比特 最高有效位时域参考 比特为 比特 有 种可能值 值构成为前一发送帧头的值加 再加前一发送帧之间未发送的帧数以 运算在低 位内进行 在可选的 帧模式中 仅用于 帧 帧的时域参考见类型信息 比特整帧图像信息只为 以避免起始码的争用只为 以区别于分屏指示 断 通文件摄像机指示 断 通整帧解除冻结
17、 断 通信源格式 禁止保留 保留图像编码类型 帧 帧可选的不限制运动矢量模式 断 通可选的语义基算术编码模式 断 通可选的高级预测模式 断 通可选的 帧模式 一般的 或 帧 帧分屏指示信号指示所解码图像的上半部或下半部依序逐次显示 此比特对图像的编码或解码无直接影响解除冻结画面为来自编码器的信号它响应分组重发的请求 若不确认 或快速更新请求 见附录且允许解码器从冻结图像模式退出 并以一般方式显示解码画面若 比特指示信源格式与前一帧头不同 则当前图像为 帧比特指示编码器和解码器 分别见附录 附录 附录 和附录 协商后应采用何种模式 若比特 置 比特 也要置量化器信息 比特比特的定长码 指示一幅图
18、像采用量化器 直至被任意顺序的 或所更新 此码由 值的自然二进制表示值为半步长 范围从持续显示多点 比特此 比特码表示是否使用可选的持续显示多点模式 为断 为通 的使用见附录图像子流指示 比特比特的定长码 在 模式指示使用持续出现多点模式时出现 帧头及其随后直到下一帧或起始码前的信息其码字由子比特流号的自然二进制表示 参见附录帧的时域参考 比特若 指示 帧 见附录 且指示从最后的 或 帧开始 到 帧前未发送图像的数量则出现 此码字由未发送图像数量加 所形成的自然二进制码表示 未发送画面的最大数量为帧的量化信息 比特若 指示 帧 则出现 见附录 解码过程中 每一宏块都有量化参数帧 用于 块 块使
19、用不同的量化参数 范围从指示了 和 之间的关系如表 所示 本表中 为整除符号范围从 到 若表 所产生的 值大于 则减到表 码字与 和 之间的关系额外插入信息 比特此比特置为 表明以下可选数据域出现备用信息 比特若 置 则 比特中有 比特的数据 和另一个指示后面是否还有 比特的 比特 如此类推 在 作出规定前 编码器不得插入 这样以后 就可在 中规定后向兼容附加信息 若 置 所设计的解码器应能放弃 若 后 置 为了避免起始码的争用则禁止使用 为任意由此 个值中的 个被禁止值填充 变长少于 个 比特的变长码 编码器可在 码前直接插入此码若 出现则 的最后一比特为字节的最后一比特最后一个无效位 以便
20、 起始码为字节组合 所设计的解码器应能放弃结束序列 比特比特长 值为 取决于编码器是否插入此码 为字节组合 通过在起始码前插入 可得到 因此起始码的第一比特为字节的第一比特 最高有效位填充 变长少于 个 比特的变长码 编码器可插入此码作为下一个 的字节组合 的最后一比特为字节的最后一比特 最后一个无效位 因此 从 比特流中第一比特开始到 结束的视频比特流为 的倍数 所设计的解码器应能放弃若由于某原因在某段时期内编码器停止图像编码以后又开始编码则在编码器停止前会发送以避免编码器重新开始编码前 先前图像中有最多 个比特会停止发送块组层每一 数据由 头及其随后宏块数据构成 结构示于图 每一 包括一个
21、或多个宏块每一图像的第一个 号不发送 头 而别的 中根据编码策略 头允许为空 由外部方式决定解码器是否给远端的编码器发送非空 头例如 建议 若 出现则也可出现 若 出现则 和 也出现 若持续显示多点模式为通 则出现并在图像头指示图 层的结构填充 变长为少于 个 比特的变长码 编码器可在 码前插入此码 若 出现 则 的最后一比特为字节的最后一比特最后一个无效位 以保证 码的开始为字节组合 所设计的解码器应能放弃起始码 比特码长 比特 值为 起始码为字节组合 通过在起始码前插入可得到 以便保证起始码的第一比特为字节的第一比特 最高有效位号 比特比特的定长码 用二进制表示 号 对 为 的 而言 包括
22、有和 的 头为空 用于 中 用于 中 的值保留以便 将来使用子流指示 比特比特的定长码 只在 指示持续出现多点模式时出现 头和所有直到下一帧或 起始码前出现的随后信息码流都用子比特流号的自然二进制表示见附录帧 比特比特的定长码 每一给定图像的 头中 都为相同值 而且 若图像头指示的 与前一发送帧相同 则 与前一帧的 值也相同而若某一帧头中 不同于前一发送帧头则此帧的 值应不同于前帧量化器信息 比特比特的定长码 指示 中应用量化器 直到被 所更新 此码的值用自然二进制数表示且为量化步长的一半范围从宏块层每一宏块数据包括宏块头及其随后的块数据 结构示于图 图像的每一宏块中若 指示则出现 若 有指示
23、 或 指示 则出现 若 指示帧 则 类型 中出现 在 指示下 和会出现 指示时 和 才可能出现 若 和 有指示则出现块数据仅在高级预测模式中出现 参见附录 和 仅在 帧模式中出现参见附录 语义基算术编码模式的编码方式参见附录图 宏块层结构编码宏块指示 比特此比特置 则指示宏块进行编码 若置 则表明本宏块无更多信息要发送 这时 解码器将宏块看作 宏块整个宏块的运动矢量为 且无系数数据 对本帧每一宏块而言若 指示则出现注 在高级预测模式中 若 置 则采用重叠运动补偿色度块的宏块类型和编码块模式 变长为变长码给出了有关色度的宏块类型和编码块模式的信息 码字由表 和表 给出总是出现于编码宏块中表 的
24、表 用于 画面 表中有一些额外的码 用于比特填充 解码器应丢掉宏块类型给出了有关宏块及其出现的数据单元的信息 宏块类型及其所包括的单元见表 和表表 的 表用于 画面序号 类型 比特数 代码填充表 的 表用于 画面序号 类型 比特数 代码填充当至少发送一个非 直流变换系数时色度编码块模式表示 和或 块 对块而言 为直流系数 参见 对编码块模式中 和 而言 若块不出现任何非 系数则 否则为 块号由图 给出 若 填充 则宏块的剩余部分省略 这时 的处理与任何编码或未编码的宏块无关 因此宏块号不增加 对于帧而言由多组 和 填充 来完成多组填充表 一般画面的宏块类型和所包含的数据单元画面类型 宏块名称不
25、编码填充填充注 即此代码在宏块中出现表 帧中宏块类型和所包含的数据单元画面类型 类型名称不编码填充注表示此码字出现于宏块中若 指示 则仅 和 出现块总为 模式编码即使 宏块的 类型指示块的宏块模式变长为变长码 若 指示 帧 则 类型 中出现 且 指示是否出现指示本宏块中发送 系数和 或 的变长码 表 定义此 码表 的 表序号 比特数 代码注 表示此码字出现于宏块中块的编码块模式 比特若 指示 则 帧模式中出现 对于编码块模式中每比特 而言若 块 中出现任何系数 则 否则为 块号由图 给出 最左比特相应为块亮度的编码块模式 变长为变长码 给出了一个格式号 标明发送至少有一个非 变换系数的宏块中的
26、 块块中 为直流系数 见对于编码块模式中每比特 而言若块 出现任何非 系数 则 否则为 块号见图 最左比特相应为 对于某种模式 和 宏块使用不同码字 见表量化器信息 比特用 比特定义 的改变 表 中给出了用于不同码字的不同值 范围从若加差值后其值小于 或大于 则相应减到 和表 代码和 的差值序号 差值运动矢量数据 变长所有 宏块中都有 帧模式也用 宏块 由水平分量的变长码及随后垂直分量的变长码构成 变长码由表 给出运动矢量数据 变长若 和 有指示则出现这三个码 每个矢量都由水平分量变长码及其随后的垂直分量变长码构成 变长码由表 给出表 的 表序号 比特数 代码表 完序号 比特数 代码仅出现于高
27、级预测模式 见附录宏块的运动矢量数据 变长若 有指示则仅在 帧模式中才出现 它的每个矢量由水平分量变长码及其随后的垂直分量变长码构成 变长码由表 给出 的使用参见附录块层除 帧模式外每个宏块都由 个亮度块和两个色差块构成 两个色差块每样一块 见图 块层结构示于图 若 指示 类型 或 则宏块中每个块都出现 见表 和表若 或 有指示 则 出现图 块层的结构帧模式中 宏块由 个块组成 缺省模式下先发送 个 块的数据 然后是 块数据 若指示 类型 或 则宏块的每个 块都有 见表 和表 块中不出现若 或 有指示则 块出现 若 有指示则 块出现块的直流系数 比特码长 比特 不用 码和 码被编码的 重建电平
28、为 见表表 的 表序号 差 值 数 代 码表 完序号 差 值 数 代 码表 模式 系数的重建电平序号 反变换的重建电平变换系数 变长最常出现的 以表 所给的变长码进行编码 最后一比特 注明电平标记 为正为负包括最后一个非零系数指示 块中有多个非零系数 块中最后一个非零系数 编码系数前多个连零值 和编码系数的非零值其他的 组合以 比特进行编码其中包括 比特的换码 比特的 比特的连零 和 比特的电平 不禁止用此 比特的码作为表 所列的编码 比特的 中禁止使用 和 码 和 的码表见表解码过程运动补偿本节中描述了缺省的 预测描述的运动补偿 不限制运动矢量模式中运动补偿的描述见附录 高级预测模式中运动补
29、偿的描述见附录差分运动矢量通过给 所指的运动差值加入一个预测值可得到宏块矢量见表 每宏块 个矢量差分编码参见附录 在每宏块一个矢量的情况下差分编码的备用预测值取自三个邻接宏块 如图 这些预测值的水平和垂直分量都是独立计算的表 的 表序号 结尾标志 连零 电平 代码 序号 结尾标志 连零 电平 代码表 完序号 结尾标志 连零 电平 代码 序号 结尾标志 连零 电平 代码表 和 的 表序号 连零 代码 序号 连零 代码画面或 边缘图 运动矢量预测特殊情况下 例如处于当前 或图像的边缘加入如下规定若相应宏块在图像外左端 则备用预测值 置为若相应宏块在图像外上端 或当前 的 头非空时在 外高端 则备用
30、预测值和 置为若相应宏块在图像外右端 则备用预测值 置为若相应宏块以 模式编码若不是在 帧模式或不编码 则备用预测值为每一分量中预测值是此分量的三个备用预测值的中值运动矢量分量值受到一定限制是有优点的 的每一 码代表一对差值 这对差值中仅有一个将产生落于允许范围 内的宏块矢量分量 若运动矢量的水平分量或垂直分量为正 则表明预测由在空域中位于先前图像像素的右边或下边的先前图像的像素形成宏块中运动矢量用于四个亮度块的所有像素 由于色差块的色差格式较低 可通过将宏块矢量的分量值除以 得到两个色差块的运动矢量 所产生的 像素分辨率矢量的分量值改为最近的半像素位置 如表表 四分之一像素分辨率色度矢量分量
31、的修正四分之一像素位置产生位置子像素预测的插入用图 所述的线性插入可得到半像素值 表明除后取整图 线性插入半像素预测系数解码反量化若 则重建电平 的重建电平由表 给出 除 外 所有非零系数的重建电平由下式给出若 奇若 偶注意 此过程不允许出现偶数值 这样可避免反 失配误差的累积 计算 后加一个以得到由 码的最后一比特见表 或表 给出重建电平的限幅反量化后 除 外所有系数的重建电平限幅为之字型定位由图 序列可得到 块量化后的变换系数 系数 为直流系数图 量化变换系数的之字扫描反变换反量化和系数的之字型扫描后 所产生的 块由 尺寸的独立的二维离散余弦变换进行处理 反变换的输出范围从 到 限幅后以
32、比特表示 反变换的变换系数如下其中 像素域空间坐标变换域坐标时为 否则为时为 否则为注在变换的像块内 和 分别指图像的最左边和最上边 计算反变换的运算过程不作规定但应符合附录中规定的容差要求块的重建求和运动补偿和系数解码后包括反变换 每一亮度和色度块都进行了重建 对于 块而言 重建等同于反变换的结果 对于 块而言重建由预测与反变换的产物共同形成 此求和基于像素实施限幅为防止变换系数幅度的量化失真引起编码器和解码器环路的算术溢出 应插入限幅功能 在预测和重建预测误差求和后产生的系数值小于 或大于 时进行限幅将其值相应改为 和附录标准的附录反变换精度的技术规范按照下面给定的随机数发生器 型 产生范
33、围从 到 的随机整数像素数数据值 组成的块包含 个块的数据集应该在 和 的情况下分别产生对每个 像块使用至少 比特浮点精度的方法 进行可分离的正交的多重矩阵的前向离散余弦变换其中 像素域空间坐标变换域坐标时为 否则为时为 否则为对每个块以四舍五入的办法将 个变换系数取成最接近的整数值 然后把它们限幅到的范围内 这就是到反变换的 比特输入数据对于由 产生的每个 的 比特数据块用至少 比特浮点精度进行可分离的正交的多重矩阵的离散余弦反变换 将得到的像素四舍五入成最接近的整数并限幅到 的范围内 这些 的像素块便是参考 输出数据对由 产生的每个 数据块 按试验方法进行离散余弦反变换 并将输出限幅到的范
34、围内 这样得到的 的像素块便是试验 输出数据对 个 输出像素中的每个像素 对上面产生的 个像块数据集的每个集 在参考数据和每个试验数据之间测量峰值平均值和均方误差对任何像素 峰值误差的幅度不得超过对任何像素均方误差不得超过总均方误差不得超过对任何像素平均误差幅度不得超过总平均误差幅度不得超过全零输入必须产生全零输出使用与步骤 完全相同的数据值但改变每个像素的符号重新测量产生随机数的 程序附录标准的附录假想参考解码器假想参考解码器 定义如下与编码器有相同的时钟频率与 速率且同步操作接收缓冲器大小为 比特 其中 为每帧的最大比特数 此数由使用中的比特流进行协商 见 值定义如下其中 为 为每秒比特连
35、接时最大视频比特率 此时 值最小 编码器可使用较大的值 由外部方式协商提供较大的 值例如 建议的值由系统配置决定 例如 或 单或多链路 且可等于由物理链路支持的最大比特率 由外部方式协商 例如 建议初始为空缓冲器在 间隔进行检测 例如 若至少有一帧完整的编码画面位于缓冲器中则最早画面的数据瞬间清除 例如图 中以 为间隔 清除以上数据后缓冲器占据量必须小于 这是编码器输出比特流的要求 它包括编码画面数据和 和 缓冲但不包括附录 中描述的纠错定帧比特填充指示 填充比特或纠错奇偶比特信息为了定义方便一个完整的编码画面一般包括 或 画面或 帧为了满足第 帧的比特数 编码画面 必须满足其中 时间 后缓冲
36、器的占据数量第 帧编码画面从 缓冲器清除的时间时间 时的视频比特率图 缓冲器占据数量注 时间 为 画面间隔时期 整数附录标准的附录多点的考虑下列功能用以支持交换型多点应用画面冻结请求促使解码器冻结其显示画面 直到释放画面冻结信号 或达到至少 的超时期 画面冻结请求信号的传输由外部方式提供 例如 建议快速更新请求促使编码器对下一帧图像以 方式编码 编码时采用适当的编码参数以防止缓冲器溢出 快速更新请求信号也由外部方式提供 例如 建议冻结图像的释放响应快速更新请求编码器发出此信号使编码器脱离冻结状态而以正常方式显示解码图像 此信号由响应快速更新请求的第一个编码画面的画面头中 来发送持续显示多点 不
37、适用于在 中 提出一种协商的持续出现多点模式它可将最多四个独立的 比特流以子比特流的形式复用为一个新的使用了 和 域的视频比特流 本模式的交换能力由外部方式提供 如在 模式中每一独立 比特流中 域置为 每一 比特流的帧头和 头中子比特流指示信号 指示 比特流的数目 规定为复合视频比特流所属的 直至下一帧或下一 头之前的头和随后信息每一子比特流都作为一般的 比特流 且符合外部方式交换的能力 不同 比特流的信息不以特殊的预规定的顺序来发送一个 可有独立于前一 的值且不同 比特流的帧率不同 每一独立比特流中的信息也完全独立于别的比特流中的信息 例如一个子比特流中 码字不影响别的子比特流的 或 码字附
38、录标准的附录不限制运动矢量模式本附录讲述 中可选的不限制运动矢量模式 中本模式的功能由外部方式提供 例如建议 中指示是否使用本模式图像边缘的运动矢量在 缺省的预测模式中运动矢量受到一定限制 以保证他们所参考的所有像素都位于编码图像区 见 而在不限制运动矢量模式中 去掉了此限制允许运动矢量指向画面外 若运动矢量所参考的像素位于编码图像区外则用边缘像素代替将运动矢量限制在编码图像区内的最后全像素位置 可得到边缘像素 此运动矢量的限制以像素为单位 且独立于运动矢量每一分量例如若 图像用不限制运动矢量模式其亮度分量所参考的像素值由下式给出其中 像素域空间坐标使用不限制运动矢量模式时所参考图像 的像素值
39、使用不限制运动矢量模式时所参考图像 的像素值若 若若 若其他 其他的编码图像区为 所给边界为整像素位置但 也可为边界处半像素位置运动矢量范围的扩展缺省预测模式时运动矢量的水平和垂直分量值限制在 范围内 此范围时 帧中前向和后向运动矢量分量也有效 而在不限制运动矢量模式中 矢量分量的最大范围为而且若预测值在 范围内 则只能得到每一运动矢量分量中范围在 的值 若预测值在 之外则所有范围在 内且与预测值加 值有相同标号的值都可得到 若 为运动矢量分量 且 为其预测值 则若若若不限制运动矢量模式中表 对 和 的解释如下若运动矢量分量的预测值范围在 内则仅提供矢量差的第一个值若运动矢量分量预测值范围在
40、之外则表 中矢量差将产生一个范围在的矢量分量且与预测值包括 有相同的标号和 的预测值定义为矢量分量 和 的中值 和 定义于 和 的预测值为 其中 表示 帧中 亮度块的矢量分量见附录标准的附录语义基算术编码模式概要在本建议第 节所述的变长编码解码 中用基于编码器语义的特殊表来表示编码 本表主要存储 码字的长度和值 本信号在查表操作中制定一个表的窗口 然后将窗口定义的二进制码字发送到缓冲器 以便发往接收器 在 解码器中 所接收的比特流在基于编码器语义的特定表内进行逐个窗口的匹配 此表必须与解码当前符号的编码器中所用的表一致 本表中匹配窗口重新转变为相应的信号 就产生了 解码器 并用它来恢复视频图像
41、 此 处理意味着每一符号必须被编码为固定的整数比特若去掉固定比特的限制将导致降低了算术编码器所产生的比特数本附录讲述 中可选的语义基算术编码 模式 本模式中以 操作的所有相应变长编码 解码都换为算术编码解码 本模式的能力由外部方式决定 例如 指示是否使用此模式编码器的规定模式中 用基于编码器语义的特定整数矩阵或一个模型 来对符号编码也可通过调用以下程序的子程来编码和 的初始值相应置为 和 算术编码器经过缓冲后的输出比特为先入先出型 此模型通过 来定义且用模型的名称来定义子程的符号解码器的定义在 解码器中 用基于语义的特定模型或调用以下 程序可对符号进行解码此模型也通过 来定义 通过模型中的名称
42、可返回解码符号 输入比特流缓冲器为先入先出队列 通过调用以下程序 可将解码器初始化为开始对算术码流解码语义如 表模式 符号的语义分为 层 图像层 层宏块层和块层 上三层语义相同 块层语义基本相同但由图 的详细注释图 块层的结构图 中 如 所述 和 为 符号 且相应为第一第二第三和最后符号 若块层中有 或多个系数 则相应的出现和编码器或解码器的 为大于 比特的 队列 在编码器的 中 和的非法仿真已被定位 且通过在 个 后插入一个 来避免出现此情况 这不是 或的一部分 在解码器的 中删去 个 后的第一个 若 个 后还为 则表明检测到合法的 或 或 的精确定位是由一串 后是否还有 决定的固定长符号有
43、三种可能的固定长符号串和 此串随着编码器端的通用 表模式而直接发送到 且检测到合法 或 或 后直接从解码器的 中发送出来若定长符号串不是视频会话的第一个则在发送定长字符串前 通过调用以下程序来重置算术编码器 此程序也可在视频会话结束前或 前调用解码器中 每一定长字符串后 调用 程序非定长字符非定长符号的模型见 节 第 节 表所给出的指示用于本模型中整数的标志帧中 和 模型由 和 命名 为 指示为 为指示为 的标志若是 帧则定义于表 若是 帧则定义于表 帧中 模型由 命名模型为 的标志定义于表 的模型为的模型为 则标志为 则标志为在 宏块中 的模型为 在 宏块中 的模型为的模型为 和 的标志分别
44、定义于表 和表和 的模型为 的模型为 其标志分别定义于表 和表一个非换码 包括一个符号 对于 及其随后的符号 和 对于的标志 块中 和 的模式为块的模式为所有 标志定义于表 的模型为 正值标志的 为 负值标志的 为块中 后面的 的模型为时 标志为 时标志为 而 和 定义于表模型附录标准的附录高级预测模式概要本附录讲述 可选的高级预测模式 包括重叠块运动补偿和每宏块可能产生 种运动矢量本模式的功能由外部方式提供 例如 中指示是否使用本模式 与不限制运动矢量模式类似 本技术见附录 中 节 在高级预测模式中允许运动矢量超出画面边缘 若选用不限制运动矢量模式 则不限制运动矢量模式的扩展运动矢量范围不能
45、出现在高级预测模式中 仅能单独使用 若高级预测模式与 帧模式共同使用 则重叠块运动补偿仅用于 帧的预测 而不用于 帧的预测每宏块 个运动矢量中除高级预测模式外每宏块只用一个运动矢量 本模式中 由每宏块的 码指示选择 矢量 若某宏块仅发送一个运动矢量 则定义为值相同的 块 若 指示当前发送 个运动矢量 则第一个运动矢量信息作为 码字发送 另外三个运动矢量的信息作为 发送见 和根据 的判断规则通过给 和 所示的矢量差加入预测值 可得到此矢量 这就与每宏块仅一个运动矢量的方式相同 在水平和垂直分量上再独立计算预测值 而备用预测值和 按图 进行定义 若每宏块仅出现一个矢量 则 块号 的 按图定义此定义
46、见图 四个子图左上角图 用于宏块中每一亮度块的备用预测器 的重新定义若用 个矢量则宏块中 个亮度块中每一块所有的像素都要使用运动矢量 如图 所给 运动矢量的数目等同于 个亮度块的数目 两个色差块的运动矢量 是通过计算 个亮度矢量的总和 再除以 得到的 所产生 像素分辨率矢量的分量值被修正到最近的半像素位置见表表 产生的 个色度数量分量的修正十六个像素的位置产生的位置用 所述的双线性插入可得到半像素值 在高级预测模式中 由 节所述重叠块运动补偿可得到亮度的预测 通过给色度块的所有像素使用运动矢量 可得到色度的预测亮度的重叠运动补偿亮度预测块的每个像素都是 个预测值加权求和再除以 舍 入而得到的
47、为得到三个预测值采用了 个运动矢量 当前亮度块的运动矢量 和四个 相邻矢量中的两个当前亮度块之左或之右的运动矢量当前亮度块之上或之下的运动矢量别的 的相邻运动矢量与当前 内的相邻运动矢量用法相同每个像素都采用了两个最近块边缘处的相邻块运动矢量 即采用了当前块之上相应的上半部运动矢量 和当前块之下相应的下半部运动矢量 见图 同样采用当前块之左相应的左半部运动矢量和当前块之右相应的右半部运动矢量 见图使 位于图像中所测的整像素单元位置使 位于图像中所测的半像素单元位置且使 和 为所测的半像素单元的运动矢量分量则亮度预测块中每一像素所生成的 由下式决定其中 和 为参考图像所采用的预测值 定义如下其中
48、 为参考画面中 处预测值在不限制运动矢量模式中 可位于图像外 注意可为整像素或半像素位置见 节为当前块的运动矢量 为当前块之上或下的运动矢量 为当前块之左或右的运动矢量矩阵 和 定义于图 图 和图 其中 为矩阵相应的行和列若邻接宏块中有一个未编码 则相应的邻接运动矢量置为 若邻接块的一个为 编码 则除帧模式外相应的邻接运动矢量由当前块的运动矢量代替 此时 帧模式 块 使用块的运动矢量也见附录 若当前块位于图像边缘因此无邻接块则相应的邻接运动矢量由当前运动矢量代替 在上述情况下 若当前块位于宏块底部 块 或块 见图 则当前宏块之下的宏块中具有 亮度块的邻接运动矢量由当前块的运动矢量代替预测的加权
49、值见图 和图 加权值 当前亮度块运动矢量图 加权值 当前亮度块之上或下的亮度块的运动矢量分量的预测图 加权值 当前亮度块之左或右的亮度块的运动矢量分量的预测附录标准的附录帧模式概要本附录讲述 中可选的 帧模式 本模式的功能由外部方式提供 例如 建议中指示是否出现本模式帧模式包括两帧被编码成一个单元的图像 帧的命名来自于 中 帧和 帧的命名因此 帧包括一个 帧和一个 帧 帧由前一已解码 帧预测而得 帧由前一解码 帧和正解码的 帧共同预测得到 选择 帧这个名字是因为部分 帧可由先前帧和下一帧双向预测而得 预测过程由图 给出图 帧模式的预测帧和 块若用 帧 则编码模式 意义如下 见块为 编码块为由 块预测的 编码若用 帧 指示 则图像中 宏块也用了运动矢量数据中不用 见表 当用高级预测模式和 帧模式 且有一个邻接块以 模式编码时相应的邻接运算矢量不被当前块运动矢量代替 相反采用邻接 运动矢量块层帧模式中宏块有 块缺省的 模式
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1