GB T 17975.1-2000 信息技术 运动图象及其伴音信息的通用编码 第1部分 系统.pdf

上传人:twoload295 文档编号:174476 上传时间:2019-07-15 格式:PDF 页数:115 大小:5.59MB
下载 相关 举报
GB T 17975.1-2000 信息技术 运动图象及其伴音信息的通用编码 第1部分 系统.pdf_第1页
第1页 / 共115页
GB T 17975.1-2000 信息技术 运动图象及其伴音信息的通用编码 第1部分 系统.pdf_第2页
第2页 / 共115页
GB T 17975.1-2000 信息技术 运动图象及其伴音信息的通用编码 第1部分 系统.pdf_第3页
第3页 / 共115页
GB T 17975.1-2000 信息技术 运动图象及其伴音信息的通用编码 第1部分 系统.pdf_第4页
第4页 / 共115页
GB T 17975.1-2000 信息技术 运动图象及其伴音信息的通用编码 第1部分 系统.pdf_第5页
第5页 / 共115页
亲,该文档总共115页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、中华人民共和国国家标准信息技术运动图像及其伴音信息的通用编码第部分系统发布 实施国家质量技术监督局 发布前言本标准等同采用国际标准 信息技术运动图像及其伴音信息的通用编码第 部分系统在信息技术运动图像及其伴音信息的通用编码 的总标题下目前包括以下几个部分第 部分 系统第 部分 视频第 部分 音频本标准的附录 是标准的附录附录 到附录 是提示的附录本标准由原中华人民共和国电子工业部提出本标准由中国电子技术标准化研究所归口本标准起草单位南京大学镇江江奎集团公司广电总局广科院数字广播电视技术研究中心本标准主要起草人张福炎王继成陈毅松 黄伟红杨杰前言国际标准化组织 和 国际电工委员会是世界性的标准化专

2、门机构 和 的成员国通过各个组织建立的技术委员会积极参与特定技术领域的国际标准的起草工作 和 技术委员会在共同感兴趣的领域内进行合作其他一些与 和 有联系的官方和非官方国际组织也参与国际标准的制定工作在信息技术领域 和 建立了一个联合技术委员会即 被联合技术委员会采纳的国际标准草案在成员国范围内投票表决 发布一项国际标准需要至少 的成员国投票赞成国际标准 是由联合技术委员会 信息技术分会在 的合作下制定 它同时已作为 建议 出版国际标准 在总标题 信息技术 运动图像及其伴音信息的通用编码 下 包括以下部分第 部分 系统第 部分 视频第 部分 音频第 部分 一致性测试第 部分 扩展第 部分 系统

3、解码器的实时接口扩展附录 是完整的 系统部分的一个组成部分 附录 到附录 仅用作参考资料引言本系列标准的系统部分论述了这样一个问题 即如何将单路或多路基本音频和视频流以及其他数据组合成为适合于存储和传输的单路和多路复合流 系统编码遵循本规范指定的语法和语义规则 并提供了使解码器缓冲区能在一个宽范围的补偿或接收条件下同步解码的信息系统编码被指定为两种形式传输流和节目流 每一种针对不同的应用集合加以优化 本标准中定义的传输流和节目流提供了编码语法该语法对于同步解码及展现音频 视频信息是必要的也是充分的同时保证了解码器中数据缓冲区不发生上溢和下溢 在该语法中利用有关编码音频和视频数据解码和演示的时间

4、戳以及有关数据流自身传输的时间戳对信息进行编码 传输流和节目流都是面向分组的多路复合流单一音频和视频基本流的多路复合过程参见图 音频和视频数据按 和编码 压缩数据被打包以形成 分组 在形成 分组的过程中可能会加入独立使用传输流或节目流的 分组所需的信息 当 分组进一步与系统层信息结合形成传输流或节目流时 这一信息是不必要的也是不能加入的 本系统标准覆盖了竖直虚线右边所示的处理过程图 本标准范围简图节目流是模拟信号与 系统层类似 它是由具有共同时间基准的一个或多个 分组合并而成的单一流有些应用中要求包含单个节目的基本流是未多路复合的分离流对这些应用基本流也可作为分离的节目流编码 每一基本流含一个

5、节目流且具有共同时间基准 在这种情况下 不同流中 字段的编码值必须一致和单一节目流一样 所有的基本流都可被同步解码节目流被设计为用于相对无差错环境中且适用于牵涉到诸如交互式多媒体应用等系统信息软件处理的应用 节目流分组长度可变 而且可能很长传输流将具有一个或多个不同时钟基准的一个或多个节目组成一个单一流 由属于同一个节目的多个基本流组成的多个 分组共享一个时钟基准 传输流是为用于可能出现差错的环境设计的 例如在有损或有噪媒体中的存储或传输 传输流分组长度为 字节节目和传输流是为不同应用设计的 它们的定义并不严格遵守分层模型彼此之间的转换是可能和合理的但并不互为子集或超集 特别是 从一个传输流中

6、抽取一个节目的内容并创建一个有效节目流是可能的 该工作利用 分组的公共互换格式完成 但并非节目流需要的所有字段都包含在传输流中 有一些必须导出而在分层模型中 传输流可能横跨多个层 且被设计为在宽带应用中高效和易于实现系统规范中陈述的语法和语义规则的范围是不同的语法规则仅用于系统层编码并不延伸到音频视频规范的压缩层编码 而语义规则适用于复合流本系统规范并未规定编码器或解码器的体系结构或实现方法 也未对多路复合器或分流器作相应的规定然而 比特流的性质对编码器 解码器多路复合器和分流器提出了功能和性能上的要求 例如编码器必须满足最小的时钟容差要求等 尽管有这样或那样的要求编码器解码器 多路复合器和分

7、流器的设计与实现仍然有相当大的自由度传输流传输流作为一种流 是针对在那些可能会出现显著错误 往往表现为位差错或丢失分组 的环境中进行节目传送和存储而定义的 这些节目包含按照 和 编码的数据以及其他数据传输流的速率可以是恒定也可以是可变的 在任何情况下所包含的基本流也是速率恒定或可变的 在每一种情况下流的语法或语义限制是相同的传输流速率由节目时钟参考 字段的值和位置定义这些 字段通常分离在每个节目中构造和传输包含多个有独立时钟基准的节目 从而总体比特率是可变的传输流存在着一些困难参见传输流可以以任何方式构造 只要能生成一个有效的流 一个包含一个或多个节目的传输流可以从基本编码数据流节目流或其他可

8、能包含一个或多个节目的传输流构造得出传输流是按照在最小开销的情况下能对传输流执行某些操作的原则而设计的 这些操作包括从传输流的一个节目中获得编码数据解码并展现如图 所示从传输流的一个节目中抽取传输流分组并生成一个仅包含该节目的不同的传输流作为输出 如图 所示从一个或多个传输流中抽取一个或多个节目的传输流分组并生成一个不同的传输流无图示从传输流中抽取一个节目内容并生成包含该节目的一个节目流 如图 所示把一个节目流转化为传输流 并在有损环境中传输 然后再重建一个有效的 在某些情况下完全相同的节目流图 和图 描述了以一个传输流作为输入的分流及解码系统原型 图 说明了第一种情况即一个传输流被直接分离和

9、解码 传输流构造分为两层 系统层和压缩层传输流解码器的输入流在压缩层外有一个系统层包围着 音频解码器及视频解码器的输入流只含一个压缩层接收传输流的解码器原型的操作既适用于整个传输流 复合流操作 也适用于单个基本流 特定流操作 传输流系统层被分为两个子层一个用于复合流操作 传输流分组层 另一个用于特定流操作 分组层图 也给出了一个包括视频和音频的传输流解码器原型以说明解码器的功能 其结构并不是唯一的 有些系统解码器功能例如解码器时间控制 可能被相等地分配到基本流解码器或通道特定解码器中但该图有助于讨论 类似的通道特定解码器测出的错误也可以用多种途径通知独立的音频和视频解码器 这些通信途径并未显示

10、在图中该解码器原型的设计并不意味着对传输流解码器的设计作出任何标准化的要求 实际上非音频 视频数据也是允许的 但并未在图 中画出图 传输分流和解码原型示例图 说明了另一种情况即一个包含多个节目的传输流被转变为一个只含单个节目的传输流 这种情况下的再复合操作可能需要纠正 值以补偿比特流中 位置的变化图 传输多路复合原型示例图 说明了一个多节目传输流先被分离再被转变为节目流的情况图 传输流到节目流转换原型示例图 和图 指出 不同类型和构造的传输流之间的转换是可能的和合理的 在传输流和节目流的语法中都定义了一些特定字段以方便上述转换过程 但并不要求分流器或解码器的具体实现要包含以上所有功能节目流节目

11、流作为一种流是针对在那些出错率很低且系统编码的处理过程作为主要考虑因素的环境中进行一个节目的传送和存储而定义的 该节目包含编码数据和其他数据节目流的速率可以是恒定也可以是可变的在任何情况下 所包含的基本流的速率也是恒定或可变的 在每一种情况下流的语法或语义限制是相同的 节目流速率是由系统时钟参考 字段与字段的值和位置所定义的图 描述了一个音频 视频节目流解码系统原型 其结构并不是唯一的 包括解码器时间控制在内的系统解码器功能可能被相等地分配到基本流解码器或通道特定解码器中 但该图有助于讨论 该解码器原型的设计并不意味着对节目流解码器的设计作出任何标准化的要求 实际上非音频视频数据也是允许的但在

12、图中并未画出图 节目流解码器原型图 所示的节目流解码器原型是由系统视频和音频解码器三部分组成的 它们分别符合本系列标准的第 部分 第 部分和第 部分 在该解码器中 单路或多路音频 视频流的复合编码表示假定以某种特定通道格式在特定通道中存储或传输 特定通道格式不由本标准决定特定通道解码也不是本解码器原型的一部分原型解码器接受节目流作为输入并依靠节目流解码器从流中提取信息节目流解码器分离复合流由此产生的基本流作为音频和视频解码器的输入 音频和视频解码器的输出是已解码的音频和视频信号 节目流解码器音频和视频解码器以及通道特定解码器之间的定时信息流应包含在设计中 但并未在图中画出 利用定时信息音频和视

13、频解码器相互之间以及与通道之间可以实现同步节目流构造分为两层 系统层和压缩层 节目流解码器的输入流在压缩层外有一个系统层包围着音频解码器及视频解码器的输入流只含一个压缩层解码器原型的操作既适用于整个节目流 复合流操作 也适用于单个基本流 特定流操作 节目流系统层被分为两个子层一个用于复合流操作 包层 另一个用于特定流操作 分组层传输流与节目流的转换利用 分组传输流与节目流之间的转换是可能的也是合理的 这是由包含在本标准的标准要求 和 中的传输流和节目流规范得出的 在某些限制下 分组可能直接从一个复合比特流的有效数据映射到另一个复合比特流的有效数据 如果在所有 分组中都有的话就可能标识出 分组的

14、正确次序以帮助实现这一功能在这两种流的表和标题中 均可得到转换所必需的其他特定信息 例如基本流之间的关系 这些数据 如果有的话 在任何流中转换前后都应是正确的分组的基本流正如 中的语法定义所指出的那样传输流和节目流是从 分组中逻辑地建立的分组被用于传输流与节目流之间的转换 在有些场合进行这种转换时无需变动 分组 分组的尺寸可能比传输流分组的尺寸大得多具有一个流 的一个基本流的一系列连续 分组可用于构造 流 当 分组用于形成流时应当在 中所定义的限制下 带有基本流时钟参考 字段和基本流速率字段 流数据应是来自基本流且保持原次序的连续字节 流中不包含一些包含在节目流和传输流中的必须的系统信息 例如

15、 包含在包标题系统标题 节目流映像 节目流目录节目映射表中的信息以及在传输流分组语法中的元素流是一个在本标准的实现中可能有用的逻辑结构但它并不被定义为一个用于相互交换和交互操作的流应用程序在需要仅含一个基本流的流时可使用仅含一个基本流的节目流或传输流 这些流包含了所有必须的系统信息 每一个都包含一个基本流的多个多目流或传输流可以在公共时间基准下构造起来 以传送一个带视频和音频的完整节目定时模型系统 视频和音频都有一个定时模型 在该模型中 从编码器的信号输入到解码器的信号输出之间的端到端延迟是恒定的 这一延迟是编码编码器缓冲区多路复合传送或存储分流 解码器缓冲区以及展现延迟的总和 作为该定时模型

16、的一部分所有视频画面和音频采样仅展现一次 除非经过特殊编码 且 画面间隔和音频采样速率在编码器和解码器中一致 系统流编码包括了定时信息以用于实现端到端延迟恒定的系统 实现不严格遵守该模型的解码器也是可能的 但此时的解码器必须负责以一种可接受方式完成以上要求 定时包含在本标准的标准规范中 所有有效的比特流 无论它们是如何被创建的 都必须遵循这一规范所有定时是根据称为系统时钟的公共时钟定义的 在节目流中 该时钟与视频或音频采样时钟之间可以有确定的比值 也可以有一个与比值略有偏差的工作频率 但仍提供精确的端到端定时和时钟补偿在传输流中系统时钟被限制为在任何时刻均与音频和视频采样时钟保持确定比值这一限

17、制是为了简化解码器中的采样速率恢复条件存取系统数据流的定义支持用于对编码在节目流和传输流中节目条件存取的加密和加扰 这里并未指定条件存取机制 由于设计了流定义 因此实际的条件存取系统的实现是合理的 并且有一些特定语法元素对此系统提供特定支持复合流操作复合流操作包括通道数据读出的协调 时钟的调整以及缓冲区管理 这些任务是紧密相关的 若通道数据传送速率是可控的则可调节数据传送以使解码缓冲区不发生上溢或下溢但是若数据速率不可控 则基本流解码器就必须使它们的定时服从于从通道中接收的数据以避免上溢或下溢节目流由包组成包标题有助于以上任务的完成包标题指定了从通道中送来的每一字节进入节目流解码器的预定时间

18、这个预定到达时刻表作为时钟校正和缓冲区管理的参考 虽然解码器不一定要严格遵守该时刻表但必须对有关偏差作出补偿类似地 传输流由传输流分组构成 分组标题中包含有信息以指定从通道中送来的每一字节进入传输流解码器的预定时间 该时刻表提供了与上述节目流中完全相同的功能另一个复合流操作是解码器能确定解码传输流或节目流时所需的资源 每个节目流的第一个包均包含一些参数来协助解码器完成此功能 例如流的最大数据速率以及同步视频通道的最大数目 传输流也包含类似的全局适用的信息每个传输流和节目流都包含一些信息 以标识组成一个节目的各基本流的相关特征以及基本流之间的相互关系 这些信息可能包括音频通道中的语言以及在实现多

19、层视频编码时各视频流之间的关系单个流操作 分组层基本的特定流操作为分流多个基本流的同步回放分流编码时 节目流由复合基本流组成 传输流则由复合基本流 节目流或其他传输流的内容组成 基本流除音频和视频流外还可能包括专用流 备用流及填料流 流被临时性地分割为分组 分组被串行化 一个 分组包含仅来自一个基本流的编码字节节目流中的分组长度可以是固定的或可变的但必须遵守 和 中规定的约束 传输流分组长度是 字节 分组的长度可以是固定的或可变的 在大多数的应用中相对较长解码时需要对复合的节目或传输流分流以重建基本流 这可以借助节目流分组标题中的和传输流分组标题中的分组标识码来完成同步多个基本流之间的同步通过

20、节目流或传输流中的展现时间戳 来完成 时间戳通常以为单位但系统时钟参考 节目时钟参考 和可选的基本流时钟参考 将其扩展为个基本流解码的同步是通过使流的解码被调整至一个公共主控时钟基准 而不是通过使流的解码彼此适应 主控时钟基准可以是 个解码器时钟中的一个 也可以是数据源时钟或某个外部时钟传输流可能包含多个节目其中的每一节目都可能有自己的时钟基准 一个传输流中不同节目的时钟基准可能不同因为 用于单个基本流解码 所以它同时存在于传输流和节目流的 分组层中 编码器在捕获时记录时间戳 当时间戳连同有关编码数据被传输到解码器 而解码器再利用它们来安排展现时间时 就能够实现端到端的同步单通道解码系统的同步

21、通过使用节目流中的 及传输流中的 来实现 和 是编码比特流自身时序的时间戳它们来自于同一个时间基准 该时间基准在同一个节目中也用作音频和视频的 值 因为每一节目可能有自己的时间基准所以一个包含多个节目的传输流中的每个节目各自有独立的 字段 在某些场合下节目共享 字段也是可能的 确定一个节目与哪个 相关联的方法可以参见 节目特定信息 一个节目有且仅有一个相关的 时间基准与压缩层的关系分组层在某种意义上是与压缩层各自独立的但也不完全如此 正如本系列标准的第 部分和第 部分所定义的那样 分组的有效负载数据不要求开始于一个压缩层起始码 在这一意义上它是独立的 例如视频起始码可能出现于 分组的有效负载数

22、据中的任何部位而且可能被分组标题分离 但是 编码于 分组标题中的时间戳适用于压缩层结构 即展现单元 中的展现时间此外当基本流数据符合 或 时 应遵照本标准进行字节对齐系统参考解码器本标准使用了系统目标解码器 对传输流参见 而言称为 传输流系统目标解码器 对节目流 参见 而言称为 节目流系统目标解码器 如此提供一种对定时和缓冲区之间关系的形式化表示 由于 按 的各个字段如缓冲区大小 加以参数化所以每一基本流都有自己的 参数 编码器应产生符合适当的 约束的比特流 物理解码器可以假定一个流能在其 上正确播放 但必须对它与 在设计上的不同之处作出补偿应用本标准所定义的流意在能适用于尽可能多样化的应用

23、应用程序设计者应选择最合适的流现代数据通信网络也许能够支持本系列标准的视频和音频 一种实时传输协议也是必需的 节目流可能适合在这种网络上传输节目流适用于 上的多媒体应用 对节目流的软件处理也是允许的传输流可能更适用于容易出错的环境 例如 在远程网络和广播系统上用于分布式压缩比特流许多应用要求在不同的数字存储媒体 上存储和读出本标准比特流 在附录 及的第 部分给出了一个数字存储媒体命令与控制 协议以便于对这些媒体加以控制中华人民共和国国家标准信息技术运动图像及其伴音信息的通用编码第部分 系统国家质量技术监督局 批准 实施概述范围本标准给出系统层编码规范 它主要被设计用于支持把本系列标准的第 部分

24、和第 部分定义的视频和音频编码方式组合起来 系统层支持以下五个基本功能解码时多条压缩流的同步多条压缩流交织为一个单一流为启动解码而对缓冲区进行初始化连续的缓冲区管理时间标识本标准多路复合比特流可以是传输流或节目流 两种流均由 分组或包含其他必要信息的分组构成 两种流类型均支持来自具有一个共同时间基准节目的视频和音频压缩流的复合 传输流还支持来自具有独立时间基准的多个节目的视频和音频压缩流的复合对于几乎不发生差错的环境而言 节目流通常更为合适并且支持节目信息的软件处理 传输流更适合于可能出错的环境本标准多路复合比特流不论是传输流还是节目流 其结构分两层 最外层是系统层 最内层是压缩层 系统层提供

25、了使用系统中一个或多个压缩数据流所必需的功能 本系列规范的音频和视频部分定义了音频和视频数据的压缩编码层 其他类型数据编码的定义不包括在本标准中 但如果它们符合中定义的限制 则将被系统层支持引用标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文 本标准出版时所示版本均为有效 所有标准都会被修订 使用本标准的各方应探讨使用下列标准最新版本的可能性信息处理 八位单字节编码图形字符集第部分拉丁字母信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分系统信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频信息技术 具有 数据传输率的数字存储媒体运动图像及

26、其伴音的编码第部分音频数字音频系统语种名称代码第部分 代码信息技术 多媒体和超媒体信息的编码第部分 对象表示基本表示法信息技术运动图像及其伴音信息的通用编码第部分视频信息技术运动图像及其伴音信息的通用编码第部分音频建议 用于演播室的数字电视的编码参数建议 电视系统建议 音频信号的数字录音报告 范围内车载 便携和固定接收器的卫星声音广播建议 用于声音节目的预加重电路实现 离散余弦逆变换的规范技术原理定义下列定义适用于本系列标准 若只适用于某一部分 则用方括号注明存取单元 系统一个展现单元的编码表示 对音频而言一个存取单元就是一个音频帧的编码表示对视频而言在视频压缩的情况下 一个存取单元包括一幅画

27、面中所有的编码数据及跟随其后的任何填充 直至 但不包括下一个存取单元的开始 如果画面不是由 或起始 则存取单元由画面起始码开始 如果画面由 及或起始 则画面由上述起始码的第一个中的第一个字节开始 如果画面是比特流中之前的最后一幅画面 则该编码画面中的最后一个字节与 包括之间的所有字节均属于该存取单元比特率压缩的比特流从通道传输到解码器输入端的速率字节对齐如果某一位在编码比特流中的位置从流的第一位算起是 的倍数则该位是字节对齐的通道存储或传输本标准比特流的数字媒体编码表示数据元素用其编码格式表示压缩减少用于表示某个数据项的比特数目固定比特率压缩比特流从开始到结束比特率保持不变的操作受限系统参数流

28、 系统遵循本标准中 所定义的约束条件的一个节目流循环冗余码校验用于检验数据的正确性数据元素编码之前和解码之后所表示的一个数据项解码流压缩比特流的解码后重构解码器解码过程的具体实现者解码 过程在本标准中定义的读入一个输入的编码比特流并产生解码的画面或音频信号样本的过程解码时间戳 系统分组标题中的一个字段用来指出一个存取单元在系统目标解码器中被解码的时刻数字存储媒体数字存储或传输的设备或系统数字存储媒体的命令和控制权限控制信息一些专用的条件存取信息以指定控制语句和其他可能的 通常是流所特有的加扰及 或控制参数权限管理信息一些专用的条件存取信息以指定权限等级或特定解码器的服务 它们可以被提供给一个或

29、一组解码器编辑对一个或多个压缩比特流进行操作以生成一个新的压缩比特流的过程 编辑后的比特流必须与编辑前满足相同的要求基本流 系统泛指 分组中编码视频流 编码音频流或其他编码比特流中的某一个 一个基本流以有且仅有一个 的 分组序列来传送基本流时钟参考 系统流中的时间戳 流解码器从中获取定时编码器编码过程的具体实现者编码 过程读入输入画面或音频样本流并产生符合本标准的编码比特流的过程 该过程并未在本标准中规定熵编码为减少冗余而对信号的数字表示进行的可变长无失真的一种编码方法事件一个事件定义为有共同的时间基准 相关的起始时间和相关的结束时间的基本流的集合快速正向回放 视频用快于实际速度并按显示顺序显

30、示画面序列或序列一部分的过程禁止本标准中定义编码比特流时 术语 禁止是指绝不能使用的专用数值复合 流 系统由零个或多个基本流按照符合本标准的方式组成的位流层 视频和系统本标准的第 第 部分中定义的视频和系统规范中数据层次结构中的一个层次包 系统包由一个包标题及随后的零个或多个分组所构成它是本标准中 所描述的系统编码语法中的一个层次分组数据 系统一个分组内所含的连续数据字节 它来自某个基本流分组标识符 系统在本标准 中描述的用来标识一个或多个节目传输流中的一个节目的基本流的唯一整数值填料 音频一种调节音频帧平均时间长度的方法 对应于 采样的持续时间有条件地在音频帧中加进狭道有效负载数据在分组中跟

31、在标题字节之后的那些字节 例如 一些传输流分组的有效负载数据包括一个 分组标题 分组数据字节或指针域以及 段或专用数据 但一个 分组的有效负载数据仅包含分组数据字节 传输流分组标题和适应字段不是有效负载数据系统已分组基本流的缩写分组 系统传输基本流数据的数据结构 一个 分组包含一个 分组标题 其后跟有一些来自基本数据流的连续字节 它是本标准中 所描述的系统编码语法的一层分组标题 系统一个 分组中的前导字段 当一个流不是填料流时 它一直到但并不包括 分组数据字节字段 在填料流的情况下 分组标题被类似地定义为 分组的前导字段 直到但并不包括填料字节字段流 系统流包含一些 分组 这些分组的有效负载中

32、包含来自于单个基本流的数据 且分组具有相同的流标识 特定的语义约束可以适用 参见本标准中的展现时间戳 系统在 分组标题中可能包含的一个字段 用来指出一个展现单元在系统目标解码器中被展现的时刻展现单元 系统已解码的一个音频存取单元或一幅画面节目 系统一个节目是节目元素的集合 节目元素可能是基本流 它不需要有任何定义的时间基准 那些有时间基准的则为共同时间基准以用于同步展现节目时钟参考 系统流中的时间戳 流解码器从中获取定时节目元素 系统用来描述可能包含在一个节目中的基本流或其他数据流的一个流的通用术语节目特定信息 系统包括用来分离传输流和成功地再生节目所必需的标准化数据 在本标准的 中对其进行了

33、描述 专门定义的 数据的一个例子是非强制性的网络信息表随机存取从任意点开始读入编码比特流并解码的过程保留值术语保留值用来在定义编码比特流时表示某数值可以用于 将来的扩充 除非在本标准中有特别定义否则所有的备用值应被设为加扰 系统对视频音频或编码数据流进行改动以防止未经授权地接收明文信息 这种改动是在条件存取系统控制下的一种特定的过程源流在压缩编码之前的一个非复合的样本流拼接 系统系统层对两个不同的基本流进行的连接操作 所产生的系统流完全符合本标准 拼接可能会引起时间基准连续性计数器 和解码的不连续起始码 系统嵌入在编码比特流中的 位码 它有若干用途 包括编码语法的某些层次的标识 起始码包含了一

34、个 位的前缀 和一个 位的流标识 参见本标准中的表输入缓冲区 系统系统目标解码器输入端的一个先进先出缓冲区用来存储解码之前的基本流的压缩数据静态画面已编码的静态画面由包含唯一一个已帧内编码的视频序列组成 该画面有一个相关的 若该画面有后续画面的话则其后续画面的展现时间将比该静态画面晚至少两个画面周期系统标题 系统系统标题是在本标准的 中定义的一个数据结构 它携带了概述本标准节目流系统特性的信息系统时钟参考 系统节目流中的时间戳 解码器从它获取定时系统目标解码器 系统用来描述本标准多路复合流语义的一个假想的解码过程参考模型时间戳 系统用来指示事件发生时刻的一个术语 例如一个字节的到达或一个展现单

35、元的展现传输流分组标题 系统传输流分组中的前导字段 直到且包括连续计数器字段可变比特率传输流或节目流的一种属性到达解码器输入端的字节速率随时间而变化符号和缩略语用于描述本标准的数学运算符类似于 程序语言中使用的运算符 但本标准特别定义了具有截断和舍入功能的整除运算 按位运算符的定义则假定采用整数的二进制补码表示 标号和记数循环通常由零开始算术运算符加法减法 双目运算符或取反单目运算符增量减量或 乘法乘幂结果向零截断的整除 例如 和 取整为 和 为结果舍入为最近整数的整除 除非特别指明 否则 向上舍入 例如 舍入为舍入为是结果趋向 的带截断的整除取模运算符 仅适用于正整数最近的整数运算符 返回与

36、实数最接近的整数 对 进行向上舍入正弦余弦指数平方根以 为底的对数以 为底的对数逻辑运算符逻辑加逻辑乘逻辑非关系运算符大于大于或等于小于小于或等于等于不等于参数表中的最大值参数表中的最小值按位运算符与或带符号扩展的右移补充零的左移赋值赋值运算符助记符下列助记符用于描述编码比特流中不同的数据类型比特串即二进位串左位在先 其中 左是指本标准中书写比特串的顺序 比特串书写成单引号括住的 和 的串如 比特串中的空格有助于阅读 但无实际意义通道音频层 中 个子频带采样的颗粒 音频层 中 个子频带采样的颗粒比特流的主数据部分包含比例因子 编码数据以及其他辅助信息某一帧 在比特流中的开始位置 它等于前面一帧

37、 的结束位置加上一个二进位 可从前一帧的 值计算出来用作比例因子的 的二进制位数目余数多项式的系数最高项排列在先子频带比例因子选择信息使用窗口切换点所依据的比例因子频带数 长块比例因子频带使用窗口切换点所依据的比例因子频带数 短块比例因子频带二的补码整数 符号位优先无符号整数 高位在先可变长代码左边的二进制位在先这里 左边是指书写可变长代码的顺序在 时实际时间狭道的数目多字节组成的字其字节顺序是最高字节在先常量比特流语法的描述方式解码器获得的比特流的描述见 和 比特流中的每个数据项以粗体表示 由它的名称二进制长度类型助记符和传输顺序描述在比特流中由一个已解码的数据元素所引起的动作取决于该数据元

38、素本身的值和先前已解码的数据元素的值 在包含对语法的语义描述的章节中描述了这些数据元素的解码操作以及在解码过程中所使用的状态变量的定义 以下结构用于表达数据元素何时出现以及何时为正常类型的条件注意本语法使用 语言的约定 变量或表达式为非零值时等价于条件为真若条件为真则一组数据元素便紧接着在数据流中出现直到条件为假数据元素至少出现一次 如此重复直到条件为假若条件为真则第一组数据元素紧接着出现在数据流中若条件为假则第二组数据元素紧接着出现在数据流中数据元素组出现 次 数据元素组中的条件结构取决于循环控制变量 的值 第一次出现时设置为以后每出现一次就增加注意数据元素组可以包含有嵌套条件结构 为简洁起

39、见 若仅有一个数据元素时 可以省略数据数组 数据元素数量取决于上下文数据数组中的第 个元素二维数据数组中的第 个元素三维数据数组中的第 个元素数据元素中从位 到位 的闭区间中的所有位尽管使用了过程式的术语来描述语法但并不能认为图 或图 中实现的解码过程一定会令人满意 特别地它们定义了一个正确的无差错的输入比特流 为了能够正确地开始解码 实际的解码器必须具有寻找起始码和同步字节传输流的方法 并且在解码时能够识别出错误 进行删除或插入等处理 识别这些事情的方法及所采取的措施都未标准化传输流比特流要求传输流编码结构与参数本标准传输流编码层允许一个或多个节目组合在一个流中 来自每个基本流的数据与允许节

40、目中基本流同步展现的信息一起多路复合一个传输流包括一或多个节目 视频与音频基本流由存取单元组成基本流数据由 分组携带 一个 分组包括一个分组标题后跟分组数据 分组被插入到传输流分组中每一 分组标题的首字节位于一个传输流分组的第一个可用的有效负载位置分组标题以一个 位起始码开始 该起始码也标识该分组数据所属的流或流类型 分组标题可以包含解码和展现时间戳 和 分组标题也包含其他可选字段 分组数据字段包含来自一个基本流的可变数目的连续字节传输流分组以一个 字节前缀开始 内含一个 位的分组标识 定义参见表 通过节目特定信息 表指定包含在传输流分组中的数据内容 具有相同 值的传输流分组携带仅来自同一个基

41、本流的数据表携带于传输流中共有以下 个节目相关表节目映射表条件存取表网络信息表这些表包含了对于分流和展现节目所必要的也是足够的信息 表 所示的节目映射表规定了在其他信息中哪一些 以及哪一些基本流与组成每一个节目相关 该表还指出了携带每一节目的传输流分组的 如果使用加扰 则将会出现条件存取表 网络信息表是可选的 它的内容未在本标准中规定传输流分组可以为空 空的分组用于填充传输流它们可能在再复合处理中被插入或删除 因此并不能假定空的分组会作为有效负载数据而被传送到解码器本标准并未规定可能被用作条件存取系统的一部分的编码数据 但为节目服务供应商提供了一些机制以用于在解码过程中传输和标识这些数据 以及

42、正确地引用本规范所规定的数据 这种支持是通过传输流分组结构和条件存取表参见 的表 来提供的传输流系统目标解码器中规定的传输流语义及 规定的语义限制需要精确地定义字节的到达 解码事件以及它们发生的时间 本标准使用一个称为传输流系统目标解码器 的假想解码器来给出这些所需定义 有关 的进一步解释可参见附录是一个用于精确定义这些术语及在创建和校验传输流时模型化解码过程的一个概念化模型 仅为此目的而定义 在 中有三种解码器 视频音频和系统 图 给出了一个例子的结构和所描述的定时都不排除各种具有不同结构或定时机构的解码器对传输流进行不间断同步回放图 传输流系统目标解码器框图以下记号用于描述传输流目标解码器

43、 其中一部分已在前面图 中说明传输流中字节的索引 第一个字节索引为基本流中存取单元的索引基本流中展现单元的索引基本流的索引传输流中传输流分组的索引以秒为单位指出传输流中第 个字节进入系统目标解码器的时间 是一个任意常数编码在 字段中的时间 以 系统时钟周期为单位来度量 其中 是节目时钟参考基准字段的最后一个字节的索引基本流 中第 个存取单元它按照解码顺序加以索引基本流 中第 个存取单元在系统目标解码器中的解码时间 以秒为单位基本流 中第 个展现单元它是解码 的结果并按展现顺序加以索引基本流 中第 个存取单元在系统目标解码器中的展现时间 以秒为单位以秒为单位的时间系统目标解码器对基本流 在 时刻

44、的输入缓冲区占用度 以字节为单位基本流 的主缓冲区仅用于音频基本流缓冲区 的大小 以字节为单位系统目标解码器的主缓冲区用于存放正在解码过程中的节目的系统信息缓冲区 的大小以字节为单位基本流 的复合缓冲区 仅用于视频基本流缓冲区 的大小以字节为单位基本流 的基本流缓冲区仅用于视频基本流缓冲区 的大小 以字节为单位正在解码过程中的节目的系统信息的传输缓冲区缓冲区 的大小以字节为单位基本流 的传输缓冲区缓冲区 的大小以字节为单位节目流 中系统信息的解码器基本流 的解码器视频基本流 的重排序缓冲区从 中移走数据的速率从 中移走数据的速率在使用泄漏方式时 从 中移走 分组有效负载数据的速率在使用 方式时

45、从 中移走 分组有效负载数据的速率从 中移走数据的速率编码在序列标题中的视频基本流速率系统时钟频率中所引用的定时信息携带于本规范定义的一些数据字段中 参见 和 在字段中该信息作为节目的系统时钟采样值被编码 字段携带于传输流分组的适应字段中 该传输流分组具有一个和传输流节目映射段中定义的 相等的 值实际解码器可能从这些值及它们各自的到达时间重建该时钟 以下给出了作用于节目的系统时钟频率的最小限制正如解码器收到的 字段值所表示的那样系统时钟频率值以 为单位且满足如下约束随时间的变化率注 编码数据源应有更严格的误差以便适应用户的录制和回放装置的操作一个节目的系统时钟频率可能比要求的更精确 这一改进的

46、精确性可经 定义的系统时钟描述符传递给解码器本规范定义的比特率按系统时钟频率测定 例如 比特秒的比特率意味着每 个时钟周期传输 字节数据在本规范中术语 系统时钟频率 多次用于表示符合这些要求的时钟频率 为了便于表示和理解在出现 的公式中时间精确到 系统时钟频率 秒的整数倍 这是因为 定时信息被编码为 位的系统时钟频率的 另加 位的余数 对 及 它们被编码为 位的系统时钟频率的传输流系统目标解码器的输入传输流系统目标解码器的输入是一个传输流 一个传输流可能包含带有独立时间基准的多个节目但 一次只解码一个节目 在 模型中所有定时均表示该节目的时间基准来自传输流的数据以分段恒定速率进入 第 个字节进

47、入 的时间 通过对输入流中的节目时钟参考字段 进行解码以及对该节目中到后续 之间的整个传输流字节进行计数来定义 其中 编码在待解码节目的传输流分组适应字段中 字段分两部分编码 一部分以系统时钟频率的 为单位称为节目时钟参考基准 参见式 另一部分以系统时钟频率为单位称为节目时钟参考扩展 参见式其中的编码值分别由 式 和 式 计算 字段中编码值指出了时间 其中 是包含节目时钟参考基准字段最后一位的字节的索引特别地式中所有其余字节的输入到达时间 如下式 所示 是由 和数据到达传输率计算而来的这里的传输率指在传输流中包含同一节目的两个连续的 字段最后一位的字节之间的字节数除以编码在这两个 字段中的时间

48、值的差式中 传输流中满足 的任何字节的索引包含可用于当前被解码节目的最近的 字段的最后一位的字节索引是以系统时钟为单位的编码在节目时钟参考基准及扩展字段中的时间传输率如下式所示式中包含可用于当前被解码节目的紧随着的节目时钟参考基准字段的最后一位的字节索引注当传输分组适应字段中的 指示出时间基准不连续时式 和 中对输入 的字节的到达时间的定义在旧时间基准的最后一个 和新时间基准的第一个 之间并不适用 在这种情况下 字节到达时间的确定应对式 进行修正所用的传输率是旧时间基准的最后一个和倒数第二个 之间的传输率对 值规定了一个容限 定义为收到 的所允许的最大偏差 这一偏差可能是由于 值的不精确或再复

49、合时对 的修正引起的 它不包括因网络抖动或其他原因造成的到达时间误差容限为在 模型中 术语 不精确 表现为使用式 计算出的传输率不精确具有多节目和可变速率的传输流传输流可能含有带独立时间基准的多个节目 每个独立节目需要有分离的 集分别由各自的值来标识因此 不能共存 对于进入 的节目而言 传输流速率是分段恒定的所以如果一个传输流速率是可变的它只能在当前所考虑的节目的 变化 因为 也就是传输流中速率改变点不是共存的 传输流进入 的速率将因不同节目进入 而不同 因此 在一个传输流包含多个具有不同时间基准的节目且传输流速率是可变的情况下不可能为整个传输流构造出一个一致的 传输方案但构造一个带有多个可变

50、速率节目的恒定比特率的传输流却是简单的缓冲由 标识的含有来自基本流 的数据的完整的传输流分组被传送到流 的传输缓冲区 中这包括重复的传输流分组和无有效负载的分组 第 个字节从 输入到 是瞬时的 因此 第 个字节在 时刻进入大小为 的流 的缓冲区所有进入缓冲区 的字节都按以下规定的速率 被移出 作为 分组的一部分或其内容的字节被传送到音频基本流和系统数据的主缓冲区以及视频基本流的多路复合缓冲区 其余字节则不会传送到缓冲区中 但可能会用于控制系统 重复的传输流分组不会被传送到 或缓冲区 按以下规则被清空当 中无数据 时或对于视频其中是根据档次 和等级 来规定的 参见 中的表 该表规定了每一基本视频

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1