GB T 17191.1-1997 信息技术 具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码 第1部分;系统.pdf

上传人:confusegate185 文档编号:162670 上传时间:2019-07-15 格式:PDF 页数:53 大小:4MB
下载 相关 举报
GB T 17191.1-1997 信息技术 具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码 第1部分;系统.pdf_第1页
第1页 / 共53页
GB T 17191.1-1997 信息技术 具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码 第1部分;系统.pdf_第2页
第2页 / 共53页
GB T 17191.1-1997 信息技术 具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码 第1部分;系统.pdf_第3页
第3页 / 共53页
GB T 17191.1-1997 信息技术 具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码 第1部分;系统.pdf_第4页
第4页 / 共53页
GB T 17191.1-1997 信息技术 具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码 第1部分;系统.pdf_第5页
第5页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分系统发布实施国家技术监督局发布前言本标准等同采用国际标准 信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 第 部分 系统在 信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 总标题下 目前包括以下 个部分第 部分 系统第 部分 视频第 部分 音频第 部分 一致性测试本标准的附录 附录 是提示的附录本标准由中华人民共和国电子工业部提出本标准由电子工业部标准化研究所归口本标准起草单位 清华大学本标准主要起草人 钟玉琢 智西湖前言国际标准化组织 和 国际电工委员会 是世界性的标准化专门

2、机构 国家成员体 它们都是 或 的成员国 通过国际组织建立的各个技术委员会参与制定针对特定技术范围的国际标准 和 的各技术委员会在共同感兴趣的领域内进行合作 与 和 有联系的其他官方和非官方国际组织也可参与国际标准的制定工作对于信息技术 和 建立了一个联合技术委员会 即 由联合技术委员会提出的国际标准草案需分发给国家成员体进行表决 发布一项国际标准 至少需要 的参与表决的国家成员体投标赞成国际标准 是由 信息技术 联合技术委员会制定的在 信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 总标题下 目前包括以下 个部分第 部分 系统第 部分 视频第 部分 音频第 部分 一致性测试附

3、录 附录 仅提供参考信息引言注 对运动图像编码标准 中系统层感兴趣的读者 在阅读正文第 章和第 章之前 应该先阅读引言和附录 因为本标准的标准内容和提示信息都涉及了系统目标解码器概念 这些提示信息对查阅特别是 是有用的 描述了系统目标解码器系统规范提出了把一个或多个符合国家标准的视频和音频数据流与时间信息结合起来形成单一数据流问题 一旦形成了单一数据流 数据将适合于数字式存储和传输 系统规范中规定的语法和语义规则使同步播放成为可能 这种播放在多种条件下数据流的恢复和接受都不会引起解码缓冲区的上溢和下溢 语法和语义规则以不同形式载于系统规范中 语法规则仅适用于系统层编码 并不能扩展到视频和音频压

4、缩层编码 而语义规则完全适用于混合数据流系统规范并没有规定编码器和解码器的体系结构和具体实现 而位流的性质把需要的功能和特性施加于编码器和解码器 例如 编码器必须满足最小的时钟允许误差 不仅如此 还有其他方面的要求在设计和实现一个编码器和解码器的过程中 要考虑留有一定的自由度为了说明 解码器的功能 图 描绘出音频 视频解码系统原型样机的框图 这一系统结构并不是唯一的 系统解码功能 包括时序控制 可以分成基本的数据流解码和媒体规定的解码 但是解码器原理样机图对讨论问题是非常有用的 该图并未对 解码器的设计作出要求 实际上 非音频 视频数据也是允许的 但这一点并未在图中表示出来图 解码器样机原理图

5、图 所示原型 解码器由系统 视频和音频三部分组成 它们分别符合本系列标准的第部分 在这个解码器中 一路或多路声音或图像数据流的复合编码表示 假定以某种特定媒体的格式存储在 数字存储媒体 或网络中 存储的格式在本标准中未做规定 同样 原型解码器也未规定特定媒体的解码部分这个原型解码器把 数据流作为输入 利用系统解码器可以从数据流中把时间信息分离出来 系统解码器把数据流分成多路 生成的每一路基本数据流可作为音频和视频解码器的输入 视频 音频解码器的输出形成了解码后的视频和音频信号 在设计中包含而在原型样机原理图中并没有表示出来的 是系统解码器 视频和音频解码器中以及媒体特定解码器中的时间信息流 视

6、频和音频解码器中的视频和音频信息以及同 之间的同步问题就使用这些时间信息解决数据流被分成两层 系统层和压缩层 输入到系统解码器的数据流既有系统层又包含了压缩层 输入到视频和音频解码器的数据流仅有压缩层系统解码器的操作既适应于 多路流 多路操作 又适应单独的基本数据流 特定的数据流操作 系统层可分成两个子层 一个用于多路操作 包层 另一个用于特殊数据流操作 分组层多路操作 包层多路操作包括 数据恢复的调整 时钟的调整以及缓冲区的管理 这些任务是密切相关的 如果 传送数据率是可控的 那么可以把 传送数据率调到使解码器的缓冲区既不上溢也不下溢 但是如果 的速率不能控制时 那么基本数据流解码器必须能够

7、跟踪 的时序以避免上溢或下溢多路数据流由一系列包组成 这些包的头部即可解决上述任务 每个包的头都规定了每个字节从 输入到系统解码器的预期时间 这个目标达到时间表可以做为时钟调整和缓冲区管理的参考 解码器无须完全依照达到时间表 但是必须根据它校正偏差附加的多路操作是解码器为了解码 多路流形成所需资源的能力 每个多路流的第一个包将传送参数帮助解码器解决这一任务 例如 它包括数据流的最大数据率和同步视频通道的最多个数单一数据流操作 分组层特定数据流最基本的操作是 多路数据的分离 多个基本数据流的同步重放 下面将阐述这些问题多路数据的分离在编码过程中 多路流是由多路基本数据流构成的 基本数据流不仅包括

8、音频视频数据流 还包括专用的 保留的或填充的数据流 这些数据流暂时分成分组 这些分组是串行的 这些分组都由一个且仅有一个基本数据流编码字节组成根据 以及 和 中规定的约束条件 允许固定和可变分组的长度在解码过程中 多路流重新构成基本数据流 因此需要进行多路数据的分离 分组头中 码使多路数据的分离成为可能同步在 多路流中 多个数据流的同步用演示时间戳来实现 时间戳的基本频率是在 个数据流重放过程中 调整所有的重放数据流同步于一个基本的时间基准 而不是调整重放的一个数据流去匹配其他的数据流 这个基本的时间基准可以是 个解码器时钟之一 的时钟 通道时钟或者是外部时钟由于演示时间戳依赖于单一基本数据流

9、的解码过程 因此它们是在分组层中 在捕获时编码器记录时间戳 时间戳与相应的编码数据一起传送到解码器时 以及当解码器利用这些时间安排演示时 头尾相连的同步得以实现在多路数据流中用 时基的时间戳也能够实现同步与压缩层的关系在某种意义上讲分组层与压缩层是独立的 但也不完全如此 如果分组层不需要从压缩层起始码开始 从这个意义上讲 正如 音频 和 视频 中定义的那样 它是独立的例如 一个视频分组可在视频数据流任一处开始 但是 位于分组头中的时间戳编码时用压缩层结构中的演示时间表示 即演示单位系统参考解码器本标准使用了 系统目标解码器 给出了时序和缓冲关系的表达式 由于 可以根据定义域的值规定参数 例如

10、缓冲区大小 因此每个多路数据流都可得出一组 自己的参数它能够确保位流能够以正常速度播放以及与 保持一致的向前播放 实际的解码器可以假定数据流完全按照 模型播放 但由于它与 设计方法不同 实际解码器必须进行补偿中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分系统国家技术监督局批准实施概述范围本标准详述了系统层的编码过程 经过改进原则上支持在 和 中定义的视频和音频混合编码方法 系统层有五个基本功能回放过程中多路压缩数据流的同步把多路压缩数据流分解为单一数据流回放开始时缓冲区的初始化连续缓冲区的管理时间的标识多路位流结构可以分成两层 最外层是系统层 最内层是压

11、缩层 系统层提供在一个系统中使用一个或多个压缩数据流必需的能力 本规范的视频和音频部分定义了音频视频数据的压缩编码层 其他类型的数据的编码不由本规范定义 但遵守 定义的约束的其他类型数据将在系统层得到支持引用标准下列标准所包含的条文 通过在本标准中引用而构成为本标准的条文 本标准出版时 所示版本均为有效 所有标准都会被修订 使用本标准的各方应探讨使用下列标准最新版本的可能性信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 第 部分 视频信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码 第 部分 音频建议 演播室数字电视编码参数报告 单色和彩色电视系统特性建议 音频信

12、号的录制报告 便携和移动式卫星接收器的声音信号广播 附录 中的先进数字系统 的综述建议 声音编程电路的预增强实现离散余弦逆变换的规范数字音频系统技术要素定义采用下列定义 如果仅针对某一部分 则在方括号内注明系数 视频在一个或两个方向上为非零的所有 系数存取单元 系统对压缩音频 存取单元是音频存取单元 对压缩视频 存取单元是一幅图像的编码表示自适应段 音频音频信号数字表示的一分段 其时间是可变的自适应位分配 音频根据心理声学模型 以时间和频率变化的方式对子带进行位分配自适应噪声分配 音频按照心理声学模型 以时间和频率变化的方式对频带赋以编码噪声混迭 音频奈奎斯特子采样所产生的镜像信号分量分析滤波

13、器组 音频在编码器中把宽带 音频信号变换成一组子采样的子带样值音频存取单元 音频对层 和 音频存取单元定义为可由自身进行解码的编码位流的最小部分 其中解码是指 完全重构的声音 对层 音频存取单元是指利用以前获得的主要信息可以解码的一部分位流音频缓冲器 音频系统目标解码器中用于存储压缩音频数据的缓冲器音频序列 音频一个不中断的音频帧序列 其中以下的参数保持不变标识符层采样频率对层 和 位速率索引向后运动矢量 视频按照显示顺序 利用后继图作为运动补偿的参考图中的运动矢量巴 音频临界频带速率单位 巴尺度是一个从频率尺度到与人耳的频率选择性相对应的音频范围的非线性映射双向预测编码图 图 视频使用根据过

14、去和 或将来的参考图的运动补偿预测进行编码的图位速率压缩位流从存储媒体输入到解码器的速率块压扩 音频某一时间内音频信号数字表示的归一化块 视频一个 行 列的正交像素块边界 音频利用强度立体声编码的最低子带字节对齐在编码位流中 如果一位的位置 从位流的第一位开始 是 的倍数 则该位就称为字节对齐的字节位的序列信道存储和传输 流的数字媒体声道 音频立体声信号的左 右信道色度 分量 视频按照 建议 中定义的方式 用于表示与主色彩相关的两色差信号之一的矩阵 块或单个像素编码音频位流 音频按照 中规定的音频信号的编码表示编码视频位流 视频按照 的规定 一幅或多幅图像序列的编码表示编码顺序 视频图像存储和

15、解码的顺序 该顺序未必与显示的顺序一样编码表示以编码形式表示的数据元素编码参数 视频表现编码视频位流特征的 可以由用户定义的参数的集合 由编码参数表征位流 由能够解码的位流表征解码器分量 视频组成一幅图的 个矩阵 亮度和两个色度 之一的矩阵 块或单个像素压缩缩减表示数据项的位数恒位速率编码视频 视频具有恒定的平均位速率的压缩视频位流恒位速率压缩位流时从开始到结束的位速率是常数的操作约束参数 视频中定义的编码参数集中的值约束系统参数流 系统符合本标准的 中定义的约束的 多路流循环冗余码临界带速率 音频频率的心理声学函数 对一给定的可听频率 它正比于低于该频率的临界带的个数临界带 音频与人耳的频率

16、选择性相对应的谱域的心理声学度量 该选择性用巴 表示数据元素编码前或解码后的数据项的表示系数 视频在两个方向上频率均为零的 系数编码图 图 视频仅用其自身信息进行编码的图 在编码表示的 系数中 仅有 系数系数一给定的余弦基函数的幅值解码流压缩位流的解码重构解码器输入缓冲器 视频在视频缓冲检验器中规定的先进先出 缓冲器解码器输入速率 视频在视频缓冲检验器中规定的且在编码视频位流中编码的数据速率解码器解码处理的实体解码 处理中定义的处理 即读入编码的位流并产生解码图像或音频采样值解码时标 系统可在数据包头中出现的一个域 它用于表明系统目标解码器解码一个存取单元的时间去矫 音频对存储或传输的音频信号

17、所采取的一种滤波以消除因加重而引起的线性失真逆量化 视频量化 系数在对其位流中的表示进行解码之后和作 逆变换之前所进行的比例变换处理数字存储媒体数字存储或传输的器件或系统离散余弦变换 视频离散余弦正变换或离散余弦逆变换 是一种可逆的正交变换 的附录 中定义了 逆变换显示顺序 视频解码图像进行显示的顺序 通常与输入编码器编码的顺序相同双声道模式 音频在一个位流中编码有两个相互独立节目内容 如两种语言 的音频信道模式 编码过程与立体声的相同编辑对一个或多个压缩位流进行操作 以产生一个新的位流 合格的编辑位流必须满足 规定的要求基本流 系统编码视频 音频或其他编码位流的统称加重 音频音频信号在进行存

18、储或传输前所进行的滤波 以提高高频下的信噪比编码器编码处理的实体编码 处理在 中没有规定的一种处理 读入输入的图像或音频样值流 以产生一个符合中定义的有效的位流熵编码信号数字表示的一种变长无损编码 用以减少冗余快速正放 视频按显示顺序 以比真实时间快的速度播放一图像序列或图像序列的一部分快速傅立叶变换 离散傅立叶变换的快速算法 一种正交变换滤波器组 音频覆盖全部音频范围的一组带通滤波器固定分段 音频分成固定时间段的音频信号数字表示的一段禁止定义编码位流的条文中用到的 禁止 表示某值决不能被使用 这常用于避免起始码的误判强迫更新 视频不时地对宏块进行帧内编码处理 以确保编码器和解码器间的 逆变换

19、不匹配误差不至于过分积累向前运动矢量 视频用于运动补偿的运动矢量 它以显示顺序上在其前的图为其参考图帧 音频与从音频存取单元的音频 样值相对应的部分音频信号自由格式 音频对每层小于最大有效位速率且与所定的位速率不同的所有位速率将来参考图 视频依显示顺序在当前图之后的参考图区组 层 音频量化前被一起考虑的 个子带中连续 个子带样值的集合 它们对应于 个 样本区组 层 音频载有自身辅助信息的 频率线图组 视频支持随机操作的一幅或多幅编码图的序列汉宁窗口 音频傅立叶变换之前将逐个样值应用于音频样值块的时间函数哈夫曼编码一种熵编码方法混合滤波器组 音频子带滤波器组和 的串行组合音频改进的离散余弦逆变换

20、强度立体声 音频基于在高频下仅保留左 右声道的能量包络以缩减立体声音频节目中的立体声不相关或冗余的一种方法隔行扫描 视频常规电视图像的一种性质 其中相间各行在时间上连续帧内编码 视频宏块或图像仅用其自身的信息进行编码帧内编码图 图 视频仅用其自身信息进行编码的图多路复用 流 系统由零个或零个以上的基本流 按本标准的定义组成的 组成的位流联合立体声编码 音频缩减立体声不相关或立体声冗余的所有方法联合立体声模式 音频使用联合立体声编码的音频编码算法的一种模式层 音频中定义的音频系统编码层次的一个层次层 视频和系统以及本标准中定义的视频和系统规范中数据层次中的一个层次亮度 分量 视频表示单色信号的矩

21、阵 块或单个像素 符合 建议 定义的与基色差信号相联系 表示亮度的符号是宏块 视频从图像的亮度分量的一个 区域得到的 个 的亮度数据块和与之相对应的 个色度数据块 宏块有时指像素数据 有时指像素值的编码表示 以及本标准所定义的其他宏块层语法中的数据元素 从上下文可明确具体用法映射 音频通过子带滤波和 或 音频信号从时域到频域的转换屏蔽现象 音频人类听觉系统的一种性质 当存在另外一种音频信号时 一种音频信号不能被感知屏蔽阈值 音频是一个频率和时间的函数 在该值以下 音频信号不能被人类听觉系统所感知音频改进离散余弦变换运动补偿 视频利用运动矢量来改善像素值预测的效率 预测利用运动矢量提供相对过去或

22、 和将来参考图的偏移 参考图中包含有用于形成预测差值信号的以前解码的像素值运动估值 视频编码过程中估算运动矢量的处理过程运动矢量 视频用于运动补偿的二维矢量 它提供从当前图像的坐标位置到参考图像坐标的偏移立体声 音频基于对和信号与差信号而不是左右声道进行编码来减小立体声音频节目中出现的立体声不相关和或冗余的一种方法帧间编码 视频宏块或图像的编码不仅用到其自身的信息而且还用到其他时间的宏块或图像的信息非音调成分 音频音频信号中的一种类似噪声的分量奈奎斯特采样以大于或等于信号带宽的两倍的频率进行采样包 系统一个包由一个包头和跟随其后的一个或多个分组组成 它是本标准中描述的系统编码语法中的一层分组数

23、据 系统分组中基本流的连续字节分组头 系统包含于分组数据中的载有基础流数据信息的数据结构分组 系统一个分组由一个头和其后面的一些基础数据流中的连续数据字节组成填充 音频通过有条件地在音频帧中加入一槽来调整音频帧的平均时间长度 使其与对应的 采样值的持续期相适应过去参考图 视频按显示次序出现在当前图之前的参考图像素纵横比 视频显示像素的标称垂直高度与标称水平宽度之比像素 视频图元素图周期 视频图速率的倒数图速率 视频解码输出图的标称速率图 视频源 编码的或重构的图像数据 个源图或重构图由 个 位的矩阵组成 个矩阵分别代表一个亮度信号和两个色度信号 图层是 中定义的编码语法的一个层 注意 总是用

24、图 这个词 而不是场或帧多相滤波器组 音频一组具有相等带宽的且相位之间有特殊关系的滤波器 它使滤波器组能有效地实现预测 视频利用预测值提供当前解码图像的像素值或数据元素的估计值预测编码图 图 视频利用从过去的参考图得到的运动补偿预测进行编码的图预测差值 视频像素或数据元素的实际值同预测值的差预测值 视频以前解码的像素值或数据元素的线性组合演示时标 系统可出现在分组头中的一个域 它指示演示单元出现在系统目标解码器中的时间演示单元 系统解码的音频操作单元或解码的图心理声学模型 音频人类听觉系统屏蔽行为的一个数学模型量化矩阵 视频逆量化器使用的一组 位的 个数量化 系数 视频逆量化之前的 系数 量化

25、 系数的变长编码表示作为压缩视频的一部分进行存储量化器比例因子 视频位流中的一个数据元素 解码过程中用其确定逆量化尺度随机操作在任一点上进行读取并对编码的数据流进行解码的处理过程参考图 视频按显示顺序与当前图最邻近的 图或 图顺序调整缓冲器 视频系统目标解码器中的缓冲器 用来存储重构的 图或 图重量化 音频对编码子带样值进行解码以恢复原始量化值保留当在定义编码位流的条文中使用 保留 一词时 表明其值可用于国家标准将来定义的扩充中反向播放 视频以与正常播放顺序相反的顺序显示图像序列的过程比例因子带 音频层 中的一组频率线 它可通过一个比例因子进行缩放比例因子索引 音频比例因子的一个数值码比例因子

26、 音频量化前对一组数值进行缩放的因子序列头 视频编码位流中的一种数据块 包含有一些数据元素的编码表示辅助信息位流中的控制解码器所需的信息空白宏块 视频没有存储数据的宏块子图 视频一系列的宏块 它是 中定义的编码语法的一层槽 音频槽是位流的一个基本部分 在层 中 一个槽为 个字节 在层 中 一个槽为 个字节源流压缩编码前 一个单一的非多路复用的采样值流传播函数 音频描述屏蔽频率传播的函数起始码 系统和视频嵌入编码位流中的唯一的 位码 它可用于包括标识编码语法中的层在内的多种目的输入缓冲器 系统系统目标解码器输入时的一种先进先出缓冲器 用于存储解码前基础流的压缩数据立体声模式 音频是这样一种模式

27、形成一个立体声对 左和右 的两个音频信道编码在一个位流中 编码过程与双通道模式相同填充 位 填充 字节插入到压缩位流中的码字 但在解码过程中被丢弃 它用于增加流的位速率子带 音频音频频带的一部分子带滤波器组 音频覆盖全部音频频率范围的一组带滤波器 中子带滤波器组是一个多相滤波器组子带样值 音频音频编码器中的子带滤波器组产生一输入音频流的滤波 子采样表示 其中滤波样值叫子带样值从输入的 个时间连续的音频样值中 在 个子带中每个子带产生 个时间连续的子带样值同步字 音频音频流中嵌入的一个 位码 它用于标识一帧的开始合成滤波器组 音频解码器中的用于从子带样值重构 音频信号的滤波器组系统头 系统本标准

28、中定义的一种数据结构 它载有概括 多路流系统特征的信息系统目标解码器 系统解码过程的一个假设的参考模型 它用于描述 多路流的语义时标 系统用来标明一个事件发生的时间三重组 音频一个子带中的三个连续的子带样值集合 个子带的三重组形成一个区组音调分量 音频音频信号的一个正弦波状的分量可变位速率解码压缩位流过程中位速率随时间而变化的操作变长编码一种可逆的编码过程 对较常出现的事件赋予较短的码字 不常出现的事件赋予较长的码字视频缓冲检验器 视频概念上与编码器的输出相连接的一种假设的解码器 它用于约束编码器或编辑过程中生成的数据速率的变化量视频序列 视频一个或多个图组组成的序列 它是 所定义的编码语法的

29、一个层字扫描顺序 视频系数的一种从 大约 最低空域频率到最高空域频率的顺序符号与缩略语用于描述本标准的数学运算符号与 程序设计语言中的类似 然而 关于整数除法的取位和舍入又有专门的规定 位运算符的定义假设整数是用补码表示的 数字和计数的循环一般从零开始算术运算符加减 作为二元运算符 或负 作为一元运算符增减乘乘方整数除法 结果取整 例如 和 取整结果为 和取整结果为整数除法 结果四舍五入 若不特殊说明小数部分的 作进位处理 如整数除法 往负向取整 即取小于正常除法运算结果的最大整数绝对值取模运算 仅对正数有定义取整运算符 将其实参舍入成与它最接近的整数 小数部分的 作进位处理正弦余弦指数平方根

30、以 为底的对数以 为底的对数以 为底的对数逻辑运算符逻辑 或逻辑 与逻辑 非关系运算符大于大于或等于小于小于或等于等于不等于取参数中的最大值取参数中的最小值位运算使用按位运算时 操作数均假设采用补码表示与或右移 带符号扩展左移 移后填赋值运算赋值运算符助记符下列助记符用于描述编码位串流中的不同数据类型位串 左边位开始 规定位串从左开始书写 位串是单引号内的 或 组成的串 如 位串当中的空白只是为了阅读方便 没有其他意义通道 如果 值是 是指立体声信号的左通道或两个独立信号中的第一个信号 音频通道号 等于 表示单通道模式 等于 表示其他模式 音频音频层 子带采样的粒度 音频层子带采样中的粒度位串

31、流的 部分包含比例因子 哈夫曼编码数据以及辅助信息 音频位于位串流中帧的 的开始处 具体位置是前帧末端的位置再加上 位 它由前帧的 值计算出来 音频中比例因子所占的位数 音频余数多项式的系数 最高幂在前 音频子波段 音频没有分配位的最低子波段的个数 音频选择比例因子的信息 音频使用了窗口开关上的点的长块比例因子波段的个数 音频使用了窗口开关上的点的短块比例因子波段的个数 音频无符号整数 最高位在前变长码 左边位开始 这里 左 指 码的书写顺序当 时 实际时间槽的个数 音频常量描述位流的语法规则中描述了解码器得到的位流 位流中的每一数据项用黑体字印刷 并描述了它们的名称 位长度 类型助记符以及传

32、送顺序等 在位流中由解码数据元素所引起的动作与该数据元素的值以及前面解码的数据元素有关 中描述了数据元素的解码以及解码中所用的状态变量的定义 以下结构用于表述数据元素何时出现以及何时为正常类型的条件注意 本语法中使用了这样的 代码约定 一个非零的变量或表达式相当于一个为真的条件条件 如条件为真 数据流中将出现数据元素组 直到条件为假为止数据元素至少出现一次条件 数据元素不停重复直到条件为假条件如果条件为真 则接下来数据流中出现第一组数据元素若条件为假 接下来在数据流中出现第二组数据元素是一个说明循环起始条件的表达式 通常它给出计数器的初始状态 是每次重复循环的测试条件 当条件为假时结束循环是一

33、个表达式 每循环一次 它发生一次作用 通常它是计数器的增量注意以下是本结构最普通的用法数据元素组出现 次数据元素组中的条件结构同循环控制变量 有关 第一次出现时 被置 第二次被加 等等数据元素组中可含有嵌套的条件结构 为简短起见 若只有一个数据元素时 可以省略是一个数据数组 由上下文指明数据元素的个数是数据数组中第 个元素是二维数据数组中第 个元素是三维数据数组中第 个元素的范围从 至若是用程序的方式表示语法 则 的解码程序是不能令人满意的 尤其 语法定义了一个正确无差错的输入位流 实际的解码器在解码过程中必须能检出起始码 以使其能正确地开始解码 识别错误 删除 插入等 至于识别这些状态的方法

34、以及所采取的行动不必统一函数的定义如果当前位置处在字节的边界上 即位流中的下一个位是一个字节的第一位 则函数返回值为 否则返回值为函数的定义函数 允许一个位串同位流中下一个解码的位进行比较函数的定义函数除去所有零位和零字节填充位并定位下一个起始码 见表表语法 位数 助记符该函数检验当前位置是否是字节对准的 若不是 则加入零填充位 在起始码前可加入任意个零字节 因此 起始码总是字节对准的 在其前可有任意个数的零填充位要求编码结构及其参数系统编码层允许一个或多个基本流组成单一流 每个基本流的数据都是多路的 集合在一起编码并且带有允许基本流同步重放的信息多路流流由一个或多个基本流组成 每个基本流均由

35、存取单元构成 即演示单元的编码表示 对于视频流来说这一单元指的是画面 相应的存取单元还包括所有画面的编码数据 存取单元包含画面组第一个编码画面 还包含画面组任意处理数据 正如在 的 中定义的那样用 码开始 存取单元还包含序列头后的第一个编码画面 正如 中所定义的那样还要包括序列头 包含序列最后编码画面的存取单元中包括序列结束码 见的 中序列结束码的定义 声音基本流的表示单元是声音帧相应采样点的集合见 中 和 中定义的声音帧基本流的数据存储在分组里 分组由分组头后跟着的分组数据组成 分组头部以 位的起始编码开始 并指明分组数据属于哪个流 分组头部还包含有解码时间戳 和 或显示时间戳 通过它们可获

36、知分组中第一个存取单元位的位置 分组数据包含有一个基本流的不同数目的连续字节分组可组合成包 一个包同样有一个包头和零个或多个分组 包头以 位起始码开始 包头用于存储时间和位速率信息流以系统头作为开始 系统头可以任意选择重复几次 系统头携带着流中定义的所有系统参数系统目标解码器中规定的多路流语义及 对语义的一些限制和约束都需要对编码事件及事件发生的时刻有一个明确说明 在本标准中通过一个假设的系统目标解码器 来具体阐述是一个理想的模型 用它可以明确而严谨地定义上述术语 并且构造了 多路流编码过程的模型 定义 仅为此目的 阻碍不中断同步播放 多路流既不是 的结构也不是描述时序 该数据来自具有不同结构

37、或时序表的可变的解码器注下面的注是为了阐述系统目标解码器 系统目标解码器的原理框图如图 所示表示 多路流中的字节 第一个字节索引为表示基本流存取单元的索引表示基本流的演示单元表示基本流多路流中第 个字节多路流中第 个字节进入系统目标解码器的时间在 系统时钟下 字段的编码时间 指向 字段的最后字节第 路流的第 个存取单元 注意存取单元按解码顺序排定目标解码器内第 路基本流的第 个存取单元解码所用的时间 用秒表示第 路流的第 个表示单元第 路基本流的第 个表示单元在系统目标解码器内的表示时间 用秒表示用秒 表示的时间在 时刻 存储第 路基本流的系统目标解码器输入缓冲区的充满度 用字节来表示存储第

38、路流的系统目标解码器输入缓冲区存储第 路流的系统目标解码器输入缓冲区的大小 用字节来表示第 路基本流的解码器存储第 路基本流的重排缓冲区图 系统目标解码器原理图系统时钟频率时钟信息由若干 和 定义的数据字段携带 这些信息编码以后作为系统时钟的采样值系统时钟频率值用 来表示并遵循以下约定系统时钟频率随时间的波动幅度注 本标准中系统时钟频率即指遵循上述约定的时钟频率 为了注释方便 和 中出现的等式可以导出准确的 整数倍的时间值 这是因为时间信息作 位二进制编码的缘故系统目标解码器输入数据从 多路流进入系统目标解码器 第 个字节 在 时刻进入 这个字节进入系统目标解码器的时间可由输入流中 的解码信息

39、得到 是预先编码置于包头的字段的编码值即表示了 其中 为 的最后一个字节其他字节的输入到达时间可由 和数据到达率得出 其中每个包的数据到达率存在包头的字段中 见 和式中 包头的 字段的最后一个字节包中与索引字节的相对位置 例如 指的是 字段后的第一个字节系统时钟条件下 字段的编码时间在 和 中定义的一个字段当包的最后一个字节递交以后 可能有一段时间 遮这段时间内系统目标解码器没有任何输入字节通过 字段的使用 系统目标解码器工作速率是可变的 其值在包到包之间可以变化 事实上在到来包的最后一个字节以后和下一个包头到来以前 进入系统目标解码器的数据率可能下降到零缓冲区基本流的分组数据可传送到流 的输

40、入缓冲区 字节 从系统目标解码器的输入端传送到几乎不需要时间 因此字节 进入大小为 的流 的缓冲区的时间亦为多路流中包 系统或分组头部之前的字节并不是分组数据的一部分 例如分组长度字段等 见 将不会被传送给任何缓冲区 但是可以用来控制系统输入缓冲区的大小 至 由语法参数给出 见 和在解码时间 内 在输入缓冲区停留时间最长的存取单元的全部数据立即解码 对于视频图像基本流 画面组和序列头同时解码后移出 对于一个视频序列的第一幅编码图 紧挨序列头前的零位或零字节在解码同时立即移出 注意这只适用于一个视频序列的第一幅图 而不适用于一个视频序列中的后继序列头 存取单元从缓冲区移出后立即解码形成表示单位解

41、码过程缓冲区 至 的基本流由解码器 至 即时解码 但有可能从系统目标解码器输出时 在播放给观众以前 在重排序缓冲区 至 内部被延迟 重排序缓冲区只在图像解码时用于存储 画面或画面 这样 在显示以前 显示单元的顺序被重新调整对于一个图像基本流来说 有些存取单元可以不必按显示顺序存储 那么这些存取单元在显示以前需要重排序 尤其是存储于一个或多个 画面之前的 画面或 画面 在显示之前肯定会在系统目标解码器的重排序缓冲器 内被延迟 直到下一个 画面或 画面解码完成 并被存储于重排序缓冲区 这时 随后的 画面将解码显示如果 是一个 画面或是 画面 那么在显示之前需要重排序 在解码之后 它被存储在缓冲区

42、而 以前存储的画面将被显示 随后的 画面无须重排序 直接解码并显示显示单元 显示给观众的时间为 既然存取单元无延迟地解码 那么对于不重排序的显示单元来说 等于 对于重排序的显示单元来说 与 之间差一个重排序缓冲区延迟时间 这个值是 在重排序缓冲区中的延时 这一延时是正常画面周期的整数倍的 对图像画面的重排序有更详细的解释显示解码系统的作用就是从压缩数据中重建显示单元 并且在正确的显示时间同步地把它们显示出来虽然实际的视听显示装置均有不同的有限延迟 在后处理过程和输出时也会产生累加延迟 但是系统目标解码器将这些延迟忽略为零在系统目标解码器内 视频显示单元 画面 可在显示时间 即时显示系统目标解码

43、器在显示时间 输出音频显示单元 此时解码器即时播放第一组采样 在显示单元之后的采样样本以音频采样频率播放系统流语法的规定下面是描述由字节组成的流的语法层 见表表语法 位数 助记符包层包 见表表语法 位数 助记符系统头 见表分组层 见表表语法 位数 助记符表语 法 位数 助记符语法中字段的语义定义层是位串 十六进制它表示一路 多路流的结束包层包是位串 十六进制 它表明一个包的开始是分作三个字段的 位编码数字 它指明 字段的最后一个字节到达系统目标解码器的输入端的预定时间 值是在 系统时钟下测定的 详述 用的注释 可得 的编码值为 这里是编码的 字段中的最后一个字节是值为 的 位的字段是包含在包内

44、的一个正整数值 它指明了系统目标解码器接收多路流的速率的值经测定向上取整为 字节 秒 零值禁止使用 描述的值用于定义字节到达中系统目标解码器输入的时间 一个 多路流的 字段编码值对于各个包来说是不相同的系统头部是位串 十六进制 它表明一个系统头的开始的值与系统头部 字段后的字节长度是相等的 注意以后对本标准的扩展可能扩展系统头部是一个整数值 它大于或等于 多路流的任何包的已编码 字段的最大值 解码器用它来评定是否能够解码整路流是 范围内的整数值 它大于或等于解码时与 多路流复合在一起的声音流的最大个数为此 如果 缓冲区非空 或者在 模式中解码存取单元被描述 的音频流的解码才进行是 位宽的标志位

45、 如果其值被置为 指明为固定位率操作 如果为 指明为可变位率操作 在固定位率操作过程中 多路流的所有 字段的编码值遵循下列等式式中 对所有 的实常数对所有 的实常数多路流 字段的最后一个字节的索引是一标志位 如果值为 那么 多路流必须遵守本标准 中的约定是一标志位 它表明了音频采样频率和系统目标解码器的系统时钟频率之间的特定的 不变的关系 定义了系统时钟频率 定义了声音采样频率 如果仅置 那么对于 多路流的所有声音基本流的全部表示单元系统时钟频率为实际的声音采样频率的比率 是常数 并等于表 中所列的在声音流标准采样频率下的值在 中音频采样速率符号 表示实数除法表标准音频采样频率比值是一个标志位

46、 它表明了图像画面频率和系统目标解码器的系统时钟频率之间特定的 不变的关系 定义了系统时钟频率 规定了图像画面频率 如果仅置 对于 多路流的所有图像基本流的全部表示单元 系统时钟频率与实际的图像画面的比率 是常数 且等于表 中所列的标准基本流画面频率下的值在 中图速率这些 系数是确切的 实际的图像速率比标准速率稍有不同 标准速率是 或画面每秒表标准画面频率比值是 的整数值 它大于或等于与 多路流复合在一起的图像流的最多个数 在本章中 如果 缓冲器不空 或者解码器存储单元在 模式中正在用 或者重排序缓冲器不空 视频流解码过程起作用这一字节留作国家标准以后使用 除非另有规定否则应为表明了多路流的类

47、型和数目以供后面的 和字段引用如果 等于 那么 后面的 和字段指的是 多路流的全部音频流如果 等于 那么 后面的 和字段针对的是 多路流的全部图像流如果 为除此之外的其他值 那它应大于或等于 这样才能按照下列表查找到流的类型和数量 表 也用于标识由 定义的 表示的流的类型和数目表 表流类型留用数据流填加流音频流数目视频流数目留用数据流数目注 可以为 或者 表示同一种类型的流 流的数目通过 给出多路流的每个基本流在每个系统头用这种结构一次性地规定和是一 位字段 它描述了比例因子 而比例因子用来解释后继的字段 如果先前的 表明为一个音频流 那么的值为 如果 字段表明为一个视频流 则 的值为对于除此

48、之外的其他流 的值既可为 亦可为是一个 位长的无符号整数 它的值大于或等于系统目标解码器最大输入缓冲区 大小的值 是 流中所有分组 的缓冲区 如果的值为 那么 以 字节划为一单位测量缓冲区的大小如果 的值为 那么 以 字节划为一单位测量缓冲区的大小 因此分组层是一个 位码 它与其后的 结合起来构成一个分组的起代码 它标识分组的开始 是位串十六进制规定了基本流的类型和数目 它由 的 表所定义 在 多路流中每个基本流有唯一的规定了 字段以后的分组内剩余的字节个数为等于 的 位长固定字节 它可由编码器插入 以使采样符合数字存储媒体的要求 它被解码器忽略 在一个分组头部不应超过 个填充字节是一位宽字段

49、 它描述了用来解释后继的 字段的比例因子 如果先前 说明为一个声音流 那么 的值为 如果 说明了一个视频流 那么 的值为 除此之外的其他类型的流 值既可为 亦可为是定义系统目标解码器的输入缓冲区大小的 位无符号整数 如果的值为 以 字节为一单位进行量测 如果的值为 以 字节为一单位进行量测因此当 系统目标解码器接收到 字段时 缓冲器大小的编码值取立即有效值是分作三个字段的 位编码数字 它指出了系统目标解码器显示单元显示的预期时间 显示单元是与分组中第一个开始的存取单元相符的 的值可以 系统时钟为单位测量 偏差规定详见 利用 的注释 的编码值为式中 显示单元 的显示时间分组数据中开始的第一个存取单元相应的显示单元 如果视频画面起始码的第一个字节或音频帧的同步字的第一个字节是分组数据的当前字节 那么存取单元即是分组的起始单元是分作三个字段的 位编码数字 它指明分组中开始的第一个存取单元在系统目标解码器的预定解码时间 的值可以 系统时钟为单位测量 偏差规定详见利用 中的注释可得 的编码值为式中 存取单元 的解码时间标志分组数据开始的

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1