1、第二章 多媒体音频技术,2.1 数字音频基础,一、声音的基本概念声音是通过一定介质传播的一种连续波。,振幅:音量的大小 周期:重复出现的时间间隔 频率:指信号每秒钟变化的次数,声波,重要指标,2.1 数字音频基础,声音按频率分类:,人类说话声音频率范围:300Hz-3kHz 声音质量的频率范围:,2.1 数字音频基础,二、声音的数字化1.声音信号的类型模拟信号(自然界、物理)数字信号(计算机)2.声音数字化过程,2.1 数字音频基础,3.声音数字化过程图示,2.1 数字音频基础,4.声音数字化三要素,2.1 数字音频基础,5.声音数字化计算公式数据量采样频率量化位数 声道数/8(字节/秒),2
2、.1 数字音频基础,三、数字音频的文件格式1.WAV文件WAV是Microsoft/IBM共同开发的PC波形文件。因未经压缩,文件数据量很大。特点:声音层次丰富,还原音质好2.MP3文件MP3(MPEG Audio layer 3)是一种按MPEG标准的音频压缩技术制作的音频文件。特点:高压缩比(11:1),优美音质,2.1 数字音频基础,3.WMA文件WMA(Windows Media Audio)是Windows Media格式中的一个子集(音频格式)。特点:压缩到MP3一半4.MIDI文件MIDI(乐器数字接口)是由一组声音或乐器符号的集合。特点:数据量很小,缺乏重现自然音,2.2 数字
3、音频压缩标准,一、音频压缩方法概述,压缩编码是用某种方法使数字化信息的编码率减低,无损压缩:霍夫曼编码、算术编码、行程编码 有损压缩:波形编码、参数编码、混合编码,2.2 数字音频压缩标准,二、音频压缩技术标准,2.2 数字音频压缩标准,三、音频压缩工具MP3压缩工具(豪杰超级解霸3000),2.3 声卡与音箱,一、声卡(又称声音卡、音频卡)1.声卡的主要功能声卡是负责录音、播音和声音合成的一种多媒体板卡。录制、编辑和回放数字音频文件控制和混合各声源的音量记录和回放音频时进行压缩和解压缩语音合成技术(朗读文本)具有MIDI接口(乐器数字接口),2.3 声卡与音箱,2.声卡的组成原理,2.3 声
4、卡与音箱,3.声卡的性能指标采样和量化能力衡量音响器材音质好坏。采样频率:11.025kHz (语音效果)22.05 kHz (音乐效果)44.1 kHz (高保真效果)量化等级: 8位/256级 (语音质量)16位/65536级(高保真质量),2.3 声卡与音箱,芯片类型CODEC芯片(依赖CPU,价格便宜)数字信号处理器DSP(不依赖CPU)总线类型ISA总线、PCI总线、USB接口输出声道数2声道(立体声)、2.1/4.1/5.1声道多通道声卡(营造杜比环绕立体声),2.3 声卡与音箱,4.声卡的外部接口,2.3 声卡与音箱,二、音箱音箱是一种电声转换的发音设备,它由箱体、扬声器、电源和
5、信号放大器等组成。分类:2.0双声道立体声2.1/4.1/5.1/7.15.1五声道超重低音声道,2.3 声卡与音箱,杜比环绕 立体声技术,2.4 音频处理软件,专业音乐软件,2.4 音频处理软件,一、Cool Edit概述Cool Edit Pro 1.1/1.2/2.0/2.1 (专业版)Cool Edit 2000(简化版)是一种集录音、编辑、合成于一体的数字音频处理软件。编辑:插入、叠加、替换、调制等;音效:回音、延迟、失真、杂音等;分析音讯及频率;与Cakewalk能很好地结合。,2.4 音频处理软件,1.Cool Edit的启动和退出开始/所有程序Cool Edit 20002.C
6、ool Edit的窗口组成,2.4 音频处理软件,二、音频的基本操作1.声音的录制Options/Windows Mixer音量控制从麦克风中输入File/NewNew Waveform对话框语音:11025Hz、Mono、8-bit 音乐:44100Hz、Stereo、16-bit从CD唱机中输入CD唱机(波形输出混音),2.4 音频处理软件,2.音频的编辑选择删除(选区、非选区)复制粘贴混合粘贴,2.4 音频处理软件,3.音频文件管理新建文件打开文件保存文件另存为(其他格式)保存选择区,2.4 音频处理软件,三、调整音量大小1.调整音量Transform/Amplitude/Amplify
7、菜单 Amplify对话框 Constant Amplification选项卡2.显示振幅边界线(90%)View/Show Boundaries3.静音(选择区域)Transform/Silence,2.4 音频处理软件,四、淡入与淡出淡入效果是指音频选区的起始音量很小甚至无声,而最终音量相对效大。淡出效果是指音频选区的起始音量相对较大,而最终音量很小甚至无声。操作步骤:选择音频区域Transform/ Amplitude/Amplify选择Fade In(淡入)、Fade Out(淡出)Linear Fades(线性) Logarithmic Fades(对数),2.4 音频处理软件,五、
8、消除环境噪音环境噪音是在语音停顿之处有一种振幅变化不大的声音,这个声音贯穿于录制声音的整个过程。消除环境噪音的方法是在语音停顿之处选择一段环境噪音,让CE记录噪音的特征,然后自动消除所有的环境噪音。操作步骤:选取噪音样本Transform/ Noise Reduction/Noise Reduction双击波形显示区选取整个波形,2.4 音频处理软件,六、延迟效果1.Delay延迟效果Transform/Delay Effects/Delay菜单Delay对话框参数:Delay:延时(-500500ms)Mixing:声音混合(0100%)Invert:颠倒Presets:预置模拟各种房间效果
9、、空中回声、隧道。,2.4 音频处理软件,2.Echo回声效果Transform/Delay Effects/Echo菜单Echo对话框的参数:Decay:衰减(0100%)Delay:延时(02000ms)Initial Echo Volume:初始回声音量Lock Left/Right:锁定左右声道Echo Bounce:弹簧回声模拟声场效果,如礼堂、峡谷、大厅。,2.4 音频处理软件,3.Flanger空间感效果Transform/Delay Effects/Flanger菜单Flanger对话框的主要参数:,模拟科幻、火星人、水下等声音感觉。,2.4 音频处理软件,七、正弦波发生器正弦
10、波发生器 音频信号发生器 非正弦法发生器 噪音发生器Generate/TonesNew Waveform(16000,Mono,16-bit)Generate Tones(选中Lock to these400,0,0),2.5 MIDI与音乐合成,一、MIDI技术概述1.什么是MIDIMIDI是一种利用合成器产生的音乐技术。 Musical Instrument Digital Interface译为乐器数字接口。利用数字信号处理技术合成的音效有:模仿钢琴、小提琴、吉他等音色;超越时空的太空音乐。,2.5 MIDI与音乐合成,2.MIDI标准MIDI是各种电子音乐设备之间以及与计算机交换信息的
11、国际标准。(Yamaha,Roland)MIDI硬件规范:硬件接口标准和信号传输机制(I/O通道类型、连接电缆和插座形式)。MIDI软件规范:音乐信息数字化编码方式(音符、音符长短、音调和音量等)。,2.5 MIDI与音乐合成,二、MIDI合成方式1.调频合成法FM原理:利用傅立叶级数进行分解。特点:系统开销小,声音较清脆;声音音色少,音质差。2.波形表合成法WT原理:预先存放实际乐器的声音样本。特点:音乐真实感强,音色自然。硬波形表,软波形表。,2.5 MIDI与音乐合成,三、MIDI的工作过程,音序器是MIDI音乐 创作的核心控制部件。,2.5 MIDI与音乐合成,四、音乐制作系统1.基本
12、设备音源:声卡(模拟乐器发声的设备)音序器:硬件音序器、软件音序器输入设备:电子琴(MIDI In,MIDI Out)MIDI键盘(省去音源) Cakewalk虚拟键盘MIDI连接线,2.5 MIDI与音乐合成,2.音乐制作技术提取原音软件:Exact Audio Copy(EAC)MP3数字CD抓轨把CD音轨转换成WAV格式(无失真)。音频处理软件:Cool Edit 2000原音伴唱消除:Effect/Amplitude/ Channel MixerVocal CutVCD(卡拉OK):左声道、右声道 人声 伴音,2.6 语音识别技术,一、语音识别的发展历史1952:Bell实验室研制可识
13、别十个英文 数字的语音识别器-Audry系统。60-80:动态规划(DP)、线性预测(LP)、 矢量量化(VQ)、隐马尔可夫模型、 人工神经元网络(ANN)。1988:卡内基-梅隆大学研制SPHINX系统 非特定人、大词汇量、连续语音。1997:IBM公司开发出汉语ViaVoice语音 识别系统。ViaVoice98-地方口音,2.6 语音识别技术,二、语音识别的基本原理,三、语音识别系统的分类1.根据词汇量大小小词汇量语音识别系统:几十词中词汇量语音识别系统:几百词,2.6 语音识别技术,大词汇量语音识别系统:几千-几万词2.根据对说话人依赖程度特定人语音识别系统:专人非特定人语音识别系统:所有人限定人识别系统:一组人3.根据对说话人说话方式孤立词语音识别系统:每词后停顿连接词语音识别系统:连音连续语音识别系统:连音、变音,2.6 语音识别技术,四、语音识别软件中文听写语音识别软件 语音命令语音合成IBM ViaVoice 8.0中文语音识别系统,英特尔公司的可视音频语音识别软件(AVSR)。,
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1