ImageVerifierCode 换一换
格式:PDF , 页数:12 ,大小:252.84KB ,
资源ID:777958      下载积分:10000 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【http://www.mydoc123.com/d-777958.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(GOST R 53556 6-2013 Sound broadcasting digital Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels A part III (MPEG-.pdf)为本站会员(赵齐羽)主动上传,麦多课文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文库(发送邮件至master@mydoc123.com或直接QQ联系客服),我们立即给予删除!

GOST R 53556 6-2013 Sound broadcasting digital Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels A part III (MPEG-.pdf

1、 55556.6 2013 . III (MPEG4 AUDIO) (TTSI) ISO/IEC 14496-3:2009 (NEQ) 53556.6 2013 II 1 - - ( ) 2 480 3 22 2013 . 1703- 4 / 14496-3:2009 . . 3. (ISO/IEC14496-3:2009 Information technology - Coding of audio-visual objects - Part 3: Audio (NEQ) 5 1.0 2012 ( 8). ( 1 ) , . () . , (gost.ru) , 2014 , 53556.

2、6 2013 1 . III (MPEG4 AUDIO) (TTSI) Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. A part III (MPEG4 audio). Te to speech interface (TTSI) 20140901 1 MPEG4 Audio (-TTS) , . -TTS, (FA) (MP) . -TTS , . FA

3、 , . (TTS) . TTS , . , TTS (FA) / (MP) . TTS FA MP . MPEG4 TTS FA/MP. -TTS TTS. TTS . : , , . -TTS, , TTS , , TTS FA MP. 2 , 53556.0-2009. 53556.6 2013 2 3 F0 ( ) DEMUX FA FAP ID IPA MP -TTS TTS MPEG4 Audio STOD TTS 4 MPEG4 Audio 4.1 TTSSpecificConfig MPEG4 Audio TTSSpecificConfig () TTS_Sequence ()

4、 1 - TTS_Sequence () TTS_Sequence () TTS_Sequence_ID; Language_Code; Gender_Enable; Age_Enable; Speech_Rate_Enable; Prosody_Enable; Video_Enable; Lip_Shape_Enable; Trick_Mode_Enable; 5 18 1 1 1 1 1 1 1 uimsbf uimsbf bslbf bslbf bslbf bslbf bslbf bvslbf bslbf 4.2 MPEG4 Audio AlPduPayload TTS_Sentence

5、 (); 2 TTS_Sentence () TTS_Sentence () TTS_Sentence_ID; 10 uimsbf Silence; 1 bslbf if (Silence) SilenceDuration; 12 uimsbf else if (Gender_Enable) Gender; 1 bslbf if (Age_Enable) 3 uimsbf Age; 53556.6 2013 3 2 if (!Video_Enable 4 uimsbf Length_of_Text; 12 uimsbf for (j = 0; j , . , , FAP, TtsFAPInte

6、rface . , . Dur_Enable , 1, . F0_Contour_Enable , 1, . Energy_Contour_Enable , 1, . Number_of_Phonemes - , . Phonemes_Symbols_Length - Phonemes_Symbols ( IPA) , IPA . Phoneme_Symbols - Unicode 2,0. IPA. IPA , , , . Dur_each_Phoneme - , . Num_F0 - F0, . F0_Contour_each_Phoneme - F0, , F0_Contour_each

7、_Phoneme_Time. F0_Contour_each_Phoneme_Time - , , F0_Contour_each_Phoneme. Energy_Contour_each_Phoneme - 8- , . X 1050logint ,xp- pA - . Sentence_Duration - , . Position_in_Sentence - , . Offset - , . Number_of_Lip_Shape - , . Lip_Shape_in_Sentence - , . Lip_Shape - , . 6 MPEG4 Audio -TTS , -TTS. :

8、; ; ; ; / FAP. 6.1 , -TTS 53556.6 2013 6 . 6.2 -TTS, . -TTS: FA MP : : () , : , trick pseudo-C . 6.3 . 32767 + 32768. 6.4 , . MP ttsControl, : 4 ttsControl () ttsControl() ttsPlay(); ttsForward(); ttsBackward(); ttsStopSyllable(); ttsStopWord(); ttsStopPhrase(); TtsChangeSpeedRate(); TtsChangePitchD

9、ynamicRange(); TtsChangePitchHeight(); TtsChangeGender(); ttsChangeAge(); ttsPlay , ttsForward ttsBackword . ttsStopSyllable, ttsStopWord ttsStopPhrase , , , . ttsChangeSpeechRate . 1 16. ttsChangePitchDynamicRange . , , 1 16. 1 16 ttsChangePitchHeight. ttsChangeGender ttsChangeAge , , . 6.5 / FAP M

10、PEG4 . . TTS phonemeSymbol phonemeDuration, Phoneme/Bookmark-to-FAP. / FAP phonemeSymbol, phonemeDuration . . TTS. Lip_Shape_Enable , 53556.6 2013 7 Lip_Shape_in_Sentence , phonemeDuration. TTS . / wordBegin, , / , . MTTS_Text TtsFAPInterface . , TtsFAPInterface . , 40 . starttime , , -TTS, . ttsFAP

11、Interface phoneme-to-FAP. 5 TtsFAPInterface () TtsFAPInterface () PhonemeSymbol; 8 uimsbf PhonemeDuration; 12 uimsbf f0Average; 8 uimsbf ; 1 bslbf WordBegin; 1 bslbf ; char Starttime; long int 53556.6 2013 8 A () MPEG4 Audio A.1 -TTS. A.2 : MPEG4 (STOD) STOD , -. STOD -TTS MPEG4 . , , (, ). , , . -TTS MPEG4 -TTS MPEG4. A.3 :

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1