1、 Rec. UIT-R BR.1352-3 1 RECOMENDACIN UIT-R BR.1352-3 Formato de fichero para el intercambio de materiales de programas de audio con metadatos por medios basados en la tecnologa de la informacin (Cuestin UIT-R 58/6) (1998-2001-2002-2007) mbito de aplicacin La presente Recomendacin contiene las especi
2、ficaciones relativas al segmento de extensin de audio de radiodifusin1y su utilizacin con la codificacin MIC, y datos de audio MPEG-1 o MPEG-2. Tambin se incluye en esta Recomendacin informacin bsica sobre el formato RIFF y la manera en que puede ampliarse a otros tipos de datos de audio. La Asamble
3、a de Radiocomunicaciones de la UIT, considerando a) que los medios de almacenamiento basados en la tecnologa de la informacin, incluidos los discos y cintas de datos, sern utilizados en todos los campos de la produccin de audio para la radiodifusin, a saber, edicin no lineal, reproduccin a partir de
4、 la emisin y archivos; b) que esta tecnologa ofrece ventajas importantes desde el punto de vista de la flexibilidad de funcionamiento, flujo de produccin y automatizacin de la estacin y que, en consecuencia, es interesante para la mejora de los estudios existentes y el diseo de nuevas instalaciones
5、de estudios; c) que la adopcin de un solo formato de fichero para el intercambio de seales simplificara considerablemente la interoperabilidad de los equipos y estudios distantes, y facilitara la integracin deseable de la edicin, la reproduccin a partir de la emisin y el archivo; d) que se debe incl
6、uir un conjunto mnimo de informacin relacionada con la radiodifusin en el fichero para documentar la seal audio; e) que, con miras a asegurar la compatibilidad entre aplicaciones con complejidades diferentes, se debe acordar un conjunto mnimo de funciones, comunes a todas las aplicaciones capaces de
7、 tratar el formato de fichero recomendado; f) que la Recomendacin UIT-R BS.646 define el formato de audio digital utilizado en la produccin de audio para radiodifusin sonora y de televisin; g) que la necesidad de intercambiar materiales de audio se plantea tambin cuando se emplean los sistemas de co
8、dificacin de las Normas ISO/CEI 11172-3 e ISO/CEI 13818-3 para comprimir la seal; 1Un segmento (chunk) es el componente bsico de un fichero en el formato de fichero de intercambio de recursos (RIFF) de Microsoft . 2 Rec. UIT-R BR.1352-3 h) que la compatibilidad con los formatos de ficheros comercial
9、es actualmente disponibles podra minimizar los esfuerzos de la industria para aplicar este formato en los equipos; j) que un formato normalizado para la informacin de historial de codificacin simplificara el empleo de la informacin tras el intercambio de programas; k) que la calidad de la seal de au
10、dio est influida por el tratamiento que haya tenido la seal, especialmente por la utilizacin decodificacin y decodificacin no lineales durante los procesos de reduccin binaria, recomienda 1 que, para el intercambio de programas de audio por medios basados en la tecnologa de la informacin, los parmet
11、ros de la seal audio, la frecuencia de muestreo, la resolucin de codificacin y la preacentuacin se fijen de acuerdo con las partes pertinentes de la Recomendacin UIT-R BS.646; 2 que se utilice el formato de fichero especificado en el Anexo 1 para el intercambio de programas de audio en formato modul
12、acin por impulsos codificados MIC lineal por los medios basados en la tecnologa de la informacin; 3 que cuando las seales audio sean codificadas aplicando los sistemas de codificacin de las Normas ISO/CEI 11172-3 o ISO/CEI 13818-3, se utilice el formato de fichero especificado en el Anexo 1 y comple
13、mentado en el Anexo 2 para el intercambio de programas de audio por los medios basados en la tecnologa de la informacin2; 4 que, cuando se utilice el formato de fichero especificado en los Anexos 1 y/o 2 para cursar informacin sobre el material de audio recopilado y reordenado por una estacin de tra
14、bajo audio digital (DAW, digital audio workstation), los metadatos cumplirn las especificaciones detalladas en el Anexo 3. Anexo 1 Especificacin del formato de onda de radiodifusin Un formato para ficheros de datos de audio en radiodifusin 1 Introduccin El formato de onda de radiodifusin (BWF, broad
15、cast wave format), se basa en el formato de fichero audio WAVE de Microsoftque es un tipo de fichero especificado en el Formato de fichero de intercambio de recursos (RIFF, Resource Interchange File Format) de Microsoft. Los ficheros WAVE contienen especficamente datos de audio. El componente bsico
16、del formato de fichero RIFF, denominado segmento (chunk), contiene un grupo de piezas de informacin estrechamente relacionadas. Consiste en un identificador de segmento, un valor entero que representa la longitud en octetos del segmento y la informacin. Un fichero RIFF se compone de una coleccin de
17、segmentos. 2Se ha reconocido que una Recomendacin en ese sentido podra penalizar a diseadores que utilizan ciertas plataformas informticas. Rec. UIT-R BR.1352-3 3 Para el BWF, se aplican algunas restricciones al formato WAVE original. Adems, el fichero BWF incluye un segmento de extensin de audio de
18、 radiodifusin (), que se ilustra en la Fig. 1 siguiente. Este Anexo contiene la especificacin del segmento de extensin de audio de radiodifusin que se utiliza en todos los ficheros BWF. Adems, en el Apndice 1 figura informacin sobre el formato RIFF bsico y cmo se puede ampliar a otros tipos de datos
19、 de audio. Los detalles del formato de onda con MIC figuran tambin en el Apndice 1. Las especificaciones detalladas de la extensin a otros tipos de datos de audio y metadatos se incluyen en los Anexos 2 y 3 a esta Recomendacin. 1.1 Disposiciones normativas La observancia de esta Recomendacin es volu
20、ntaria. Ahora bien, la Recomendacin puede contener ciertas disposiciones obligatorias (para asegurar, por ejemplo, la aplicabilidad o la interoperabilidad), por lo que la observancia se consigue con el cumplimiento exacto y puntual de todas las disposiciones obligatorias. La obligatoriedad de un ele
21、mento preceptivo o requisito se expresa mediante las frases tener que, haber de, hay que + infinitivo o el verbo principal en tiempo futuro simple de mandato, en modo afirmativo o negativo. El hecho de que se utilice esta formulacin no entraa que la observancia se imponga a ninguna de las partes. 4
22、Rec. UIT-R BR.1352-3 2 Fichero de formato de onda de radiodifusin 2.1 Contenido de un fichero de formato de onda de radiodifusin Un fichero de formato de onda de radiodifusin (BWF) comenzar con el encabezamiento obligatorio MicrosoftRIFF WAVE y por lo menos los segmentos siguientes: RIFF(WAVE /* For
23、mato de la seal audio: MIC/MPEG */ /* la informacin sobre la secuencia audio */ /* el segmento ubxt se requiere slo para admitir un lenguaje de mltiples bytes */ /* el segmento ampliado se requiere slo para los formatos MPEG */ /* el segmento de extensin de audio MPEG se requiere slo para los format
24、os MPEG */ ) /* datos radiofnicos */ /* se requiere slo cuando se debe obtener informacin relativa a sucesos pertinentes que afectan a la calidad */ NOTA Es posible que en el fichero estn presentes otros segmentos. Algunos de ellos pueden estar fuera del alcance de la presente Recomendacin. Las apli
25、caciones pueden o no interpretar o utilizar estos segmentos, de modo que es imposible garantizar la integridad de los datos contenidos en ese tipo de segmento desconocidos. Sin embargo, las aplicaciones homologadas transferirn de manera transparente los segmentos desconocidos. 2.2 Segmentos existent
26、es definidos como parte de la norma RIFF La norma RIFF se define en documentos publicados por Microsoft3Corporation. Esta aplicacin utiliza varios segmentos que ya estn definidos, a saber: fmt-ck (segmento de formato) fact-ck (segmento ampliado) En el Apndice 1 al Anexo 1 figuran las descripciones a
27、ctuales de estos segmentos para informacin. 2.3 Segmento de extensin de audio de radiodifusin4Los parmetros suplementarios necesarios para el intercambio de material entre entidades de radiodifusin se aaden en un segmento especfico extensin de audio de radiodifusin que se define como sigue: broadcas
28、t_audio_extension typedef struct DWORD ckID; /* (broadcastextension)ckID=bext. */ DWORD ckSize; /* tamao de segmento de extensin */ BYTE ckDatackSize; /* datos del segmento */ 3Formato de fichero de intercambio de recursos (RIFF) de Microsoft, disponible (2005-12) en http:/ 4Para la definicin de seg
29、mento ubxt, que indica la informacin legible para el hombre del segmento bext en un conjunto de caracteres de mltiples bytes, vase el 2.4. Rec. UIT-R BR.1352-3 5 typedef struct broadcast_audio_extension CHAR Description256; /* ASCII : Descripcin de la secuencia sonora */ CHAR Originator32; /* ASCII
30、: Nombre del creador */ CHAR OriginatorReference32; /* ASCII : Referencia del creador */ CHAR OriginationDate10; /* ASCII : yyyy:mm:dd */ CHAR OriginationTime8; /* ASCII : hh:mm:ss */ DWORD TimeReferenceLow; /* Primer cmputo de muestras desde medianoche, palabra baja */ DWORD TimeReferenceHigh; /* P
31、rimer cmputo de muestras desde medianoche, palabra alta */ WORD Version; /* Versin del BWF; nmero binario sin signo */ BYTE UMID_0, /* Byte 0 binario de SMPTE UMID */ BYTE UMID_63, /* Byte 63 binario de SMPTE UMID */ CHAR Reserved190, /* 190 bytes, reservado para uso futuro, puesto a .NULL. * / CHAR
32、 CodingHistory, /* ASCII : Historial de codificacin */ BROADCAST_EXT, Campo Descripcin Description Cadena ASCII (256 caracteres como mximo) que contiene una descripcin libre de la secuencia. Para asistir a las aplicaciones que slo visualizan una breve descripcin, se recomienda que un resumen de la d
33、escripcin figure en los primeros 64 caracteres y que los ltimos 192 caracteres se utilicen para detalles. Si la longitud de la cadena es menor que 256 caracteres, el ltimo va seguido por un carcter nulo. (0x00) Originator Cadena ASCII (32 caracteres como mximo) que contiene el nombre del creador/pro
34、ductor del fichero audio. Si la longitud de la cadena es menor que 32 caracteres, el campo es terminado por un carcter nulo. (0x00) OriginatorReference Cadena ASCII (32 caracteres como mximo) que contiene una referencia unvoca asignada por la organizacin creadora. Si la longitud de la cadena es meno
35、r que 32 caracteres, el campo es terminado por un carcter nulo. (0x00) Un formato estndar para la informacin del identificador de fuente nico (USID, Unique Source Identifier), para utilizar en el campo OriginatorReference se ofrece en el Apndice 3 al Anexo 1 OriginationDate 10 caracteres ASCII que c
36、ontienen la fecha de creacin de la secuencia audio. El formato es ,ao,-,mes,-,da, con 4 caracteres para el ao y 2 caracteres para los otros tems. Ao se define de 0000 a 9999 Mes se define de 1 a 12 Da se define de 1 a 31 El separador entre los tems debe ser un guin conforme a la Norma ISO 8601. Cier
37、tas implementaciones tradicionales pueden utilizar _ subrayado : dos puntos espacio . punto; el equipo de reproduccin debe reconocer estos caracteres separadores. 6 Rec. UIT-R BR.1352-3 OriginationTime 8 caracteres ASCII que contienen la hora de creacin de la secuencia audio. El formato es hora,-,mi
38、nuto,-,segundo con 2 caracteres por tem. Hora se define de 0 a 23. Minuto y segundo se definen de 0 a 59. El separador entre los tems debe ser un guin conforme a la Norma ISO 8601. Ciertas implementaciones tradicionales pueden utilizar _ subrayado : dos puntos espacio . punto; el equipo de reproducc
39、in debe reconocer estos caracteres separadores. TimeReference Este campo contiene el cdigo temporal de la secuencia. Es un valor de 64 bits que contiene el primer cmputo de muestras desde medianoche. El nmero de muestras por segundo depende de la frecuencia de muestreo que se define en el campo (nme
40、ro de muestras por segundo) de (segmento de formato). Version Un nmero binario sin signo que indica la versin del BWF. En la versin 1, se pone a 0x0001. UMID 64 bytes que contienen un UMID ampliado definido por SMPTE 330M. Si se utiliza un UMID bsico de 32 bytes, los ltimos 32 bytes se rellenarn con
41、 ceros. Si no se disponde de ningn UMID, los 64 bytes se rellenarn con ceros. NOTA La longitud del UMID se codifica al comienzo del propio UMID. Reserved 190 bytes reservados para extensin. Estos 190 bytes deben ponerse a cero. CodingHistory Bloque de caracteres ASCII de tamao variable que comprende
42、 0 o ms cadenas, cada una de ellas terminada por . El primer carcter no utilizado ser un carcter nulo (0x00). Cada cadena debe contener una descripcin del proceso de codificacin aplicado a los datos de audio. Cada nueva aplicacin de codificacin tiene que aadir una nueva cadena con la informacin apro
43、piada. En el Apndice 2 del Anexo 1 figura un formato normalizado para la informacin del historial de codificacin. Esta informacin debe contener el tipo de sonido (MIC o MPEG) con sus parmetros especficos: MIC: modo (monofnico, estereofnico), tamao de la muestra (8, 16 bits) y frecuencia de muestreo.
44、 MPEG: frecuencia de muestreo, velocidad binaria, capa (I o II) y el modo (monofnico, estereofnico, estereofnico asociado o canal dual). Se recomienda que los fabricantes de los codificadores proporcionen una cadena ASCII para utilizarla en la historia de codificacin. 2.4 Segmento de extensin de aud
45、io de radiodifusin universal La informacin contenida en el segmento de extensin de audio de radiodifusin (bext) definido en el 2.3 puede ser transmitido tambin mediante un segmento especfico llamado extensin de audio de radiodifusin universal o segmento ubxt, que indica la informacin legible para el
46、 hombre del segmento bext en lenguajes de mltiples bytes. La estructura bsica de este segmento de metadatos es la misma que la correspondiente al segmento bext. Cuatro tems legibles para el Rec. UIT-R BR.1352-3 7 hombre, uDescription, uOriginator, uOriginatorReference y uCodingHistory, se describen
47、en UTF-8 (formato de transformacin nico de 8 bits) y no ASCII. Los primeros tres tems tienen 8 veces el tamao de los datos de los tems correspondientes en el segmento bext. La estructura del segmento ubxt se define como sigue: typedef struct chunk_header DWORD ckID; /* (extensin de radiodifusin univ
48、ersal)ckID=ubxt */ DWORD ckSize; /* tamao del segmento de extensin */ BYTE ckDatackSize; /* datos del segmento */ CHUNK_HEADER; typedef struct universal_broadcast_audio_extension BYTE uDescription256*8; /* UTF-8 : Descripcin de la secuencia sonora */ BYTE uOriginator32*8; /* UTF-8 : Nombre del creador */ BYTE uOriginatorReference32*8; /* UTF-8 : Referencia del creador */ CHAR OriginationDate10; /* ASCII : yyyy:mm:dd */ CHAR