ITU-R BS 1693 SPANISH-2004 Procedure for the performance test of automated query-by-humming systems《自动哼唱检索系统性能测试的过程》.pdf
《ITU-R BS 1693 SPANISH-2004 Procedure for the performance test of automated query-by-humming systems《自动哼唱检索系统性能测试的过程》.pdf》由会员分享,可在线阅读,更多相关《ITU-R BS 1693 SPANISH-2004 Procedure for the performance test of automated query-by-humming systems《自动哼唱检索系统性能测试的过程》.pdf(6页珍藏版)》请在麦多课文档分享上搜索。
1、 Rec. UIT-R BS.1693 1 RECOMENDACIN UIT-R BS.1693 Procedimiento para probar la calidad de los sistemas automatizados de consulta cantada (Cuestin UIT-R 8/6) (2004) La Asamblea de Radiocomunicaciones de la UIT, considerando a) que en el futuro los metadatos acompaarn a la mayora de las transmisiones d
2、e radiodifusin de audio; b) que la generacin automtica de metadatos ser necesaria para ofrecer un servicio completo y rentable en el futuro; c) que los sistemas de consulta cantada constituyen una forma natural de interrogar a los bancos de datos de audio; d) que hoy en da se han desarrollado divers
3、os esquemas para la extraccin de metadatos de audio; e) que la Recomendacin UIT-R BS.1657 Procedimiento para probar la calidad de funcionamiento de los sistemas de identificacin automtica de audio, describe un procedimiento para las pruebas de calidad de los sistemas de identificacin automtica; f) q
4、ue el ISO/CEI JTC 1/SC 29 WG 11 est concluyendo actualmente esquemas de codificacin de metadatos para datos multimedio; g) que hasta el momento no se han normalizado procedimientos de evaluacin de la calidad de los esquemas de extraccin de metadatos de audio, recomienda 1 que para evaluar la calidad
5、 de funcionamiento de los sistemas automatizados de consulta cantada se utilice el procedimiento descrito en el Anexo 1. Anexo 1 Procedimiento para evaluar la calidad de funcionamiento de los sistemas por pseudomeloda automatizados de interrogacin 1 Introduccin En una poca en la que cada vez hay ms
6、bases de datos sobre contenido musical, ya sea material genuino de audio o sus metadatos (datos sobre los datos), tambin hay una demanda cada vez ms apremiante de aplicaciones para mantener ese gran volumen de datos. A esta demanda no slo contribuyen profesionales, tambin usuarios comunes de Interne
7、t y melmanos que buscan en la Red informacin sobre su estilo musical preferido. Para facilitar la recuperacin de la informacin deseada se distinguen dos niveles de abstraccin: La bsqueda de metadatos de nivel superior, tal como un oyente humano describira el contenido, por ejemplo, la meloda, el rit
8、mo, el timbre, la instrumentacin o el gnero. Como ejemplo de aplicacin se puede citar un sistema de consulta cantada, el cual puede utilizarse como referencia para posibles recomendaciones. 2 Rec. UIT-R BS.1693 La extraccin de metadatos de nivel medio para la identificacin automtica de ciertas inter
9、pretaciones de contenidos musicales. Descripciones de los aspectos tcnicos de los datos de audio (contenido espectral, etc.) se extrae y compara con un banco de datos de material conocido, creando con ello un enlace a metadatos tales como los de artista o nombre de la cancin. Para una panormica del
10、estado actual de la tcnica de los sistemas de consulta cantada, vase el documento ISMIR 2002 (3rd International Conference on Music Information Retrieval, IRCAM Centre Pompidou Paris, France, octubre de 2002. 2 Motivacin Para satisfacer la demanda de la industria discogrfica, la velocidad de identif
11、icacin de la tecnologa utilizada de consulta cantada debe ser alta y debe soportar las alteraciones y modificaciones habituales de las representaciones almacenadas en el banco de datos de canciones. Este problema se aborda mediante una serie de soluciones distintas, a menudo patentadas, surgida reci
12、entementeClarisse y otros, 2002, Ghias y otros, 1995, Haus y Pollastri, 2001, Heinz y Brckmann, 2003, si bien, todos los mtodos se enfrentan a los mismos problemas relacionados con su inmunidad ante las modificaciones del material original. Ello lleva a la propuesta de que los sistemas automatizados
13、 de consulta cantada deben ser en teora tan precisos y tolerantes ante las modificaciones de la seal como la percepcin y la identificacin humanas. Por tanto, un sistema avanzado de consulta cantada tiene que tener una gran inmunidad ante las distintas distorsiones respecto a la calidad de la seal y
14、las variaciones respecto a las entradas de meloda ideal. Adems, debe incorporar un tratamiento fiable de grandes bancos de datos de canciones compuestos por varios miles de ellas. Por consiguiente, para evaluar la calidad de un sistema de consulta cantada se ha de definir un entorno de prueba en que
15、 abarque los diferentes tipos de modificaciones de la seal y que describa cmo determinar otros parmetros esenciales del sistema. Para poder evaluar objetivamente los sistemas de identificacin se necesita un procedimiento de prueba unificado. 3 Parmetros de calidad Para la evaluacin de los sistemas d
16、e consulta cantada se han de considerar los siguientes parmetros de calidad: Entrada de audio requerida: Es necesario cantar una cierta parte de la cancin o es posible cantar cualquier parte? Cul es la longitud mnima de la entrada para dar un resultado fiable? Tamao de la representacin de los datos:
17、 Cuntos datos (bytes) por cancin han de almacenarse en un banco de datos musical? Tamao del banco de datos musical: Cuntas canciones pueden guardarse en un banco de datos musical? Rec. UIT-R BS.1693 3 Modo de identificacin: Cmo influye en la velocidad de identificacin y en la calidad el tipo de entr
18、ada, tal como el canto en lengua materna, el tarareo o los modos de cantar del tipo la-la-la, etc.? Velocidad de identificacin de la meloda: Cunto tiempo lleva identificar una meloda? Cmo se conjuga ello con el nmero de canciones del banco de datos musical? Cmo se conjuga ello con la calidad de los
19、datos de entrada? Para evaluar estas propiedades de forma sensible y mostrar con ello la conveniencia de un sistema para aplicaciones del mundo real, un entorno de pruebas debe tener condiciones de contorno constantes en relacin con las caractersticas que se prueban. Las condiciones de prueba pertin
20、entes son: el tamao y contenido del banco de datos musical (vase el 4); el tamao de la interrogacin (en referencia a la duracin de la meloda) y el nmero de elementos de prueba (vase el 4); las reglas exactas de modificacin de los elementos de prueba (vanse los 5 y 6); y la plataforma de clculo, que
21、incluye la especificacin de la unidad de procesamiento central (CPU), la memoria y el sistema operativo (vase el 7). 4 Seleccin del material de prueba y del tamao del banco de datos musical Debe definirse un banco de datos de muestras musicales de referencia respecto al que plantean su interrogacin
22、todos los sistemas. El banco debe contener una mezcla de distintos estilos musicales (canciones populares de diferentes pases, clsica, .) con prevalencia de las canciones ms familiares a nivel mundial. Debe adoptarse una proteccin especial para evitar la duplicacin de elementos en el banco de datos
23、(nuevas grabaciones, etc.). Para una evaluacin estadsticamente fiable y pertinente se sugiere un tamao del banco de datos musical comprendido entre 500-1 000 canciones. Como la preparacin de representaciones abstractas de gran calidad de canciones musicales en la forma necesaria para la bsqueda en e
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
本资源只提供5页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITURBS1693SPANISH2004PROCEDUREFORTHEPERFORMANCETESTOFAUTOMATEDQUERYBYHUMMINGSYSTEMS 自动 哼唱 检索系统 性能 测试

链接地址:http://www.mydoc123.com/p-790331.html