ITU-R BS 1693 FRENCH-2004 Procedure for the performance test of automated query-by-humming systems《自动哼唱检索系统性能测试的过程》.pdf
《ITU-R BS 1693 FRENCH-2004 Procedure for the performance test of automated query-by-humming systems《自动哼唱检索系统性能测试的过程》.pdf》由会员分享,可在线阅读,更多相关《ITU-R BS 1693 FRENCH-2004 Procedure for the performance test of automated query-by-humming systems《自动哼唱检索系统性能测试的过程》.pdf(6页珍藏版)》请在麦多课文档分享上搜索。
1、 Rec. UIT-R BS.1693 1 RECOMMANDATION UIT-R BS.1693 Procdure de test des systmes automatiques de requte par fredonnement (Question UIT-R 8/6) (2004) LAssemble des radiocommunications de lUIT, considrant a) que, terme, des mtadonnes accompagneront la plupart des systmes de diffusion audio; b) que la p
2、roduction automatique de mtadonnes sera ncessaire pour offrir dans lavenir un service complet prsentant un bon rapport cot-efficacit; c) que les systmes de requte par fredonnement offrent un moyen naturel dinterrogation des bases de donnes audio; d) que diffrents systmes dextraction de mtadonnes son
3、t mis au point actuellement; e) que la Recommandation UIT-R BS.1657 Procdure de test des systmes automatiques didentification audio, dcrit une procdure de test des systmes automatiques didentification audio; f) que le Groupe de Travail 11 de lISO/CEI JTC 1/SC 29 labore actuellement, sous la forme df
4、initive, des systmes de codage de mtadonnes pour les donnes multimdias; g) que, jusqu prsent, aucune procdure dvaluation de la qualit des systmes dextraction de mtadonnes audio relatifs la reconnaissance des mlodies na t normalise, recommande 1 dutiliser la procdure dcrite dans lAnnexe 1 pour valuer
5、 la qualit de fonctionnement des systmes automatiques de requte par fredonnement. Annexe 1 Procdure de test des systmes automatiques de requte par fredonnement 1 Introduction A lheure dun accroissement toujours plus grand des bases de donnes contenu musical, quelles contiennent de vritables donnes a
6、udio ou des mtadonnes associes (donnes sur les donnes), lexigence doutils permettant de conserver ces masses de donnes devient galement chaque jour plus urgente. Ce souhait nest pas seulement exprim par des professionnels, mais galement par le simple amateur de musique utilisateur de lInternet qui n
7、avigue frquemment sur la Toile la recherche de son style musical prfr. Pour faciliter lextraction des donnes souhaites, on peut distinguer ici deux niveaux dabstraction: La recherche de mtadonnes de haut niveau telles que les dcrivait un auditeur (mlodie, rythme, timbre, instrumentation ou genre par
8、 exemple). On peut citer comme exemple dapplication les systmes de requte par fredonnement, qui peuvent tre utiliss par les moteurs de recherche. 2 Rec. UIT-R BS.1693 Lextraction de mtadonnes de niveau intermdiaire pour lidentification automatique de certaines interprtations de contenus musicaux. De
9、s caractristiques techniques dcrivant les donnes audio (contenu spectral, etc.) sont gnres puis compares une base de donnes connue, crant ainsi un lien vers des mtadonnes pertinentes telles quun nom dartiste, le titre dune chanson, etc. Pour un aperu de ltat actuel des techniques en matire de systme
10、s de requte par fredonnement, on se rfrera au Document de lISMIR 2002 (3rd International Conference on Music Information Retrieval, IRCAM Centre Pompidou Paris, France, octobre 2002). 2 Objet Pour rpondre aux exigences de lindustrie musicale, le taux de reconnaissance des techniques appliques de req
11、ute par fredonnement doit tre lev et ne pas tre dgrad par les altrations courantes subies par les reprsentations stockes dans la base de donnes musicales. Ce problme est trait par un certain nombre de solutions diffrentes, souvent propritaires, qui sont apparues rcemment (Clarisse et autres, 2002, G
12、hias et autres, 1995, Haus et Pollastri, 2001, Heinz et Brckmann, 2003). Pour toutes ces mthodes, cependant, les mmes problmes se posent quant leur robustesse vis-vis de modifications ou de dtriorations des donnes dorigine. Il convient donc de proposer que les systmes de requte par fredonnement soie
13、nt idalement aussi prcis et robustes vis-vis de modifications apportes aux signaux que le sont la perception et la reconnaissance humaine. Par consquent, un systme de requte par fredonnement sophistiqu doit tre robuste vis-vis des diffrentes distorsions de qualit du signal et variations par rapport
14、la mlodie idale. Par ailleurs, le maniement fiable de grandes bases de donnes musicales comprenant plusieurs milliers de chansons devrait galement tre assur. En consquence, pour valuer la qualit dun systme automatique de requte par fredonnement, il faut dfinir un environnement de test couvrant diffr
15、ents types de modification des signaux et dcrivant la faon de dterminer dautres paramtres essentiels du systme. Une procdure de test unifie est ncessaire pour parvenir une valuation objective de ces systmes de requte. 3 Paramtres de qualit Il convient de considrer les paramtres de qualit ci-aprs pou
16、r valuer les systmes de requte par fredonnement: Donnes audio dentre requises: Doit-on fredonner une partie prcise de la chanson ou peut-on en chanter une partie quelconque? Quelle est la taille minimale des donnes audio dentre pour obtenir un rsultat fiable? Taille de la reprsentation des donnes: C
17、ombien de donnes (octets) par chanson doivent tre stockes dans la base de donnes musicales? Taille de la base de donnes musicales: Combien de chansons peuvent tre traites dans la base de donnes musicales? Rec. UIT-R BS.1693 3 Mode didentification: De quelle faon le type de donnes dentre (chant dans
18、la langue maternelle, ou chant fredonnement dun air tel que na na na, etc., utilisation dun instrument de musique quelconque) a-t-il une incidence sur le taux de reconnaissance et sur la qualit de fonctionnement? Vitesse de reconnaissance de la mlodie: Quel est le temps ncessaire pour identifier une
19、 mlodie? Comment varie cette dure avec le nombre de chansons figurant dans la base de donnes? Comment varie cette dure avec la qualit des donnes dentre? Pour valuer ces proprits dune manire raliste et donc pour dterminer si un systme est adapt des applications relles, un environnement de test doit p
20、rsenter des conditions aux limites constantes en ce qui concerne les caractristiques testes. Les conditions de test doivent porter sur: la taille et le contenu de la base de donnes musicales (voir le 4); la taille des donnes de requte (en termes de dure denregistrement) et le nombre denregistrements
21、 de test (voir le 4); les rgles exactes de modification des enregistrements de test (voir le 5 et le 6); et la plate-forme de calcul (spcification de lunit centrale, de la mmoire et du systme dexploitation) (voir le 7). 4 Slection des donnes de test et taille de la base de donnes musicales Une base
22、de donnes contenant des chantillons musicaux de rfrence et laquelle tous les systmes pourraient adresser leurs requtes devrait tre dfinie. Elle devrait comprendre un mlange des diffrents styles musicaux (musiques populaires de diffrents pays, musique classique, ) avec une priorit donne lchelle mondi
23、ale aux chansons les plus connues. Il faudra particulirement veiller viter la duplication des enregistrements dans la base de donnes (reprises, etc.). Une base de donnes musicales comprenant 500 1 000 chansons est suggre pour une valuation statistiquement fiable et pertinente. Etant donn quil est di
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
本资源只提供5页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITURBS1693FRENCH2004PROCEDUREFORTHEPERFORMANCETESTOFAUTOMATEDQUERYBYHUMMINGSYSTEMS 自动 哼唱 检索系统 性能 测试 过程

链接地址:http://www.mydoc123.com/p-790330.html