ImageVerifierCode 换一换
格式:PPT , 页数:23 ,大小:969.50KB ,
资源ID:389261      下载积分:2000 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
如需开发票,请勿充值!快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
注意:如需开发票,请勿充值!
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【http://www.mydoc123.com/d-389261.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于有指导的音乐实体关系抽取.ppt)为本站会员(outsidejudge265)主动上传,麦多课文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文库(发送邮件至master@mydoc123.com或直接QQ联系客服),我们立即给予删除!

基于有指导的音乐实体关系抽取.ppt

1、基于有指导的音乐实体关系抽取,学 生:王莉峰指导老师:秦 兵 老师日 期:2009-6-7,2,提纲,课题简介 主要研究内容 研究方法和实施方案 下一步工作,3,提纲,课题简介 什么是信息抽取? 什么是音乐实体类型? 什么是音乐实体关系抽取? 为什么选择音乐领域? 主要研究内容 研究方法和实施方案 下一步工作,4,位置 关系,知识数据库,吉林大学坐落在北国春城 -长春市,它创立于1946年,前身为东北行政学院,是教育部直属的一所全国重点综合性大学。,吉林大学坐落在北国春城 -长春市,它创立于1946年,前身为东北行政学院,是教育部直属的一所全国重点综合性大学。,关系表,吉林大学 它 东北行政学

2、院,北国春城 长春市,1946年,机构成立时间,教育部,附属关系,5,问答系统 智能化搜索,信息抽取 细粒度挖掘,面向IR的NLP: (分词、词性标注、命名实体识别、依存句法分析、词义消歧、语义角色标注等),用户,文档,理解文档 抽取信息,理解语言,理解用户 智能交互,垂直搜索 精准化搜索,互联网,基于NLP的IR,结构化数据,提问、log,答案,采集信息,结构化数据,非结构化数据,6,什么是音乐实体类型?,命名实体(Named Entity, NE) 实体名:人名、地名、机构名、专有名词、时间等 例子:在2008年11月7日吉林大学召开的全校干部大会上,任命原山东大学校长展涛为吉林大学校长。

3、 音乐命名实体(Music Named Entity, MNE) 艺术家名、艺术家别名、歌曲名、专辑名、唱片公司名、时间 例子:亚洲天王周杰伦发行第六张国语专辑十一月的萧邦,新专辑包含了夜曲、发如雪等十二首动听的歌,大家可以在专辑当中,嗅出周董潜藏的浪漫古典因子。,7,什么是音乐实体关系抽取?,在音乐实体识别的基础上,判断一个句子中任意两个实体是否属于我们预先定义好的某种关系。 例子:08年12月,蔡依林3000万改签华纳唱片。,8,为什么选择音乐领域?,通用域的难点 没有完善的关系类型体系 建立关系类型体系困难 关系类型太多 关系如何命名呢? 覆盖面要尽可能全 细化、准确 领域收缩:乐坛、电

4、子产品、教育、体育等 研究方法可移植,也是某种意义上的通用域,9,提纲,课题简介 主要研究内容 研究方法和实施方案 下一步工作,10,主要研究内容,音乐实体关系抽取,基于有指导的学习方法,11,提纲,课题简介 主要研究内容 研究方法和实施方案 语料库建设 特征提取 模型训练 评测 下一步工作,12,语料库建设,来源:新浪音乐新闻(2008.8-2009.3) 处理流程,新闻文本,断句,分词、 词性标注、 音乐实体 识别,句子,句子,句子,制定标 注规范、 人工标 注语料,音乐实体 关系抽取 语料库,随机筛选 10000句 作为待标 注语料,13,音乐实体关系抽取技术介绍,训练过程 识别过程,训

5、练数据 (2/3),测试数据 (1/3),特征提取,SVM训练/ MaxEnt训练,SVM模型/ MaxEnt模型,SVM分类/ MaxEnt分类,识别结果,语料库,随机筛选 实验数据,14,训练过程-特征提取,输入:训练语料&词法句法信息 输出:特征文件 例如:在/p 北京/ns 奥运会/j 开幕式/n 上/nd ,/wp 刘欢/Na 和/c 莎拉布莱曼/Na 共同/d 演绎/v 了/u 主题歌/n 我和你/Nc 。/wp 特征提取器 实体1的类型 实体2的类型 实体1和实体2之间的第一个动词 实体1前面的第一个词 实体2后面的第一个词 实体1前面第一个词的词性 实体2后面第一个词的词性 ,

6、15,训练过程-SVM or MaxEnt,输入:特征文件 输出:分类模型文件 开源的SVM工具包:Libsvm 2.89 http:/www.csie.ntu.edu.tw/cjlin/libsvm/ 开源的MaxEnt工具包:OpenNLP.maxent http:/ 区别 特征文件中无类别信息,17,识别过程-SVM or MaxEnt分类,输入:特征文件 输出:类别编号,18,评测方法与结果,评测指标为准确率(P)、召回率(R)和F值,19,评测方法与结果,20,21,大纲,课题简介 主要研究内容 研究方法和实施方案 下一步工作,22,下一步工作,目前只处理了5种最常见的音乐实体关系 特征提取优化 歌曲-专辑效果较低 核函数方法 存在代词,需要共指消解模块处理 句子级关系抽取-篇章级关系抽取 ,谢谢各位老师!,

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1