1、信息组织,参考教材,1.信息组织原理与方法.司莉编著.武汉大学出版社,2011年3月 2.情报语言学基础(增订二版).张琪玉著,武汉大学出版社,最新版 3.信息组织(第三版).马张华著.清华大学出版社,2011年3月 4.信息组织(第三版).周宁著.武汉大学出版社,2012年2月 5.A. C. Foskett,A. C. The Subject Approach to Information Retrieval, 5th ed. , Information Resources Press, 1997 _第一、二章 性质:学位课 学分: 2 总学时数: 考核方式: 闭卷考试,赖茂生教授总结出十
2、大领域为情报学前沿领域:,1 知识组织。重点是元数据、本体、语义Web、自动标引与分类、自动编目(元数据收割和自动创建)。 2 情报检索。主要指四大检索,即智能检索、基于内容检索、情报检索语言的问题(包括自然语言检索和跨语言检索)。 3 情报研究。重点是竞争情报分析、商务智能、数据挖掘、数据融合、知识发现。 4 信息资源管理与知识管理。还包括战略信息管理与系统、网络信息资源管理。 5 数字图书馆。包括数字化信息资源整合、数字资源长期保存以及知识组织和情报检索中有关的领域。 6 网络用户行为研究。重点是用户搜索行为研究、人机交互(HCI)理论与技术、认知模型。 7 情报学理论。重点是信息构建理论
3、、元理论、社会网络理论、信息哲学、信息生态学、信息化理论、泛在信息环境、信息公平与数字鸿沟问题、数字环境下的学术交流模式。 8 信息计量学。重点是网络计量学以及文献计量学的某些方面,如网络信息资源生产规律、分散规律、增长规律、老化规律、网络语言分析、引用行为分析、链接行为分析、域名分析、点击率分析等。 9 信息政策与法律。重点是信息公平政策、开放获取政策、互联网治理、信息安全政策、数字化环境下的知识产权保护、隐私保护、信息伦理问题。 10 信息经济学。重点是信息资源的价值评估、信息产品和服务的定价与营销问题、智力资产管理、社会资本管理、信息内容产业、知识服务业。 其中:知识组织、情报检索、情报
4、研究是情报学的三大支柱。,信息组织研究领域,信息组织基本理论方法的研究; 信息组织的发展及其类型的研究; 信息描述规范的基本理论研究; 信息描述研究; 类表、词表研究 ; 标引理论与技术的研究; 信息检索工具研究; 计算机技术应用的研究; 自然语言在信息检索中应用的研究; 各种对象资源组织研究; 信息组织在联机系统和网络环境下的应用研究。,信息组织研究领域的三个层面,理论层面。研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。 规范层面。是进行信息组织必须共同遵守的规范。为信息组织的操作提供实施的规范和依据。 方法层面。指信息资源组织技术方法,包括操作的技术方法、信息组织的管
5、理、具体标引规则、描述规则等。其作用是按照信息资源组织的要求进行操作、实现信息资源系统的组织。,信息组织的基本方法,基本方法,传统型,网络型,分类法,主题法,主页方式,自由文本法,超文本方法,搜索引擎,一次信息,二次信息,主题树法,字顺法,时空组织法,随机法,:Google、Baidu等,:Yahoo、Sohu等,信息组织的技术,基本技术 1计算机技术信息处理 2通信技术信息传输 3控制技术信息控制 4传感技术信息支柱,高新技术 1自动分类标引技术 2自动主题标引技术 3汉语分词技术 4字符识别技术 5语音识别与语音合成技术,信息组织研究的主要内容,1信息资源描述 (1)文献著录标准化 (2)
6、网络信息资源描述标准化MARC格式与新的元数据(Metadata)方案 2信息资源标引 (1)分类标引 (2)主题标引 3信息资源的整序与存储 (1)传统印刷文本的整序与存储 (2)数字化的信息对象的整序与存储Web数据库与搜索引擎,如中国知网(CNKI)和百度(baidu) 4信息资源的检索与利用 (1)检索语言:对文本、概念、图像、数值、表格、音频、视频等的检索。 (2)检索原理:匹配过程,本次课程内容及讲述次序,信息组织概述 分类法 分类标引与检索工具 主题法 主题标引与检索工具 信息描述与组织 网络信息组织,第一章 信息组织概述,11,本章内容,第一节 信息组织的含义与信息组织工具的类
7、型 第二节 信息组织的理论基础 第三节 分类法的基本特征与作用 第四节 主题法的基本特征与作用,12,第一节 信息组织的含义与信息组织 工具的类型, 信息组织的含义,信息组织就是根据信息检索与获取的需要,采用一定的规则、技术与方法,对信息进行揭示与序化的过程。,13, 信息组织必要性,信息组织是信息检索的基础,在信息系统中,信息组织是依据信息资源的主题内容或外部特征,将无序的信息资源组织为有序集合的过程,也就是建立检索系统的过程。 只有对信息进行序化,才能有效地获取与利用。两者相互依存、互为因果。,信息组织的对象信息资源范围,信息资源通常是指一切记录形式存在的信息载体 。 按基本类型,包括:书
8、籍、期刊、报纸、论文、标准、档案等各种类型; 按媒体的形式,包括:印刷型资源,缩微型、机读型资源,网上资源等。,信息组织处理层次,至少存在三种基本层次: 直接以信息资源存在单元为处理对象,如,以一图书、期刊、网站等为处理单元; 以期刊、报刊、网站中的个体,如论文、新闻、网站中的构成单元如网页等为处理单元; 直接以其中的信息成分作为处理的单元。,信息组织与信息检索关系,两者关系: 信息组织是信息检索的基础和前提 。 信息检索是信息组织的目的 。,信息组织与检索需要的关系简要流程图,传统信息处理的方法 对信息资源特征进行描述。包括:著录或编写题录。作用:记录信息资源外部特征,确认该资源。 对信息资
9、源的内容进行浓缩。包括:编写内容提要或文摘。作用:使用户能迅速了解其内容,供选择使用。 提供检索点。包括:著者名、标题名称、出版机构名等,分类号和主题词;机检系统中,文摘和提要中的语词。作用:确定可检信息,供有序化组织。, 信息组织的常用方法,在标引和检索过程中,信息组织工具,或称情报检索语言,是标引和检索人员的共同工具,是沟通存储与检索的桥梁,是情报检索系统的重要组成部分,在检索过程中起到“语言”保证作用,在用户检索与浏览界面中也起来关键作用。,信息处理的依据控制语言,控制语言,是根据信息资源组织和检索的需要制订的信息标识选择和组织的规范。包括:资源描述语言,如图书馆的编目规则,元数据规范等
10、;情报检索语言,或知识组织系统,如分类法、主题法等。,资源描述语言,如图书馆的编目规则,元数据规范等。以统一、有效的方式记录资源信息、特征。 情报检索语言一种由表达文献主题概念及其相互关系的词汇及规则组成的人工语言系统,对应的控制语言为标引语言(indexing language)。 检索语言组成: 词汇各种词表,包括分类表或标题表、叙词表等。 语法指分类标引和主题标引的规则系统。 关于知识组织系统(KOS)-是表达知识结构工具的统称,其范围比传统的检索语言更广,它试图包含各种类型组织信息、促进知识管理的词表,包括较少传统意义的知识组织工具,如语义网、本体等。,知识组织系统 (KOS) 一览,
11、资料来源:曾蕾:受控语言标准最新进展,检索体系的类型: 1)按照检索工具的处理对象和特点 2)按照标识特征和提供的检索途径分 3)按照所用标识是否控制 4)按照标识组配特点,25,添加标题,添加标题,添加标题,集成组织法,分类组织法,主题组织法, 信息组织的常用方法,按一定的知识概念体系的树状等级结构或分面结构来组织信息,提供字顺检索途径,并主要采用参照系统揭示词间关系来标引和检索文献,多种信息组织方法的结合,26,概念逻辑基础,第二节 信息组织的理论基础,规范控制的依据,1.逻辑知识 2.知识分类,28,概念的内涵:概念所反映的对象的本质属性。特征:概念的内涵是概念质的方面,它回答对象“是什
12、么”或“什么样”问题。例如:什么是“飓风(台风)”?,概念的外延:就是具有概念所反映的本质属性的对象或对象范围。特征:概念的外延是概念量的方面,它回答对象“有哪些”或“是哪些”。例如:“飓风”的种类或范围?,概念的内涵与外延的反变关系 :内涵越多,外延就越小;内涵越少,外延越大,概念的逻辑特征,29,概念的限定增加概念的内涵缩小概念的处延。如:生物工程学仿生学人机系统仿生学,概念的概括减少概念的内涵扩大概念的处延。如:高空气候学气候学气象学,概念的限定与概括,30,划分的含义与组成含义:概念的划分是将一个属概念分为若干个种概念的方法,它是揭示概念外延的逻辑方法。如:如何划分“雕塑”?(按材料分
13、),划分的规则划分必须遵守以下4条划分规则:(1)划分后子项外延之和等于其母项;(2)划分后的子项必须是互相排斥的;(3)每次划分必须按照同一标准进行;(4)划分必须逐级进行。,概念的划分及其规则,31,概念的分析与综合,概念的分析包含两个重要步骤,首先是分,分解整体为部分;接着是析,找出内在的本质规定性,分析就是把研究对象分解为部分,并认识这些“部分”的一种方法。所谓综合,就是找到各部分、文献或要素间的本来联系,将它们还原为一个有机的整体,逻辑知识概念逻辑是信息组织的基础,事物,概念,语词,33,概念逻辑的应用,概念的限定与概括、概念的划分原理能够为文献分类法等级结构体系的建立提供逻辑基础。
14、概念的限定与概括、概念的划分实质上就是利用概念内涵与的反变关系,即通过增加或减少概念内涵(缩小或扩大概念的外延)来形成一系列新的具有隶属、并列关系的概念,从而表达各种客观事物及其内在联系。如中图法法律类目。法的理论、法学各部门、中国法律、各国法律、国际法律而概念的分析与综合为分类法的分面组配结构以及叙词表提供逻辑基础。运用这一原理,便可将概括文献内容与事物的各种类目按不同的分类标准,组成不同的分面,形成“基本分面亚面子目”等结构体系,用以表达新主题或复杂主题概念时进行组配使用。如冒号分类法文学类目。语言、体裁、著者、作品4个标准,34, 概念的限定与概括原理、概念的划分原理为文献分类法等级体系
15、的建立提供逻辑基础, 概念的分析与综合原理为原理为文献分类法的分面组配结构的建立提供逻辑基础,二、知识分类,科学分类体系 学科分类体系 事物分类体系 行业分类体系等,信息组织必须依据人类对知识的知识关系的发现,知识分类体系根据对知识之间关系的了解建立的系统。 例如,植物的分类。单靠逻辑不能解决,必须利用人类的研究、发现,包括等知识之间关系的了解。,(1)科学分类体系,科学分类是根据对科学之间关系的认识建立的体系。它关系到科学整体之间的关系,涉及对对世界的看法,是与世界观相联系的,是一个哲学问题。 部分有影响的分类体系 亚里士多德 培根 恩格斯科学分类体系 集结层次论,亚里士多德分类体系,依据:
16、从人类的活动出发 理论哲学(逻辑学、物理学、数学、形而上学) 实践哲学(伦理学、经济学、政治学) 创造哲学(诗学、修辞学、艺术)。,培根的分类体系,从人类的心理特征出发,将人类的知识分为三类: 记忆知识历史 想象知识诗歌 理性知识哲学,恩格斯的分类体系,恩格斯根据客观、发展原则提出: 数学、力学、星体、地球、原子和分子运动、原子(物理)、分子(化学)生物学(生物的运动)、植物、动物、社会科学、人类思维,集结层次论,严格按照主题对象的集结层次确定分类序列的一种分类理论。,(2)学科分类体系,如我国1992年编制的学科分类代码 依据原则为: 科学性、 实用性、 简明性、 兼容性、 扩延性、 唯一性
17、。,信息资源组织对分类的借鉴,作为信息资源分类的基础,用于建立合理的信息组织的结构; 作为基本类目门类的设置依据; 作为主题系统中范畴处理的依据; 作为专门领域下具体类目的设置依据; 作为类目之间关系、词间关系处理的依据等。,46,以知识分类为基础 在确定分类体系时要以知识分类为基础,充分利用知识分类的成果。这条原则要求文献分类法应当以反映科学家和教育家一致意见的知识分类为基础,要与学校系科和课程设置、科学研究机关的业务分工和规划取得大体一致的意见。知识系统化学科体系学科分类情报科学系统化始终是情报检索语言研究不能离开的基本方向!要充分反映知识分类。,知识分类的应用,47,类目与科学分类体系相
18、符必须以各门学科的研究对象为基础,而这些研究对象便是自然界、人类社会和思维领域客观存在的事物,同时科学分类还必须反映科学知识之间的内在联系,也就是按照事物本身存在的客观关系加以排列与组合。分类法的类目与科学分类体系两者基本相符。,课后作业:,1。国内图书情报学有哪些重要期刊?你是怎样认识和评价一个期刊的? (要求第一小组完成)2。什么是文献、情报、数据、信息、概念、知识、智慧?它们有什么区别和联系? (要求第二小组完成)3。你是怎样理解检索语言与检索系统之间的关系。请以实例说明 。 (要求第三小组完成)要求: 先以小组方式讨论,然后要求做成简单的ppt文档。,思考,1.从文献组织、情报组织、信息组织到知识组织,Web2.0下的信息组织、个人信息组织与管理,在组织方式上的区别和联系? 2.为什么说“失去控制和无组织的信息不再是一种资源”? 3.信息组织在信息产业中的地位与作用?,术语查询,信息 信息组织与信息组织学 信息资源描述 元数据 自动聚类与自动归类 图文转换 语音识别与语音合成 自动抽词标引与自动赋词标引 汉语分词技术,