1、第一节 信息检索及其类型 第二节 信息检索语言 第三节 信息检索技术 第四节 检索工具,第二章 信息检索基础知识,第一节 信息检索及其类型,一、信息检索的概念 二、信息检索的类型 三、信息检索的意义,一、信息检索信息检索:是指将信息 (主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信 息的过程。,信息检索,存储,检索,存储:是对信息进行著录、 标引、整序,编制检索工 具和建立检索系统的过程。,检索:是指面向信息需求 而进行高度选择性的查找 过程。,二、信息检索的类型,(一)按检索内容划分,2、数据检索是以数据为检索内容的信息检索,要求从检索系统存储的大量原始调查数据和
2、其它统计数据中查出所需的数字资料。,1、书目检索是以文献线索为检索内容的信息检索。,3、事实检索是以具体事项为检索内容的信息检索,要求从检索系统存储的各种原始信息资源中查出专门的事实材料。,4、全文检索即检索系统存储的是整篇文章或整本图书。 5、图像检索即以图形、图像或图文信息为检索内容的信息检索。 6、多媒体检索是以文字、图像、声音等多媒体信息为检索内容的信息检索。,(二)按是否使用检索工具划分1、直接检索就是指利用一次文献进行检索,这是以前比较常用的一种查找方法。所花时间多和精力大,检出文献少。2、间接检索就是指利用各种检索工具获得文献线索,再根据线索去查找原始文献线索的方法。,(三)按信
3、息检索手段划分1、传统信息检索就是手工信息检索,是利用各种印刷型检索工具来查找文献的一种方法。2、现代信息检索现代信息检索即计算机信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。,1、信息检索是现代人才的基本生存技能 2、信息检索是现代人才信息素质的重要方面 3、信息检索是科学交流的重要途径 4、信息检索是开发信息资源的工具 5、信息检索是管理决策的基础 6、信息检索是继承和借鉴前人成果,避免重复研究的必由之路 7、信息检索是治学之道,三、信息检索的意义,第二节 信息检索语言,一、检索语言的含义及作用 二、检索语言的类型,一、检索语言的含义及作用,检索语言:是根据检索需要而创造的
4、一种人工语言。,作用:1、保证不同标引人员表征文献信息的一致性。2、使内容相同及相关的文献集中化。3、保证检索提问与文献信息标引的一致性。4、保证检索者按不同需求检索文献信息时,都能获得最高的查全率和查准率。,二、检索语言的类型,检索语言的类型,表述文献外表 特征的语言,表述文献内容 特征的语言,题名 责任者 号码 引文,分类法,主题法,标题词法 叙词法 关键词法,分类语言按知识门类的逻辑次序将信息系统地组织和划分的语言,具体体现为用分类号和类名来表达信息的主题概念。中国图书馆图书分类法美国国会图书馆分类法杜威十进位分类法 IPC国际专利分类法,标题词语言是从文献的题目和内容中抽出来,经过规范
5、 化处理的主题语言。 关键词语言直接从文献信息的标题、摘要或内容本身抽 取出来的用于揭示信息主题内容的自由词。,叙词语言是以表达文献主题内容的概念单元为基础, 经过规范化处理,可以进行逻辑组配的一种主语 语言。,第三节 检索技术,一、概念检索 二、布尔逻辑运算符组配检索 三、截词检索 四、字段限制检索 五、位置运算符 六、检索技巧和方法,一、概念检索检索标识是具体的检索词或词组,每个检索词表达一个概念,具体检索时,将检索词与数据库中的文献特征标识进行类比,两者相同,则该记录为命中文献。,二、 布尔逻辑算符组配检索布尔逻辑组配运算是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等算符,将检索提
6、问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,既为命中文献。,布尔逻辑运算符 ,1、逻辑“或” 2、逻辑“与” 3、逻辑“非”,1、逻辑“或”(和) ,用符号“or”或“+”表示,其逻辑表达式为:A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词B, 或同时含有检索词A和B的,均为命中文献。,2、逻辑“与” ,用符号“and”或“*”表示,其逻辑表达式为:A * B 或 A and B其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。,3、逻辑“非” ,用符号“not”或“-”,其逻辑表达式为:A not
7、 B 或 A-B其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。,三、截词检索,截词检索主要是利用检索词的词干或不完整的词形进行检索。截词符一般用“?”、“ :”、“#”表示 1、后方截词:用于前方一致的派生词检索。如:信息?则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。 2、前方截词:用于后方一致的派生词检索。如:?经济则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。,3、有限截词在检索词后面加上一个或一个以上(最多4 个)的“?”,空一格,再加一个“?”。如:Comput? ? 可检索出:Computer,Comput
8、ers,Computing,截词检索在不同的计算机检索系统中规 定不同,请使用时注意。,四、字段限制检索,为了缩小检索范围,可利用字段代码来限制 检索词出现的字段,以提高检索速度和命中率。如:rice in ti(表示只在题目字段中查找文献) rice in de(只在主题词中查找)rice in ab(只在文摘中查找)au = Smith,J.C (查作者为Smith,J.C 的文章)py = 1998(只查1998年的文章)la =Chinese (只查语种为中文的文献),五、位置运算符,With:设定需检索的两个词或词组在同一字段中,但不限制位置的先后。 Near:设定需检索的两个词或词
9、组在同一语句中,相对于“with”更接近。此外,在使用“near”运算符时,还可以在该运算符后添加一个数字以便进一步限定两个词之间的邻近程度,如“near3” 设定需检索的两个词或词组在同一句子中且相隔不超过3个单词。,1、检索策略计算机检索,实际上是由计算机将用户输入的检索策略与系统中存储的文献特征标识及逻辑组配关系进行类比、匹配,并把完全匹配的文献输出的过程。检索策略是科学地运用检索词和逻辑运算符正确地构造逻辑提问式的原则和方法。其核心内容在于检索策略的构造与检索的步骤。,六、检索的技巧和方法,A、弄清用户的提问要求,并确定要查找的文献 学科范围、类型、文种、时间等。 B、选择相关的数据库
10、并确定在待检数据库中的 检索途径,以便制定适合所选择数据库的检索策略。 C、对情报提问进行概念分析 D、拟定检索逻辑式 E、对数据库文档进行查找,检出相关文献并分析检索结果。 F、如有必要,对提问式进行反馈、修改,重复第五步,直到用户满意为止。,制定检索策略的步骤:,A、扩大检索范围,2、检索技巧和方法,* 概念的扩大。 * 范围的扩大。 * 增加同义词、近义词、相关词和缩略词。 * 用“or”、”?”、叙词表 * 年代的扩大。 * 去掉连字符可扩大检索范围。 * 换另外的数据库或是另外的光盘继续进行检索。,B、缩小检索范围的方法,* 核心概念的限定。 * 核心期刊的限定。 * 语种的限定。
11、* 用布尔逻辑算符“and”或者“not”组配检索词。 * 使用位置算符“near”和字段算符“in”提高查准率。 * 使用“Index”和叙词表,选择确切的检索词缩小检索范围,第四节 检索工具,检索工具:是在不同学科范围内对 某阶段出版的有关文献进行收集、整理 或对新文献加以及时报道的二次文献。,一、检索工具的作用 二、检索工具的特点 三、检索工具的类型,一、检索工具的作用,1、报道作用 2、存储作用 3、检索作用,二、检索工具的特点,1、详细而又完整地记录了文献的外部特征和内部特征。 2、对所著录的文献,标引了可供检索的检索标示。 3、提供必要的检索手段,配备各种体系的索引。,三、检索工具的类型,1、目录,是按照某种明白易懂的顺序编排的文献清单或清册,通常以一个完整的出版单位或收藏单位为著录的基本单元。它对文献的描述比较简单,只记述其外部特征。,2、题录,是将书籍、期刊等文献中所刊载的论文题目、作者、出处以及讨论或涉及的学科主题、名词术语等分别摘录出来,并按照一定的原则和方法排列起来的一种检索工具。,3、文摘,是一种著录文献题录和内容摘要的检索工具。,