1、长 春 师 范 大 学 何海波 目 录 导 论 第一讲 信息检索概述 第二讲 搜索引擎的使用 第三讲 馆藏资源的检索 第四讲 中文学术论文的检索 第五讲 中文电子书的检索 第六讲 外文文献的检索 第七讲 我馆其他电子资源的检索 第八讲 信息检索在论文写作中的应用 导 论 一 课程内容 二 课程意义 三 课程安排 导 论 一 课程内容 信息检索课,过去也被称为文献检索课,是高校学生学习信息知识、掌握检索技能、提高信息素质的基础课,是由原国家教委统一命名并三次下文要求高等院校开设的一门科学方法课。 教学内容包括基本理论、信息检索、信息利用三大部分。 导 论 二 课程意义 (1) 提高信息素质 (2
2、) 掌握信息能力 (3) 满足信息需求 导 论 三 课程安排 第一讲 信息检索概述 1周 第二讲 搜索引擎的使用 2周 第三讲 馆藏资源的检索 3周 第四讲 中文学术论文的检索 4周 第五讲 中文电子书的检索 5周 第六讲 外文文献的检索 6周 第七讲 馆藏其他电子资源 7周 第八讲 利用信息检索解决实际问题的流程 8周 导 论 考试成绩 考试形式:第 9周,随堂考试,采取开卷方式 成绩评定:满分 100分,平时成绩 30分,随堂考试成绩占 70%,其中平时成绩包括出勤 10分和课堂表现 20分(含回答问题、做课上课下作业) ,而考试成绩是以随堂考试的考试成绩为准 。 第一讲 信息检索概述 一
3、 信息检索的概念 二 信息检索的原理和本质 三 信息检索的技术 四 信息检索具体程序 第一讲 信息检索概述 一 信息检索的概念 信息 : 信息是指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。 信息检索 : 信息检索的涵义分为广义和狭义两个方面:广义的信息检索是指信息按一定的方式组织起来,并根据信息用户的需要揭示、查找、传递相关信息的过程和技术,也叫信息的存储与检索。狭义的信息检索仅指这个过程的后半部分,即从信息集合中找到所需信息的过程,也就是所谓的信息查找。 第一讲 信息检索概述 二 信息检索的原理和本质 信息检索包括存储和检索两个过程。 信息的存储就是信息组织的过程,将
4、无序的信息转换为有序的信息集合的过程。它是根据一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按一定的原则和方法进行加工处理,使之有序化。信息的存储是信息传播和检索的基础和前提,它包括信息选择、信息分析、信息源表述和内容揭示、信息重组和信息存储。这一过程主要由信息工作人员完成,他们通过信息组织将文献信息转化为文献标识,序化后构成信息检索系统库。 信息的检索是查找信息的过程,是用户对信息的需求。它是用户为解决特定的问题,使用相应的检索工具、适当的检索方法和检索途径,从信息检索系统库中获取问题的解答。这一过程是由信息用户,也就是检索人员来操作,他们将检索问题按照科学的程序分析研究
5、,转换成检索标识,再把检索标识拿到信息检索系统库中,如有与它一致的文献标识,则该文献标识对应的信息就是用户所需要的内容。 二 信息检索的原理及本质 信息人员 检索人员 第一讲 信息检索概述 原始文献信息 信息组织 文献标识 用户提问 提问分析 提问标识 信息检索系统 命中 本质:提问标识与文献标识的对比 第一讲 信息检索概述 三 信息检索的技术 1 布尔逻辑检索 2 截词检索 3 字段检索 4 位置检索 5 模糊与精确检索 练习题 第一讲 信息检索概述 1 布尔逻辑检索 布尔逻辑检索是运用布尔逻辑算符对检索词进行逻辑组配,构成检索表达式,表达概念之间的逻辑关系的检索方法。 主要的布尔逻辑算符有
6、: (1) 逻辑“与” (2) 逻辑“或” (3) 逻辑“非” 第一讲 信息检索概述 1 布尔逻辑检索 逻辑 “ 与 ” (用符号 “ and” 或 “ *” ) 写作 A and B 或者 A * B 表示检索结果为必须同时含有检索词 A和检索词 B的文献 A B 示例:吉林省的旅游资源 提问式:吉林省 *旅游资源 第一讲 信息检索概述 1 布尔逻辑检索 逻辑 “ 或 ” (用符号 “ or” 或 “ +” ) 写作 A or B 或者 A + B 表示两个检索词的并集部分,即检索结果中凡是含有检索词 A或检索词 B,或同时含有检索词 A和 B的,均为命中文献。 A B 示例:吉林省的旅游资
7、源或旅游景点 提问式:吉林省的旅游资源 + 吉林省的旅游景点 吉林省 *(旅游资源 +旅游景点 ) 第一讲 信息检索概述 1 布尔逻辑检索 逻辑 “ 非 ” (用符号 “ not” 或 “ -” ) 写作 A not B 或者 A - B 表示检索结果含有检索词 A,但不包括检索词 B的信息集合,即从检索词 A的结果集合中排除检索词 B的部分。 A B 示例:除长白山以外,吉林省的旅游资源有哪些? 提问式:(吉林省 *旅游资源) -长白山 第一讲 信息检索概述 1 布尔逻辑检索 三个或三个以上检索词间逻辑运算顺序 吉林省除长白山以外的旅游资源或旅游景点 吉林省 not 长白山 and(旅游资源
8、 or旅游景点) 优先 其次 改变顺序 逻辑或 逻辑非 逻辑与 第一讲 信息检索概述 2 截词检索 截词检索是利用检索词的词干或不完整形式进行检索,以检索出一组概念相关或同一词根的词。 截词符(通配符):?、 * 、 $ 等等 截词方式: 后截断 前截断 中间截断 前后截断 第一讲 信息检索概述 2 截词检索 后截断:前方一致 前截断:后方一致 中间截断:两端一致 前后截断:中间一致 comput? computer、 computing ?computer minicomputer、 microcomputer f?t foot、 feet ?ea? wealth、 least、 beaut
9、y 第一讲 信息检索概述 3 字段检索 字段检索是指定检索词出现的字段,被指定的字段也称检索入口、检索途径,系统只对指定字段进行匹配运算。 方 式 : 前缀式 字段代码 = 检索词 后缀式 检索词 / 字段代码 第一讲 信息检索概述 3 字段检索 例: TI=信息检索 作者 =姜维公 鲁迅 / AU 主题 =鲁迅 微格教学 *双语教学 / AB 字段名称 代码 题 名 TI 文 摘 AB 作 者 AU 刊 名 JN 文献类型 DT 第一讲 信息检索概述 4 位置检索 位置检索是运用位置算符表示两个检索词间的位置邻近关系,又叫邻近检索。 常用的位置算符: with near field subf
10、ield 第一讲 信息检索概述 4 位置检索 with算符: (W)或 ( ),表示两个词在命中结果中相邻(可有空格、标点和连字符),词序不得颠倒。 例:“ input(w)output” “input output” 、“ input-output” (nW),表示两个词之间最多可夹入 n个词,词序不得颠倒。 例:“ laser(1w)printer” “laser printer” 、“ laser color printer” 第一讲 信息检索概述 4 位置检索 near算符: (N) ,表示两个词在命中结果中相邻,词序可颠倒。 例:“ computer(N)network” “ com
11、puter network” 、“ network computer” (nN) ,表示两个词之间最多可夹入 n个词,词序可颠倒。 例:“ computer(2N)system” “computer system” 、 “computer code system” 、 “system using modern computer” 第一讲 信息检索概述 4 位置检索 field算符: 两个检索词必须同时出现在记录的同一个字段中,次序不限。 例: “digital(F)computer/TI” 题名为 Hybrid analog and digital computer的文章 第一讲 信息检索概述 4 位置检索 Subfield算符: 两个检索词必须同时出现在记录的同一个句子或短语中,次序不限。 例:“ intelligence(S)service” business Intelligence software as a service (SAAS) Shimaa Ouf, 第一讲 信息检索概述 5 模糊与精确检索 模糊检索 也称概念检索,是指检索系统不仅能检索出包含指定的检索词,还将与检索词主题概念相同的信息检索出来。 例: 自行车(模糊) 扩展概念:脚踏车、单车等