版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 信息检索概述,Outline,信息检索的基本概念 信息检索的历史 信息检索模型 信息检索系统的结构与评价,第一节 信息检索的基本概念,Information Hierarchy,1 信息检索的含义,广义的信息检索 information storage information retrieval,狭义的信息检索 information retrieval,信息检索的常用术语,检索词:用户输入的字、词、字符或短语 检索式:检索提问表达式 检索策略:是对查询的全面策划,在操作上主要指数据库的选择和检索式的编制 前者选择数据库资源,后者实现检索目标 一般也直接将检索式视为搜索策略,信息素质的
2、含义 信息素养(information literacy)又称信息素质,由美国信息产业协会主席保罗车可斯基(Paul Zurkowski)在1974年首先提出 他定义为:“利用大量信息工具及主要信息源使问题得到解答的技术和技能。” 后来又将其解释为“人们在解答问题时利用信息的技术和技能”。,Librarians Information Literacy Annual Conference (LILAC ),2005-,国际会议 国际图联(International Federation of Library Associations and Institutions ,IFLA)发布信息素质评
3、价指南,促进发展中国家信息素质教育 UNESCO 与IFLA信息素质教育的中长期合作项目 UNESCO :An Analysis of Information Literacy Education Worldwide UNESCO全球信息素质教育资源指南 / OECD (经济合作组织)2000年起组织Programme for International Student Assessment( PISA)项目,PISA蕴含的意义 在这个迅速变化的时代,学生不可能在学校里学到将来所需的每一种知识和技能,必须在具备阅读、数学、科学等方面基础的
4、前提下,努力培养自己的学习能力。学会如何学习(learn how to learn),将比学会事实(learn to know)更为重要。,2 信息检索的种类,根据检索手段的不同 Manual retrieval Disc retrieval Online retrieval Web-based retrieval,根据检索对象形式 document retrieval data retrieval fact retrieval,信息资源的有关概念,文献(literature,document) 信息资源(information resource) electronic resources(电
5、子资源) virtual resources(虚拟资源) digital resources(数字资源 ) networked resources, WWW resources, web-based resources, resources on the Internet(网络资源) online resources(联机资源),3 信息检索的原理,4 信息检索语言,中图法等级分明的科学系统 O 一级类目 数、理、化 O1 O3 O4 O6 O7 二级类目 数学 力学 物理 化学 晶体 O11 O12 O13 三级类目 古典数学 初等数学 高等数学 O121 O122 O123 O124 四级
6、类目 算术 初等代数 初等几何 三角,国内外常用的叙词表: 我国的汉语主题词表 美国国会图书馆主题词表(LCSH) 英国科学文摘使用的INSPEC叙词表 美国工程索引使用的COMPENDEX叙词表,第二节 信息检索的历史,手工检索(1876-1945) 机械信息检索 (19451954) 脱机批处理检索(1954-1965) 国际联机检索 (1965-) 光盘检索(1980-) 网络检索(1991-) 后四者统称为计算机信息检索 多种方法并存,网络检索最有发展前景,第三节 信息检索的模型,浏览型模型 扁平式模型 结构导向模型 超文本模型,基于内容的检索型模型 集合论模型 代数论模型 概率论模型
7、,第四节 信息检索系统的结构与评价,信息检索系统的含义 信息检索系统的类型 信息检索系统的物理结构 信息检索系统的逻辑结构,评价信息检索系统效果的指标,查全率(Recall Factor,R) 查准率(Precision Factor, P) 漏检率(Omission Factor) 误检率(Noise Factor) 新颖率 检索速度,重要指标,查全率是系统在进行某一检索时,检出的相关信息量与系统信息库中相关的信息总量的比率。,查准率是系统在进行某一检索时,检出的相关信息量与检出的信息总量的比率,被检出相关文献量 查全率:R = 相关文献总量 被检出相关文献量 查准率:P = 被检出文献总量 未检出相关文献量 漏检率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年锅炉事故风险辨识与紧急停炉措施
- 上海立达学院《AutoCAD 绘图》2025-2026学年第一学期期末试卷(A卷)
- 2026年防止交叉污染卫生控制程序
- 2026年承包商(外协单位)安全准入与管理全流程
- 自修复纤维单体的功能化改性
- 上海立信会计金融学院《Access 数据库技术》2025-2026学年第一学期期末试卷(B卷)
- 上海科技大学《安装工程施工》2025-2026学年第一学期期末试卷(B卷)
- 大连东软信息学院《Access 数据库》2025-2026学年第一学期期末试卷(B卷)
- 2026年留守儿童心理健康辅导志愿者培训计划
- 上海科技大学《Android 高级应用开发》2025-2026学年第一学期期末试卷(B卷)
- 2026贵州黔南州企事业单位人才引进268人备考题库附答案详解(突破训练)
- 2026国家中医药管理局监测统计中心招聘应届高校毕业生(第二批)重点基础提升(共500题)附带答案详解
- 四年级下册数学运算定律拓展课件·跨学科主题式教学设计【人教版】
- 房屋市政工程有限空间识别及施工安全作业指南
- (二模)宁波市2026届高三高考模拟考试政治试卷(含答案)
- GB/T 2970-2016厚钢板超声检测方法
- 智能农业实验报告
- GB/T 23445-2009聚合物水泥防水涂料
- 人工神经网络HOPFIELD神经网络
- 中小学生励志主题班会课件《告诉你孩子:几年的放纵-换来的是一生卑微和坎坷》
- 022pet热灌装饮料生产工艺及品质控制
评论
0/150
提交评论