信息检索课程重点整理.doc_第1页
信息检索课程重点整理.doc_第2页
信息检索课程重点整理.doc_第3页
信息检索课程重点整理.doc_第4页
信息检索课程重点整理.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索课程重点整理一、信息概念:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。特征:预先性、实用性、时效性、可传递性、共享性。传递渠道:1、非正式过程(表现为个人的行为特征。对话、通信、演讲、授课);2、正式过程(表现为文献流通。借助文献系统进行正式交流)。文献概念:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。也可以称为固化在一定载体上的知识。必须含有知识、记录方式、载体。资料概念:固化在一定的实物或载体上的知识。二、信息的类型:1、按信息的加工层次划分:一次信息(原始文献)、二次信息(检索工具)、三次信息(参考性文献)。P42、按信息载体的出版编辑特点划分:十二大文献源。P53、按信息载体的物理类型划分:印刷型、缩微型、电子型、声像型。P64、按信息的性质划分:一、自然信息(自然界发出的信息,以自然物为载体);二、社会信息(经过人类利用语言、文字、符号、图像等方式加工过的自然信息)。5、按信息所表征的服务对象划分:经济信息、科技信息、教育信息、军事信息、商业信息、金融信息、综合信息。三、信息检索的定义及类型p2信息检索,就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者 是包含用户所需事实与消息的文献的过程。它包括三个方面: 数据检索、事实检索、文献检索。三者中以文献检索为主。数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。四、文献检索的定义及类型p3定义:1、检索系统的建立及检索工具的组织和积累;2、文献的查寻,利用检索工具检出与课题相关的文献。类型:直接检索:是从通过阅读原始文献直接获取所需信息;快捷、方便;漏查率高。间接检索:是通过检索工具的指导再查找原始文献而获取所需信息。系统、全面:滞后。五、检索工具定义、具备条件及类型检索工具是按一定的学科、主题等进行搜集 整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。具备条件:(1)对所收录的文献的各种特征(包括外部特征和内容特征)要有详细的描述。 (2)每条描述记录(即款目)都标明有可供检索用的标识。(3)全部描述记录科学地组织成一个有机的整体。(4)具有多种必要的检索手段。类型:按检索方法划分:手工检索工具、机械检索工具。按报道的学科范围:综合性检索工具、专业性检索工具。按出版形式:全面性检索工具、单一性检索工具。著录的形式:目录、题录、文摘、索引。P9第二章、网络一、网络基本术语TCP(Transmission Control Protocol,传输控制协议)将文本分成包(数据包) ,再加上特别信息,使数据可以准确无误的地发送到接收方的计算机上。 IP(Internet Protocol,网际协议)在数据包上标上特别的信息(接收主机的IP地址),到目的地后,系统自动将IP地址去掉,再利用TCP检查数据是否完整,如有丢损则要求发送方重新发送被丢损的数据包。POP3 (Post Office Protocol) ,表示邮局协议。允许用户访问接收邮件的主机,并取走存放在上面的邮件。POP邮件服务器FTP是File Transfer Protocol(文件传输协议)的缩写,它允许两台因特网主机相互传送/拷贝文件,可以把自己计算机上的某个文件拷贝到网络上的某台计算机上,或是把网络上某台计算机上的文件拷贝自己计算机上。HTTP:超文本传输协议。IP地址:在Internet上的每一台计算机主机都必须有唯一的“地址”,以保证Internet上所有的计算机和网络能够被互相传送信息而不被混淆,以数字表示,称为IP地址。为确保IP地址在整个网上的唯一性,该地址一般由Internet网络信息中心统一分配。域名系统DNS,按域名系统定义的名字称为域名。域名和IP地址的联系:前者是名称,面对用户操作;后者是主机地址,主要供电脑识别用的,IP 地址共有32位,这么多数字不便于我们记忆,就对应取了域名便于人们的使用,域名和IP地址间是一一对应的,可通过域名服务器进行转换。P54HTML (超文本标记语言)HTTP (超文本传输协议)URL(统一资源定位器) 格式:协议: /主机地址: 端口号/子目录/文档名EMAIL地址组成:用户名邮件服务器域名。FTP 是 TCP/IP 协议组中的协议之一,简单的说,FTP就是完成两台计算机之间的拷贝,从远程计算机拷贝文件至自己的计算机上,称之为“下载(download)”文件。若将文件从自己计算机中拷贝至远程计算机上,则称之为“上载(upload)”文件。文件传输工具。二、搜索引擎的分类按检索机制分:分类目录式搜索引擎、全文搜索引擎、元搜索引擎按搜索的内容分:综合性搜索引擎、专门搜索引擎三、搜索引擎的工作原理搜索引擎是指通过“网络机器人”(网络信息挖掘系统)在网际某一空间、某一领域中寻找和发现有用或相关的信息,并在此基础上建立检索数据库,通过简单友好的界面提供给用户查询的工具。三大功能:在因特网上漫游收集信息(人工的,自动的两种);对收集到的信息标引并建立或更新数据库;提供检索服务接待用户访问。P65第三章、图书索引语言定义与类型: 作为一种通讯工具,索引需要有一种用来描述文献特征的检索标识,以将文献信息的产生者、加工者、检索者在文献特征的识别上彼此联系起来,以便取得能共同理解、实现思想交流的语言,这种语言就叫索引语言。按结构原理分:分类语言:体系分类语言、组配分类语言 描述语言:标题词叙词单元词关键词(非规范化语言)代码语言 引文语言定义:体系分类法是一种直接体现知识分类的等级标识系统,它对概括文献信息内容及其外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。它提供某学科、专业的集中文献。类型:中图法科图法资料法人大法中图法:5大部22大类。索书号=分类号+作者号联合目录:汇总某地区或若干地区甚至是全国图书馆或其他收藏单位所收藏的书刊统计目录。反映几个图书馆藏书的情况,某一种书刊见于何处,藏于何馆,便于查找借阅。/ P24馆藏目录:是图书馆或信息资料部门所收藏的全部书刊的统计目录。公共检索目录:各图书馆的网上公共可检索目录OPAC(Online Public Access Catalog),即一个基于网络的书目检索系统,提供本馆书目信息的检索服务。 课题检索检索步骤 P20(1)分析检索课题(2)选择检索方法常用法:要求查全-用顺查法;要求快、新-用倒查法;掌握了课题的发展阶段特点-用抽查法追溯法:查全率、查准率较低,易误检漏检综合法:优点是当检索工具缺期、缺卷时,也能连续获得所需年限以内的文献资料。(3)选择检索工具P9一般结构:1、使用说明:是检索工具编制着为检索工具检索者提供的必要指导。包括编辑内容、著录标准、代号说明和使用方法。2、目次表:检索工具的正文一般按分类方法组织编排,在检索工具前有详简不等的分类目次表。为使用者提供分类途径的检索。3、正文:正文部分是检索工具的主体部分。4、辅助索引:为用户提供多种途径的检索,从而提高检索效率。5、附表:是检索工具内容的必要补充,包括摘用刊物的种类,各种缩写,文字转译,术语和文献入藏单位代号等。(4)确定检索途径主题途径(要求特性检索)、分类途径(要求族性检索)、著者途径 、序号途径 、书名途径 。(5)查找文献线索 (6)获取原文a、到本单位的图书馆或资料部门去查找 ;b 、从国内图书信息机构,由近及远地获取;c、给著者写信获取;d、从文摘、索引等检索工具出版机构获取;e、网上查询,查全文期刊数据库、搜索引擎、电子期刊等;f、通过商业机构获取。计算机检索的基本技术(P31)1、布尔逻辑检索+*-;2、截词检索 ;3、字段限制检索 (field limiting)检索效果评价(P25)1查全率、查准率的定义以及两者之间的关系被检索出的相关文献的数量查全率%总文献中所有相关文献的数量被检索出的相关文献的数量查准率%被检索出文献的数量 查全率与查准率两者是互逆的关系优化检索策略的方法1、如果检索结果太多,可缩小检索范围,提高查准率。使用逻辑非剔除无关内容; 使用规范词、下位类主题词,提高检索词专指度; 限定检索字段; 限定文献外表特征,如语种、时间等; 将AND算符改为更严格的位置算符。2、如果检索结果太少或为0,可扩大检索范围,提高查全率。少用AND,多用OR; 使用主题词的同义词、近义词、上位类词; 使用截词符,以检出所有词干相同的词; 将限制严格的位置算符改为不太严格的位置算符; 选择更合适的数据库。检索表达式:作者单位=北京大学*作者=王少华*刊名=首都经济贸易大学学报*关键词=(人力资源管理+人才资源管理)* 年=2000文献著录形式(1)期刊 例如: 袁庆龙,候文义Ni-P 合金镀层组织形貌及显微硬度研究J太原理工大学学报,2001,32(1):51-53(2)图书(专著) 例如:刘国钧,王连成图书馆史研究M北京:高等教育出版社,1979:15-18,31 (3)论文集 例如:孙品一高校学报编辑工作现代化特征C中国高等学校自然科学学报研究会科技编辑学论文集(2)北京:北京师范大学出版社,1998:10-22 (4)学位论文 例如:张和生地质力学系统理论D太原:太原理工大学,1998 (5)专利文献 例如:姜锡洲一种温热外敷药制备方案P中国专利:881056078,1983-08-12 (6)国际、国家标准 例如:GB/T 161591996,汉语拼音正词法基本规则S北京:中国标准出版社,1996 第五章特种文献专利定义、类型、专利三性专利定义:由个人或单位将自己的发明创造向专利局提出申请,经专利局审查核实,发明人在法律规定的时间和区域内,对其发明享有独占权,即专利权,在该期限内若有人未经允许而采用此项专利,属于侵权。三性:(1)时间性 (2)独占性(专有性 ) (3) 区域性(地域性 )三种类型:发明专利、实用新型专利、外观设计专利。专利文献的特点与作用1、专利文献的特点 P103(1)内容广泛(2)内容详实(3)报道速度快(4)大量重复报道(5)技术内容新颖。2、专利文献的识别 P24通常有表示专利的词(Patent),有专利号 、国际专利分类号、专利申请日期、专利申请号、专利公布日期、专利说明书总页数。专利号按国际规定由两个字母表示的国家名称和其后的顺序号构成。3、作用:起法律文件的作用、起技术情报交流作用。图际专利分类法(IPC)(8个部5级) 部(Section) IPC的第一个分类等级。在IPC 中,首先将与发明专利有关的全部技术领域划分为8个部,并分别用A-H中的一个大写字母进行标记。大类(Class) IPC的第二级类目,是对部的进一步细分。大类类号用一个二位数进行标记。小类(Subclass) IPC的第三级类目,是对大类的进一步细分。小类类号用一个大写字母进行标记。主组(Main Group)或大组 IPC的第四级类目,是对小类的进一步细分。类号用1-3位数加/00表示。分组(Sub Group)或小组 IPC的第五级类目,是在小组的基础上进一步细分出来的类目。其类号标记是将主组类号中“/”后的00改为其他数字。检索国内专利文献的检索工具印刷型检索工具中国专利公报:从1985年9月10日定期出版

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论