信息检索基础知识_第1页
信息检索基础知识_第2页
信息检索基础知识_第3页
信息检索基础知识_第4页
信息检索基础知识_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第1 1章章 信息检索基础知识信息检索基础知识 1.1 信息及其相关概念 1.2 信息资源及其类型 1.3 信息检索的问题1.1信息及其相关概念 信息 什么是信息? u 信息的拉丁文词源information,意思是通知、报道、消息,而现代汉语词典将“信息”一词解释为“一切音信和消息”。(拉丁词源)u 申农从信息论的角度定义:信息是用来消除随机的不定性的东西。(信息论)u 维纳从控制论的角度定义:信息是我们用于适应外部世界,并且在使这种适应为外部世界所感知的过程中,和外部世界进行交换的内容的名称。(控制论)u 科学技术信息系统标准与使用指南-术语标准:信息是物质存在的一种方式、形态或运动状态

2、,是事物的一种普遍属性。 本书认为:信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 信息已成为继物质、能源之后的第三大战略性资源,是当代社会的三大基础资源。 信息的基本特征信息的基本特征u 信息的客观性u 信息的价值性u 信息的时效性u 信息的传递性u 信息的共享性u 信息的可存储性 知识 知识是系统化了的信息。 现代汉语词典中的“知识”是指人们在改造世界的实践中获得的认识和经验的总和。 本书认为,知识源于表征事物属性和事物间关系的各种信息,成于这各种信息的集合或有序化。因此,从外延上看,知识包含在信息之中。信息也不等

3、同于一般的知识,而是知识的原料与矿藏,是知识之源 。 文献文献 现代汉语词典中的“文献”是泛指“有历史价值或参考价值的图书资料”。 中华人民共和国国家标准文献著录总则(GB7392.1-83)为文献下了简明的定义:文献是“记录有知识的一切载体”。具有三个最基本的要素:构成文献的信息和知识内容;负载信息和知识内容物质载体;记录信息和知识内容的手段与符号。 u情报的概念起源于战争, 现代汉语词典中的“情报”,特指“战时关于敌情之报告”。 u Oxford Dictinary中的“情报”(Intelligence)是news,information with reference to importa

4、nt events,即有关重要事件的消息与信息。u 本书认为,情报就是“作为交流对象的有用知识”,“在特定时间、特定状态下对特定的人提供的有用知识”。n 情报情报信息知识情报关于事物特征的描述,是基础,包含了情报和知识经过思维加工处理和提炼升华的信息。文献是记录知识的载体为了解决某一特定问题所需要的有针对性的知识,是狭义的知识。情报的三个基本属性(知识性、传递性、效用性) 信息与知识、文献、情报的关系1.2信息资源及其类型信息资源及其类型 信息资源 信息资源:广义理解是指信息活动中各种要素的总称,既包括信息本身,也包括与信息相关的人员、设备、技术和资金等因素。 本书所探讨的信息资源指的是狭义的

5、理解,仅限于信息本身,是指各种载体和形式的信息的集合,包括文字、音像、印刷品、电子信息及数据库等。 信息资源的分类 (P19) 根据不同的标准,可以将信息资源划分成不同的类型: 1 不同载体制作形式的信息资源 2 不同文献出版形式的信息资源 3 不同文献内容公开程度的信息资源 不同载体制作形式的信息资源 刻写型 包括印刷术发明之前的古代文献(如古代的甲骨卜辞、金石简牍、帛书等),现代的篆刻、雕刻、雕塑,以及没有正式付印的手稿等。 印刷型 以纸张为存储载体,通过油印、铅印、胶印以及静电复印等各种印刷手段,将文字固化在纸张上所形成的文献。 缩微型 缩微型文献是以感光材料为存储载体,以光学摄影技术为

6、记录手段而生产出来的一种文献形式,这种文献体积小,密度大,一张胶片上可存储大约20万页书的信息 声像型 声像型信息亦称视听型信息,以磁性材料或感光材料为载体,利用声频、视频等多媒体手段来记录声音、图像信号的信息载体,如录音带,录像带、唱片、CD、VCD、DVD等 电子型 指以磁性材料(磁带、磁盘、光盘)为载体,通过编码技术将信息转换为计算机可识别的语言,并将信息记录在磁带、磁盘、光盘上的信息资源。 网络信息资源 指直接在计算机技术、通信技术及多媒体技术相互融合而成的网络上出版、流通和传播的各种信息资源的总和,是电子出版的最高形式。 不同文献出版形式的信息资源 图书 期刊 报纸 专利信息 标准

7、学位论文 科技报告 会议信息 政府出版物 产品样本资料 技术档案1. 图书图书 图书(Book),联合国教科文组织对图书的定义,凡由出版社(商)出版的不包括封面和封底在内49页以上的印刷品,具有特定的书名和著者名,编有ISBN号,有一定价值并取得版权保护的出版物称为图书 是最早出现的文献类型之一,至今仍占据社会科学文献的主导地位。 图书出版量大,稳定性强,质量较高,保存期长;但编辑出版周期较长,传递知识信息相对较慢。 图书主要包括专著、教科书、工具书、图册、读物和文集等。在图书馆查找。 识别图书的主要依据有:书名、著者、出版地、出版社、出版时间、总页数、国际标准书号(ISBN)等。 ISBN由

8、10位数字分成4段组成,各段依次是:地区或语种号-出版商代号-书名号-校验号。 我们使用的教材的ISBN号为:978-7-03-026985-0 马费成. IRM-KM范式与情报学发展研究M. 武汉:武汉大学出版社,2008:356-3642. 期刊期刊 又称连续出版物,指有固定名称、统一开本、有编号或年月标志、定期或不定期连续出版、每期内容不重复并由多名责任者撰写不同文章的出版物,又称为杂志。 期刊论文内容新颖,报道速度快,信息含量大,是传递科技信息、交流学术思想最基本的文献形式。被称为“整个科学史上最成功的无处不在的科学信息载体”。据估计,期刊信息约占整个科技信息源的60-70%。大多数检

9、索工具也以期刊论文作为报道的主要对象。 各种期刊既可在图书馆,也可在情报所查阅。 识别期刊论文的主要标识有:著者姓名、文献篇名、著者工作单位、期刊名称、期刊出版的年、卷、期,国际标准刊号(ISSN)等。 ISSN由8位数字分两段组成,如1000-0135,前7位是期刊代号,末位是校验号。 电子科技大学学报CN号为:CN511207/T 图书情报工作的CN号为:CN111541/G2 陈鑫卿,张永奎,李荣陆. 一种协调的科技文献分类方法J. 计算机工程与应用,2003,(26):91-933报纸报纸 报纸(Paper,Newspaper)在国外被称为新闻报纸。 专门刊载新闻报道和时事评论为主的定

10、期出版物;但有些报纸同时也刊载学术论文和其它信息。 报纸具有时事性、时效性、普及性、大众性,出版周期短,传递信息快速,传播范围广,是不容忽视的文献信息源。 著者姓名、文章篇名、报纸名称、年月日版4会议文献会议文献 在学术会议上宣读或书面交流的报告、论文、会议记录、会议纪要等有关资料。是科学工作者了解学科发展动态,获取学科最新信息的窗口。 英文常用Preprint表示会前文献的会议论文预印本;Transactions表示会议上发表的汇编论文;Proceedings、 Symposium表示会议的记录和会后整理出版的会议论文录、论文集。 识别要素:著者、论文题名、会议名称、会议录名称、会议举行的地

11、点 5、学位论文、学位论文 高等学校、科研机构所培养的硕士生、博士生等为取得学位资格而呈递的毕业论文。 特点:选题新颖,理论性、系统性强,参考文献全面。 识别学位论文的主要依据有:著者、论文名称、学位名称、导师姓名、学位授予机构、地址、时间等 侯海燕. 基于知识图谱的科学计量学进展研究D. 大连:大连理工大学,2006:123-1266政府出版物政府出版物 指国家政府和所属机关颁布的各种文件,如政府公报、公告等,国家党政机关为开展日常工作而印刷的文件、参考资料也属此类。 政府出版物具有正式性、权威性的特点,它与国际国内政治经济形势密切相关,是科技工作者十分重视的文献信息源。 政府出版物包括两类

12、:行政性文献和科技类文献7标准文献标准文献 标准文献(Standard literature)是技术标准、技术规格和技术规则等文献的总称。 是以科学、技术和社会实践经验的综合成果为基础拟定,经主管机构批准,以特定形式发布的对重复性事物和概念所作统一规定的法定性文献。 国际标准化机构中最重要、影响最大的是1947年成立的国际标准化组织(ISO)和1906 年成立的国际电工委员会(IEC),它们制定或批准的标准具有广泛的国际影响。如美好火腿肠通过了“ISO9001:2000国际质量体系认证”。 识别标准:标准号、标准名称、版次、页数、价格代码、技术委员会编号 我国标准分类:强制性标准GB、推荐性标

13、准GB/T行业标准代码及主管部门名称的8. 科技报告科技报告 科技报告是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。 国际上较著名的科技报告是美国政府的四大报告,即PB(Publishing Board)报告、AD(ASTIA Documents)报告、 NASA(National Aeronatics and Space Administration)报告和DOE(Department of Energy)报告。 科技报告主要在情报所或收藏科技报告的院校、研究所图书馆查阅。九院收藏有大量的科技报告。9. 专利文献专利文献 与专利制度有关的所有专利文件

14、,包括专利说明书、专利公报、专利分类表、专利检索工具以及专利的法律性文件。 专利文献主要由专利说明书构成。专利说明书应在国家专利局或收藏专利文献的情报所查阅。四川省情报所收藏国内外专利。10. 档案档案 指各级政府机构、企事业单位和某些个人在实践工作中形成立卷归档、集中保管、有历史价值的原始文献资料,它是科技、政治、经济、历史的真实记录,是科技工作者进行科研的重要参考资料。 详细内容包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、设计资料、试验和工艺记录等。 一般为内部使用,不公开发行11. 产品技术资料产品技术资料 指产品目录、产品样本和产品说明书一类的产品宣传和使用资料。其内容主要是对产品的规格、性能、特点、构造、用途、使用方法等的介绍和说明, -产品技术资料一般向厂商直接索取,在情报所可以查到一部分,有些以汇编形式正式出版的可以在图书馆查到。 按内容公开程度 白色文献 一切正式出版并在社会上公开流通的文献。包括图书、报纸、期刊等。这类文献通过出版社、书店、邮局等正规的渠道公开发行,向社会所有成员公开,其蕴涵的信息大白于天下,人人均可利用。 黑色文献 包括两个方面,一是人们为破译和了解其中信息的文献,如考古发现的古老文字未经分析厘定的文献;二是处于保密状态和不愿公布其内容的文献,如未解密的政府文件、内部档案、个人日记、私人信件等。这类文献

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论