《文献检索》课件.ppt_第1页
《文献检索》课件.ppt_第2页
《文献检索》课件.ppt_第3页
《文献检索》课件.ppt_第4页
《文献检索》课件.ppt_第5页
已阅读5页,还剩151页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机信息检索 原理与技术,计算机信息检索 原理与技术,3.2 文献信息数据库原理,3.3 计算机信息检索技术,3.4 检索策略及其设计,3.1 计算机检索基础,检索系统的构成,硬件,软件,数据库,系 统 软 件,应用系统软件,3.1 计算机检索基础,3.2 文献信息数据库原理,计算机贮存信息就是生成数据库。数据库中文献的某一特征, 如:题名、作者、关键词等是为用户提取信息设计的。称之为 “检索点”,数据库的类型,文献型数据库,文献型数据库也称书目数据库主要是书本式文摘索引等文献检索工具的机读版,如EI的书目数据库为COMPENDEX,数值数据库,主要包含的是数字数据,如化学物质毒性数据库、人

2、口统计数据库、化学结构图数据库等。,事实数据库或词典数据库,直接提供科学依据或事实。,数据库的结构,数据库是由若干记录(Record)组成 每条记录由若干字段(Field)构成。,文档(File),文档也称之为数据库中。一个大数据库可分为若干个子库如CA数据库根据年代被分为6个子库。,记录(Record),记录是构成数据库的最小单元, 每条记录都描述了一条原始信息。 文献型数据库中的一条记录通常是一篇 原始文献 包括题录、文摘、主题词等。,一条记录由各数据项组成字段。 包括篇名、作者、作者单位、来源、文摘、主题词等字段。每一个字段通常由两个字母所组成的代码表示,如TI(Title),AU(Au

3、thor)等。,字段(Field),通常字段分为基本索引字段及辅助索引字段,基本索引字段 “字段(field)”是“记录”中的基本单位 记录中用来描述文献内容特征的字段叫基本索引字段。它的表示方法为:,/TI (题名字段:title field) /AB(文摘字段:abstract field) /DE或/DF (规范词字段:descriptor field或controlled term field) /ID或/IF (自由词字段:identifier field),辅助索引字段 记录中用来描述文献外表特征的字段叫辅助索引字段。它的表示方法为:,AN=(文摘号:Abstracts No.)

4、AU=(著者:Author) DT=(文献类型:Document type) PA=(专利代理人:Patent assignee) PN=(专利号:Patent No.) LA=(文种:Language) PY=(出版年:Publication year),文献记录样例 (SAMPLE RECORD),3.3 计算机信息检索技术,计算机检索:计算机将人工输入的检索式(检索策略)与数据库中的检索点进行比较匹配,得到结果 以命令检索为例介绍检索技术,(易熔玻璃 or 低熔玻璃 or 封接玻璃) and (等离子显示器 or PDP or 显象管),(automobil? +vehicle?+car

5、? ?)()bod? *vibrarion?/de *(finite(w) element()method +computer? (w)aided()analysis)/de,ab* PY=1990:2000,检索项也称作:检索词或检索点,检索项是构成检索式的基本单元,是概念词。准确选择至关重要。,检索项,检索项可以是单词、词组、数字、化学分子式等,布尔逻辑检索,布尔逻辑检索有三个基本运算符:逻辑与(积),逻辑和,逻辑非。,逻辑与,计算机运算符为:A and B 或 A*B 在命中结果中同时出现A和B两个检索词。,A,B,逻辑和,计算机运算符为:A or B 或 A+B 逻辑和是指命中结果无论

6、论及A或B均为命中。,B,A,逻辑非,计算机运算符:A not B 或 A and not B 或 A-B 逻辑非是指一个命中结果中去除含有另一主题的文献。A not B表示在A文献中去除论及B的文献的文献。,A,B,字段限制检索,指定检索提问在特定字段中出现,只有在指定的字段中出现与检索提问相同的记录才被检索出来。如要求检索的内容在题目中出现。 如: computer / ti and py=1999,截词检索,截词(Truncation)检索就是把检索词截断,取其中的一部分片段,再加上截词符号一起检索。 截词符号有问号?、星号*、井字符#等。,*可代表多个字符, 如果输入 instruct

7、ion* instruction,instructions,instructional,#代表单个的字符 如果输入wom#n woman,women 一个?或者n?代表0个到9个额外的字符。 如果输入colo?r,包含 color,colour或colonizer comput? 则可检出含有computers, computing, computered computer? ? 表示“?”可以有0-1个字母变化, 检出带有computer和computers的文献; 输入stud?,表示截三个字母, 可检索出带有study, studies, studied和studing,概念: 车 au

8、tomobile vehicle car 身 body body bodies (bod?),*vibrarion?/de,*(finite(w)element()method +computer?(w)aided()analysis)/de,ab,* PY=1990:2000,概念: 振动 vibration,概念: 有限元法 finite element method computer aided analysis,检索词的选取方法,检索词有时决定着检索结果的满意程度,应重视对检索词的研究。,(2) 异称法: 不同地区、时代、职业和不同场合下,对于同一种东西会产生出不同的称呼。例如: “马

9、铃薯”与“土豆” ; “电动机”与“马达” ; “逻辑代数”与“布尔代数”等等。,(1) 命名法: 每个事物都有多种属性,因此可以产生多种名称。例如:“计算机”与“电脑”;“人造金刚石”与“合成金刚石”;“X射线”与“伦琴射线”等等,(3) 内容分析法: 内容分析就是具体说明事物的组成部分。 a) 以“发电厂烟气净化”来作内容分析。 烟气中含有: 灰尘、二氧化硫、氮氧化物; 净化操作则由: 除尘,脱硫,脱硝组成, 与除尘有关:静电除尘,脉冲除尘,脉冲放电, 布袋除尘,过滤; 与脱硫有关:洗涤塔,碱性吸收剂相关词。,b) “声纳技术”为例 其内容包括有:发射换能器,接收换能器,信号处理,终端判决

10、与显示技术,声纳自动化技术等。 了解的内容越多,检索的收获就越大。,(4) 变体分析法: 变体分析即找出词或词组的各种变化形式。常见形式有: 拼写变体及不同语种文字, 如center + centre; program + programm;; disk + disc; sulfone + sulphone;, 单数加上复数, 如 car + cars, 分离式加上复合式,如:book case + bookcase; gas dynamic + gasdynamic,课题名称:氨基硅油织物柔软剂 检索词: (1)氨基硅油 (2)制备 (3)纺织 (4)乳化 (5)织物柔软剂 (6)表面活性剂

11、 (7)有机硅,例1,课题检索词选取实例,课题名称3:快速高强度耐磨釉 检索词: (1)高强度 (2)耐磨损 (3)快速烧 (4)玻璃陶瓷 (5)陶瓷 (6)微晶玻璃 (7)乳浊 (8)析晶 (9)主晶相 (10)硅灰石 (11)无光釉 (12)釉,例3,4因特网主要资源类型 4.1 数据库信息资源 指通过因特网提供的商业与非商业的数据库资源。,网络文献资源检索,商业的数据库资源如美国的 Dialog 和美、德、日三国联合的国际联机系统 STN 等。我国的CNKI、重庆维普、万方数据公司等都通过因特网提供数据库查询。授权的用户可以通过WWW形式进行查询。,非商业的数据库资源,即免费数据库如中国

12、专利数据库、美国专利数据库等都可以通过 WEB 方式免费检索并获得专利说明书全文。,2. 电子出版物资源 通过因特网提供电子期刊、报纸、图书等网上浏览、订阅服务。电子出版物已构成因特网上科技信息的主流。 万方数据集团的000余种科技期刊全文上网 国家图书馆将多种古书进行了数字化加工上网,供查阅。,学习网络文献资源检索系统 需要掌握的要领 分清检索系统(数据资源系统、网址)、数据库类名与数据库之间的区别,了解每个数据资源系统的特点 了解每个数据资源系统的特色数据库,可以免费得到的资源。如题名,文摘或是 全文 网址及检索方法,中国知网(CNKI),万方电子全文期刊数据库,中国企业与产品数据库,电子

13、图书时代圣典电子图书,万方文摘数据库,重庆维普资讯,电子图书读秀知识库,4.2 图书馆中文电子资源,中国知识基础设施工程(China National Knowledge Infrastructure 简称CNKI )中国知网,是由清华同方光盘股份有限公司于1996年开始组织实施的一项信息工程。其目的在于提高国家知识和技术的创新能力,增强国际竞争力。,中国知网(CNKI),CNKI 拥有的数据库如下:,中国期刊全文数据库 8200种期刊 2200多万篇原文 中国博士学位论文全文数据库 1999-今 5万多篇 a.中国优秀硕士学位论文全文数据库 1999-今 37万多篇,我馆购进了CNKI上述数

14、据库,中国重要会议论文全文数据库 中国重要报纸全文数据库 中国图书全文数据库 中国年鉴全文数据库 中国引文数据库,中国期刊全文数据库 分为: 理工A(数理科学)、 理工B(化学化工能源与材料)、 理工C(工业技术)、 农业、医药卫生、文史哲、 经济政治与法律、 教育与社会科学综合、 电子技术与信息科学、 9大专辑,网上数据每日更新。,最大限度与文献中的各个检索点进行了无缝联接。,CNKI特点:,CNKI检索方法,字段选择,输入检索词,中国优秀博士学位论文库、中国优秀硕士学位论文全文数据库 单个数据库的检索与期刊全文数据库相同。,跨库检索 一次同时检索期刊全文数据库、中国优秀博士学位论文库和中国

15、优秀硕士学位论文全文数据库数据库,课题:高等院校会计核算与财务管理,检索词:会计、核算、管理、 高校高等学校高等院校,检索式:(高校 or 高等学校 or 高等院校) and 会计 and 核算 and 管理,点击3个中的任意一个,跨库检索,选择字段,命中记录,增加检索词,检索结果,查看检索史,2. 数据库:中国期刊全文数据库,中国博士学位论文全文数据库,中国优秀硕士学位论文全文数据库 检索条件: (题名=会计)and (题名=管理)and (题名=核算)(模糊匹配);时间排序;不排重 跨库检索(高级检索),1. 数据库:中国期刊全文数据库,中国博士学位论文全文数据库,中国优秀硕士学位论文全文

16、数据库 检索条件:(题名=会计)and (题名=管理)and (题名=核算) 并且 (题名=会计)and (题名=管理)and (题名=核算)and (主题=高校)(模糊匹配);时间排序;不排重 跨库检索(高级检索),万方数据数据库是由万方数据(集团)公司, 其前身为中国科技信息研究所。,1988年,中国科技信息研究所设立国际联机情报检索服务部,并与国际信息检索系统联机 美国DIALOG 美、日、德的STN国际联机系统 欧洲空间组织检索中心ESAIRS系统,万方数据资源系统简介,1997年,中国科技信息研究所组建万方数据股份有限公司 万方数据资源系统 拥有上百个我国自建的数据库,是我国最大的信

17、息资源系统,为了弥补CNKI学位论文收录不全。图书馆引进了万方学位论文数据库中211工程前100所大学的数据。 南京大学、华中科技大学、上海交通大学、中山大学、中国科学技术大学、哈尔滨工业大学、西安交通大学、天津大学、南开大学、北京航空航天大学、同济大学、华南理工大学、东北大学、兰州大学、北京交通大学、北京邮电大学等,万方中国学位论文全文数据库,数字化期刊全文数据库基本包括了我国自然科学类统计源刊和社会科学类核心源期刊。,是核心期刊测评和论文统计分析的数据源基础。收录了自1998年以来的共5037种高质量期刊。,万方电子全文期刊数据库,选择数据库,输入检索词 检索多个数据库,点击以查看详细摘要

18、,可下载全文,下载论文全文浏览,重庆维普资讯,重庆维普资讯有限公司(Vipinfo)是国内著名的科技资讯类软件企业,全文数据库提供商。 主要产品有中文科技期刊数据库全文版、文摘版、引文版、外文科技期刊数据库、中国科技经济新闻数据库、行业信息资源系统等。,默认字段为 题目、关键词,会计*核算*管理*(高校+高等学校+高等院校),检索结果,T=会计*核算*管理*(高校+高等学校+高等院校),点击篇名,记录格式,我馆已购进圣典电子图书 24万册。,时代圣典电子图书 北京时代圣典科技有限公司是中国大学出版社协会指定合作伙伴, 是中国最早从事全文本格式电子图书的高新技术企业之一。,5电子图书时代圣典电子

19、图书,首先下载并安装阅读器,检索和浏览均可,点击书名,下载图书,6电子图书读秀知识库,超星数字图书馆是全球最大的中文数字图书馆. 读秀知识库是超星的一个全新的检索平台, 最大的特点是将图书馆纸质图书、电子图书等各种资料整合于同一平台,统一检索. 能够对图书内容进行检索, Web阅读形式,无需浏览软件。,读秀数据资源: 228万种中文图书数据(约占95 1949年以来全部出版的中文图书) 160万种图书全文 6亿页资料 2亿条目次 每年更新10万种以上的图书,二次文献,一次文献,书目检索,请求后50页,进入邮箱浏览,百链云图书馆,7 图书馆信息系统,7.1 图书馆信息系统概述,7.2 图书馆信息系统的基本功能,图书馆信息系统,7.1 图书馆信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论