文 献 检 索 报 告.docx_第1页
文 献 检 索 报 告.docx_第2页
文 献 检 索 报 告.docx_第3页
文 献 检 索 报 告.docx_第4页
文 献 检 索 报 告.docx_第5页
免费预览已结束,剩余2页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文献检索报告本学期我选修了信息检索这门课,很荣幸我选了这门课,通过这门课的学习,我学会了如何用网络这个无尽的资源库查找文献资料,以及快速便捷的找到自己所需的信息,因此上这门课让我受益匪浅。当今时代,被誉为信息爆炸的时代,我们用各种各样的方式获取各种各样信息,而信息检索是20 世纪50 年代在国外兴起的一门新兴学科, 主要研究信息的表示、存储、组织和访问,即根据用户的要求, 从信息数据库中检索与之相关的信息资料。信息检索的兴起源于计算机技术的广泛应用和网络通信技术的迅速普及。近年来, 信息检索在我国有了突飞猛进的发展, 成为当前图书情报界研究的一个热点问题。而文献检索(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。例如我学的专业是环境工程,做实验时,需要设计方案,就需要大量的资料,文献,以及论文等。主要用到的数据库有CNKI中国知网,万方数据库,维普中国科技期刊数据库,百度搜索引擎。 1.CNKI-中国期刊全文数据库(http:/)该库是目前世界上最大的连续动态更新的中国期刊全文数据库,收录国内8200多种重要期刊,以学术、技术、政策指导、高等科普及教育类为主,同时收录部分基础教育、大众科普、大众文化和文艺作品类刊物,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,全文文献总量2200多万篇。CNKI文献搜索是清华同方知网公司以CNKI总库资源为基础,具有自主知识产权的专业文献检索系统.其搜索范围包含近8000种期刊、300所大学研究院所博士、硕士论文18万本、1000种学术会议论文集16万册、1000种重要报纸文章,而且实时数据更新。数据涵盖中国学术期刊、博硕士论文、会议论文、报纸文献、专利标准等近4000 多万篇最新专业学术文献。 CNKI 搜索界面简洁明快,并通过引证文献、相似文献等链接,层层深入搜索,使用户对搜索结果有更全面的了解.用户可以通过指定来源数据库、学科分类等不同分组方式,对检索结果进行进一步筛选,查到符合自己要求的检索内容。CNKI 知识搜索提供相关度、被引次数、下载次数、时间检索等排序方式,搜索结果根据下载次数标出下载指数,供用户参考;CNKI 知识搜索的高级检索提供文献重要度检索,包括核心期刊、SC、EI 文献来源有基金选项,对快速检索出高质量的科技文献很有帮助。可以搜索到环境工程129,127条结果 共6457页。CNKI具有丰富的文献引文信息和知识链接,实时的知识聚类,个性化的搜索排序,多种资源的整合,他的不足是CNKI 知识搜索平台还存在调动用户参与方面不够,只能在自己旗下的数据库中搜索,搜索范围比较小、查准率低、相关性排序科学性不足等缺点,在CNKI知识搜索平台中由于采用了知识元为检索的单位,同时没有提供相关的检索技术进行实现,用户利用语词检索时产生了许多虚假组配, 严重影响了信息的准确性。 在这一点上,CNKI 知识搜索平台应借鉴Google的技术和实现方式,以使检索功能更完备,满足不同用户的个性化的检索求。CNKI 知识搜索平台提供了相关性排序方式,但其判定标准科学性不足,导致CNKI 知识搜索平台的相关性测度与文献与检索需求的实际相关性有着较大的差别,这是CNKI 知识搜索平台需要改进之处。CNKI 学术趋势缺少国外资料,不能有效利用大量免费国外资源,而且更新较慢,有些资料仅仅更新到06 年。我们大多时间都是用CNKI。就期刊而言,具有实时的知识聚类以及个性化的搜索排序。输入“环境工程微生物学”可以找到全部期刊1523条结果。CNKI 知识搜索根据输入的搜索词和搜索结果自动生成文献类型聚类和知识聚类。CNKI 提供了文献类型、文献所属学科属性和结果聚类三种聚类方式.文献类型、文献所属学科属性是常见的聚类方式,CNKI 提供了独有的结果聚类, 即基于快速聚类算法,对检索结果的知识点进行聚类,并将知识点显示给用户,帮助用户改善检索表达式,使得文献选择更精细,更准确.CNKI 提供了文献的重要程度分类,通过期刊来源如核心期刊、SCI、EI 收入期刊等可以帮助科研人员判断文献的质量;CNKI 的关键词聚类展示了知识系统,把知识组织成簇,揭示了知识的背景,方便读者获得领域的全局知识结构CNKI包含8000多种期刊,CNKI 文献搜索是学术期刊文献知识检索的典型代表,系统提供多种个性化排序方式: 综合排序、相关度、被引次数、期望被引、发表时间、作者指数, 检索时可以根据需要自由调整。CNKI 知识搜索在搜索结果的显示和链接方面做的比较好, 通过层层链接展示学术研究的脉络, 读者通过分析文献的信息来源, 可以判断与评价信息的可靠性及其价值, 同时也有助于读者获取全文, 缺点是只能在自己旗下的数据库中搜索, 搜索范围比较小。 就学位论文而言,具有丰富的文献引文信息和知识链接,CNKI包含300 所大学研究院所博士、硕士论文18万本、且包含各个领域,让我们选择的范围广,且学位论文部分为一次出版,出版量在世界上也是绝无仅有的。CNKI使用的是独特的数据库技术知网节, 是CNKI 技术平台KNS5.0 的独创性技术,知网节技术将每一篇文献(即节点文献)与其相关文献链接而形成一种汇编网页,内容包括节点文献题录摘要、参考文献、引证文献、共引文献、同被引文献、相似文献、同作者文献、同机构文献、读者推荐文献、同类文献等。比如,当使用者以作者名字为搜索关键词进行搜索时,得到的结果就包括了该作者在各个期刊上发表的所有学术论文;当读者得到一条搜索结果时,页面下方还会显示与此文章相关的其他文献。这让我们在搜索资料时,有了更多的选择,并能挑选更高质量的文献资料。判定信息的可靠性及其学术价值,便于研究的深入开展。就专利而言,包含发明专利、实用新型专利、外观设计专利三个子库,准确地反映中国最新的专利发明。专利相关的文献、成果等信息来源于CNKI各大数据库。可以通过申请号、申请日、公开号、公开日、专利名称、摘要、分类号、申请人、发明人、优先权等检索项进行检索,并一次性下载专利说明书全文。与通常的专利数据库相比,中国专利全文数据库(知网版)每条专利的知网节集成了与该专利相关的最新文献、科技成果、标准等信息,可以完整地展现该专利产生的背景、最新发展动态、相关领域的发展趋势,可以浏览发明人与发明机构更多的论述以及在各种出版物上发表的文献。2.万方数据库() 中国科技信息研究所万方数据中心暨北京市万方数据公司是我国第一家专业数据库公司,自1988年至今已相继推出10种工商经济类及科技文献类数据库,拥有国内外用户千万个。万方数据库包括科技信息、商务信息和数字化期刊三大系统. 其中, 数字化期刊系统包括2500种科技核心期刊和500 种社科类核心期刊文; 商务信息系统包括经贸信息和中国企业公司及产品信息; 科技信息系统包括自然科学学位论文文摘( 28 万篇硕士、博士和博士后论文) 、会议论文全文( 260 篇全国性学术会议论文) 、科技文献信息( 960 万条) 、成果专利( 60 多万项、年更新2- 3 万项) 。覆盖了自然科学,数理化,天文,地理,生物,医药,环境,社科等各个学科领域。万方数据库回溯的时间从1988年开始, 时间较短, 其收录的范围较少, 但其检索速度很快, 而且具有“英文标题” 和“ 引文” 项目为检索入口, 拓宽了检索途径。另外万方数据以科技信息为主, 兼顾人文社会科学, 适合工科或理工科院校使用。适合我们环境工程检索资料。从期刊种类收录情况来看,万方收录5928种,核心期刊2374种,此数据库对核心期刊的收录均沿用了自身设定的筛选标准,因此无法做出绝对的判断。2007年以来医学中华系列杂志由万方独家发行,这样万方数据库在收录核心期刊中占有绝对优势。而万方学科覆盖范围在人文科学方面要稍显不足。从收录散文篇数来看(截止日期为2007年年底), 万方数字化期刊收录期刊文献约800万条。检索界面分析,此数据库可以进行简单检索、二次检索、高级检索等,检索策略可以编辑、保存。从对检索结果的处理办式来看,万方对检索结果的处理方式更为全而周到,尤其是对检索结果的排序。 从能否进行检索范围限定来看,万方不可进行范围限制。就期刊而言,按期刊的主题分为5大类,77个小类。数字化期刊系统包括2500 种科技核心期刊和500 种社科类核心期刊文,期刊数据库, 并对全文期刊数据库进行更好地开发和利用, 深入地了解全文期刊数据库, 分析和掌握目前我国比较有代表性的全文期刊数据库的特点,对我们自己检索本专业所需的资料有很大的帮助。万方数字化期刊收录年限1982 年至今, 万方数字化期刊收录的时间最长, 不过1982年-1989 年收录的文献306880 篇, 只占其全部800 万篇的3.8%, 1982年-1993 年收录文献610391 篇, 占总数的7. 6%。先输入“环境工程微生物”,则可检索到254篇论文,仅全文的可以找到222篇。使的我们选择范围广。就学位论文而言,万方包括自然科学学位论文文摘( 28 万篇硕士、博士和博士后论文),为我们提供了获得的大量一次文献的机会,输入“环境工程微生物”可以检索到497篇论文,仅全文的可以找到431篇。就专利而言,万方包括成果专利( 60 多万项、年更新2- 3 万项)。输入“环境工程微生物”找到2件专利,所以在做微生物实验时,有涉及到专利的资料时,使用万方不是很好的选择。3维普中国科技期刊数据库()维普库由科技部西南信息中心重庆维普资讯公司研制出版, 是目前我国收录期刊最全的综合性中文期刊文献数据库1989年至1999 年收录期刊达7000余种,2000年以来达到12000余种。学科分为: 自然科学工程技术、农业、医药卫生、经济、教育和图书情报等学科, 刊载的全文约500 余万篇文献。按照中国图书馆分类法进行分类, 所有文献被分为7个专辑: 自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报。专辑又细分为27个专题。科学的分类使得数据库可以胜任综合学科文献服务, 同时又能根据购买者不同的专业需求, 选择不同的类别进行组合。从期刊种类收录情况来看,维普收录12000余种,核心期刊1810种。维普收录期刊总数最多,其中包括了具有一定影响且连续性的非正式发行刊物。它收录沿用了自身设定的筛选标准。从收录散文篇数来看(截止日期为2007年年底),维普收录期刊全文文献最多,特别是在学科交叉中体现较为明显,这是它的优点之一。从收录时限来看,维普收录年限1989年至今, 维普从1989年-1993年收录的文献1359290篇,也只占其全部的8,大部分还是1994年至今的。检索功能分析与评价,检索界面可以进行简单检索、二次检索、高级检索等,检索策略都可以编辑、保存。但维普的检索功能更为全面。从检索导航功能来看,维普只有三种导航系统。不是很全面。从能否进行检索范围限定来看维普数据库可进行范围限制的功能最全面,比其他的数据都较全面。维普的不足在于导航系统少,且只有简体中文一种界面。数据库则采用扫描方式建库, 虽然保持了原刊的真实面貌, 却不能做到真正意义上的全文检索。维普以扫描原文方式建库, 其页面显示及打印结果显得不够清晰。就期刊而言,是目前我国收录期刊最全的综合性中文期刊文献数据库1989年至1999 年收录期刊达7000余种,2000年以来达到12000余种。输入“环境工程微生物”找到47篇全部期刊。而且还会出现引征文献,耦合文献等其他相关的信息能更进一步得了解这些资料。维普数据库还提供了刊名导航, 这不仅便于用户了解各学科收录了哪些期刊和各期刊收录的完整程度, 增加了数据库收录情况的透明度,而且为浏览期刊和针对某种期刊的检索提供了方便。此数据库提供了多种检索入口, 并能在检索结果中进行二次或多次检索, 逐步缩小检索范围, 逼近检索目标。就学位论文而言,数据库则采用扫描方式建库, 虽然保持了原刊的真实面貌, 却不能做到真正意义上的全文检索,输入为“微生物”找到58787篇期刊,而被引学位论文1243篇,被引专利210。就我们环境工程专业来说有很多是用的数据库,但主要的就这几种,通过了解以上几种数据库我们知道,随着科技的不断发展,学术搜索引擎会越来越强大,而且必然会成为网络用户获取信息的一个不可或缺的网络检索工具。本文在此总结了3 大发展趋势:(1)更加智能化。具有自然语言理解技术的学术搜索引擎可以正确有效地切分汉字,识别用户检索词中的错别字,同用户使用自然语言“交谈”,并能深刻理解和挖掘用户深层次的意图;如今数据库开发商与学术搜索引擎以及学术搜索引擎之间的相互合作也无疑推动了学术搜索引擎朝着多元智能化的方向发展。(2)服务本地化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论