1信息检索与利用教案_第1页
1信息检索与利用教案_第2页
1信息检索与利用教案_第3页
1信息检索与利用教案_第4页
1信息检索与利用教案_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

科技情报检索教师:张建英

1一、根本要求:计算机根本操作到课率二、学习形式笔记提问上机作业site:+题目

2三、学习目的综合素养:信息素养案例自由猎取学问:四、任何学习重点:实际应用3五、主要内容文献信息存储规章根底、语言、工具相关检索系统使用方法其他相关学问4检索意义需要记忆的知识知道从哪里获取知识1.学问2.学问片断理论告知我们需要信息检索技能在当今的社会没有一门学科或一套学科在可见的将来对你完全有用,更不必说一辈子受用不尽,应当学会的最重要的是学会如何学习的方法。5客观学问的总量与人类吸取学问的力气之间存在着巨大的差距,并且这种差距在不断地扩大。在信息爆炸时代,随着科学技术的越来越专业化,跨学科的信息传递变得更加困难,就会产生学问的分裂,并且随着学问的持续增长,这种现象会更加严峻。一个专业领域的信息可能对另一个专业领域是有价值的,跨学科间确定存在着潜在的未被觉察的关联。事实上文献间隐性的关联数量可能远多于显性的相互引用的关联数,并且这种隐性关联的觉察比信息本身的增长更有意义。63.二十一世纪力气素养根本学习技能(指读,写,算)信息素养创新思维力气人际交往与合作精神实践力气信息素养是一种了解,搜集,评价和利用信息的学问构造。具有信息素养的人能够知道什么时候需要信息,能够有效地猎取、评价和利用所需要的信息。7信息检索在科研中地位与作用

信息检索分析、阅读、思考新学说新理论新觉察新的问题?进展延长同行评价引用、应用阅读、实践、试验问题?试验证明、验证发表:报告、论文进入公众领域在课题争论中,资料查找的时间约占全部时间的三分之二左右。内循环外循环信息的有效交流是学科发展的根基8检索作用1.应用信息的力气2.提高信息素养3.遇到问题本能地去求助信息4.成为会终身学习的人5.应对信息超载我们简直要在信息海洋中淹死,却因缺乏学问要饿死人们在工作,学习与生活上越来越依靠信息;但面对巨大的信息源,却又难于有效地获得自己所需要的信息,这就是信息社会的信息超载给人们带来的困惑。学术信息的8-2规律:80%科技的最新最重要的成果与进展分布在20%的期刊中.9情报分析功能:把握课题最新进展以及进展趋势;找到关键的文献;猎取高质量的学术信息我们正在走向一个以学问为根底的、留意学习的制造性的社会,信息资源是科技和经济进展的战略性资源。在从事争论工作时,迫切需要的是通过检索结果的分析,得到课题进展的全貌、趋势;同时,通过对检索结果的引文分析,从成千上万条的检索结果中找到那些关键的文献。10学问目标:“知道从哪里猎取学问”力气目标:1〕能够确定所需信息的范围,鉴别信息及其来源,有效地猎取所需的信息2〕将猎取的信息融入自己的学问体系3〕有效地利用信息去完成一个具体的任务、了解利用信息所涉及的经济,法律和社会问题,合理,合法地猎取和利用信息。提高信息素养,将信息猎取作为终身学习的手段教学目标在正确的地方使用正确的工具和正确的方法查找正确的内容11信息定义:从客观上看,信息是一切事物存在方式和运动规律的表征。从主观上看,信息是指人们对世界的生疏所形成的各种学问、学问、消息,它们与人类的智能活动亲切相关。属性①普遍性②客观性③集中和传递性④增值性⑤可存储性和可压缩性⑥共享性1.1根本概念第1章绪论

12定义:人们对客观事物运动规律的生疏,是经过人脑加工处理过的系统化了的信息。学问是人类阅历和才智的总结,是人们科学地生疏世界、改造世界的力气情报定义:指传递着的有特定效用的学问。是人们为了解决某个具体问题所需的新的学问信息。根本属性:学问性、传递性和效用性。信息学问情报信息、学问与情报规律关系图第1章绪论

学问13文献定义:我国公布的《—文献著录总则》(GB3792.1-83〕中文献的定义为:“记录有学问的一切载体”。如:甲骨文、碑刻、图书、连续出版物、帛书、录音磁带、缩微平片、电影片、光盘等〔注:可参考国家标准《文献类型与文献载体代码》〔GB3469-83〕〕文献由三个要素构成,三位一体不行分割。形态构成文献的重要手段内容学问载体记录方式第1章绪论

14记录传递应用信息、学问、文献与情报间的关系加工学问在用来解决特定问题时情报在不利用时就复原为学问特定的学问和情报对既不生疏又不理解的人来说,就不过是一种信息信息学问文献情报15(1)数量急剧增长第一个百万条1907-1946年历时40年第五个百万条1972-1975年历时4年第二个百万条1947-1960年历时14年第六个百万条1976-1978年历时3年第三个百万条1961-1967年历时7年第七个百万条1979-1980年历时2年第四个百万条1968-1971年历时4年第八个百万条1981-1982年历时2年目前全世界每年出版各种文献总量约12023万册,平均每天出版文献约32万件。下面是美国《化学文摘》报道文献量的变化状况,从中不难看出文献数量的增长之快。1.2现代科技文献的特点第1章绪论

16(2)内容穿插重复(3)文献分布散乱使用寿命5~7年,各类文献的使用寿命不同(4)文献更新周期缩短我们再也不能刻苦地、一劳永逸地猎取学问了,而需要终身学习如何去建立一个不断演进的学问体系--学会生存。国际教育进展委员会主席埃德加.富尔17信息资源类型潜在信息资源现实信息资源载体信息资源实物信息资源网络信息资源文献信息资源信息资源类型口语信息资源体语信息资源印刷型缩微型声像型电子型模型雕塑碑刻数据库搜寻引擎数字图书馆电子出版物电子图书电子期刊电子报纸谈话授课唱歌讨论等手势表情姿态舞蹈等图书期刊报纸……18A、按载体形式划分〔1〕印刷型文献:载体:纸张记录手段:手写、打字、印刷和复印等优点:便于直接阅读,使用便利缺点:较笨重、存储密度低,不便于加工、整理和保藏。此类型文献有:期刊、图书等〔2〕缩微型:载体:感光材料记录手段:缩微照相优点:存储密度较大、体积小、便于保藏保存、便于远距离传递缺点:缺点是不能直接阅读,需借助缩微阅读机才能阅读此类型文献有:缩微胶卷、缩微胶片等1.3信息资源类型

19〔3〕声像型文献〔视听资料〕载体:磁性和感光材料记录手段:借助于特殊的机械装置(如复录机、摄像机、录像机等)直接记录声音、图像优点:直观、生动缺点:制作本钱较高,需要借助于确定的设备才能阅读此类型文献有:唱片、录音带、录像带、幻灯片、电影片、多媒体资料等〔4〕机读型载体:光、电、磁介质记录手段:利用计算机进展存储优点:存储密度高,,出版周期短、易更新,传递信息快速,存取速度快,可以融文本、图像、声音等多媒体信息于一体,信息共享性好、易复制,识别和提取易于实现自动化缺点:需借助计算机等先进技术设备才能阅读此类文献有:电子图书、电子期刊、网络数据库、光盘数据库等〔5〕手写型甲骨、手稿、帛书等20各种载体形式的文献蒋介石日记的缩微胶卷样品声像资料甲骨文商晚期兽甲骨文帛书中国古代写在绢帛上的文书,又称缯书。手稿印度梵文哲学手稿作机读型21B、按出版形式、内容划分1.图书依据联合国教科文组织的定义,图书是指50页以上的以印刷方式单本发行的出版物。用途:内容全面系统,根底理论性强,论点成熟牢靠。假设需要对大范围问题获得一般性学问,对生疏问题进展一般了解,对生疏问题进展历史性的全面系统的回忆,查阅图书一般来说是行之有效的方法。但图书传递信息速度慢,内容相对陈旧。阅读型:教科书(Textbook)、专著(Monograph)、文集(Anthology)等工具型:词典(Dictionary)、百科全书(Encyclopedia)、手册(Handbook)、年鉴(Yearbook)等

图书分类22图书的特征及著录格式书名信息检索导论责任者叶继元主编出版项北京:电子工业出版社,2002

载体项412页:20cm价格33.00ISBN7-5053-8694-8

索书号G252.7/Y621主题词情报检索-高等学校-教材图书的特征[美]R.霍克著.Internet通用搜寻引擎检索指南[M].沈阳:辽宁科学技术出版社.2023.2ISBN7-5381-3849-8图书著录格式23识别图书的主要依据有:书名、著者、出版地、出版社、出版时间、总页数、ISBN等。

e.g.978-7-302-14436-6图书识别的主要依据及主要检索工具图书出版信息检索工具:《全国新书目》《新华书目报》《出版社名目》各图书馆名目信息检索系统:ILASGDLIS网上书店:亚马逊网上书店当当书店上海书城数字图书馆:美国国会图书馆中国国家图书馆上海图书馆其它数字图书馆(书生、超星、Apabi等电子图书)ISBN由13位数字分成5段组成,各段依次是:EAN·UCC前缀号〔978或979〕-地区或语种号〔0、1-英语国家:澳大利亚、加拿大、爱尔兰、新西兰、波多黎各、南非、英国、美国、津巴布韦2-法语,法国、卢森堡以及比利时、加拿大和瑞士3-德语,德国、奥地利和瑞士德语区4-日本5是俄罗斯〕-出版商代号-书名号-校验号。978-7-302-14436-6,表示中国大陆代号为302的(清华大学)出版社,出版的一种图书,其书号为14436,该书的校验码为6。校验码为10时,记为罗马数字X。中国ISBN信息网::///main/图书检索工具242.期刊〔Journal〕期刊俗称杂志。是定期或不定期周期性出的连续出版物。特点:内容新颖、信息量大、出版周期短、传递信息快、传播面广、时效性强用途:猎取最新争论成果和动态目前,全世界每年出版各类期刊达15万种以上,科技期刊约占10万种。我国现有期刊8000多种,其中科技期刊占54%。据统计,科研人员从期刊中得到的信息约占65%以上,是特殊重要的情报源。25学术性:一般性期刊(Journal),汇刊(

Transactions)

,各种学报(

Acta)

通报(

Bulletin)

、评论(

Reviews)

、进展等(Progress)快报性期刊:各种通讯Letters、短讯News等

检干脆期刊:index,Abstract核心期刊是指那些发表该学科〔或该领域〕论文较多、使用率〔含被引率、摘转率和流通率〕较高、学术影响较大的期刊期刊分类一般性期刊学术水平内容26识别期刊的主要依据:

期刊名称,期刊出版的年、卷、期,国际标准刊号(ISSN)等。

正式出版的期刊有ISSN代码,即国际标准连续性出版物编号ISSN由8位数字分两段组成期刊代号+末位是校验号如,ISSN1001-8867为《中国图书馆学报》的国际标准编号我国正式出版的期刊都有国内统一刊号(CN),它由地区号、报登载记号和《中图法》分类号组成,如CN11-2257/G3。地区号依《中华人民共和国行政区划编码表GB2260-82》取前两位,如北京为11、天津12、上海31、辽宁21、吉林22等。刘泉,吕锋,刘翔.灰色趋势关联分析及其应用[J].系统工程理论与实践.2023,21(5):7780,86.27期刊检索工具《中文科技期刊全文数据库》〔维普〕《中国期刊网全文数据库》〔CNKI〕〕《中国数字化期刊群》〔万方〕中国国家科技图书文献中心〔NSTL〕的期刊数据库联机检索系统EBSCOElsevierSDOL(ScienceDirectOnline)ProQuestOVID283.科技报告(Sci-TechReport):特点:内容新颖、具体、专业性强、出版准时、传递信息快,发行范围把握严格,不易猎取原文识别科技报告的主要依据有:报告名称、报告号、争论机构、完成时间PB报告是美国国家技术信息效劳处(NTIS)出版的报告。报道美国政府资助的科研工程成果,其内容包括自然科学和工程技术全部学科领域,主要侧重民用工程,如土木建筑、城市规划、环境疼惜、生物医学等方面。PB报告的编号为“PB+年月+挨次号”。美国政府四大报告:科技报告也称技术报告、争论报告,它是科学争论工作和开发调查工作成果的记录或正式报告29AD报告是美国国防技术信息中心〔DTIC〕出版的报告。主要报道美国国防部所属的军事机构与合同单位完成的争论成果,主要来源于陆海空三军的科研部门、企业、高等院校、国际组织及国外争论机构。AD报告的内容涉及与国防有关的各个领域,如空间技术、海洋技术、核科学、自然科学、医学、通信、农业、商业、环境等38类。30NASA报告是美国国家航空宇航局出版的报告。NASA报告的内容侧重于航空和空间科学技术领域,广泛涉及空气动力学、飞行器、生物技术、化工、冶金、气象学、天体物理、通信技术、激光、材料等方面。DOE报告是美国能源部出版的报告,主要报道能源部所属的争论中心、试验室以及合同户的争论成果,也有国外能源机构的文献。内容包括能源疼惜、矿物燃料、化学化工、风能、核能、太阳能与地热、环境与安全、地球科学等。美国政府四大报告:31中文科技报告的主要检索工具:国家科技图书文献中心〔NSTL〕、万方数据库、中国科技成果网、中国公众科技网〔:///report/〕。外国科技报告的主要检索工具:美国科技信息效劳局NTIS。此外网上也有外国科技报告免费站点:GrayLITNetWork:可以检索并扫瞄DTIC、NASA、DOE、EPA等美国政府报告全文。DOEInformationBridge:可以检索并获得美国能源部供给的争论与进展报告全文,内容涉及物理、化学、材料、生物、环境、能源等领域。NetworkedComputerScienceTechnicalReportsLibrary(NCSTRL):集合了世界上很多大学以及争论试验室有关计算机学科的科技报告,可免费得到全文。TheCongressionalResearchServiceReports:供给了很多环境方面报告全文。SearchforCaliforniaEnvironmentalDocuments:美国加州大学环境科学方面的科技报告全文。【科技报告检索工具】

324.会议文献(conferencepaper)特点:内容新颖、专业性和针对性强,传递信息快速,能准时反映科学技术中的新觉察、新成果、新成就以及学科进展趋向。用途:了解有关学科进展的动向识别会议文献的主要依据有:会议名称、会址、会期、主办单位、会议录的出版单位等。会议文献的关键词“Proceeding”、“Meeting”、

“Conference”、“Symposium”会前文献:会谈论文预印本、会谈论文摘要会后文献:是会后经整理出版的文献,如会议录(Proceedings)、会谈论文集(Symposium)、会谈论文汇编(Transactions)、会议丛刊、丛书是指在各种学术会议上沟通的学术论文。33中国学术会谈论文库〔:///〕分为中国学术会谈论文文摘数据库〔CACP〕和中国学术会谈论文全文数据库〔PACC〕国家科技图书文献中心〔://〕的中文科技会谈论文数据库CNKI会谈论文数据库【会议文献检索工具】34ISIProceedings会谈论文数据库包含两个数据库:科技版、社会和人文科学版。美国ThomsonScientific公司〔:///〕基于ISIWebofKnowledge的检索平台将ISTP〔科学技术会议录索引〕和ISSHP〔社会科学及人文科学会议录索引〕两大会议录索引集成为ISIProceedings,供给会谈论文文摘索引信息,掩盖了从1990年至今召开的60,000次会议上发表的约200万篇论文。【会议文献检索工具】355.专利文献(PatentLiterature):是实行专利制度的国家,在承受申请和审批制造过程中形成的有关出版物的总称。包括专利说明书、专利公报、专利分类表、专利检索工具以及与相关的法律性文件。特点:(1)内容新颖、出版快速据统计全世界制造制造成果约90%~95%首先公诸于专利文献,故它是猎取新技术最快的、最重要的和最大的技术信息资源,被称作企业的技术百科全书。(2)涉及技术领域广泛、有用性强在争论开发和生产活动中遇到的各种技术问题,几乎均能在专利文献中得到有价值的解决方案,还能依据专利申请状况,觉察正在开拓的新技术市场以及它对经济进展的影响,故专利文献也是最好的有用技术信息源。36(3)具有法律效力专利说明书是一种有法律效力的文件,是推断专利侵权的主要依据。(4)重复量大由于同一项制造可以向不同国家申请专利,便形成了专利说明书,它们虽然文字不同但内容几乎完全一样。特点:中国国家学问产权局的专利检索数据库〔://〕。〔1〕欧洲专利局〔:///〕的esp@cenet,可检索欧洲专利局EP、世界学问产权组织WO、日本英文文摘(PAJ)及世界范围的专利信息。〔2〕美国专利商标局专利数据库〔://〕。〔3〕日本特许厅专利数据库〔://〕。【检索工具】376.标准文献(StandardLiterature):是经过公认的权威机构批准的以特定的文件形式消逝的标准化工作成果。特点:是对标准化对象描述具体、完整、内容牢靠、有用,有法律约束力,适用范围明确,是从事生产、设计、治理、产品检验、商品流通、科学争论的共同依据,也是执行技术政策所必需的工具。国家标准代号用GB表示,“GB”表示强制性国家标准,是具有法律属性,在确定范围内通过法律、行政法规等手段强制执行的标准。强制性标准:①药品、食品卫生、兽药、农药和劳动卫生标准;②产品生产、贮运和使用中的安全及劳动安全标准;③工程建设的质量、安全、卫生等标准;④环境疼惜和环境质量方面的标准;⑤有关国计民生方面的重要产品标准等。“GB/T”表示推举性国家标准,又称为非强制性标准或自愿性标准。是指生产、交换、使用等方面,通过经济手段或市场调整而自愿承受的一类标准。专业标准的代号是“专标”,汉语拼音的字母“ZB”加《中国标准文献分类法》的二级类目号〔《中国标准文献分类法》〕。38根底标准产品标准方法标准安全卫生标准正式标准法定标准推举标准试行标准国际标准ISO3297-1986区域标准国家标准GB18187-2023行业标准企业标准按内容分按成熟度分按范围分识别标准文献的主要依据有:标准级别、标准名称、标准号、审批机构、公布时间、实施时间标准类型与识别标准文献分类39标准实例、构成及检索工具中国标准网://中国标准效劳网://中国标准询问网://国际标准化组织ISO://美国国家标准学会://中国农业标准网://中国农业质量标准网://【检索工具】留意:标准在不断地补充和修订,新的标准不断地替代旧的标准。因此,查阅时应以最新标准为准。GB19506-2023原产地域产品吉林长白山人参GB/T17296-2023表示2023年的“中国土壤分类与代码”国家推举性标准ISO658-2023表示《Oilseeds-Determinationofcontentofimpurities》国际标准。ZBG32023-87表示阳离子羟基硅油乳液的专业标准【实例】标准代号标准挨次号标准公布年月标准名称407.学位论文(Thesis,Dissertation):是指高等学校或争论机构的学生为取得某种学位,在导师的指导下撰写并提交的学术论文。识别依据:学位名称、导师姓名、学位授予机构

特点:具有确定独创性、探讨的问题比较专一、内容系统和完整,有较大的参考价值、一般不公开发表,具有确定保密性。中国科技信息争论所是国家法定的学位论文保藏单位UniversityMicrofilmsInternational--UMI)负责保藏和报道全美的博士、硕士论文,并收集报道其他国家的学位论文英国国家图书馆(不列颠图书馆)负责保藏和报道本国的学位论文在日本,国立大学的学位论文由日本国立图书馆统一保藏,私立大学的学位论文则保藏在学位授予单位的图书馆中。41学位论文检索工具中国学位论文全文数据库〔万方〕中国优秀博硕士学位论文全文数据库〔CNKI〕CALIS学位论文库〔/〕国家科技图书文献中心的中文学位论文数据库,国外学位论文检索工具―PQDDPQDD〔ProQuestDigitalDissertations〕收录了欧美1000余所大学的170万篇学位论文,每年还增加4.5万篇论文摘要。我校已订购该库,访问地址://428.政府及国际组织出版物是指各国政府部门及其所属机构出版的文献,又称官方出版物。

行政性文献(包括立法、司法文献),主要有政府法令、方针政策、规章制度、决议、指示、统计资料等,主要涉及政治、法律、经济等方面。科技文献主要是政府部门的争论报告、标准、专利文献、科技政策文件、公开后的科技档案等。【用途】了解各国的方针政策、经济状况及科技水平,有较高的参考价值。【特点】内容范围广泛;具有权威性;一些非正式出版的文献,不易收集43人民网〔://〕国研网美国政府出版物名目月报(://)美国政府报告通报与索引〔GovernmentReportsAnnouncement&Index,简称GRAI〕是由美国NTIS编辑出版的摘要式检索刊物,它全面报道美国政府四大科技报告,重点报道NASA和DOE报告。美国政府期刊索引数据库〔://〕供给了促进科学争论的美国政府期刊的完全索引,是翻开美国联邦政府出版的全部情报资料财宝的钥匙。欧共体信息网政府联机信息效劳系统〔://〕它供给政府网址清单,通过它可检索欧盟及其它欧洲国家官方机构信息。【检索工具】

44国际组织出版物检索工具经济合作与进展组织://联合国贸易与进展组织://国际贸易中心://国际货币基金组织://联合国工业进展组织://联合国粮农组织://459.产品资料(ProductLiterature):是厂商为推销产品而印发的介绍产品状况的文献,包括产品样本、产品说明书、产品名目、厂商介绍等。【特点】反映的技术比较成熟,数据也较为牢靠,内容具体、通俗易懂,常附较多的外观照片和构造简图,形象、直观。但产品样本的时间性强,使用寿命较短,且多不供给具体数据和理论依据。【用途】1、作为技术人员设计、制造新产品的一种有价值的参考资料。2、了解各厂商出厂产品现状、把握产品市场状况及进展动向。46【产品资料检索工具】

网络上的产品资料信息数据库如《中国企业产品库》,有中国27万余家各行业企业根本状况及产品资料。还有行业网站、公司企业网站都供给产品资料信息。单独出版的产品名目《机械产品名目》、《全国化工产品名目》等。广告资料全国广告资料库NAD实时查询系统,是特地为广告公司、营销询问公司、企业的市场营销部门和媒体等设计的高度复合的信息数据库,产品类别涉及品牌和产品型号。每月监测和采集大约28000则中文报刊广告,有广告主或品牌的投放分析、媒体的广告收入分析以及各产品类目下的广告主分布信息,而且全部的分析数据均可以连接到投放明细数据,包括广告的创意画面。4710.科技档案(TechnicalRecords):是指在自然科学争论、生产技术、根本建设等活动中所形成的应当归档保存的科技文件,如课题任务书、预备、大纲、合同、试验记录、争论总结、工艺规程、工程设计图纸、施工记录、交接验收文件等。【特点】内容真实、详尽、具体、准确牢靠,保密性强,保存期长期,是科研和生产建设工作的重要依据,具有很大参考价值。【用途】了解生产领域和科学实践中的阅历和技术窍门48【实例】福建省科技档案馆的一个档案资料中亚热带常绿阔叶林生态采伐作业系统争论时间:2023年9月8日来源:科技档案馆主要完成单位:福建农林大学主要完成人员:周新年、邱仁辉、杨玉盛、游明兴等省级成果登记号:20230074主要内容:选择皆伐作业的5种集材方式与采伐强度为30%的择伐作业,进展土壤理性质指标变化程度的比较。经主成分分析得出不同采伐、集材方式对林地土壤理化性质的干扰程度,并作出科学排序。49信息量大传递快传播面广现实感强以刊载新闻和评论为主的出版周期较短的定期连续出版物。【特点】【检索工具】中文:人民日报网络版://、中国人民大学报刊全文数据库、慧科中文报纸、中国财经报刊数据库、中国科技经济新闻数据库。上海图书馆出版的中文社科报刊篇名数据库可以检索清末以来的报纸篇名。人民日报网络版有版面细分的图标,免费点击阅读。外文:TheNewYorkTimes(://)收录《纽约时报》全文数据库;EBSCO报刊全文索引,只收录TheNewYorkTimesindex《纽约时报索引》文章的摘要。11.报纸50文献类型主要识别特征馆藏单位图书

出版地、出版商、ISBN、总页码

各类型图书馆、省级以上信息研究所期刊论文刊名、年、卷、期、ISSN、起止页码

各类型图书馆、省级以上信息研究所会议文献会议名称、会址、会期、举办单位

专业性图书馆、省级以上信息研究所、中国科技信息研究所科技报告

报告提交单位、报告号

国家图书馆等大型图书馆、省级以上信息研究所专利文献

发明名称、专利号

专利局、省级以上信息研究所学位论文

学位名称、学位授予单位

学位授予单位的图书馆、档案室,中国科技信息研究所标准文献

标准号、颁布日期、实施日期

省级以上技术监督部门、图书馆(以书出版的标准文献汇编)技术档案

归档号各级档案馆、各单位的档案室小结51概念例子

通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。

零次文献二次文献一次文献C、按信息内容加工深度划分期刊论文、科技报告、会议论文、专利说明书是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。目录、题录、文摘、索引、各种书目数据库是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目三次文献检索的手段对象+工具通常未经正式发表或未公开于社会,其内容为非正式交流的原始文献。手稿、笔记、记录、书信、口头交流非文献信息检索的对象52S农业科学

S3农学〔农艺学〕

S3-3农学的争论方法

S3-33丰产试验〔阅历〕、农业技术推广

S31作物生物学原理、栽培技术与方法

S311作物生理学

S312作物生物化学

S313作物生物物理学

S314作物生态学

S315作物分布、作物地理学

S316疼惜地栽培

S317无土栽培

S318其他栽培技术与方法

S32作物品种与种质资源〔品种资源〕……【实例】A马克思主义、列宁主义、毛泽东思想、邓小平理论N自然科学总论B哲学、宗教O数理科学和化学C社会科学总论P天文学、地球科学D政治、法律Q生物科学E军事R医药、卫生F经济S农业科学G文化、科学、教育、体育T工业技术H语言、文字U交通运输I文学V航空、航天J艺术X环境科学、安全科学K历史、地理Z综合性图书《中图法》分类简表中国图书馆图书分类法例如53图书:主要著录特征:主要责任者、书名(版本)、出版社、出版地、出版年如:刘少奇.论共产党员的修养〔修订2版〕[M].北京:人民出版社,1962,(76页).WeinsteinL.DigitalFiltersandTheirApplications[M].London,England:AcademicPress,1978,p472-481.1.6检索工具中文献源的辨识54期刊:主要著录特征:作者、文章题名、刊名〔通常为缩写〕、年、卷、期、页码如:邹振扬,郑绎根.纳米TiO2的光化学特性及其在环境科学中的应用[J].工材料导报,2023,14(6):35-39TeraokaK,NonamiT,YokogawaY,TaodaHandKameyamaT.PreparationofTi02—coatedhydroxyapatitesinglecrystals[J].JournalofMaterialResearch,2023,15(6);1243—1244.Aoki,Hatanaka.Y.ApplPhysLett[J],2023,76(22):3257—3258.1.6检索工具中文献源的辨识55会议文献:主要特征:1〕会议特征:如conference,Congress等2〕主办会议的机构特征:如:society,association等3〕会议文献类型的特征:如会前出版的文献paper,会后出版的文献proceedingsMeowD.Mixed-typeopticalfibercurrentsensor[C],ProceedingsofSPIE,V.1572,p497-507,1991

SPIE〔InternationalSocietyforOpticalEngineering〕国际光学工程师学会【实例】1.6检索工具中文献源的辨识56专利文献:主要特征:1〕国别名:如CN代表中国,GB代表英国,US

代表美国2〕专利号,如:20231065481专利申请人,专利名称,US.patent4142783,1979专利申请人,专利名称,US.Patent20230165750,2023【实例】1.6检索工具中文献源的辨识57学位论文:主要特征:1)学位和学位论文名称,

如PhD.Dissertation,MasterThesis2)授予学位的大学名称、地点及授予年份等作者,论文题目[D],Ph.DDissertation,StanfordUniv,StandfordCA,1980

高连生.大路联网收费关键性技术的争论[D],北京工业大学,北京,2023参考文献著录规章可参考标准:GB7714—87【实例】1.6检索工具中文献源的辨识58单字码名称单字码名称B档案M专著C会议录N报纸D学位论文P专利J期刊R科技报告K参考工具(如手册、年鉴)S标准1.7检文献特征代码59公共图书馆高校图书馆科学图书馆专利、标准文献效劳系统档案、科技信息效劳系统1.8文献信息效劳系统各效劳系统有着亲切的联系,又有各自不同的效劳重点与效劳对象601.9中文论文后参考文献的著录格式人类文明史进展到21世纪,几乎全部的科技活动都是在前人工作的根底上进展的,或多或少都要参考他人的成果、阅历或数据,这就是大多数科技论文后都附有参考文献的道理。正确把握科技论文后的参考文献的书写格式,对于文献发表与被他人检索等均有很重要的意义。我国关于正文中参考文献的标引格式及论文后所附参考文献的格式都有严格的规定。这里受篇幅所限,对常用的一些格式做一些简洁的介绍。611.论文中参考文献的标注格式〔1〕论文正文中指明引文的著作者,引文序号直接放在作者名后面的右上角。引文序号也即文后参考文献的序号。(2)假设正文中没有写明作者,只是引用某一观点或某些数据,则序号放在引文之后的右上角。〔3〕参考文献假设为正文句中的组成局部,则参考文献序号直接以正文的形式跟在文献后。(4)假设论文正文中同时引用了两篇参考文献,则两篇参考文献的序号写在一起用逗号隔开。(5)假设在论文正文中同时引用多于两篇参考文献,则参考文献的序号用横线和逗号相连。固然一篇论文中也可以分别在不同的地方引用同一篇参考文献的内容,但全部一样参考文献在正文不同位置消逝时的序号要全都。622.论文后参考文献的著录格式不同的文献类型,其著录格式略有不同,下面分别简洁介绍。〔1〕图书标准格式为:作者1,作者2.书名.出版地:出版者,出版年.引用页码。(2)期刊标准格式为:作者1,作者2.篇名.期刊名,出版年,卷(期):引用页码。〔3〕报纸标准格式为:作者1,作者2.篇名.报纸名称,出版年-月-日(版次)。(4)学位论文标准格式为:作者.论文篇名:“学位论文”.出版地:出版者,出版年.引用页码。63举例:布喇格光纤光栅以其波长编码的优势,激发了人们对其传感应用的兴趣,已广泛应用于大型桥梁建筑的安康监测[1-3]。解调技术是光纤光栅传感技术的关键环节之一,承受光谱仪对波长漂移测量最为准确,但仪器体积大、重量大,不利于现场工作,而且解调本钱高。利用干预解调[4,5]能够抑制光谱仪的缺点,然而受环境影响大,必需保证工作环境温度恒定,不受振动影响。文献[4]中供给了一种解调方法,用于传感系统。参考文献:欧进萍,周智,武湛君等.黑龙江呼兰河大桥的光纤光栅智能监测技术[J].土木工程学报,2023,37(1):45~49周智,武湛君,赵雪峰等.混凝土构造的光纤光栅智能监测技术[J].功能材料,2023,34(3):344~348林述涛,李志刚.卫水道特大桥的光纤光栅智能监测系统[J].徐州建筑职业技术学院学报,2023,5(2):15~18余有龙,谭华耀,锺永康.基于干预解调技术的光纤光栅传感系统[J].光学学报,2023,21(8):987~989江毅陈淑芬.用3×3耦合器的干预仪直接解调光纤光栅传感器的信号[J].光学学报,2023,24(11):1487~1490641.3.1检索的定义广义的信息检索是指将信息按确定的方式组织和存储起来,并依据信息用户的需要找出关信息的过程,所以其全称又叫信息存储与检索。狭义的信息检索是指从信息集合中找出所需信息的过程.一般是指狭义上的检索.依据检索对象和检索结果的不同,信息检索可分为3种类型:数据检索、事实检索和文献检索。1.数据检索数据检索是指检索结果是数据的信息检索,例如某种金属的熔点,某种材料的电阻等。另外,有关计算公式、数据图表、化学分子式等都属于数据检索的范畴。第2章信息检索根底65数据检索它是以数值或图表形式表示的数据为检索对象的信息检索,又称数值检索。即检索工具或检索系统中存储的是大量的数据,它包括物质的各种参数、号码、银行帐号、观测数据、统计数据等数字数据,这里以各种参数、统计数据为主。还包含图表、图谱、市场行情、化学分子式、物质的各种特性等非数字数据,并供给确定的运算推导力气。数据检索是一种确定性检索,信息用户检索到各种数据是经过专家测试、评价、筛选过的,可直接用来进展定量分析。数据检索与文献检索有很多共同之处,文献检索的很多方法也适用于数据检索。662.事实检索指检索结果是事实结论的信息检索。凡查询某一事物或大事的性质、定义、原理,以及发生的时间、地点、过程等,都属于事实检索的范畴。诸如某类产品由哪些厂家生产,哪个牌号最好等均属于事实检索。说明:进展事实检索和数据检索的工具主要是有关参考工具书。

67事实检索它是以文献中抽取的事项为检索内容的信息检索,又称事项检索,其检索对象既包括事实、概念、思想、学问,也包括一些数据信息,但要针对查询需求,由检索系统进展分析、推理后再输出最终结果。事实检索是信息检索中最简洁的一种,要求检索系统必需有确定的规律推理力气和自然语言理解功能,目前很多事实检索仍是以人工检索为主。事实检索也是一种确定性检索,用户获得的是有关部门某一事物的具体答案。683.文献检索指检索结果是文献资料的信息检索。但凡查找某一课题、某一作者、某一地域、某一机构、某一事物的有关文献的保藏单位和出处等,均属于文献检索的范畴。文献检索可分为手工检索(简称手检)和计算机检索(简称机检)两种类型。手检是基础,机检是进展方向。69文献检索它是以文献为检索对象的信息检索。即利用相应的检索方式与手段,在存储文献的检索工具或文献数据库中,查找检索者在特定的时间和条件下所需文献的过程。它为检索者供给的是与用户的需求相关的文献信息。文献检索的目的:是检索相关文献的出处和保藏处所,这些文献可以是涉及某一主题、学科、著者、文种、年月的文献。文献检索的结果:供给与检索课题相关的数篇文献的线索或原始文献供用户参考,这些文献的相关程度与检索系统、检索技术的优劣、检索策略是否合理、检索需求主题分析是否准确有很大区分。70信息检索分类按检索对象划分文献检索数据检索事实检索按检索手段划分手工文献检索计算机文献检索网络文献信息检索71文献检索的原理科技文献的快速增长和内容的高度分散,给文献检索和利用带来了越来越多的困难。承受传统的扫瞄来直接猎取文献已不能满足需要。人们需要承受科学的方法,来猎取所需文献、编制文献检索工具(存储文献)和利用文献检索工具(检索文献)。文献检索包括对文献的加工整序(存储)和查寻(检索)两局部,其检索原理简洁地说,就是在存储过程中,对每一篇有价值的文献进展分析、著录,以极其简洁的形式加以提示,赐予特定的标识(如分类号、主题词等),并将某种标识依据确定的检索语言(分类语言、主题语言等)集中组织起来,成为有规律的检索系统,即检索工具。检索过程就是检索者在查找所需文献时,以该系统所用的标识作为提问标识与系统中的文献特征标识进展比较,并将文献特征标识与提问标识全都的线索从检索系统中检出,检出的局部就是检索的结果。所谓著录是指对某一特定文献的描述,即依据确定的著录条例用文字把文献的特征,如文献篇名、作者姓名、争论主题、学科属性、内容提要、文献出处等表示出来,使检索者从这些工程中,对文献有概括的了解,从而考虑是否需要。72以上的两个过程——存储过程和检索过程可用图1-1来表示。73在存储和检索过程中,检索语言起着重要的语言保障作用,它沟通文献检索和存储两过程,沟通标引人员和检索人员双方的思路,既是编制检索工具的依据,也是计算机信息存储及检索系统用以表达文献主题概念的人工语言。假设没有检索语言作为沟通标引人员与检索人员之间的桥梁,就很难使得标引人员对文献主题内容的表达与检索人员对相同内容的课题文献需求取得全都,文献检索也就不能顺当实现,甚至无法实现。关于检索语言将在以后的章节中作具体的介绍。74

常用运算算符与检索技术

常用的规律算符有三种,分别是规律“与”〔“AND”、“*”〕;规律“或”〔“OR”、“+”〕;规律“非”〔“ANDNOT”、“NOT”、“-”〕。2.7计算机检索

ABAandBAorBAnotB规律运算〔Booleanoperator〕75截词检索就是用截断的词的一局部进展的检索,并认为凡满足这个词局部中的全部字符〔串〕的文献,都为命中的文献。按截断的位置来分为前截断、后截断、中截断三种类型。依据截断数量来分,包括有限截词〔即一个截词符只代表一个字符〕和无限截词〔一个截词符可代表多个字符〕。不同的系统所用的截词符也不同,常用的有“?”、“$”和“*”等。绝大局部数据库的无限截词符用“*”,少数数据库用“?”或者“$”。2.7.4截词检索76下面以联机检索系统的无限截词符“?”举例说明:〔1〕后截断,前方全都。如:“comput?”表示computer、computers、computing等。〔2〕前截断,前方全都。如:“?computer”表示minicomputer、microcomputers等。〔3〕中截断,中间全都。如:“?comput?”表示minicomputer、microcomputers等。772.7.5位置算符邻近位置算符〔W〕W是with的缩写。〔W〕算符也可以简写为〔〕算符,A〔W〕B,表示A紧挨着B,挨次不能颠倒。A和B之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。邻词位置算符〔nw〕A〔nw〕B,表示两个词的次序不变,其间可以插入n个词。句子位置算符〔S〕S是sentence的缩写。A〔s〕B表A和B必需同时消逝在记录的同一个句子或短语中,但次序可能任凭转变,A与B之间可以有假设干个其他的词。78字段位置符〔F〕F是field的缩写。A〔F〕B,表示A和B必需同时消逝在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如Rice〔F〕Genetics/Ti要求Rice和Genetics必在同时消逝在篇名之中。记录位置算符〔C〕C是citation的缩写。A〔C〕B其作用等同于AandB,均表示A和B同时消逝在同一记录内,但词序不限,也不要求在同一字段内。79其它符号1括号转变运算挨次。2引号引号内的检索项以整体形式消逝。准确匹配:“”和《》号,给查询词加上双引号则不拆分查询词,加上书名号的查询词,一是书名号会消逝在搜寻结果中;二是被书名号扩起来的内容,不会被拆分。〔百度〕3.个别数据库使用的特殊符号某些搜寻引擎使用加号〔+〕表示该单词必需消逝。【实例】在某些搜寻引擎中输入“+电脑++”就表示要查找的内容必需要同时包含“电脑、、”这三个关键词。个别数据库例如“国研网”、山东标准网使用“&”代替“and”;欧洲专利局光盘数据库的“without”、美国专利商标局数据库的“andnot”就是通用的“not”。80检索预备选择检索工具选择检索途径拟订检索式实施检索筛选文献索取原文检索步骤弄清课题学科属性、专业范围及其相关内容弄清检索课题的信息类型和时间要求考虑课题的特殊要求明确用户自身的信息需求将全部相关文献汇总,并分析梳理,编辑,选择亲切相关文献,调阅文献的全文,提取有关数据及指标同时依据课题的技术要点,将检索结果与课题的主要论点进展比照分析,猎取有用的信息。第2章信息检索根底81【例题】中文争论课题为“法国文艺复兴时期文学作品浅析”。要求查询国内中文检索工具。如何具体分析课题?

〔1〕学科属性、专业范围属于社会科学,具体属于外国文学,还涉及外语等多学科。〔2〕文献类型文献类检索结合事实数据类检索:事实数据类检索包括①查询“文艺复兴”这个概念②文艺复兴时期有多长?③在该期间法国诞生了哪些重要的有影响的作品?可以从百科全书、文学辞典等参考工具书中查到。文献类检索就是查询是否有前人撰写的法国文艺复兴时期文学作品浅析的期刊论文、学位论文、专著或者网页。〔3〕课题的特殊要求补充检索标识:文学家、F·拉伯雷、小说、《巨人传》。由于查阅《中国大百科全书》第5卷2757页上关于F·拉伯雷的记载,知道在当时的法国文学家F·拉伯雷以长篇小说《巨人传》在欧洲获得崇高声誉。82评价的目的是为了准确把握检索系统的各种性能水平,分析影响检索效果的因素,调整检索策略,改进检索系统的性能,优化检索、提高检索效果,更好地满足用户信息检索要求。判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。因此,对信息检索的效果评价也应当从这三个方面进展。质量标准主要通过查全率与查准率进展评价。费用标准即检索费用是指用户为检索课题所投入的费用。时间标准是指花费时间,包括检索预备时间、检索过程时间、猎取文献时间等。查全率和查准率是判定检索效果的主要标准。查准率和查全率结合起来,描述了系统的检索成功率。2.8检索效果评价与优化2.8.1评价的目的2.8.2评价评价标准83查全率查准率

系统文献库中相关文献总量对于用户来讲几乎无从得知。由此可见,查全率和漏检率很难成为用户自我评价检索效率的准绳查全率和查准率的评价标准

阅历评价标准理论评价标准检出相关文献量--------------------×100%文献库内相关文献总量检出相关文献量--------------------×100%检出文献总量通过相关领域从业的人员状况通过手头把握的信息资料842.8.3影响检索效果的因素

1.工具和检索系统本身的问题。工具收录的信息不全、标引深度不够。2.检索者本身的问题。一般的状况下检索者只能或许地表述自己的提问而不能准确地衡量文献信息与提问的切题程度。加之,学科的不断进展,使课题的性质和范围也不断地变化〔一〕影响查全率的因素85从文献存储来看:文献库收录文献不全;索引词汇缺乏把握和专指性;词表构造不完整;词间关系模糊或不正确;标引不详;标引前后不全都;标引人员遗漏了原文的重要概念或用词不当等。从情报检索来看:检索策略过于简洁;选词和进展规律组配不当;检索途径和方法太少;检索人员业务不娴熟和缺乏急躁;检索系统不具备截词功能和反响功能,检索时不能全面地描述检索要求等。〔二〕影响查准率的因素影响查准率的因素:索引词不能准确描述文献主题和检索要求;组配规章不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所用检索词〔或检索式〕专指度不够,检索面宽于检索要求;检索系统不具备规律“非”功能和反响功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用规律“或”不当等等。86提高查全率的方法留意相关领域〔如近缘学科、穿插学科和边缘学科〕的检索,这是扩大检索范围、提高查全率特殊重要而有效的途径。计算机信息检索时,应取消各种限制,承受任意字段检索分类检索时可承受更加广泛的上位类号来检索用词汇检索时,尽可能供给更多的同义词或近义词〔计算机检索时用规律“或”/“+”联结〕以拓宽检索范围87计算机检索时可承受模糊检索或运用规律“或”检索,以放宽条件,提高查全率适当放宽检索时限尽可能选择信息收全率高的检索工具,假设一个工具不能满足信息查全率上的要求,应细心选择多个工具进展检索对检索词进展修正用词汇检索时,选词不全是很重要的漏检缘由。选词时除了要参阅相关词表以外,还应参阅已在手的相关文献或征询有关专家的意见。88机构名、人名、地名、出版物名称等作为限制检索项限制检索的语种缩短检索的时限分类途径中可承受进一步细分检查是否有操作错误增加限定词汇,让不同检索词同时消逝在同一记录提高查准率的方法89

计算机检索图书馆书目数据库国家图书馆书目数据库大学图书馆书目数据库全国新书目等书目数据库网络检索远程登陆电子邮件WWW新浪北极星搜豹等百度搜狐网易悠游焦点电子期刊CNKI万方、维普概念、特点搜索引擎检索工具电子图书书生、超星等电子图书常用中文参考数据库中文科技期刊数据库全国报刊索引数据库人大复印报刊资料事实和数值型数据库新华社多媒体信息数据库中国科学院“科学数据库”大百科全书、年鉴、手册电子报纸人民日报全文数据库中华读书报光明日报参考消息中国日报分类搜索引擎关键词搜索引擎光盘数据库CAB、FSTA90第3章搜寻引擎3.1搜寻引擎及工作原理搜寻引擎指自动从英特网搜集信息,经过确定整理以后,供给应用户进展查询的系统。搜集信息:搜寻引擎利用称为网络蜘蛛(spider)的自动搜寻机器人程序来连上每一个网页上的超链结。机器人程序依据网页链到其它的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开头,连到数据库上全部到其它网页的链接。理论上,假设网页上有适当的超连结,机器人便可以遍历绝大局部网页。搜集信息整理信息承受查询91整理信息:搜寻引擎整理信息的过程称为“建立索引”。搜寻引擎不仅要保存搜集起来的信息,还要将它们依据确定的规章进展编排。这样,搜寻引擎根本不用重新翻查它全部保存的信息而快速找到所要的资料。92承受查询:用户向搜寻引擎发出查询,搜寻引擎承受查询并向用户返回资料。目前,搜寻引擎返回主要是以网页链接的形式供给的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜寻引擎会在这些链接下供给一小段来自这些网页的摘要信息以帮助用户推断此网页是否含有自己需要的内容。93全文搜寻引擎:如Google、百度分类名目:如雅虎、搜狐、新浪、网易分类名目主题型搜寻引擎混合型搜寻引擎3.2搜寻引擎分类全文搜寻引擎由于依靠软件进展,所以数据库的容量特殊浩大,但是,它的查询结果往往不够准确;分类名目依靠人工收集和整理网站,能够供给更为准确的查询结果,但收集的内容却特殊有限。94分类型搜寻引擎用户通过扫瞄名目来查找所需信息。分类一般按主题分类,并辅之以年月、地区等分类。网站多以此方式组织。优点:使用户清晰便利地查找到某一大类信息,尤其适合那些希望了解某一范围内信息,并不严格限于查询关键字的用户。缺点:搜寻范围较全文搜寻引擎要小很多,尤其是当用户选择类型不当时,可能遗漏某些重要的信息源。代表性的名目式分类搜寻引擎是Yahoo、搜狐、新浪网站。95主题型搜寻引擎主题型搜寻引擎将不断收集到的网上页面及地址信息以数据库的形式组织存贮。查询时用户向其提问框中输入关键词,搜寻引擎便会从数据库中检索与之相匹配的相关记录,按确定的排序返回给用户。优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词进展搜寻,检索直接、便利,而且可使用规律检索、短语检索等高级功能。缺点:繁多而杂乱的感觉。代表性的主题型搜寻引擎是Google、百度〔Baidu〕网站96运算符号搜寻引擎根本上都支持“与”、“或”、“非”、括号或引号等规律运算符号,不同的搜寻引擎使用的规律符不完全一样,常见的有“AND”、“OR”“NOT”以及“+”、“-”、“&”、“^”等规律符号“AND”在中文搜寻引擎都可以用空格代替;“NOT”有时可以用减号代替,格式如“关键词A-关键词B”,减号前面要有空格。“OR”有时用“|”表示,例如在百度搜寻引擎的格式是“关键词A|关键词B”。Google直接用“OR”表示,格式是“关键词AOR关键词B”。97字段限定①intitle网页的标题限定intitle:林青霞②sitesite是限定在某类站点或某个网站内搜寻。例如“评估”,是在这个网站内搜寻“评估”的网页。③filetype:filetype限定文件类型。“关键词Afiletype:文件格式后缀名”。如“个人总结filetype:doc”,搜寻结果全都是word文件的个人总结。④inurlURL就是地址栏里的域名等。inurl常见的使用方式是“关键词Ainurl:英文字符B”。例如“Oracleinurl:lib”,是检索在url中含有lib的网页中关于“Oracle”的信息。98复制中的文章我们把题目记住之后,在搜寻引擎的框框里输入:site:+题目

【site命令是指在制定的网站里搜寻,加号也是要的,假设嫌输入加号麻烦,可以用空格代替。】

如搜寻android+论文,输入:android+论文〔中间有空格〕

搜寻引擎都有网页网页快照,如百度有百度快照,谷歌有网页快照,我们点击快照进入网址.99翻开网页快照或百度快照之后,我们就可以看到以网页形式显示的正文内容了。最终,我们只需要将内容复制下来就可以,粘贴到WORD等文本编辑器里,就可以保存下来了。1003.3混合搜寻引擎该引擎是将用户提交的检索恳求发送到多个独立的搜寻引擎上去搜寻,并将检索结果集中统一处理,以统一的格式供给应用户,因此有搜寻引擎之上的搜寻引擎之称。它的主要精力放在提高搜寻速度、智能化处理搜寻结果、共性化搜寻功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。101元搜寻引擎通过调用、把握和优化其它多个独立搜寻引擎的搜寻结果并以统一的格式在同一界面集中显示,它在检索恳求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜寻技术。比方“metaFisher元搜寻引擎”〔〕,它就调用和整合了百度、Google、Yahoo、OpenFind(源自台湾中正大学GAIS试验室的搜寻引擎,它收集的中文网页仅次于百度,GOOGLE,搜寻的相关性也相当不错,因网络连接,大陆的用户较慢,但是一样是一个优秀的中文搜寻引擎)等多家搜寻引擎的数据。102集成搜寻引擎它是通过网络技术,在一个网页上链接很多个独立搜寻引擎,查询时,点选或指定搜寻引擎,一次输入,多个搜寻引擎同时查询,搜寻结果由各搜寻引擎分别以不同页面显示,比方“网际瑞士军刀”〔〕103网际瑞士军刀metaFisher元搜寻引擎万纬搜寻

:///元搜寻引擎例如第3章搜寻引擎104主要的全文搜寻引擎Google成立于1997年,几年间快速进展成为世界范围内规模最大的搜寻引擎。Google数据库现存有42.8亿个Web文件,每天处理的搜寻恳求已达2亿次,而且这一数字还在不断增长。百度国内最早的商业化全文搜寻引擎,拥有自己的网络机器人和索引数据库,专注于中文的搜寻引擎市场,除有网页搜寻外,百度还有新闻、MP3、图片等搜寻中国搜寻〔:///〕。中国搜寻的前身是慧聪搜寻,原慧聪搜寻在联合中国网等30多家知名网站的根底上,2023年9月25日,正式组建了中国搜寻联盟,经过一年多的进展,联盟成员就已达630多家,成为中国互联网一支重要的力气。3.4主要的搜寻引擎介绍第3章搜寻引擎105主要分类名目雅虎中国分类名目〔:///〕新浪分类名目〔:///〕。新浪的分类名目目前共有18个大类目,用户可按名目逐级向下扫瞄,直到找到所需网站搜狐分类名目〔:///〕。分类名目把网站作为收录对象,具体的方法就是将每个网站首页的URL地址供给应搜寻用户,并且将网站的题名和整个网站的内容简洁描述一下,但是并不提示网站中每个网页的信息内容。除此之外,也可以使用关键词对搜狐的“分类名目”或全部网站进展搜寻。网易分类名目〔〕。网易的分类名目承受“开放式名目”治理方式,在功能齐全的分布式编辑和治理系统的支持下,现有5000多位各界专业人士参与可扫瞄分类名目的编辑工作,极大地适应了互联网信息爆炸式增长的趋势。106107第3章搜寻引擎3.5典型搜寻引擎介绍百度公司〔Baidu,Inc〕于1999年底成立于美国硅谷,它的创立者是资深信息检索技术专家、超链分析专利的唯一持有人――百度总裁李彦宏,及其好友――在硅谷有多年商界成功阅历的百度执行副总裁徐勇博士。

百度是目前全球最优秀的中文信息检索与传递技术供给商。中国全部供给搜寻引擎的门户网站中,超过80%以上都由百度供给搜寻引擎技术支持,现有客户包括新浪、搜狐、163.net、腾讯、263、上海热线、广州视窗、新华网、北方时空、西部时空、重庆热线、吉林信息港、大庆信息港、东方热线、湖南信息港、南阳信息港、顺德信息网。108限制文档格式:FiletypePDF、DOC、XLSe.g.霍金黑洞filetype:pdf限定在特定站点:sitee.g.mp3播放器限定在网页标题中:intitlee.g.写真intitle:林青霞限定在url链接中:inurle.g.AUTOCADinurl:newhua准确匹配:双引号和书名号要求搜寻结果中不含特定查询词:e.g.神雕侠侣-电视剧

第3章搜寻引擎百度高级搜寻语法109①site:后面跟的站点域名,不要带://;另外,site:和站点名之间,不要带空格②intitle:和后面的关键词之间,不要有空格③inurl:语法和后面所跟的关键词,不要有空格④给查询词加上双引号则不拆分查询词,加上书名号的查询词,一是书名号会消逝在搜寻结果中;二是被书名号扩起来的内容,不会被拆分;⑤前一个关键词,和减号之间必需有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。110第3章搜寻引擎GoogleGoogle是由英文单词“googol”变化而来它表示10100,是个巨大的数字。Google的胃口犹如它的名字,大得特殊。编入其索引的有30多亿页面,4亿幅图片和8亿个新闻公告.Google使用这个词代表公司想制服网上无穷无尽资料的雄心。Google成立于1997年,几年间快速进展成为目前规模最大的搜寻引擎,目前Google每天处理的搜寻恳求已达2亿次!而且这一数字还在不断增长。Google数据库存有42.8亿个Web文件。属于全文搜寻引擎。Google允许以多种语言进展搜寻,在操作界面中供给多达30余种语言选择。Google可用“AND”、“and”、“&”进展规律“与”运算,但只能用大写“OR”表示规律“或”,不支持“NOT”规律符操作,允许使用“-”符号代替规律“非”运算;曾获得“精彩搜寻效劳”、“最正确引擎界面”、“最正确引擎设计”、“最友好网络治理”和“最正确搜寻功能”六项大奖111112结果要求包含两个及两个以上关键字e.g.搜寻引擎历史结果不包含某些特定信息e.g.搜寻引擎历史-文化-中国历史-世界历史结果至少包含多个关键字中的任意一个aORb限制文件类型filetypee.g.资产负债表filetype:docORfiletype:xlsORfiletype:ppt显示全部指向该网址的网页link:。例如,“”将找出全部指向Google主页的网页。不能将link:搜寻与一般关键词搜寻结合使用。在某个特定的域或站点中进展搜寻,“site:xxxxx”查看字词或词组的定义,键入“define”,接着键入一个空格,然后键入您需要其定义的词很多搜寻引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必需用““引起来。比方,““以*治国“”,表示搜寻第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。Google高级搜寻语法113搜寻整个短语或者句子Google的关键字可以是单词〔中间没有空格〕,也可以是短语〔中间有空格〕。但是,用短语做关键字,必需加英文引号,否则空格会被当作“与”操作符。e.g.“worldwarI”“文献检索”《文献检索》搜寻引擎无视的字符以及强制搜寻对无视的关键字进展强制搜寻,则需要在该关键字前加上明文的“+”号。e.g.+www+的历史internet搜寻的关键字包含在URL链接中e.g.inurl:midi沧海一声笑搜寻的关键字包含在网页标题中e.g.“写真集“intitle:藤原纪香图片搜寻Google的图像搜寻界面输入描述图像内容的关键字就会搜寻到相关的图片。名目检索假设不想搜寻广泛的网页,而是想查找某些专题网站,可以访问Google的分类名目:///,中文名目是Google高级搜寻语法114Google其它技巧中英文字典定义计算器天气查询区号手机号归属地股票查询115其它技巧中英文字典Google给中英文单词互译带来了极大的便利。您只需输入一个关键词(“翻译”,“fy”和“FY”任选其一〕和要查的中(英)文单词,Google返回的网上字典链接让您即刻便可知道您要查的词的英文〔或中文〕翻译。假设是中译英,Google还会

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论