版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、华东师范大学软件学院工程硕士论文写作Lecture 01 文献检索主讲: 姜宁康 博士日期: 2022/7/242022/7/241工程硕士论文写作, Author: NK Jiang孔子曰:三人行,必有我师。唐朝大诗人韩愈弟子不必不如师,师不必贤于弟子。闻道有先后,术业有专攻授人以鱼不如授人以渔 -文献检索这里介绍一些概念、方法,帮助大家去(比如, Internet网)找资料,准备论文。师傅引进门,修行靠自身2022/7/242工程硕士论文写作, Author: NK Jiang 你是否会经常遇到下列问题& 如何使用网络数据库或电子资源?& 如何获取原文?& 我可以使用的免费资源有哪些?&
2、如何科学、合理地确定检索词、检索式? 需要解决的问题 信息的选择 信息的检索2022/7/243工程硕士论文写作, Author: NK Jiang信息检索的重要意义和作用充分利用信息资源,避免重复劳动科学研究具有继承和创造两重性,科学研究的两重性要求科研人员在探索未知或从事研究工作之前,应该尽可能地获取与之相关的信息,即利用信息检索的方法,充分了解国内、国外,前人和他人对拟探索或研究的问题已做过哪些工作?取得了什么成就?发展动向如何?等等。这样才能做到心中有数,防止重复研究,将有限的时间和精力用于创造性的研究中。因此,信息检索是科学研究必不可少的前期工作。为人们更新知识,实现终生学习提供途径
3、在当代社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。美国工程教育协会曾估计,学校教育只能赋予人们所需知识的20%25%,而75%80%的知识是走出学校后,在研究实践和生产实践中根据需要,不断再学习而获得的。因此,掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。2022/7/244工程硕士论文写作, Author: NK Jiang信息检索的三个层次知道在哪里能找到信息(了解不同的信息源)能从信息源中检索出合适的信息(课题分析和检索技术)能对检索结果进行评价和分析(选择、综合利用)2022/7/245工程硕士论文写作, Autho
4、r: NK Jiang预备: 认识IP地址人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。动态IP地址指的是每次连线所取得的地址不同而静态IP地址是指每次连线均为同样固定的地址。如,在图书馆无线上网就是动态IP地址,每次所取得的地址不同。 静态地址如学校网站的IP 02通常一经设定,变动较少。2022/7/246工程硕士论文写作, Author: NK Jiang预备: 网络地址和认识域名虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串
5、显然是非常困难的,为此,Internet提供了域名(Domain Name)。域名也由若干部分组成,各部分之间用小数点分开,例如我校主机的域名是 :“”。域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:“http:/ www. ”。域名一般不会变动。2022/7/247工程硕士论文写作, Author: NK Jiang预备: 网络地址-网址-URL网络地址是URL(UniformResourceLocator)的俗称,一般由三个部分构成,各个部分如下:服务器标识符通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可以有HTT
6、P:/、FTP:/、GOPHER:/、TELNET:/、NWES:/等等类型,分别指定为采用超文本传输协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。信息资源地址信息资源地址是由两部分构成的,一是机器名称,如是用来指示资源所存在的机器,另一个是通信端口号,如HTTP的标准端口号为80,TELNET的标准端口号为23,FTP的标准端口号为21等等。路径名路径名是给出资源在所在机器上的完整文件名.如:/keynews/2008/2008,1001,066519.html2022/7/248工程硕士论文写作, Author: NK Jia
7、ng预备: 域名与网络信息资源有什么关系?由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人们按用途把它们分为几个大类,它们分别以不同的后缀结尾:随着Internet向全世界的发展,除了edu、gov、mil、一般只在美国专用外,另外三个大类com、org、net则成为全世界通用,因此这三大类域名通常称为国际域名。ac 代表科研机构由于国际域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如: . 中国的商业.org.hk 香港的组织.net.jp 日本的网络对网络信息资源的获取与评价有参考作用.com 商业公司.org 组织、
8、协会等.net 网络服务.edu 教育机构.gov. 政府部门.mil 军事领域2022/7/249工程硕士论文写作, Author: NK Jiang全世界为美国打工 目前,全世界共有13台根服务器,其中10台在美国,而且2台由美军使用,1台由美国国家航空航天局使用。也就是说,每天世界各地的电子邮件有很多要先由美国人“过目”之后才能去它该去的地方。此外,美国私营公司掌握着全世界互联网域名的分配大权。假如美国与日本的关系急剧恶化,只要美国通过技术手段删去日本的域名“. jp”,日本马上就会成为“网上孤岛”,无法通过网络与外界联系。全世界的网络用户都要向美国支付费用,“全世界都在为美国打工”。
9、中国已经建成了世界第一个同时也是规模最大的纯IPv6网 2022/7/2410工程硕士论文写作, Author: NK Jiang 第一讲 文献检索基础知识和理论 第一节 信息检索基本概念 第二节 科技文献类型与识别 第三节 文献检索工具 第四节 文献检索的方法和途径 第五节 计算机检索基础知识 第六节 计算机检索技术 本讲要点:信息检索、文献检索、计算机检索的基本概念和原理,各出版类型文献的特点,检索工具的类型和作用,计算机检索技术。 2022/7/2411工程硕士论文写作, Author: NK Jiang第一节信息检索基本概念 一、信息、知识、文献的概念 1. 信息 ( informat
10、ion ): 信息是事物发出的体现它存在和运动状态的信号和消息。是物质的一种普遍属性,是生物以及具有自动控制系统的机器,通过感觉器官和相应的设备与外界进行交换的一切内容。 2. 知识 (Knowledge): 知识是信息的一部分,是一种特定的人类信息。知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映。 3. 文献(document): 记录有知识和信息的一切载体。由四要素组成:所记录的知识和信息、记录知识和信息的符号图像、用于记录知识和信息的物质载体、记录的方式或手段。2022/7/2412工程硕士论文写作, Author: NK Jiang二、信息检索定义 广义的信息
11、检索: 是指将信息按一定的方式组织和存储起来, 并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索” 。 狭义的信息检索: 指该过程的后半部分,即从信息集合中找出所需要的信息的过程, 相当于人们通常所说的信息查寻。三、信息检索的本质 是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。 用户根据检索需求,对一定的信息集合采用一定的技术手段,根据一定的线索与准则找出相关的信息。 第一节信息检索基本概念2022/7/2413工程硕士论文写作, Author: NK Jiang 三、检索方式 1. 根据信息的存储技术和检索技术的不同, 信息检索可分为: 手工检索:通
12、常使用的是一些印刷载体的工具书和检索期刊,检索过程由人脑和手动翻书/刊的配合来完成,匹配是由人脑的思考、比较和选择。 计算机检索: 使用的是检索系统。系统包括计算机设备、终端、通信设施、数据库和检索、应用软件等。 2. 根据检索对象形式的不同, 信息检索可分为: 文献检索: 凡以文献(包括文摘、题录或全文)为检索对象的, 是一种相关检索,不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。 数据或事实检索: 凡以数据或事实为检索对象的, 是一种确定性检索, 直接回答用户提出的技术问题,提供用户所需要的确切数据或事实。检索结果一般是确定性的有或无,对或错。第一节信息检索基本概念2
13、022/7/2414工程硕士论文写作, Author: NK Jiang 传统的图书馆是专用于典藏书籍的处所,其收藏的主要是纸本文献。随着科学技术的迅速发展,现代的记录形式和出版方式有了很大变化,“图书”这个概念已经不能概括当前所有的出版物。今天,人们将数据、期刊、资料等出版物统称为“文献”,图书馆文献资源类型的划分标准纷繁复杂,这里主要介绍三种划分方法 。 1. 根据文献的载体形式划分 2. 根据文献的编辑出版形式划分 3. 按文献的结构等级 (文献的加工程度)划分一、文献资源类型第二节 科技文献类型与识别2022/7/2415工程硕士论文写作, Author: NK Jiang1. 根据文
14、献的载体形式划分印刷型缩微型机读型视听型图 书连续出版物资 料缩微平片缩微胶卷缩微胶片磁带、磁盘光 盘联机网络版录音带、录像带唱片、幻灯片电影胶卷2022/7/2416工程硕士论文写作, Author: NK Jiang 例:OCLC 2022/7/2417工程硕士论文写作, Author: NK Jiang2. 根据文献的编辑出版形式划分图 书连续出版物特种文献普通图书工具书期刊型书籍报 纸期 刊科技报告专利文献学位论文标准规范政府出版物产品资料会议文献2022/7/2418工程硕士论文写作, Author: NK Jiang2.1. 图书 ( book ) ISBN:国际标准书号( Int
15、ernationalStandardBookNumber)的简称定义:指内容比较成熟、资料比较系统、有完整定型的装祯形式的出版物。格式:著者、书名M、版本(第1版不标注)、出版地、出版者、出版年、引文所在的起始或起止页码。 【例】翟婉明. 车辆-轨道耦合动力学M. 北京:中国铁道出版社, 1997. 74-80. 2.2. 期刊 ISSN国际标准连续出版物号(InternationalStandardSerialNumber)的简称 定义:一种以印刷形式或其他形式逐次刊行,通常有数字或年月顺序编号,并打算无限期地连续出版下去的出版物。期刊一般都有固定的刊名。格式:著者、题(篇)名J、刊名、出版
16、年、卷号(期号)、引文所在的起始或起止页码。【例】史峰,李致中.铁路车流路径的优选算法J.铁道学报,1993,15(3):70.2022/7/2419工程硕士论文写作, Author: NK Jiang一、概念 人们根据一定的目的全面系统地搜集某一方面的有关资料,经过筛选、加工整理、概括、浓缩等手段,用一定的编排方法加以组织编排,专供查考问题和检索文献线索的一种特种图书。二、特性 1.知识的密集性 2.知识的价值性 3.知识的有序性 4.检索性三、根据编制特点和功能分类 1. 字典、辞典; 2. 百科全书;中国大百科全书、不列颠百科全书 3. 年鉴、手册、名录;上海经济年鉴 4. 年表、历表;
17、中国历史纪年表 例如, 工具书2022/7/2420工程硕士论文写作, Author: NK Jiang定义:是科学技术工作者围绕某个课题研究所取得的成果的正式报告,或对某个课题研究过程中各阶段进展情况的实际记录。其中绝大多数涉及高、精、尖科学研究和技术设计及其阶段进展情况,客观地反映科研过程中的经验教训。格式:著者、报告题名R、出版地、出版者、出版年、页码。 【例】朱家荷,韩调.铁路区间通过能力计算方法的研究R.北京:铁道部科学研究院运输及经济研究所,1989.34. 2.4. 会议文献 ( conference、 paper )定义:会议文献是在各种学术、专题会议上发表的论文和报告。会议文
18、献多数以会议录的形式出现。是专业领域最新研究成果报道的一种主要方式。格式:文献著者、题(篇)名A、论文集名C、出版地、出版者、出版年、引文所在起始或起止页码。【例】张玉心.重载货车高摩擦系数合成闸瓦的研制和应用A.见:中国铁道学会编译.国际重载运输协会制动专题讨论会论文集C.北京:中国铁道学会,1988.242. 2.3. 科技报告 ( report、 technical report )2022/7/2421工程硕士论文写作, Author: NK Jiang2.5. 专利文献 ( patent document )定义:发明人或专利权人申请专利时向专利局所呈交的一份详细说明发明的目的、构成
19、及效果的书面技术文件,经专利局审查,公开出版或授权后的文献。广义包括专利申请书、专利说明书、专利公报、专利检索工具以及与专利有关的一切资料。格式:专利所有者、题名P、专利国别、专利号、出版日期。【例】曾德超.常速高速通用优化犁P.中国专利:85203720.1,1986-11-13. 2.6. 标准文献 ( standard、 specification、 requirement )定义:指经过公认的权威当局批准的以文件形式表达出的统一规定,包括技术标准、技术规格和技术规则等文献的总称。 格式:标准代号(标准顺序号-发布年)、标准名称S。 【例】 GB J111-87,铁路工程抗震设计规范S.
20、 2022/7/2422工程硕士论文写作, Author: NK Jiang2.7. 学位论文 ( dissertation、 thesis )定义:高等学校或研究院所的学生在导师指导下从事某一学术课题的研究,为获得某种学位而撰写的学术性较强的研究论文。格式:著者、题(篇)名D、保存地点、保存单位、年份、引文所在起始或起止页码。 【例】党建武.神经网络方法求解组合优化问题的研究D.成都:西南交通大学,1996.20-25. 2.8. 政府出版物 ( government document ) 政府出版物是各国政府部门及其所属机构发表、出版的文件,其内容广泛,概括可以分为行政性文献和科技文献两大
21、类。2.9. 产品资料、技术档案等(product literature、technical record) 各厂商为推销产品而印发的商业宣传品,包括产品样本、产品目录、产品说明书、厂商介绍、技术座谈资料等。 企业或科研机构在技术工作中形成的、有一定的工程对象的技术文件。如任务书、协议书、技术经济指标和审批文件、研究计划方案大纲和技术措施等。2022/7/2423工程硕士论文写作, Author: NK Jiang 各类型出版物特点比较 内 容 新颖性: 科技报告、专利、期刊、会议文献、图书 信息报道速度: 科技报告、期刊、会议文献、专利 流通范围广度: 期刊、图书、会议文献、专利、政府出版物
22、 发 行 量: 期刊、专利、图书、会议文献 具有法 律 性: 专利、标准 易于获取程度: 期刊、图书、会议文献、专利、标准、政府出版 物、学位论文、科技报告2022/7/2424工程硕士论文写作, Author: NK Jiang3. 按文献的结构等级(文献的加工程度)划分 按文献中信息量的变化情况来划分,可分成三个结构等级。 3.1. 一次文献(primary document) 即原始文献。是指人们以自己的经验和研究成果为依据而形成的文献,不管文献以何种物质形式出现。如期刊论文、会议论文、科技报告、专利说明书、标准等,一次文献的信息比较具体、详尽和系统化。 维普中文科技期刊数据库、Else
23、vier Science 、UMI博/硕士论文全文库 3.2. 二次文献(secondary document) 是通过对大量分散、无序的一次文献进行加工、提炼、压缩和组织,成为系统的、便于查找一次文献的工具。如书目、索引、文摘等检索工具即是二次文献。二次文献的重要性在于它可以提供一次文献的线索。 工程索引 Ei 、ISTP 、中国学术期刊数据库(题录文摘版) 3.3. 三次文献(tertiary document) 在利用二次文献的基础上,对检索到的一次文献进行广泛、深入的分析研究之后,再次加工出来的成果。如综述、述评、进展等。 百科全书、年鉴2022/7/2425工程硕士论文写作, Aut
24、hor: NK Jiang 为了获取原始文献,应学会辨识科技论文后所附参考文献的不同出版类型。一般著录项目都包括篇名、著者姓名、文献出处,可以从文献出处识别各种文献的出版类型。 (1)图 书: 有出版社名称和出版年份。 (2)期 刊: 包括刊名、卷、期、页码、月年。 (3)会议文献: 包括会议名称、时间、地址、会议录出版单位及其地址、出版年份、会议录提供单位及其地址、页码。 (4)专利文献: 有专利国家名称或国家代号、专利号,有的还有出版时间。 (5)科技报告: 最明显是出处中有报告号,有的有出版时间。 (6)学位论文: 一般著录学位和学位论文的名称, 颁发的单位及地址、时间。 (7)标准文献
25、: 一般有标准编号。二、科技文献出版类型的辩识2022/7/2426工程硕士论文写作, Author: NK Jiang2022/7/2427工程硕士论文写作, Author: NK Jiang第三节 文献检索工具的基本概念一检索工具定义 定义:用来报道,存储和查找文献的印刷型出版物或数据库系统。文献检索工具是指对体积庞大、无序的一次文献经过加工压缩而成体积较小的二次文献,再根据一定的原理和规则编制而成的工具。可满足各种用户的不同层次的检索需求。2022/7/2428工程硕士论文写作, Author: NK Jiang例如,华东师范大学图书馆2022/7/2429工程硕士论文写作, Autho
26、r: NK Jiang二、检索工具的类型 检索工具可以依据不同的标准来划分,根据著录内容可划分为以下四种: 1.目录 ( catalog ) 目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。 目录类型: 馆藏目录:反映一个图书馆文献收藏情况的目录。 中国国家图书馆 / 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。 全国中西文期刊联合目录0/catal
27、og/default.htm CALIS联机公共数据库 /2022/7/2430工程硕士论文写作, Author: NK Jiang按出版类型划分:图书目录、期刊目录、会议论文目录。按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录(OPAC ,Online Public Access Catalog )等。 目录示例: 可参照图书馆主页熟悉了解。/structure/indexnew2.htm 29/index.htm OPAC :是指以计算机编码形式存贮在计算机系统内,供读者通过终端设备进行联机检索的图书馆目录,即书目数据库的一种形式。2022/7/2431工程硕士
28、论文写作, Author: NK Jiang题录是单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。 题录的著录项目一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。题录在揭示文献内容的深度方面,比目录深入,但又比文摘简单。 示例1: 2. 题录 ( bibliography 、bibliographic、citation )2022/7/2432工程硕士论文写作, Author: NK Jiang题录示例2:Ei CPX Web (工程索引网络版记录题录显示格式)2022/7/2
29、433工程硕士论文写作, Author: NK Jiang文摘示例1: 文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表示文献内容特征的摘要。3. 文摘 ( abstract )2022/7/2434工程硕士论文写作, Author: NK Jiang文摘示例2:Ei CPX Web (工程索引网络版记录文摘显示格式)2022/7/2435工程硕士论文写作, Author: NK Jiang 4. 索引 ( index ) 索引是对一组信息集合的有系统的指引。索引是一种附属性的检索工具,通常称为辅助索引。索引具有便于检索,揭示事
30、物比较深入、全面、明细等方面的优点。 索引的用途在文献检索中体现得极为突出,科技文献数量庞大、内容复杂多样,使用面广且频繁。虽然已将其中绝大部分加工压缩成文摘或题录等。但如果没索引,查检起来还是很不方便。严格地说,没有索引的检索工具不能称为完善的检索工具。 最常用的索引是主题索引、分类索引和著者索引等。2022/7/2436工程硕士论文写作, Author: NK Jiang索引示例:Ei CPX Web (工程索引网络版索引显示格式)2022/7/2437工程硕士论文写作, Author: NK Jiang 定义:是一些在网页中主动搜索信息并将其自动索引的Web网站,与普通网站不同的是,搜索
31、引擎网站的主要资源是它的索引数据库,收集了全世界成百上千万个网站和网页的信息,存储在可供检索的大型服务器中,建立索引和目录服务。 主要功能:是为人们搜索Internet上信息并提供获得所需信息的途径。 “搜索引擎”也就是指充分利用各种网络自动搜索技术,对网络信息资源提供强有力检索的工具。 常用搜索引擎介绍与链接: 1.OCLC中的WorldCat 2.EI中的Sircus 3.百度搜索 4.三、网络信息检索工具 搜索引擎( Search Engine )2022/7/2438工程硕士论文写作, Author: NK Jiang一、检索方法 文献检索的方法(查找文献的方法)大致可以归纳为三种:
32、1.直接法:即直接利用文献检索工具或检索系统来查找文献的方法,是一种常规的科学检索方法。分为顺查法、倒查法和抽查法。顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法 . 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法 抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段 2.追溯法:又称引文法,是一种跟踪查找法。是利用文献(尤其是评述性论文或有关专著) 后面所附的参考文献,进行逐一地追踪查找原文。(例如:SCI) 3.综合法:1、2两种方法的综合。利用检索工具或检索系统进行常规检索,再利用文献后所附参考文献进行追溯检索,
33、分期分段交替使用这两种方法,直到满足要求为止。可以查得较全面较准确,尤其适用于那些过去年代内文献较少的课题。第四节 文献检索的方法和途径2022/7/2439工程硕士论文写作, Author: NK Jiang文献检索的途径主要可以分为以下几种: 1. 内容途径 文献检索一般是根据课题内容查找有关的文献信息,因此该途径是主要的检索途径。内容途径又可分为以下两种检索途径: 分类途径 是一种按照文献信息所属学科(专业)属性(类别)进行检索的途径。一般检索系统均提供数据库所使用的分类表的分类号索引。 主题途径 通过文献信息的内容主题进行检索的途径。计算机检索主要是主题检索,检索系统可提供多个检索点。
34、二检索途径2022/7/2440工程硕士论文写作, Author: NK Jiang中图法的分类原则 根据当前社会科学和自然科学所包括的学科多、发展快等特点,按图书学科内容作为分类的主要标准与依据。将图书在五个基本部类的基础上分为22个大类,分别以拉丁字母AZ表示。2022/7/2441工程硕士论文写作, Author: NK Jiang示例:中图法社会科学自然科学T工业技术 TP自动化技术、计算机技术 TP3计算技术、计算机技术 TP3-0计算机理论与方法 TP3-05计算机与其他学科的关系 TP30一般性问题 TP301理论、方法 TP301.1自动机理论 TP301.2形式语言理论 TP
35、301.4可计算性理论 TP301.5计算复杂性理论 TP301.6算法理论 TP302设计与性能分析 TP302.1总体设计、系统设计 TP302.2逻辑设计 TP302.4制图 TP39计算机的应用 /andychen1984/blog/item/21a22d35868b4988a71e1276.html2022/7/2442工程硕士论文写作, Author: NK Jiang索书号: 是识别一种图书的唯一标识,图书馆同一分类号的文献数量很多,为了区别相同类号的文献,在分类号的基础上,又给了一个区分符号,这个符号称之为书次号。书次号与分类号一起共同构成索书号。图书馆的文献就是按照索书号的顺
36、序排架管理的。 中文书索书号如:TP312/ 39, 西文书索书号如:O6/ FC562022/7/2443工程硕士论文写作, Author: NK Jiang 2. 著者途径 是根据已知文献著者姓名来查找文献的途径。文献著者包括个人著者和团体著者。一般检索系统都有著者(个人)索引,有的还有团体著者(机构)索引,均按字顺编排,其下为记录个数或文摘号。在利用内容途径查文献有困难时,如一些新近发展起来的学科或技术,往往难于确定类目或检索词,使用著者途径查找文献就显出其优越性,但该方法不能满足全面检索某一课题文献的需要。 3. 名称途径 根据文献的名称查找文献的途径。一般多用于查找图书、期刊、会议名
37、称。常用于目录性检索工具/系统,如书名目录期刊目录期刊联合目录等。 4. 序号途径 以文献的编号为特征,检索文献的途径。根据一些文献类型的特有标识,如科技报告的报告号;专利文献的专利号、入藏号,合同号,技术标准的标准号;ISSN,ISBN等作为检索点。 5. 其他途径 如分子式、元素符号、数字等。2022/7/2444工程硕士论文写作, Author: NK Jiang2022/7/2445工程硕士论文写作, Author: NK Jiang核心期刊: /cjc/2022/7/2446工程硕士论文写作, Author: NK Jiang图书馆购买、拥有使用权的电子资源(网络资源)一、数据库概念
38、 由IP地址限制,专线访问,免费使用并发用户( 3-15人 )注意:严禁过量下载即在一定时间内集中、批量下载全文数量超过50篇以上 电子资源知识产权第五节 计算机检索基础知识2022/7/2447工程硕士论文写作, Author: NK Jiang二、数据库的类型 目前在计算机检索领域中数据库种类繁多,为便于学习,归纳为文献数据库和非文献数据库两大类。 文献数据库包括:题录文摘数据库、全文数据库; 非文献数据库包括:事实数据库、数值数据库等。 1. 题录、文摘数据库 (bibliographic database): 是一种二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读
39、版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。如:Ei CPX Web(工程索引)、中文期刊数据库(文摘题录版)等。2022/7/2448工程硕士论文写作, Author: NK Jiang 2.全文数据库(full-text database): 是将一个完整的信息源的全部内容转化为计算机可识别和处理的信息单元而形成的数据集合,即机读化的一次文献。用户可直接检索出原始文献,也可检索全文中的段、节、章等内容。 如:中国学术期刊数据库、维普中文科技期刊(全文版)等。 3.事实数据库 (fact database): 这类数据库
40、能直接向用户提供可用的数据 (包括文字、图形、图象、声音、计算机程序等)。如:百科全书、辞典、手册、指南、地图集、人名录、企事业名录、计算机程序、音乐等。 如:中经专网(教育版)、中国资讯行、万方。 4.数值数据库(numeric database): 这类数据库主要提供来自原始文献的统计数据、调查数据或经过处理的各种数据、数值表格。 如:气象数据、地质资料、化学或物理化合物特性的文献数据、财务数据、人口统计资料、市场调研数据等。2022/7/2449工程硕士论文写作, Author: NK Jiang 1. 联机数据库 联机检索是用户利用计算机终端设备,通过通信线路与联机信息检索中心的中央计
41、算机联机进行检索。联机检索系统由用户检索终端、通信网络和联机信息检索中心组成。联机检索允许用户采用人机对话的交互方式直接访问检索系统和数据库,检索是在线实时进行的。如:Dialog国际联机检索系统。 2. 光盘数据库 光盘检索系统的基本构成包括微机、CD-ROM驱动器、软件(检索软件和系统软件)。 光盘检索系统可单用户检索,也可将CD-ROM驱动器接入局域网,如通过图书馆网或校园网连接多个用户终端,用服务器管理运行一组光盘数据库,组成多用户CD-ROM网络。 如:INSPEC (19892000) 3. 网络数据库 通过WWW访问数据库站点,确认合法用户和口令或IP地址后,进入检索界面进行检索
42、。该种检索方式不受时空限制,合法用户可在任何地方适时检索。三、 数据库检索方式2022/7/2450工程硕士论文写作, Author: NK Jiang 利用布尔逻辑算符对检索词进行逻辑组配时,未限定检索词之间的位置关系,会影响某些课题的查准率并容易造成误检。为了弥补其不足,一般检索系统都提供文中自由词检索功能,也称全文检索功能 (Full text searching)。 所谓全文检索是利用文献记录中任何有实义的关键词、词组或字符串作为检索词,词与词之间的位置关系可以用位置运算符来表达。 位置运算符的使用,进一步强化了对概念的限制,比布尔逻辑运算符更能表达复杂的概念,并避免AND逻辑组配产生
43、的词义含糊或误检。 为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。 全文检索的运算方式,不同的检索系统有不同的规定,主要差别有两点: 规定的位置算符不同; 位置算符的职能和使用范围不同。下面介绍几种数据库经常使用的位置运算符:三、词位置检索(positional operator) 位置运算符2022/7/2451工程硕士论文写作, Author: NK Jiang 检索效果: 查全率:检索过程中,计算机输出的相关文献数与计算机数据库中相关文献的总数之比。 检 出 相 关 文 献 量 100% 文献库内相关文献总量 查准率:检索过程中,计算机输出的相关文献数与输出的文献总
44、数之比。 检 出 相 关 文 献 量 100% 检 出 文 献 总 量 实验证明: 在查全率和查准率之间存在着相反的相互依赖关系如果提高输出的查全率,就会降低其查准率,反之亦然。2022/7/2452工程硕士论文写作, Author: NK Jiang 第六节 计算机检索技术一、布尔逻辑检索 在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。 布尔逻辑(组配)算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*(与)、OR/+(或)、
45、NOT/(非)。 布尔逻辑检索: 即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间的逻辑关系。 1. AND 或 * 算符 实现逻辑“与”组配 检索时,命中信息同时含有两个概念,专指性强。如:logistics AND e-commerce traffic AND control2022/7/2453工程硕士论文写作, Author: NK Jiang 2. OR 或 + 算符 实现逻辑“或”组配 3. NOT 或 算符 实现逻辑“非”组配检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比AND扩大。如:rapid transit OR light rail OR
46、subways railway OR railroad命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词。如:fruit NOT apple windows NOT Microsoft2022/7/2454工程硕士论文写作, Author: NK Jiang二、截词检索 (truncation) 截词符 截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。 截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既
47、可减少检索词的输入量,又可扩大查找范围,提高查全率。 按 截 词 位 置 分: 有前截断、后截断、中截断; 按截词的字符数量分:有非限制截断、限制截断。 * 表示截词的截断符号,各检索系统有不同的规定,没有统一标准。2022/7/2455工程硕士论文写作, Author: NK Jiang 1. 后截断 后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。从检索性质上讲,后截断是前方一致检索。 非限制截断:是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。 例: comput? 表示允许其后可带有任何字符且数量不限
48、,相当于查找compute、 computed、 computes、 computing、 computer、 computers、computerize、computerized、computation、 computations、 computational、 computationally 等词。 *不宜将词截得过短,否则容易造成误检。 限制截断 :是在检索词词干后面加若干个截词符,表示限制可变化的字符数。 例:fib? 相当于查找 fiber 或 fibre (Ei Compendex Plus) librar? 相当于Libraries,librarian,library educa
49、t? 相当于Educator,educated 2022/7/2456工程硕士论文写作, Author: NK Jiang 2. 中截断 (通配符或屏蔽) 是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。 例:organi#ation, 可检索到包含organization和organisation的记录。 一个?代表零个或任意个字符。 例: colo?r ,可检索到包含 color、colour、colonizer、 colorimeter的记录。 一个? 和数字,其中的数字代表可替换的字符数。 例:colo?1r, 只能检索到包含colour的
50、记录。2022/7/2457工程硕士论文写作, Author: NK Jiang 1.W - With W 算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。 例: intelligent (W) robot? (Ei Compendex Plus) Wn( 或nW) 表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入n个单元词。 例: intelligent w1 robot* (OCLC FirstSearch) 2. N - Near N
51、算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。 例: intelligent NEAR robot* ( Ei CPX Web) Nn (或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。 例: intelligent N1 robot* (OCLC FirstSearch ) 3. Adj - adjacency 邻接算符,表示在此算符两侧的检索词必须按所列词序排列,不能颠倒,两词之间不允许有其他的词或字母。相当于短语检索。 例: intelligent adj robot* (Elsevier Scie
52、nce SDOS) 2022/7/2458工程硕士论文写作, Author: NK Jiang2022/7/2459工程硕士论文写作, Author: NK Jiang谷歌和百度检索语法谷歌和百度的技术几乎都一样语法符号全部是半角符号(也就是英文或大写状态下输入)搜索引擎搜索结果摘要部分,优先显示网页中含有搜索词的内容,当没网页内容中没搜索词的相关内容时,才显示网页的部分具体内容,而不仅仅是网站简介;字母大小写不敏感,BOOK和book的搜索结果一样;空格表示逻辑“与”,OR表示逻辑“或”,减号-表示“非”;空格和减号- 常常会用到,OR不常用。当结果中明显有不是你需要的信息的时候,用减号-
53、去掉相关信息。默认为模糊检索,并会自动拆分搜索的词组和句子;精确检索用双引号“ ”。可以搜索词组或句子,如:【 “检索技术”】和【 “关于google 使用的文章网”】出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制检索用加号+。但是英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。2022/7/2460工程硕士论文写作, Author: NK Jiang 通配符“全词通配符”(full-word wildcard)是指代替一个单词而不是单词中的某个或几个字母的键盘字符。“词间
54、通配符”(partial-word wildcard),一些搜索引擎如:AltaVista、Inktomi、Northern Light、Yahoo 等支持通配符*,AOL Search、Inktomi等支持通配符?,Northern Light等支持通配符%。在这里*、?、%只能代替单词中的一个或几个字母,而非整个单词。google的通配符是星号* ,包括全词和词间通配功能,一次检索可以使用若干个省略词和字母。如【comput*】 。在查找歌词、诗歌、短语等方面比较有用。比如想看看“天涯何处无芳草”的另类说法:【”天涯*无芳草”】,注意,用了精确检索语法符号。【 i will be righ
55、t * for you】。2022/7/2461工程硕士论文写作, Author: NK Jiang四、字段检索 (range searching) 字段检索即指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。西文数据库,字段检索常用代码来表示,如下表所示。 2022/7/2462工程硕士论文写作, Author: NK Jiang 注意:目前各个检索系统所设立的字段是各不相同的,即同一字段,也可能采用不同的字段代码表示。 如题名字段:Ei CPX Web 中, 用 highway transport* within TI 来表示; OC
56、LC Firstsearch 中,用 TI: highway transport* 来表示。 在进行字段检索时,为了避免出现检索误差, 应先看一下该数据库的使用指南或说明。 例: Ei CPX Web 网络版数据库主要字段的字段代码如下: CV Ei叙词表受控语言 TI 题名 AB 文摘 AU 著者姓名 AF 著者机构名称 ST 连续出版物名称 PN 出版时间2022/7/2463工程硕士论文写作, Author: NK Jiang构造检索提问式示例: 课题:数字化图书馆的文献检索服务 检索概念分析: document retrieval 并列概念 document delivery docu
57、ment delivery system digital library 同义词 virtual library electronic library 检索提问式: (document W retrieval or document W delivery or document W delivery W system*) and (digital W librar* or electronic W librar* or virtual W librar*) record found : 11 (OCLC Firstsearch)2022/7/2464工程硕士论文写作, Author: NK J
58、iang第二部分 (免费)网络资源2022/7/2465工程硕士论文写作, Author: NK Jiang资源推荐中国期刊网 万方数据库2022/7/2466工程硕士论文写作, Author: NK Jiang注意:如果网址变化了,请根据线索自己查找Internet上的重要出版商Blackwell Publishing /Taylor & Francis group http:/www.tandf.co.uk/John Wiley & Sons, Inc. Sage Publications Mosby /academic press /Oxford University Press htt
59、p:/www.oup.co.uk/Lippincott Williams & Wilkins /Cambridge University Press /The Johns Hopkins University Press /Emerald MARCEL DEKKER INC /S. Karger AG http:/www.karger.ch/Lawrence Erlbaum Associates, Inc. /World Scientific Publishing .sgHighwire press /lists/freeart.dtl2022/7/2467工程硕士论文写作, Author:
60、NK Jiang网上科技报告国研报告 http:/ 中国商业报告 U.S.Department of Energy 美国能源部科学技术信息网站。 http:/.Scientific and Technical Report Collection 美国国防部(Department of Defense)提供的科技报告,涉及国防极其相关领域。 Http:/NASA Scientific and Technical Information Program NASA(National Aeronautices & Space Administration)提供的有关航空航天方面的丰富的科技报告全文。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中芯采购流程及管理制度
- 药品采购库存管理制度
- 网上竞价采购制度规定
- 西药药品采购制度
- 企业材料采购付款制度
- 材料采购定额管理制度
- 采购物料日常管理制度
- 九州通采购制度
- 书店新书采购规章制度
- 仓库采购订购管理制度
- 2025年互联网信息审核员考试题库及答案
- 2025年江西工业贸易职业技术学院单招职业技能测试题库带答案
- 邮政快递安全培训课件
- 2025年江苏省高职单招《职测》高频必练考试题库400题(含答案)
- 7 多元文化 多样魅力 第三课时 说课稿-2023-2024学年道德与法治六年级下册统编版
- 阀门检测服务合同
- 新视野大学英语(第四版)读写教程3(思政智慧版) 教案 B3U4 Unit 4 When work is a pleasure
- 毫米波雷达行业深度研究报告:4D毫米波雷达
- 拆除工程施工方案
- 《楚门的世界》电影赏析
- 人工智能芯片设计 课件 周巍 第1-3章-绪论、数字集成电路设计 -数字集成电路系统设计
评论
0/150
提交评论