




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机信息检索基本知识第一页,共七十三页,编辑于2023年,星期五信息化社会生存策略
一、现代人应具备信息素质
信息素质包括两个方面:(1)信息意识信息意识是指对知识信息重要性的认识和对知识信息的敏感性。(2)信息能力信息能力是指获取、加工、利用和创新知识信息的能力,其重点和基础是信息检索能力。第二页,共七十三页,编辑于2023年,星期五信息化社会生存策略二、现代人信息化生存策略
●信息化生存包括数字化生存、网络化生存和智能化生存。数字化、网络化构成了人们生存的信息环境,而智能化是有效发挥知识信息的功能、解决问题、克服危机和创造财富的最佳方式。
●全球数字化信息近年来增长迅猛,据一项最新研究结果称,2006年全球产生的数字化信息总量达1610亿吉比特,其中原创信息为400亿吉比特。而到2010年,全球产生的数字化信息总量有望达到9880亿吉比特。
●具有较高信息素质的人,就应表现出有良好的信息意识、敏捷的信息思维以及较强的信息能力。(1)培养良好的信息意识(2)注重提高信息检索能力第三页,共七十三页,编辑于2023年,星期五信息知识情报文献信息是世界上一切事物的运动状态、特征及其反映。它与事物同在,与事物共存,不以人的意志而改变。信息是人类认识世界,改造世界的重要资源。了解和掌握各种信息的获取途径和方法,及时获得所需信息,对于个人、团体、企业、事业,乃至国家来说都至关重要。计算机信息检索基础知识第四页,共七十三页,编辑于2023年,星期五知识是人类对客观事物规律的认识。人类通过实践,认识和掌握自然和社会运动形态及其规律,同时对在实践中积累起来的经验进行概括、总结、升华,有选择地收入到人类的思维系统,形成知识。知识是信息的一部分,是人类认识和改造世界的武器。把信息转化为知识,再把知识转化为智慧,智慧可以转化为新的知识,新知识又可转化为新的信息,这是一种动态的开拓过程。信息知识情报文献第五页,共七十三页,编辑于2023年,星期五情报是为解决某一特定问题所需要的知识。只有将特定的知识传递给特定需要的人,特定的知识才被称之为情报。因此,知识性、传递性和效用性是情报的三个基本属性。信息知识情报文献第六页,共七十三页,编辑于2023年,星期五文献是记录有知识的一切载体。凡是用文字、图形、符号、声像等手段记录下来,印在纸上或摄制在胶片上,录在唱片或磁带上,存储在计算机磁带、磁盘或光盘等物质载体之上的知识或信息统称为文献。知识性、记录性和物质性是文献的三个基本属性。信息知识情报文献第七页,共七十三页,编辑于2023年,星期五信息的类型
1.按产生信息的客体性质来划分(1)自然信息是指自然界中的各种信息,包括瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化等等。(2)生物信息是指生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流、动物种群内的信息交流等。(3)社会信息是指人类各种活动所产生、传递与利用的信息,包括人与人之间交流的信息,人与机器之间作用的信息。按照人类活动领域,社会信息又可分为科技信息、经济信息、政治信息、军事信息、文化信息等。
第八页,共七十三页,编辑于2023年,星期五信息的类型2.按信息的内容加工层次来划分(1)零次信息是指记录在非正规物理载体上的、未经加工整理的信息,如书信、笔记、手稿、考察记录、实验记录等。这类信息往往呈现为零星的、分散的和无规则的状态,具有原始性、新颖性、分散性和不可检索性等特征。(2)一次信息一次信息是指记录在正规载体上的、经过一定加工整理的信息,即以作者本人的生产和科研工作为依据而创作的原始信息,如专著、论文、研究报告、专利说明书、技术标准等。一次信息具有创造性、系统性和新颖性等特征。(3)二次信息二次信息是指将分散的、无序的一次信息进行加工整理后,使之成为系统有序的信息,如书目、题录、文摘、索引等,就是通常所指的检索工具。二次信息具有浓缩性、汇集性和有序性等特点。(4)三次信息三次信息是根据二次信息提供的线索,利用一次信息,经过调研、分析、综合后而形成的信息,如述评、综述、进展报告、数据手册和年鉴等。三次信息具有较强的概括性,成为人们研究新事物的具体结论和成果。第九页,共七十三页,编辑于2023年,星期五信息的类型3.按信息所依附的载体来划分
(1)口语信息
是指存在于人脑记忆中,通过交谈、讨论、报告等方式交流传播的信息。它反映了人们的思考、见解、看法和观点,是推动研究的最初起源。口语信息具有出现早、传递快、偶发性强的特点,但缺乏完整性和系统性,大部分转瞬即逝,一部分通过文献保存,一部分留存在人类的记忆中,代代相传而称为口述回忆或口碑资料。作为信息留存的一种形式,口语信息无时不在,无处不有,承载着人类的知识、经验和史实,是一种需要重视和开发的极为丰富的资源。(2)实物信息
是指固化在实物中的信息,实物包括自然实物和人工实物(如文物、产品样本、模型、碑刻、雕塑等)。其特点是直观性强、感觉实在、信息量大,但需要通过知识、智慧、经验和工具来挖掘其隐含的大量信息。第十页,共七十三页,编辑于2023年,星期五信息的类型(3)文献信息
是指以文献作为载体形式所表达的内载信息,即以文字、图形、符号、声频、视频等方式记录在各种载体上的信息。文献信息也是一种相对固化的信息,一经“固定”在某种载体上就不能随外界的变化而变化。这种性质的优点是,易识别、易保存、易传播;缺点是不能随外界的变化而变化,固态化是文献信息老化的原因。
(4)数字信息
亦可称为电子信息,是指以数字代码方式将文字、图形、图像、声音、动画等存储在磁带、磁盘、光盘等介质上,以电信号、光信号的形式传输,并通过网络通信、计算机及其终端设备再现出来的一种信息。数字信息是计算机技术、通信技术、多媒体技术和高密度存储技术迅速发展的产物。它需要用计算机才能读取信息,具有存储容量大、存取速度快、体积小、可共享等特点。这是当今发展最快、最具应用价值和发展前景的新型信息。第十一页,共七十三页,编辑于2023年,星期五信息资源的概念
信息作为一种客观存在的自然和社会财富,其来源称为信息资源。信息资源是指一切能够产生信息或为了传递而存有信息的系统。它包括信息生成源和加工整理后的再生源。凡是产生和持有信息,并能传递或透露信息的人、物体和机构,都可称之为信息资源。信息资源可分为自然信息资源和社会信息资源。前者广泛存在于自然界中,是事物运动和生物生存活动的结果,人们通过自然信息资源的利用来认识世界,例如,科学技术信息;后者则存在于人类活动之中,是社会的直接产物,使人类从事各种活动的基础,例如,政策法规信息、社会发展信息、市场信息、金融信息等。第十二页,共七十三页,编辑于2023年,星期五信息资源类型
1.口语信息资源
口语信息资源是人类以口头语言所表述出来而未被记录下来的信息资源,它们在特定的场合被信息接收方直接消费并且能够辗转相传而为更多的人们所利用,如谈话、聊天、授课、讲演、讨论、唱歌、打电话、听广播、看电视等活动都是以口语信息资源的交流和利用为核心的。第十三页,共七十三页,编辑于2023年,星期五信息资源类型2.实物信息资源
●实物信息资源是指由实物本身来存储和表现知识信息的信息资源,人类传承的知识有许多被物化在各类物体之中,如工具、设备、武器、产品样本、模型、碑刻、雕塑、建筑物等。
●通过实物信息资源往往可以获取直接为生产服务的技术信息,如关于物体的生产、结构、成分、功能、用途、发展等方面的情况。
●实物信息获取的主要目标首先是高技术实物,实物的技术水平越高,则所含信息价值越大,从中获取的信息质量就高。其次是实物样品,实物样品的原始程度越高,所含信息就越真实,如采集植物标本、矿物样品、产品样本等可以获取可靠的信息。第十四页,共七十三页,编辑于2023年,星期五信息资源类型
3.文献信息资源
文献信息资源以记录方式和载体材料为依据可划分为:书写型、印刷型、缩微型、机读型和声像型五大类。
(1)书写型文献信息资源:一般以纸张为载体,记录方式为人工抄写,包括手稿、信件、日记、原始档案等。
(2)印刷型文献信息资源:主要以纸张为载体,记录方式主要是印刷技术,包括油印、铅印、胶印、木板印刷、复印、激光打印等。
(3)缩微型文献信息资源:以感光材料为载体,记录方式主要是光学记录技术,主要类型有缩微胶卷、缩微平片、缩微卡片等。
(4)机读型文献信息资源:以磁性材料为载体,记录方式为磁录技术,主要类型有磁带、磁盘、软盘、光盘等。
(5)声像型文献信息资源:以感光材料和磁性材料为载体,记录方式为光录技术和磁录技术,主要类型有唱片、录音录像带、电影胶卷、胶片、幻灯片等。第十五页,共七十三页,编辑于2023年,星期五信息资源类型这里着重介绍一些主要的文献信息源:(1)图书图书是指论述或介绍某一学科或领域知识的出版物。图书往往是作者对已经发表的科研成果及其知识体系进行概括和总结,即具有独立的内容体系、相当篇幅和完整装帧形式的文献。
其特点:内容比较成熟,所提供的知识系统、全面,出版形式也较固定,是系统掌握各学科知识的基本资料。但出版周期较长,传递报道速度较慢。
(2)期刊期刊是指有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物。期刊最突出的特点:出版迅速、内容新颖、能迅速反映科学技术研究成果的新信息。期刊还具有连续性的特点,因而能为报导不断发展着的知识提供良好的条件。这一特点,使期刊成为人们寻找研究上的新发现、新思想、新见解、新问题的首要信息源。第十六页,共七十三页,编辑于2023年,星期五信息资源类型
(3)会议文献
会议文献是指在各种会议上宣读和交流的论文、报告和其他有关资料。
会议文献的特点:专业性强、内容新颖、学术水平高、出版发行较快。会议文献往往能代表某一学科领域的最新的研究成果及水平,从中可了解国内外科技发展趋势,有较大的参考价值,是重要的信息来源之一。
(4)专利文献
专利文献是记录有关发明创造信息的文献,蕴含着技术信息、法律信息和经济信息。广义的专利包括专利申请书、专利说明书、专利公报和专利检索工具,以及与专利有关的一切资料;狭义的专利仅指各国专利局出版的专利说明书。专利说明书是指专利申请人向专利局递交的有发明目的、构成和效果的技术文件。它经专利局审核后,向全世界出版发行。专利说明书内容比较具体,有的还有附图,通过它可以了解该项专利的主要技术内容。构成专利要符合新颖性、创造性和实用性三个基本条件。
第十七页,共七十三页,编辑于2023年,星期五信息资源类型
(5)科技报告
科技报告是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。
报告的出版特点:各篇单独成册,统一编号,由主管机构连续出版。在内容方面,报告比期刊论文新颖专深、详尽、可靠,出版周期短,报道速度快,能反映一个国家或某一学科领域的科研水平,是一种不可多得的信息源。科技报告按发行范围可分为绝密报告、机密报告、秘密报告、非密报告、解密报告。
(6)标准文献
标准文献指标准化工作的文件,是经过公认的权威当局批准的标准化工作成果。其中主要为有关工业产品和工程建设的质量、规格和检验方法的技术规定文件。一个国家的标准文献反映该国的生产工艺水平和技术经济政策,而国际现行标准则代表了当前世界水平。国际标准和工业先进国家的标准常是科研生产活动的重要依据和信息来源。
第十八页,共七十三页,编辑于2023年,星期五信息资源类型
(7)学位论文
学位论文是指高等院校、科研单位的研究生为申请硕士、博士等学位,在导师指导下完成的科学研究、科学试验成果的学术论文。硕士论文一般能表明作者在某门学科上掌握了坚实的基本理论和系统的专门知识,并对所研究的课题有新的见解,有从事科学研究工作的能力。博士论文一般能表明作者在某门学科上掌握了坚实宽广的基本理论和系统深入的专门知识,并具有独立从事科学研究工作的能力,在科学研究或专门学术领域具有创造性成果。
(8)产品资料
产品资料指产品目录、产品样本和产品说明书一类的厂商为向客户宣传和推销其产品而印发的介绍产品情况的文献。产品目录介绍厂家业务范围、列出产品名称型号、并附有产品外型、规格、用途的简单介绍。产品样本多以活页形式印发,是对定型产品的型号、技术规格、原理性能、技术参数所作的具体介绍,也附有结构图和照片。产品说明书的内容更详尽,往往还列出产品的工作原理、用途、效率、结构特点、操作规程、使用、保养和维修方法等。第十九页,共七十三页,编辑于2023年,星期五信息资源类型
(9)档案文献
档案是国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动形成的具有保存价值的历史记录文献。档案是在人们的社会实践活动中形成的,它的内容也反映了人们所进行的政治活动、生产活动和科学技术活动,所以档案的内容广泛、形式多样、材料来源庞杂。经过整理后它们分别成为:文书档案、人事档案、会计档案、技术档案等等。技术档案指科研生产活动中形成的,有具体事物对象的技术文件、图纸、图表、照片和原始记录等的总称。
(10)政府出版物
政府出版物是指各国政府部门及其设立的专门机构出版的文献。政府出版物的内容十分广泛,既有科学技术方面的,也有社会经济方面的,大致上可分两类:行政性文献(包括宪法、司法文献),主要涉及政府法律、经济方面的国会和议会记录、议案、决议、司法资料、听证记录、法律、法令、规章制度、政策、调查统计资料等。科学技术文献,主要指政府部门出版的科技报告、标准、专利文献、科技政策文件,公开后的科技档案、经济规划、气象资料等。第二十页,共七十三页,编辑于2023年,星期五信息资源类型4.数字信息资源
●
数字信息资源是在计算机技术、通信技术和高密度存贮技术的迅速发展并在各个领域里得到广泛应用的环境下产生的一种信息资源形式。
●它是指经过数字化处理的,可通过计算机系统或通信网络等识别、传递、浏览的信息资源。第二十一页,共七十三页,编辑于2023年,星期五计算机信息检索基础知识
“检索”的英文是“Retrieval”,其涵义是“查找”。将信息按一定的方式和规律排列存储,并针对用户特定需求查找出所需信息的过程称为信息检索。信息检索是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。从广义来说,信息检索包括存储过程和检索过程;对信息用户而言,往往是指查找所需信息的检索过程。信息检索根据其检索对象和结果的不同可分为:
数据检索、文献检索、事实检索由于信息大多来源于文献,离不开文献这一范畴,国内外对信息检索和文献检索往住不作严格区分。
第二十二页,共七十三页,编辑于2023年,星期五计算机信息检索基础知识●文献信息检索
●是以文献(包括题录、文摘和全文)为检索对象的信息检索。即利用相应的方式与手段,在存贮文献的检索工具或文献数据库中,查寻用户在特定的时间和条件下所需文献的过程。
●凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。
●它为用户提供的是与用户的信息需求相关的文献信息。这些文献可以是涉及某一主题、学科、著者、文种、年代的文献;文献的收藏范围可以是一馆、一地、一国直至全世界。
●文献检索的结果提供与课题相关的数篇文献的线索或原文供用户参考,这些相关文献的相关程度随检索系统和检索技术的优劣可以有很大区别。
●完成文献信息检索主要借助于各种书目数据库和全文数据库。第二十三页,共七十三页,编辑于2023年,星期五计算机信息检索基础知识●数据信息检索
●是以数值或图表形式表示的数据为检索对象的信息检索,又称“数值检索”。即检索系统中存贮的是大量的数据,它包括物质的各种参数、电话号码、银行账号、观测数据、统计数据等数字数据,也包括图表、图谱、市场行情、化学分子式、物质的各种特性等非数字数据,并提供一定的运算推导能力。
●数据检索是一种确定性检索,信息用户检索到的各种数据是经过专家测试、评价、筛选过的,可直接用来进行定量分析。数据检索与文献检索有许多共同之处,文献检索的许多方法也适用于数据检索。
●完成数据信息检索主要借助于各种数值数据库。
第二十四页,共七十三页,编辑于2023年,星期五计算机信息检索基础知识●事实信息检索
●是以从文献中抽取的事项为检索内容的信息检索,又称
“事项检索”。其检索对象既包括事实、概念、思想、知识等非数值信息,也包括一些数据信息,但要针对查询要求,由检索系统进行分析、推理后,再输出最终结果。
●事实检索是信息检索中最复杂的一种,要求检索系统必须有一定的逻辑推理能力和自然语言理解功能。
●事实检索也是一种确定性检索,用户获得的是有关某一事物的具体答案。
●完成事实信息检索主要借助于各种指南数据库和全文数据库。第二十五页,共七十三页,编辑于2023年,星期五
计算机信息检索基础知识
随着计算机技术、通信技术和高密度存储技术的迅猛发展,利用计算机进行信息检索已成为人们获取文献信息的重要手段。计算机信息检索能够跨越时空,在短时间内查阅各种数据库,还能快速地对几十年前的文献资料进行回溯检索,而且大多数检索系统数据库中的信息更新速度很快,检索者随时可以检索到所需的最新信息资源。科学研究工作过程中的课题立项论证、技术难题攻关、跟踪前沿技术、成果鉴定和专利申请的科技查新等都离不开查询大量的相关信息。计算机信息检索是目前最快速、最省力、最经济的信息检索方法。第二十六页,共七十三页,编辑于2023年,星期五计算机信息检索基础知识●计算机信息检索原理
●计算机信息检索是指利用计算机存储和检索信息。
●具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,继而再由终端设备显示或打印的过程。
●为实现计算机信息检索,必须事先将大量的原始信息加工处理、以数据库的形式存储在计算机中,所以计算机信息检索广义上讲包括信息的存储和检索两个方面。第二十七页,共七十三页,编辑于2023年,星期五计算机信息检索基础知识●计算机信息存储过程:
●用手工或者自动方式将大量的原始信息进行加工,具体做法是将收集到的原始文献进行主题概念分析,根据一定的检索语言抽取出主题词、分类号以及文献的其他特征进行标识或者写出文献的内容摘要。
●然后再把这些经过“前处理”的数据按一定格式输入计算机存储起来,计算机在程序指令的控制下对数据进行处理,形成机读数据库,存储在存储介质(如磁带、磁盘或光盘)上,完成信息的加工存储过程。第二十八页,共七十三页,编辑于2023年,星期五计算机信息检索基础知识●计算机信息检索过程:
●用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统检索语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行检索。计算机按照用户的要求将检索策略转换成一系列提问,在专用程序的控制下进行高速逻辑运算,选出符合要求的信息输出。
●计算机检索的过程实际上是一个比较、匹配的过程,检索提问只要与数据库中的信息的特征标识及其逻辑组配关系相一致,则属“命中”,即找到了符合要求的信息。第二十九页,共七十三页,编辑于2023年,星期五计算机信息检索基本原理第三十页,共七十三页,编辑于2023年,星期五计算机信息检索系统的组成
1.计算机
计算机是检索系统的核心部分,通过一定的检索软件,进行信息的存储、处理、检索以及整个系统的运行和管理。2.通信网络
通信网络是联系计算机系统和检索终端设备的桥梁,起着远距离、高速度、无差错传递信息的作用。检索网络所用的通信线路,一般是公用电话线或专用线,国际联机检索系统则是由通信卫星和海底电缆构成的通信网络。第三十一页,共七十三页,编辑于2023年,星期五3.检索终端设备检索终端设备是用户与检索系统相互传递信息,进行
“人—机对话”的装置,现在基本上都是PC机终端,通常由计算机、调制解调器和打印机组成。4.数据库
数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。是检索系统的信息源,也是用户检索的对象。数据库可以随时按不同的目的提供各种组合信息,以满足检索者的需求。检索系统(检索平台)中的数据库一般由各个数据库生产商提供,也有一些是系统本身建的。第三十二页,共七十三页,编辑于2023年,星期五计算机信息检索的发展
1.脱机批处理检索阶段在利用计算机进行信息检索的早期,人们只是用单台计算机的输入输出装置进行检索,用磁带作存储介质,一般为连续的顺序检索方式。检索部门把许多用户的检索提问汇总到一起,进行批量检索,然后把检索结果通知各个用户,用户不直接接触计算机。2.联机检索阶段
20世纪60年代末,由于计算机软硬件技术的不断提高,出现了一台主机带多个终端的联机信息检索系统。这种系统具有分时的操作能力,能够使许多相互独立的终端同时进行检索。这种系统采用实时操作技术,所以用户可以使用终端设备直接与计算机进行“人—机对话”,计算机对用户的提问能及时处理并显示出结果。第三十三页,共七十三页,编辑于2023年,星期五3.光盘检索阶段
光盘是一种用激光记录和读取信息的盘片,具有信息存取密度高、容量大、读取速度快、信息类型多、保存时间长、成本低等优点。它是80年代在计算机技术、激光技术和精密伺服电机技术等现代科学技术成果的基础上发展起来的新型电子出版物。光盘数据库的类型不断丰富,除了最初的书目数据库外,又增加了文摘数据库、数值事实参考数据库、全文数据库等等,并且还出现了图像型、音频型、软件型和多媒体型等多种形式的CD-ROM产品。4.网络化检索阶段
进入20世纪90年代,图书馆、信息服务机构和科研机构以及一些大的数据库生产商纷纷加入到因特网上,为信息需求者提供各种各样的信息服务,构成极其丰富的网络信息资源。第三十四页,共七十三页,编辑于2023年,星期五数据库的类型1.文献书目数据库(BibliographicDatabases)
文献书目数据库是存储某个领域原始文献的书目,即二次文献数据库,记录内容包括文献的题目、著者、原文出处、文摘、主题词等。大多数是印刷本检索工具的机读版,如美国工程索引数据库(EiCompendex)等。2.信息指南数据库(DictionaryDatabases)
信息指南数据库主要是记录一些机构、人物、产品、项目简述等事实数据,通过该类数据库可以查到公司、机构的地址、电话、产品目录、研究项目或名人简历等信息。这类数据库也称为事实数据库。第三十五页,共七十三页,编辑于2023年,星期五3.数值型数据库(NumericDatabases)数值数据库是专门提供以数据形式表示信息的一种源数据库。主要记录科学研究中试验、测量、计算、工程设计、经济分析和工业规划等方面的数据。这类数据库主要包含数值数据,有的也包含文字,文字是用来定义数据所需的最小量的文字。4.全文数据库(CompleteTextDatabases)全文数据库是存储文献内容全文或其中主要部分的数据库,简称全文库。它是将经典著作、学术期刊、重要的会议录、法律法规、新闻报道以及百科全书、手册、年鉴等的全部文字和非文字内容转换成计算机可读形式。全文数据库可以解决用户获取一次文献所遇到的困难,能向用户提供一步到位的查找原始文献的信息服务。
第三十六页,共七十三页,编辑于2023年,星期五数据库的记录格式
数据库的记录是构成数据库顺排文档(主文档)的基本单元,是对某一实体属性进行描述的结果。在书目数据库中,被描述的实体是某一特定的文献,通常被称作文献记录。一条记录又包含若干个数据字段。这些数据字段就是原始文献的篇名、著者、文献出处、出版时间、文摘、主题词、语种等。为了方便计算机检索,每一个字段都有自己特定的标识符,称为字段名或字段代码,如AB代表文摘字段、TI代表篇名字段、AU代表著者字段等。数据库记录的字段往往都是提供对该文献的检索途径。
第三十七页,共七十三页,编辑于2023年,星期五
Accessionnumber:06209880131
Title:Practicalmethodstodefinescatteringcoefficientsinaroomacousticscomputermodel
Authors:Zeng,Xiangyang;Christensen,ClausLynge;Rindel,JensHolger
Authoraffiliation:InstituteofEnvironmentalEngineering,NorthwesternPolytechnicalUniversity,Xi'an,710072,China
Serialtitle:AppliedAcoustics
Abbreviatedserialtitle:ApplAcoust
Volume:v67
Issue:n8
Issuedate:August2006
Publicationyear:2006
Pages:p771-786
Language:English
ISSN:0003-682X
CODEN:AACOBL
Documenttype:Journalarticle(JA)
Publisher:ElsevierLtd,Oxford,OX51GB,UnitedKingdom
Abstract:Topredictacousticsofroomsusingcomputerprogramsbasedongeometricalassumptions,itisimportantthatscatteringisincludedinthecalculations.Thereforescatteringisusuallyincludedintermsofscatteringcoefficientswhichareassignedtoeachsurfacetellingthesoftwaretheratiobetweenthepartofthereflectedenergywhichisnotbeingreflectedspecularilyandthetotalreflectedenergy.Howevertheeffectivescatteringcoefficientofasurfacedependsnotonlyontheroughnessofthesurfacematerialindeeddiffractioncausedbylimiteddimensionsofthesurfaceaswellasedgediffractionalsocausesscattering.
Numberofreferences:24
Eimainheading:Acoustics
Eicontrolledterms:Computersimulation-Acousticwavescattering-Computationalgeometry-Surfaceroughness-Acousticwavediffraction
Uncontrolledterms:Scatteringcoefficient-Roomacoustics-Computermodel
Eiclassificationcodes:751Acoustics,Noise.Sound-723.5ComputerApplications-751.1AcousticWaves-921.4CombinatorialMathematics,IncludesGraphTheory,SetTheory-931.2PhysicalPropertiesofGases,Liquids&Solids
Treatment:Theoretical(THR)第三十八页,共七十三页,编辑于2023年,星期五记录中的字段标识及对应名称说明如下:AN:(DIALOGAccessionNumber),DIALOG存取号,在一个数据库中,每篇记录只有一个存取号,每个号只配给一条记录,两者一一对应。DIALOG存取号后常跟各数据库的文摘号,与相应的检索刊物一致。TI:(Title)篇名字段AU:(Author)著者字段CS:(CorporateSource)著者所在单位字段SO:(SourcePublication)文献出处字段,对于期刊文献包括期刊名称、卷、期页等;对于会议文献包括会议名称、届次、时间、地点等PY:(PublicationYear)出版年代字段。CO,SN:(CODEN),(ISSN)期刊代码,国际连续出版物标准号LA:(Language)语种字段指原文语种DT:(DocumentType)文献类型字段TC:(TreatmentCode)处理码字段,表示论文研究的性质,A表示应用,X表示实验,T表示理论,等等AB:(Abstract)文摘字段DE:(Descriptor)叙词字段,主题词表中的词ID:(Identifier)自由标引词字段,非受控词表中的词,由标引人员根据文献内容确定CC:(ClassficationCode)分类代码字段第三十九页,共七十三页,编辑于2023年,星期五检索语言计算机检索的基本原理是,将用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。用户所选用的检索词必须与数据库中标引文献记录所用的标引词相一致。检索语言就是为沟通文献标引与文献检索而编制的人工语言,也是用于文献标引和检索提问的约定语言。如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容需求时的表达取得一致,信息检索也就不可能顺利实现。因此,编制检索语言的目的就是能够保证检索提问词与文献标引词的一致性。检索语言所表达的概念应该是唯一的,尽量减少一词多义或多词一义的现象,要使其在检索系统中具有单义性。第四十页,共七十三页,编辑于2023年,星期五1.分类语言
分类语言是以学科体系为基础,用号码作为概念标识,按分类编排的检索语言。国内外比较重要的分类语言表有《国际专利分类表》、《杜威十进分类法》、《中国图书馆图书分类法》等。2.主题语言
主题语言是以语词作为概念标识,按字顺编排的检索语言。主题语言包括标题词语言、单元词语言、叙词语言和关键词语言。(1)标题词语言—最早使用的一种主题语言。它以规范化的自然语义作为标识,来表达文献涉及的主题概念,并将全部标识按字母顺序排列。表达主题的词语称为标题词。(2)单元词语言—是从文献内容中抽选出来的最基本的词汇,将代表最一般、最基本的、不可再分割的概念单元的词作为单独标引文献的单位。(3)叙词语言—从自然语言中优选出来并经过规范化处理的名词术语。叙词语言是采用表示单元概念的规范化语词的组配来对文献内容主题进行描述的检索语言,也是目前使用最广泛的主题语言。(4)关键词语言—直接从文献题名、文摘或正文中抽取出来的未经规范化处理的词。是一种用自然语言做标识的检索语言。第四十一页,共七十三页,编辑于2023年,星期五计算机信息检索技术1.布尔逻辑检索
在检索实际中,检索提问涉及的概念往往不止一个,而同一个概念又往往涉及多个同义词或相关词。为了正确地表达检索提问,系统中采用布尔逻辑运算符将不同的检索词组配起来,使一些具有简单概念的检索单元通过组配成为一个具有复杂概念的检索式。(1)逻辑“与”逻辑“与”(用and或*表示)是一种用于交叉概念或限定关系的组配,它可以缩小检索范围,有利于提高检索的专指性。如欲查同时含有概念A和概念B的文献,可表示为:“AandB”或“A*B”。第四十二页,共七十三页,编辑于2023年,星期五(2)逻辑“或”逻辑“或”(用OR或“+”表示)是用于具有并列概念关系的组配。这种组配可以扩大检索范围,提高查全率。例如,检索含有检索项A或检索项B的文献,可表示为:“AORB”或“A+B”。检索结果是将含有检索项A的文献集合与含有检索项B的文献集合相加,形成一个新的集合。检索结果如图中阴影部分即为包含A或B的命中文献。图中两者共同的部分只计一次,故避免了命中文献的重复出现。(3)逻辑“非”逻辑“非”(用“NOT”或“-”表示)是用于从某一检索范围中排除不需要的概念。这种组配可以缩小检索范围。例如,在含有概念A的文献集合中,排除同时含有概念B的文献,可表示为:“ANOTB”或“A-B”。检索结果如图中阴影部分即为包含A且排除B的命中文献。第四十三页,共七十三页,编辑于2023年,星期五第四十四页,共七十三页,编辑于2023年,星期五
2.位置检索
位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言(关键词)进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。(1)(W)—With
(W)表示该算符两侧的检索词相邻,且两者之间只允许只有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒。例如:Aircraft(W)design可检索出含有“Aircraftdesign”的文献记录。
Computer(W)aided(W)design可检索出含有“Computeraideddesign”的文献记录。(2)(nW)—nWords(nW)表示在此算符两侧的检索词之间最多允许间隔n个词(实词或虚词),且两者的相对位置不能颠倒。例如:laser(1w)printer可检出含有laserprinter和lasercolorprinter的文献记录。第四十五页,共七十三页,编辑于2023年,星期五(3)(N)—Near(N)表示该算符两侧的检索词相邻,但两者的相对位置可以颠倒。例如:computer(N)network可检出含有computernetwork,networkcomputer形式的文献记录。(4)(nN)—nNear(nN)表示此算符两侧的检索词之间允许间隔最多n个词,且两者的顺序可以颠倒。例如computer(2N)system可检出含有
computersystemcomputercodesystemcomputeraideddesignsystemsystemusingmoderncomputer等形式的文献记录。第四十六页,共七十三页,编辑于2023年,星期五(5)(S)—Subfield(S)表示其两侧的检索词必须是在文献记录的同一子字段中,而不限定它们在该子字段中的相对次序和相对位置的距离。在文摘字段中,一个句子就是一个子字段。例如computer(w)control(s)system可检出文摘中含有
“Thispaperisconcernedwithanapplicationofthe
computercontroltechniqueinaintelligentsystem
fortestinginnerwallsofpipes.”
这样一句话的文献。(6)(F)—Field(F)表示其两侧的检索词必须在文献记录的同一字段中,而它们在该字段中的相对次序和相对位置的距离不限。例如:water(w)pollution(F)control表示在同一个字段中(如篇名、文摘、叙词等)同时含有waterpollution和control的文献记录均可检索出来。第四十七页,共七十三页,编辑于2023年,星期五不同的检索系统其位置检索的表示方式是不同的
例如:EiVillage中的位置算符仅采用Near一种形式,表示两个检索词彼此接近且两词之间最多不超过5个词,前后顺序不限。CSAIllumina中的位置检索为:①词间无算符,即表示将检索词作为一个词组来检索。②WITHIN“x”,表示在指定的半径内(x个词)查找输入词,词序不限。③NEAR,在相距不大于10个词的范围内查找输入词,相当于within10。④BEFORE,按照输入检索词相应的顺序查找。⑤AFTER,按照第1个词在第2个词之后的相应顺序查找。第四十八页,共七十三页,编辑于2023年,星期五IEL中的位置检索采用以下算符:①<paragraph>,表示算符两边的检索词必须出现在同一段落内,两个检索词的顺序可以前后颠倒;②<sentence>,表示算符两边的检索词必须出现在同一句子内,两个检索词的顺序可以前后颠倒;③<phrase>,表示算符两边的检索词必须出现在同一短语内,两个检索词的顺序可以前后颠倒;④<near/n>,表示两个检索词相邻,中间相隔最多n个词,两个检索词的顺序可以前后颠倒。第四十九页,共七十三页,编辑于2023年,星期五3.截词检索
●截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单、复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。
●为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时也占太多机时。截词检索就是为了解决这个问题而设计的,它既可保证不漏检,又可节约输入检索式的时间。
●所谓截词,就是指对输入的检索词在适当位置截断。第五十页,共七十三页,编辑于2023年,星期五美国Dialog系统用“?”表示截词符,并有以下截词方式:1.后方截词它是将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。后方截词又分为词尾的有限截断和词尾的无限截断两种情况:(1)词尾的有限截断相同字符串后可能变化一个字符时,则在其后使用一个“?”、空格、再加一个“?”,常用来表示检索词的单复数变化。例如用system??可以查出system和systems的文献。相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。例如,??表示两个字符,???表示三个字符,以此类推。
(2)词尾的无限截断相同字符串后可能变化任何字符串时,则在其后使用一个“?”。这种方法可以查找出含有相同字符串的所有检索词。例如,comput?可查出compute,computer,computing,computation,computerisation等等。第五十一页,共七十三页,编辑于2023年,星期五2.中间截词中间截词又称中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。例如woman和women,可用wom?n代替;defence和defense可用
defen?e代替。截词符具有“OR”运算符的功能,如wom?n等同于womanorwomen,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。第五十二页,共七十三页,编辑于2023年,星期五
常用的截词符有“?”、“*”、“#”、“$”等多种表示形式,不同的检索系统其截词符的表示形式和截词检索的方式是不同的例如:EiVillage中的截词符为:“*”用于词中或词后表示可以代替多个字符,检索出相同词干的任意多个变化的词,例如,输入optic*可检索出optic,optics,optical等“?”用于词中表示可以代替一个字符,例如,输入wom?n可检索出
woman,womenOCLC中的截词符为:
+用于词尾,表示同时检索该词的单数和复数(仅限于s和es形式)*用于词尾,表示可检索相同词根的所有词,但词根不得少于3个字符
#用于单词当中,只代表一个字符?用于单词当中,可代表一串字符第五十三页,共七十三页,编辑于2023年,星期五4.字段限定检索
字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中可供检索的字段通常有两种:
(1)基本字段包括篇名、文摘、叙词、自由标引词(TI,AB,DE,ID)四个字段。基本字段用后缀表示,例如:
computerandnetwork/TI,DE表示将检索式限定在篇名字段(TI)和叙词字段(DE)中。
(2)辅助字段包括除基本字段以外的所有字段。辅助字段用前缀表示,要查找著者
SmithD.发表的文献,检索式可表示为
AU=Smith,D.第五十四页,共七十三页,编辑于2023年,星期五
不同的检索系统其字段限定检索的表示方法亦不尽相同EIVillage中的限定字段检索采用within命令(简写为wn),其限定字段检索的输入格式为:检索词wn字段代码,如computerwnTI。ISIWebofKnowledge中的字段限定检索格式为:字段代码=检索词,如ti=computer。USPTO中的字段限定检索输入格式为:字段代码/检索词,如TTL/computer。PQDD中的字段限定检索规则是:字段名或字段代码后跟用括号括起来的检索词,如title(biology),au(Smith,Robert)。IEL中的字段限定检索采用<in>算符,其格式为:检索词<in>字段代码,如(fiberoptic<and>network)<in>ti。第五十五页,共七十三页,编辑于2023年,星期五信息检索途径
信息检索途径也叫信息检索入口或检索点。信息检索系统是用来报道、存储和查找各类信息的工具,是对各种类型的信息进行采集、标引、著录和组织后形成的一个有序的信息集合。事实上,每一种检索系统都为检索者提供了多种检索途径,这些途径就是信息集合体——数据库用以标引和著录各种信息时选取的标识,即数据库记录的字段。选择一定的检索途径就是把所需信息的某种特征标识转换为检索标识(即字段)。
第五十六页,共七十三页,编辑于2023年,星期五信息检索途径1.著者途径
是通过已知著者的名称查找信息的途径。从著者途径检索信息是一个重要的外部检索途径,著者包括个人著者、团体著者等。方法是选择“著者”字段(Authors)来检索出与著者相关的信息内容。由于同一著者的作品往往具有特定的关联,特别是一些知名的著者,其作品常常代表本人所在学科领域的发展方向,因此从著者途径检索相关信息具有较强的实用性。第五十七页,共七十三页,编辑于2023年,星期五信息检索途径2.题名途径
题名途径是通过文献的题名查找信息的方法。题名包括文献标题名(或称篇名)、书名、刊名、标准名、会议名等,检索时可以利用“题名”字段(Title)来进行。题名途径较多应用于查找图书、期刊、单篇文献等,在计算机检索系统中应用题名途径也比较多。第五十八页,共七十三页,编辑于2023年,星期五信息检索途径3.机构途径
机构途径是通过机构名称获取相关信息的方法。如果已知与所需信息相关的机构名称(如个人著者所在机构、出版社或发行单位名称等),可以利用“机构”字段(Authoraffiliation)获取相关信息。第五十九页,共七十三页,编辑于2023年,星期五信息检索途径4.代码途径
是通过信息的某种代码来检索信息的途径。例如,国际标准书号(ISBN)、国际标准连续出版物号(ISSN)、专利号、报告号、标准号、合同号等。在已知信息代码的前提下,用此检索途径检索信息资源比较方便、快速。第六十页,共七十三页,编辑于2023年,星期五信息检索途径5.分类途径
分类途径是按文献所属学科类别进行检索的途径,是以文献所属学科专业的分类号为特征标识的检索方法。检索时根据所需信息内容的学科属性以及检索系统所采用的分类表来确定分类号,再利用“分类代码”字段(Classficationcode)来检索所需信息。利用分类途径能查到有关某一学科或相关领域的全部文献,有利于族性检索的需求和查全率的提高,因而是通过信息内容特征标识获取信息的主要检索途径之一。其缺点是专指度较差,对新兴学科、边缘学科的查找不便,且检索者需要对分类语言较熟悉。
第六十一页,共七十三页,编辑于2023年,星期五信息检索途径6.主题途径
主题途径是根据信息的主题概念来检索信息的一种方法,即利用从信息资源中抽象出来的并经过人工规范化处理的、能够代表信息资源内容的主题词来检索。检索时以能反映信息主题概
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江苏泰州市兴化市医疗卫生事业单位招聘卫生专业技术人员91人考前自测高频考点模拟试题及一套参考答案详解
- 2025河南新乡市延津县县外在编在岗教师回乡任教的考前自测高频考点模拟试题及完整答案详解一套
- 2025年度七台河市人民医院第二批公开招聘编外医疗卫生技术人员28人模拟试卷及完整答案详解
- 2025年福建省厦门分行中国光大银行2025年春季校园招聘模拟试卷及答案详解一套
- 2025年城步苗族自治县事业单位公开选调工作人员考前自测高频考点模拟试题及答案详解(考点梳理)
- 2025年有机农业发展专项整治考核试卷
- 2025辽宁锦州市教育局所属学校赴高校招聘教师24人考前自测高频考点模拟试题及答案详解(易错题)
- 2025福建漳州漳州市芗城区行政事业单位国有资产中心招募2人考前自测高频考点模拟试题附答案详解
- 2025杭州市钱塘区教育局所属事业单位高层次人才引进15人考前自测高频考点模拟试题及一套答案详解
- 2025年烟台市芝罘区卫生类事业单位公开招聘高层次人才(11人)模拟试卷及答案详解(全优)
- 餐饮食堂竞标标书
- 迪尔凯姆社会学主义的巨擎汇总课件
- 家庭经济困难学生认定申请表
- 血栓性血小板减少性紫癜ttp汇编课件
- 阀门安装及阀门安装施工方案
- 大学数学《实变函数》电子教案
- YY/T 0640-2008无源外科植入物通用要求
- GB/T 29531-2013泵的振动测量与评价方法
- GB/T 2637-2016安瓿
- 数轴上的动点问题课件
- 省级公开课(一等奖)雨巷-戴望舒课件
评论
0/150
提交评论