1.概论2.ppt_第1页
1.概论2.ppt_第2页
1.概论2.ppt_第3页
1.概论2.ppt_第4页
1.概论2.ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三部分是信息检索。首先,信息检索的概念是广泛的:以某种方式组织和存储信息,并根据用户的需要找到相关信息的过程和技术。狭义:从信息收集中找到所需信息的过程。二,信息检索的类型,按检索对象划分。文献检索是信息检索的重要组成部分,数据检索,事实检索,图像检索,多媒体检索,手工检索,计算机检索,(1)存储过程,(2)检索过程,3。信息检索原理、信息源、存储、搜索工具、(1)信息检索语言的概念实质上是一个检索识别系统,它是一种特殊的人工语言,用于描述信息特征和表达信息检索中的检索问题。功能:它是信息存储和信息检索之间的桥梁。搜索语言的类型根据其标准化而不同:非标准化搜索语言、自然语言、标准化搜索语言、

2、人工语言(关键词),如艾滋病、艾滋病、获得性免疫缺陷综合征、获得性免疫缺陷综合征(关键词)、2。按结构原则划分:(1)分类检索语言;(2)主题检索语言;(3)代码检索语言描述文献内容特征、文献外部特征、分类语言、主题语言、代码语言、图书/期刊/标题、作者姓名、被引文献、代码/序号、单位词语言、关键词语言、标题词语言、主题词(描述词)语言、标题的语言;(1)分类检索语言带分类号体现了学科的系统性。相关概念:“分类号”/“类别”/“子类”/“上类”/“下类”/“同源类”,国内主要分类简介,中国图书馆分类法(CLC)、中国图书馆分类法、中国人民大学图书馆分类法、中国科学院图书馆分类法、中国档案分类法

3、、中国图书馆分类法(简称见教材P.14中国图书馆分类法,共分为5类22个基本类别),国内94%的信息机构使用。该书于1957年首次出版,第四版于1999年出版,随后推出了电子版。架构、R医学、健康、分类表结构、类别号、类别名称、类别注释、数据法类别号、主要国外分类系统介绍、杜威十进分类法(DDC)、UDC、美国国会图书馆分类法(LCC)、美国国家医学图书馆分类法(NLMC)、冒号分类法(CC)、杜威十进分类法及相关索引(DDC)是世界上流行的、权威的图书分类方法。它由美国图书馆员麦尔维尔杜威于1876年创立,由大类、门、类、命令、副标题等组成。它将所有学科的图书和期刊分为九类,用1到9的数字表

4、示,不属于这九类的图书为第0类。每个主要类别下有1到9个子类,它们根据这个类别进行划分。普通100哲学,宗教,社会科学语言学纯科学,技术,科学和艺术800文学900历史UDC已经出版了23种语言。UDC的类别表主要由主表、辅助符号和辅助表组成。UDC的主表将所有知识分为十类,每一类又分为大纲、项目和子项目。UDC的基本分类如下:0一般1哲学,心理学2宗教,神学3社会科学,法律,行政4语言学5数学,自然科学6应用科学,医学,工程,农业7艺术,美术,摄影,音乐,娱乐,体育8语言学,文学9地理,传记,历史,和标题词被用作信息识别和检索方法在标题词检索语言。(标准化)单位词检索语言使用最基本、非细分和

5、独立的术语来识别和检索。(标准化)描述性主题检索语言标准化检索语言关键字主题检索语言非标准化检索语言(自然语言),(2)主题检索语言:用词表达各种概念的检索语言。主题词(叙事词),也称为主题词,是能够表达文档主题内容的标准语言。它的主要特点是用词受到严格限制。它是一种典型的标准化语言,用于“标准化”一个概念的同义词、同义词和拼写变体,以确保单词和概念之间的一一对应。例如,医学辞典(叙词表)将在后面单独介绍。关键词(Keywords)是指现有文献中能够表达文献主题内容或用作搜索条目的关键技术术语,这些术语不规范且没有特殊限制。直接取自最新的文献,它可以立即反映科学领域的新思想、新方法、新发现和新

6、术语。很容易造成漏检。STK15基因,关键词与关键词的异同,关键词:标准化检索语言表达文档的主要内容,只有一个概念表达文档的同一主题。文档相对集中,关键词之间有参照系统和层次关系,所以文档也是相互关联的。有些新术语不能及时出现在同义词库中。关键词:非标准化检索语言表达文献的主要内容。新兴术语被及时编入索引。掌握同一主题的零散文献既简单又容易。需要提供所有的同义词和同义词。它不能显示关键字之间的相关性。根据文献中讨论事物的代码,它被用作识别和检索系统的索引语言。例如:化学文摘中的分子式索引,c2h6o4ssntin,二甲基硫酸酯(2-)-o-44657-51-4,91:99600j c2h6o4

7、s2二磺酸酯,二甲基-10383-49-0,94:138833 (3)信息检索方法根据文件外观特征、标题检索方法、作者检索方法、序列号检索方法、分类方法、主题方法和关键词方法进行分类,(4)常见的分析和研究主题:分析和研究主题、主题和开始年份。2.选择数据库和检索方法3。确定检索标记,构造检索题公式4。在计算机上执行检索操作。组织检索结果,获取原始文档。6.对检索结果进行分析和评价,根据分析结果修改检索公式,重新检索。信息检索在科研中的时间比例,信息检索的意义,(6)信息检索效果的评价,检索效果:指检索系统的有效程度,它反映了检索系统的能力。评价指标:包含范围、召回率、准确率、响应时间、用户负

8、担和输出形式。信息素养、信息文化、信息能力、信息素养、个体认知、创造和利用信息的态度和能力第五节信息素养及其教育、观念、信息意识、信息能力和信息道德是指人脑对信息和信息工作在社会发展中的性质、地位、价值和作用的理解和反应。是指人们在社会生活和科学劳动中捕捉、处理、传递、吸收和利用信息的潜在能力。是指人体在整个信息活动中,包括信息的获取、使用、制造、传播过程中应该遵守的某些伦理规范。构件,接受综合素质教育,优化知识结构,接受信息理论教育和检索技能培训,加强自我信息能力的培养,并培养途径。1.数据库1。数据库定义:由计算机处理的一定数量的相似信息的有序集合,是用于存储和搜索文献信息的电子检索工具。

9、包含书目和文献相关数据的机器可读记录的有组织的集合。数据库不仅是存储数据的仓库,也是文献检索的对象和主体。补充内容2,数据库结构1。在文件数据库中收集书目和文献信息。它由几个相同类型和不同类型的记录组成。一个数据库只能有一个或几个文件,每个文件都有自己的文件名。2.记录是文件的组成单位。记录代表一条文献信息,由几个字段组成,包括标题和摘要。3。字段记录中的每个项目。这个领域代表文学。一些基本特征和检索功能。如标题、作者、来源等。数据库中的字段通常具有统一的格式,但是每个记录不一定包含所有的字段。例如,MEDLINE中的每个字段通常用两个字母的代码来表示。数据库组织图示例:数据库文档记录字段,C

10、BM序列号:2002303047分类编号:R457.1R619.105R654.1题目:自体血小板输注对先天性心脏病体外循环术后出血的影响。陈汝坤作者:中国人民解放军第117医院心胸外科参考文献编号:6地点:中国医学杂志,2002年7月10日;82(13): 926-927 ISSN:0376-2491国内代码:11-2137/R国内代码:Z84出版:北京主要题字:术后出血/*治疗;*自体输血;体外循环;先天性心脏缺陷/*外科手术的特殊词汇:人类、标题、题目、作者和文献来源构成标题。标题是显示检索结果和在文档后列出参考文献的常用格式,也是获取原始文本所需的基本信息。3.数据库分类:根据数据存储

11、文献信息的内容,可分为以下几种类型:1。书目数据库;2.数字数据库;3.事实数据库:4。全文数据库。超文本数据库、书目数据库,也称为摘要数据库,主要以二级文献的形式存储文献信息,一般包括标题、作者、来源、摘要、主题词、分类编号等。它们是寻找文学线索的工具。许多数据库对应手工检索工具,一些大型手工检索工具大多有相应的计算机检索数据库。例如,im-MEDLINE em-em base ca-ca search ba-BIOS is预览,数字数据库主要包含数字数据,有些数据库还包含一些定义数字所需的单词。数字是指可以用数字计算、测量或表达的项目。如化学毒性数据库、人口数据库和化学结构图数据库。事实数

12、据库或词典数据库,直接提供科学依据或事实。例如,美国国家癌症研究所建立的PDQ(医生数据查询)数据库可以提供所有主要癌症类型的最新治疗和预后、标准治疗方案和研究治疗方案,以及主要从事癌症治疗的医生名单和与癌症治疗和护理相关的保健组织名单。基于事实的数据库、全文数据库以及书籍或期刊的原始文本被转换成计算机可读的形式。清华大学中文学术期刊全文数据库(光盘版)是连续出版的大型综合性学术期刊的全文检索系统。全文数据库,2。计算机检索技术。常用的检索方法:(1)布尔检索,(2)近词检索,(3)短语检索,(4)截短词检索,(5)词干检索,(6)模糊检索和精确检索,(7)语音检索,(8)字母大小写敏感性检索

13、,(9)加权检索,(10)它可以用*或(逻辑或)非(逻辑非)表示;2.常用运算符A和B:表示命中结果是A和B的交集。A或B:表示命中结果是A和B的所有部分.a不是B:表示命中结果是a中不包含B的部分。例如,头痛和脑啡肽之间的关系;吸烟对妇女和儿童的影响;吸烟和(妇女或儿童)除锌以外的其他微量元素,在中文数据库中表示为:和:和,或:或,或:不含,不含,但在不同的数据库中操作顺序是不同的(),例如,初步搜索公式:#1(丙酸睾酮或孕酮)和HL60细胞#2(丙酸睾酮或孕酮)和阿糖胞苷#3 #1或#2,即(丙酸睾酮或孕酮)和(HL60细胞或阿糖胞苷),性激素(丙酸睾酮和孕酮)对HL60细胞的影响及其毒性

14、作用?科洛?R-color,color,field limiters:秋天的ti,秋天的ti;第三,搜索策略,搜索策略:在分析研究所提出的问题的基础上,确定要搜索的数据库和搜索词,明确搜索词之间的逻辑关系,确定科学的搜索步骤。目前很少有建立信任措施数据库来搜索水手草的药理和毒理作用。中国知识网,你可以看到全文。搜索词希曼格拉斯的文档很少,所以它被改成了“主题”字段,而且很少有人在那里。浏览全文,我找到一篇文献报道,考证海藻的名字,也叫鹧鸪?仔细阅读。再翻查鹧鸪菜,文献就乱了。有些文章认为它们是一个物种,有些文章指出它们是海藻或鹧鸪蔬菜,但他们不知道它们实际上是什么,所以暂时放在一边。查找外语。拉丁名Digenea单纯形是第一次使用,有近20篇文章。在查找全文时,发现其提取物红藻氨酸具有多种功能,用红藻氨酸检索了2000多篇文章,红藻氨酸仍是关键词,限制使用中文,有28篇文章引用了CBM,但没有使用英文,中文翻译为红色藻氨酸,还有很多其他文章。查阅中国知识网和文献,发现许多中国文献都是“海人酸”,或者KA,这是真的吗?检查每篇文章的材料,查看材料的来源,并查看摘要。分析它的化学名称和结构式,并验证它是一种物质。用“海人酸”在中文数据库中再次搜索。编写检索样式并调整检索策略,直到您满意为止。扩大搜索范围的主要措施和缩小搜索范围的主要措

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论