版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章信息检索根本方法2.1检索语言2.2分类法2.3主题法2.4数据库检索本章内容信息检索的过程:文献信息检索课题检索提问信息文献信息特征分析分析形成形成输入检索输出标引
著录选用检索语言和名称规范文献信息标识检索点检索提问标识检索词检索工具检索结果检索过程存储过程文献标识和检索标识的匹配标引人员检索人员信息检索的实质——
课堂讨论为什么选这门课?小张是服装学院的大四学生,毕业设计题目是“电磁屏蔽织物的研究〞,导师要求小张查找一些与设计题目相关的文献资料。如果你是小张,你该怎么办?2.1检索语言自然语言
PK
人工语言一词多义
如:笔记本杜鹃
arm——臂、袖子、树大枝、兵器、军队多词一义如:红薯、地瓜、山芋、白薯、甘薯、苕
airplane、aeroplane、plane、aircraft引起漏检、误检,甚至检索不到。缺陷检索语言——根据文献信息检索的需要创造出来的一种人工语言,也称受控语言。检索语言是依据一定的规那么对自然语言进行事先标准,将其编制成表,以供文献标引和检索时使用的语言。使用的场合不同,检索语言也有不同的叫法:在存储文献的过程中用来标引文献,叫标引语言;用来索引文献那么叫索引语言;在检索文献过程中那么为检索语言。检索语言的种类按照标识的性质与原理划分:分类语言——分类法主题语言——主题法代码语言按照表达文献的特征划分:表达文献外部特征的检索语言表达文献内容特征的检索语言外部标识检索标识内容标识书名、刊名题名专利号、ISBN、文献号代码著者、译者、编者责任者分类号主题词2.2分类法分类是人类的根本逻辑思维形式之一,是人类认识客观事物和区分客观事物的思维活动。分类法反映了对人类全部知识体系的认识。分类法——分类语言分类语言——用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。分类语言以数字、字母或字母与数字结合作为根本字符,采用字符直接连接并以圆点〔或其他符号〕作为分隔符,以根本类目作为根本词汇,以类目的附属关系来表达复杂概念。著名的分类法有:?国际十进分类法??美国国会图书馆图书分类法??国际专利分类表??中国图书馆分类法?我国目前的分类法是建立在学科分类体系上的,属于体系分类法。它是将全部文献按其性质分为几个主要大类,把相同的文献集中在一起,相近的文献连接在一起,并将它们按“一般到具体〞的逻辑顺序加以排列,从而组成一个系统。换句话说,就是先将文献归入某一大类,然后按第二级类目、第三级类目......层层划分下去,直至划分到能准确反映文献内容的那一级类目为止。体系分类法中国图书馆分类法原称?中国图书馆图书分类法?,简称“中图法〞,是我国图书分类法的根底:1975年正式出版第一版;1980年出版第二版;1990年出版第三版;1999年出版第四版,第四版更名为?中国图书馆分类法?,ChineseLibraryClassification〔简称CLC〕。中图法体系结构以自然科学、社会科学、哲学作为人类知识领域的根本构成建立根本序列。并将作为社会主义分类法编制指导思想的“马列主义〞和文献特殊性设置的“综合性图书〞,形成五个部类的根本序列。设置了22个根本大类,大体按“上层建筑-经济根底-意识形态〞,即“政治-经济-文化〞的次序排列。第一部类A马克思主义、列宁主义、毛泽东思想、邓小平理论第二部类B哲学、宗教第三部类C社会科学总论H语言、文字D政治法律I文学E军事J艺术F经济K历史、地理G文化、科学、教育、体育第四部类N自然科学总论S农业科学O数理科学和化学T工业技术P天文学、地球科学U交通运输Q生物科学V航空、航天R医药、卫生X环境科学、平安科学第五部类Z综合性图书自然科学各大类的排列那么按学科的属性遵循从一般到特殊、从简单到复杂、从低级到高级、从理论到应用的次序进行,并形成“根底理论-技术科学-应用科学〞三个层次。类目结构举例:1、附属关系——一个类与其直接分出来的小类之间具有上下位关系。下位类具有其上位类的属性;下位类的含义要通过其上位类来理解;上位类概念包含其所属的各级下位类概念;附属关系为通过移位进行缩检和扩检提供了便利。类目含义的理解2、并列关系——一个上位类的所有直接下位类之间具有并列关系。并列概念之和等于其直接上位概念;并列类未能枚举出所有同级类目,那么最后一个并列类目应该是“其他〞类。3、相关关系——两个类目在概念上具有相似性,但不属于同一上类位。似是而非的类可通过其上位类判断,也可以通过附注了解其区别。附属和并列关系实例:B哲学B0哲学理论B1世界哲学B2中国哲学B20唯物主义与唯心主义(总论)B21古代哲学B22先秦哲学(公元前221年)B23秦汉、三国晋、南北朝哲学(公元前221年~公元589年)B24隋、唐、宋、元、明、清哲学(589年~1840年)B25近代哲学(1840年~1916年)B26现代哲学(1919年~)B27马克思主义哲学在中国的传播与开展相关关系实例:F经济F7贸易经济F76
商品学F760
一般性问题F760.3
商品包装和运输J
艺术J5工艺美术J52
中国工艺美术J524
工商工艺美术J524.1
产品、商品装璜J524.2
包装T
工业技术TB一般工业技术TB48
包装工程TB482
包装设计TB484
包装材料(总论包装材料及其包装技术入此)T
工业技术TS轻工业、手工业TS0
一般性问题TS09
包装装璜技术2.3主题法主题法——是指直接以表示文献或信息主题的语词作标识,提供字顺检索途径,并主要采用参照系统揭示词间关系的标引和检索文献的方法。主题法——主题语言主题语言——由受控的自然语言语词直接表达主题概念,按词语字顺排列主题概念,主要用参照系统显示概念之间关系的标引语言。以自然语言的字符为字符,以名词术语为根本词汇,用一组名词术语作为检索标识的一类检索语言。主题语言——主题词的类型叙词、标题词、元词——标准词指经过控制的,表达文献信息内容的语词,由主题词表来标准。关键词——自由词但凡能概括文献主题或读者需求的、有检索意义的实词都可以作为关键词;没有词表,不是受控制词;适应计算机检索需要。主题词的构词形式:缩略词单词词组短语含有倒置符的词组——Pipe,Copper含有圆括号的词组——疲劳〔材料〕主题词的参照关系——语义网车辆非承载式车体承载式车体卡车载重汽车重型载重汽车轻型载重汽车货车属分关系等同关系属分关系属分关系相关关系概括主题词的一般方法⑴固定词组概括⑵复杂概念分解⑶主题词替换针对:概念比较单一的文献需求,可直接用一个固定词组概括表示。通用的专称、术语例:经济危机、万有引力复合的概念(字面分解后会失去检索意义或产生歧义)例:剩余价值、猎户星云⑴固定词组概括⑵复杂概念分解针对:适于概念比较复杂的文献需求,需要分解后用逻辑组配表示分解原那么——“最小概念原那么〞例:弥雾喷粉喷烟机——弥雾机、喷粉机、喷烟机分解方法:划分成具有交叉关系的并列概念例:食品的低温贮藏——食品、低温、贮藏划分成主体概念和限定概念例:环境污染取样分析——环境污染、取样、分析液压系统油泵——液压系统、油泵⑶主题词替换同义词、近义词
例:计算机→电脑客运→旅客运输上位词(概念扩大)
例:计算机键盘→键盘下位词(概念缩小)
例:信息检索→计算机检索2.4数据库检索反馈反馈检索字段反映数据库中文献信息特征的词条。①表征文献内容特征的主题字段题名、叙词、标识词和文摘等②表征文献外部特征的非主题字段作者、文献类型、语种、出版年份等DIALOG检索字段字段代码 字段名称
AB Abstract 文摘
AU Author 作者
DE Descriptor 叙词
DT DocumentType 文献类型
ID Identifier 标识词
JN JournalName 刊名
LA Language 语种
PY PublicationYear 出版年份
TI Title 题名检索组配符布尔/逻辑算符截词符/通配符位置算符优先级算符布尔/逻辑算符1.逻辑与——AANDB;A*B表示两个检索词的交集用以缩检,减小范围或是提高查准率AB不能进行“逻辑与〞组配的词:概念等同的词附属概念的词不相邻概念的词:概念并列或无关2.逻辑或——AORB;A+B用于组配具有附属关系和等同关系的词;提高查全率,降低漏检率,属扩大检索。BA等同关系——同义词/近义词异形同义词缩写和全称商品名、俗名、学名化学物质名称和化学物质表达式英文同根词附属关系——整体与局部需要针对具体情况分别列出每一个表达局部概念的检索词,否那么将出现漏检。例:欧洲能源(欧洲OR英国OR法国OR意大利OR…)AND(能源OR煤OR石油OR…)3.逻辑非——ANOTB;A-B用以排除不希望出现的检索词用以缩检,提高查准率AB如果两个关系紧密的检索词同在一检索逻辑中,对其中一个使用NOT逻辑会导致含另一个词的文献也被排除。例:(计算机AND软件)NOT硬件同时包含软件、硬件的相关文献被排除了,导致漏检。截词符/通配符一般有三种:*、?、$在不同检索系统中的书写形式和含义会不同①
*
代替任意多个字母例:auto*:auto、autocycle、automobile…B229*:B229、~②
?仅且必须截一个字母例:wom?n:woman、women…
$
截一个字母或0个字母例:Hof$man*:Hofman、Hoffman、Hoffmann、Hoffmanova
…位置算符①
N
——表示两词相邻,顺序可以颠倒②W
——
表示两词相邻,但顺序不能颠倒③
SAME
——表示两词必须出现在同一句子中,顺序可以颠倒④
nN——两词之间最多可插入n个单词,且词序可颠倒⑤nW——两词之间最多可插入n个单词,且词序不可颠倒本卷须知:1、中文数据库一般只用到逻辑运算符,通过模糊检索实现扩检;2、如果两个检索词之间无逻辑算符,那么按照固定词组处理;3、组配符的优先次序:()>SAME>NOT>AND>OR检索式的构造由检索词、检索字段和逻辑算符、截词符、位置算符以及系统规定的其他组配连接符号组成。例:SCI:TS=((urbanORcity)ANDtransport*)AND
TI=(railwayORsubwayORunderground)EI:((urbanORcity)
WN
KY)AND((railwayORsubwayORunderground)WN
TI)AND((transport*)WN
AB)检索式的调整扩检——从查全率角度①降低检索词的专指度;选一些上位词或相关词补充到检索式中②调节检索式的网罗度;如删去某个不很重要的概念面③进行族性检索;可采用分类号检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 1.3 劳动教育的发展历程
- 冬期专项施工方案
- ibm财务外包合同
- 三维影片外包合同
- 业务分包外包合同
- 交通工程外包合同
- 供暖外包合同
- 企业某车间外包合同
- 供水营销外包合同
- 修缮学校外包合同
- Python语言基础学习通超星期末考试答案章节答案2024年
- 前程无忧行测题库
- 学前教育普及普惠督导评估内容和标准量化评分表
- JT-T-1230-2018机动车发动机冷却液无机阴离子测定法离子色谱法
- 广东省广雅中学2025届数学高一下期末联考试题含解析
- 兄弟宅基地分割协议书完整版
- 房地产项目资产收购协议
- 绿化保洁物业工作总结
- 名誉权纠纷答辩状范本
- 工业机器人操作与编程课件
- 2021年湖北省新高考物理试卷(附答案详解)
评论
0/150
提交评论