信息检索语言方法与技术课件_第1页
信息检索语言方法与技术课件_第2页
信息检索语言方法与技术课件_第3页
信息检索语言方法与技术课件_第4页
信息检索语言方法与技术课件_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲信息检索语言天津商学院图书馆(一)检索语言的类型

1、什么是信息检索?广义:信息检索(InformationRetrieval):将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息的过程和技术。

狭义:从信息集合中找出所需要的信息(信息查询)

存--取

(一)检索语言的类型

2、什么是检索语言(RetrievalLanguage)?

用来描述文献、组织文献记录,进行文献检索的标识系统,称为检索语言。检索语言是文献检索系统存储与检索信息所使用的共同语言,它是标引人员与检索人员之间沟通思想、取得一致理解的桥梁。所以,检索语言实质上是标引和检索之间的约定语言。3、检索语言的类型:按描述文献的内容性质划分,可分为分类语言和主题语言。

分类语言。用分类号和相应的分类款目来表达各种概念,以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序,能反映事物的从属派生关系,便于按学科门类进行族性检索。按照分类方式的不同,分类语言又分为体系分类语言、组配分类语言和混合分类语言。主题语言。主题语言就是对表达信息主题内容特征的主题词汇概念,经规范化处理所形成的检索语言。由于主题词汇表达概念准确,所以主题途径是检索信息的主要途径。主题语言按照主题性质的不同,它又可分为标题词语言、单元词语言、叙词语言、关键词语言和引文语言。4、检索系统按功能分类目录检索系统馆藏目录、联机公共检索目录(OPAC)文献检索系统目录检索和文献检索统称为书目检索(二次文献),提供的信息是文献线索事实检索系统包括对事实、数据和全文的检索,是一种直接的确定性检索。词典、百科全书、年鉴、名录等。公共检索系统的使用随书光盘系统::8080/poweb/index.jsp

2.书刊检索系统:通过本系统可进行图书信息、本人借阅信息的检索,以及办理续借手续。

3.读者登录方式:

①、校园网用户:请登录http:///,也可在我馆还书处及阅览室的检索窗进行检索和办理续借。

②、公共网用户:请登录4/index2.html

书刊检索系统使用说明第一步:登录

3/

进入以下界面第二步:单击天津商业大学图标进入以下界面

第三步:输入用户标识(即:本人借阅证号)及个人密码(初始密码为“0000”,若有改动,请本人务必记清楚)。登录后在“我的帐户”里可进行图书信息的检索,本人借阅信息的检索,以及办理续借手续。备注:

我校现已改用校园一卡通,校园卡上没有借阅证号码,在进行检索时借阅证号码的生成规则为:

1、教工:“R130TSJ000”加本人工作证号(4位),共14位;

2、研究生:“R130TSY”加本人学生证号后七位,共14位;

3、本科生:“R130TSB”加本人学生证号后七位,共14位;

4、院外读者仍使用原借阅证,详情请查看《图书馆一卡通借阅证号码变更说明》。

中国年鉴全文库

中国药典查询应用系统

事实检索系统(二)分类语言1、几个概念:(1)分类:以事物的本质属性或其他显著特征作为依据,把各种事物集合成类的过程。是人们认识事物、区分事物、组织事物的一种逻辑方法。

(2)分类法:对文献进行分类的工具。是一种重要的情报检索语言。2、分类法的历史较早时的分类法:“四库分类法”20世纪以来,一些以现代学科分类为基础的图书分类法陆续出现。这些分类法考虑了知识的系统性,按照学科的性质归类。最有影响的有四种:

1)《仿杜威书目十进制》,沈祖荣、胡庆生,19172)《世界图书分类法》,杜定友,19253)《中国图书分类法》,刘国钧,19294)《中国十进分类法及索引》,皮高品,1934建国后陆续编制出《中国人民大学图书馆图书分类法》、《中国科学院图书馆分类法》和《中小型图书馆图书分类表草案》,都被应用于编制馆藏目录、书目和索引。《中国图书资料分类法》也是常用的分类法。现在,我国用的最广泛的是《中国图书馆分类法(第四版)》

《中图法》的前身可追溯到《中小型图书馆分类表草案》(以下称《中小型法》)

《中小型法》,1957《大型法》,1959《中图法》

《中图法》是一部综合性分类表,也就是说《中图法》是能够供所有学科专业文献标引和检索使用的标引语言。1975年10月科学技术文献出版社正式出版《中图法》第一版,1999年3月北京图书馆出版社出版第四版,全称也从《中国图书馆图书分类法》改为《中国图书馆分类法》。

2001年夏北京图书馆出版社出版了第四版的电子版,称为《中国图书馆分类法》(第四版)电子版1.0版。3、中图法五大部类序列

1)马克思主义、列宁主义、毛泽东思想、邓小平理论

2)哲学、宗教

3)社会科学

4)自然科学

5)综合性图书4、中图法类目简介S

S1S2S3S4S5S6S7S8S9

S11S12S13S14S15S16[S17]S18[S19]

S21S22S23S24S25S26S27S28S29

S281S282S283S284S285S286S287S288S2895、《中图法》的编制原则

第一,以马列主义毛泽东思想为指导,以科学技术发展水平和文献出版的实际为基础,将科学性、实用性、思想性有机地统一。第二,以科学分类和知识分类为基础,依照从总到分、从一般到具体、从理论到应用的原则构建逻辑系统。分类体系与类目设置既要保持相对稳定性,又要考虑有一定的动态性,及时反映新学科、新主题的发展,并允许对其结构与类目作一定的调整,以满足不同的需要。第三,标记符号力求简明、易懂、易记、易用;标记制度力求灵活实用,有较好的结构性,以揭示体系分类法的本质特征。第四,兼顾作为编制分类检索工具的规范与作为文献分类排架的规范的双重职能。第五,兼顾不同类型、不同规模图书馆和文献信息机构类分不同类型文献的需要。6、《中图法》的分类体系

基本部类

基本大类马克思主义、列宁主义、毛泽东想、邓小平理论

A马克思主义、列宁主义、毛泽东思想、邓小平理论哲学、宗教………………B哲学、宗教社会科学…C社会科学总论

D政治、法律

E军事

F经济

G文化、科学、教育、体育

H语言、文字

I文学

J艺术

K历史、地理6、《中图法》的分类体系

自然科学……N自然科学总论

O数理科学和化学

P天文学、地球科学

Q生物科学

R医药、卫生

S农业科学

T工业技术(包括17种工业部门技术)

U交通运输

V航空、航天

X环境科学、安全科学综合性图书……Z综合图书7、《中图法》的标记符号

《中图法》的标记符号分为基本符号与辅助符号两种:(1)基本符号:以字母和阿拉伯数字混合作为其基本符号,如R511(医学/内科学/传染病/病毒传染病)。一般一个字母表示一个大类,但“法律”大类第二分类体系用“DF”表示(以法的类型集中文献,主要供法学、法律单位选择使用。),“工业技术”的二级类采用双字母。7、《中图法》的标记符号

如:T(工业技术)、TB(一般工业技术)、TD9(矿业工程)、TE(石油、天然气工业)、TF(冶金工业)、TG(金属学与金属工艺)、TH(机械、仪表工业)、TJ(武器工业)、TK(能源与动力工程)、TL(原子能技术)、TM(电工技术)、TN(无线电电子学、电信技术)、TP(自动化技术、计算机技术)、TQ(化学工业)、TS(轻工业、手工业)、TU(建筑科学)、TV(水利工程)。

以字母顺序反映大类及工业技术所属二级类的序列,字母之后用数字表示下属各级类,数字依小数制升序排列。(以R511为例)(2)辅助符号:1)总论复分号“-”这是表示总论复分表中的类目号码,凡主表类目使用总论复分表复分组号时,须将“-”与总论复分表中的类号一起加在主类号后。例如:《物理学词典》

类号:O4-61物理学/(总论复分表)名词术语、词典、百科全书2)组配符号“∶”用于联结两个相关的主类号,合成一个组配类号。例1:《英美名诗汉译集》

类号:H319.4∶I561.2英语读物/组配编号法/文学/(世界地区表)英国文学/(专类复分表)诗歌互见类号H319.4∶I712.2

例2:《汉语方言研究文献目录》

类号:Z88∶H17专科目录/组配编号法/汉语方言3)地区区分号“()”当某类目需要依地区、国家区分,但类目无注释规定可依地区表复分时,则可将“世界地区表”或“中国地区表”中的有关类号用()括起,加在主类号之后。例如:《俄罗斯画家尼古拉·费迅油画作品》

类号:J233(512)=5(各国绘画作品)油画/(世界地区表)俄罗斯及苏联/(国际时代表)现代4)时代区分号“=”

当某类目需要依时代区分,但类目无注释规定可依时代表复分时,则可将“国际时代表”或“中国时代表”中的有关类号加在主类号之后,中间用“=”联结。

例如:《羽坛辣妹子自话》(龚智超的自传)类号:K825.47=76(中国人物传记)体育人物/(中国时代表)21世纪5)民族区分号““””如某类目需要依民族细分,但类目无注释依“世界种族与民族表”或“中国民族表”复分时,则可将种族或民族号码置于“”中,加在主类号之后。例1:《犹太人经商智慧》或《犹太人经商秘诀》

类号:F715“382”商业企业组织与管理(类目注释:商业经营管理学入此。)/(世界种族与民族表)犹太人例2:《吉普赛舞蹈》

类号:J732.2“510.5”(各国舞蹈、舞剧/各种舞蹈)民族、民间舞蹈/(世界种族与民族表)吉普赛人(茨冈人)例3:《吉普赛扑克牌游戏》(电影《叶塞尼亚》)类号:G892“510.5”(文体活动)牌类(类目注释:扑克、桥牌、麻将等入此。)/(世界种族与民族表)吉普赛人(茨冈人)6)通用时间、地点区分号“〈〉”

若某类目需按通用时间、地区复分,则将“通用时间、地点区分表”的有关类号置于“〈〉”内,加在主类号之后。例如:《春季饮食养生》或《春季进补》

类号:R247.1<111>(中医学临床)食养、食疗/(通用时间、地点表)春7)其他符号“/”(起止符号),例如:D73/77各国政治、R25/278中医各科及中医急症学;“[]”(交替符号),例如:[F418]世界工人生活状况(宜入D411.7);“{}”(停用符号),例如:{D018}消灭阶级剥削(停用;4版改入D011阶级的产生与消亡);“+”(加号,资料分类的标记符号),例如:Q563维生素B、Q563+.1维生素B1等辅助符号,只出现在分类表中,不出现在标引中,可结合《中图法》实际类表了解与掌握。

注:类号数字中三位一点的小圆点,例如:TS142.221+.321定粒式自动缫丝机,只是为了使类号清晰易读,可以不归入辅助符号之列。8、标记符号的排列

《中图法》标记符号的排列采用:一般类号由左至右逐位对比的方法进行升序排列,先比较字母部分,再比较数字部分。字母部分按字母固有的次序排列,数字依小数制排列。分类号中如果涉及多种辅助符号的使用,一般按-、()、“”、=、〈〉的顺序排列。排列举例分类号款目排序次序:总论复分区分符号:-国家地区区分符号:()民族区分符号:“”时代区分符号:=通用时间、地点区分符号:<>主类号组配复分区分符号:∶例如:《八十年代美国妇科学》

类号:R711(712)=535妇科学/(仿世界地区表)美国/(仿国际时代表)20世纪80年代(三)主题语言

主题语言是一种描述性语言。它用语词直接表达文献的主题,这些语词就是表达主题概念的标识。将这些作标识的语词按字顺排列并使用参照系统来间接表达各种概念之间的关系,这就是主题语言。

根据词语的选词原则、组配方式、规范方法,主题词语言可以分为叙词语言、标题词语言和关键词语言。1、叙词语言叙词语言是主题语言的高级形式。叙词是从文献内容中抽取出来的、从概念上不可再分的基本概念单元词汇。检索时利用这些表达概念单元的叙词进行组配,以表达一个复杂的概念。叙词语言是近代用途较广、既适用于手工检索,又适用于计算机检索的后组式检索语言。

举例:《INSPECThesaurus》是英国《科学文摘》使用的叙词表,表中全部词汇按字顺排列,正式主题词用黑体字表示,图例列出了主题词与其相关词的参照关系。

Acousticwavevelocity

UFacousticvelocity

NTultrasonicvelocity

BTvelocity

TTvelocity

RTacousticdispersion

acousticimpedance

acousticwavepropagation

acousticwavevelocitymeasurement

acousticwave

liquidheliumsoundpropagation

Machnumber

shockwaves

CCA4300A5140A6260A6265

FCa4300-za5140+ga6260+ya6265+a

DIJanuary1973

说明:UF(Usedfor)表示主题词所替代的非规范词,UF后的词不能用作检索词。

NT(NarrowTerm),狭义词,表示主题词的下位词。

BT(BroadTerm),广义词,指明主题词的上位词。

TT(TopTerm),族首词,指明主题词的最上位词。

RT(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论