数据库结构与组织_第1页
数据库结构与组织_第2页
数据库结构与组织_第3页
数据库结构与组织_第4页
数据库结构与组织_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1

数据库结构与组织

2数据库结构数据库组织方式循序档sequential随机档randomfile索引循序档indexed-sequentialhierarchical数据库组成元素Database

RecordsFieldsSubfields3数据库结构网络型:多父多子阶层型hierarchical

一父多子关系型relational

表格关联4数据库的组织在线信息系统Dialog数据库ERIC是Dialog的file1记录(record)ERICrecords>1,000,000资料栏位(field)每一record有一连串的资料栏位。次栏位(sub-field)7001|a吴|b政叡资料元(dataelements)5数据库的层次File档案--Afileisanorganizedcollectionofrelatedrecords.由一组相关的记录所组成。Record记录--Arecordisacollectionofrelateddataitemsorfields.由一组相关的数据栏组成。Field栏--Afieldisanitemofdata.在记录中的一项数据。Name:PeterChanSex:MAge:22AcademicQualification:-……………..6数据库基本名词定义Record(纪录)用来储存以供检索之文件描述Entity(实体)储存信息的物件e.g.一本书、一篇文章Attribute(属性)可用来描述实体的特性Value(属性质)用来描述实体特性的内容Field(栏位)用来描述属性质的一串字符Subfield(次栏位)Data(资料)7属性与属性值—以书为例Attributes(属性)AttributeValues(属性值)作者(Author)吴政叡书名(Title)都柏林核心集与图书著录出版商(Publisher)台湾学生出版地(cityofpublication)台北市出版年(dateofpublication)2000[民89]页数(numberofpages)2188资料组成元素DataElementExampleTextrepresentedBit1or0Byte0100110&SubfieldPlaceofpublicationChicago,IllinoisfieldPublicationstatementChicago,Illinois:AcademicPress,1985RecordAnERICindexrecord大于983,000DatabaseTheERICdatabaseLibraryAllDialogdatabases>200个databases9档案的组织SequentialFile循序档:最简单、依序RandomFile随机档:以数学函数算位址Indexed-SequentialFile索引档:主要资料区:储存档案资料溢位区:溢位被挤出之资料存放区索引区:记载每一存放记录的储存位置10档案组织--循序档特性:将档案中的资料依照一笔一笔地存放在储存装置上,如欲存取档案中之资料时,必须依照档案中资料排列的顺序读取资料。11档案组织--循序档优点:档案中的纪录长度没有限制且最节省储存区空间。缺点:存取效率差及不适于实时处理作业且资料的更新作业可能涉及大量资料搬移动作因此较不经济。适用储存装置:读卡机、磁带、磁碟、磁鼓与磁盘。循序档适用时机:整批处理。12档案组织

直接存取档(DAM)

1.特性:纪录利用数学函数来计算其位址,再根据此位址将纪录直接存放在储存装置内。

2.优点:

a.支援循序、直接存取。

b.若资料有异动不会有大量资料搬移的动作。

c.适合实时处理作业。13档案组织--索引档特性:利用一个索引表格来记载在档案中的位置,当程序欲寻找纪录之位置时,必须先透过索引表格作找寻纪录位址之动作。14档案组织--索引档组成:

1.主要资料区(PrimeDataArea): 储存档案资料得区域。

2.溢位区(OverflowArea): 当主要资料区的空间不敷档案使用时,会将无法存入主要资料区中的资料存在此区。

3.索引区(IndexArea): 所有纪录在主要资料区中的位址均会记录在此区中,借以方便资料存取的动作。15档案组织--索引档优点:

1.支援循序、直接存取。

2.若资料有异动,不会有大量资料搬移的动作。

3.适合实时处理作业。16档案组织--索引档缺点:

1任何资料存取均需两次因此较耗时。

2.索引区固定会占用一部份额外储存空间。

3.需留溢位空间因此无法妥善利用储存空间。

4.若溢位情形严重将使效能降低。

5.循序存取效率较循序档差,随机存取效率较直接档差。适用存取装置:磁碟、磁鼓及磁盘17主档与异动档主档:特性:主档会储存全部的资料,因此资料最完整、内容最多且较少修改。例:图书馆系统的读者资料档、书目资料档。

18主档与异动档异动档:特色:用于修正主档内容,又称为明细档,因此内容较少且仅包含某段时间内主档修正的信息。例:每日流通资料。19档案组织--相对档相对档(relativefile)是以纪录中之某一特定栏位做为纪录之位址,此栏位称为相对键。以相对键(relativekey)之内容来将纪录储存在储存装置中。20档案组织—倒置档在档案中欲搜寻某笔记录时,通常是利用主要键栏来找寻;若再建立一个档案结构时定义了由辅助键栏来找出纪录在档案中的位址及对应之主要键栏之方法,则此种档案结构即为所谓的倒置档或反转档(invertedfile)。21基本档案结构Linearfile(线性档)--Printfile依每一笔资料的编号连续储存Invertedfile(倒置档)--Indexfile将线形档中每一个可供检索的字依字母顺序排列,并指出此字在线形档中的位置可知此字出现在哪些纪录,且方便直接调阅该纪录常见倒置档基本索引档(basicindexfile)附加索引档(additionalindexfile)索引典档(thesaurusindexfile)讯息档(Postingfile)22书目记录结构与栏位—

以ERIC为例DIALOGBlueSheet所提供之资料/bluesheets/html/bl0001.htmlResourcesinEducation(RIE)14,000documentseachyearCurrentIndextoJournalsinEducation(CIJE).20,000journalarticles,extractedfrommorethan750serials23DIALOG—ERIC线形档24DIALOG—ERIC基本索引档25DIALOG—ERIC附加索引档26DIALOG—MathSCi索引典27ERIC--OCLC28ERIC–EBSCO29ERIC–ProQuest30数据库索引法常见索引法单字索引法(wordindexing)词组索引法(phraseindexing)单字与词组混合索引法(wordandphraseindexing)数字索引法(numericindexing)辅助索引法布林逻辑操作数(Booleanlogicoperator)切截法(truncation)相近操作数(proximityoperator)特定限制栏位检索法检索用法查证法31求全率v.s.求准率求全率recallratio成功检索到相关资料的比率=求准率precisionratio没有检索到不相关文献的比率=相关不相关总数检出aba+b未检出cdc+d总数a+cb+da+b+c+daa+baa+c32单字索引法(wordindexing)将栏位中所有可供检索的字逐一索引,键入倒置档通常用于主题相关栏位,以非控制词汇表示如题名、摘要、全文剔除停用字(Stopword)DIALOG的停用字:as、and、by、for、from、of、the、to、with可透过后组合(post-coordination)方式,以布林逻辑操作数组合查询theevaluationofdatabases

evaluation、databases33词组索引法(phraseindexing)或称复合语索引法以一个独立款目为单位进行检索,包含空白与标点符号作者、资料型态、期刊名称、出版语言检索者在检索时,必须以系统制作时的著录方式检索,甚至所有的标点符号和空格都需一致,方能检索到资料如Bush,GeorgeHerbertWalker34单字与词组混合索引法(wordandphraseindexing)多出现于与主题标目相关栏位保有单字索引法的组合弹性和词组索引法的精确检索者知道控制语汇时

采用词组检索,以提高确性检索者不知道控制语汇时

利用单字组合检索,提高检索的回现率35单字与词组混合索引法(wordandphraseindexing)(cont.)检索点较多,如consumerattitudes以单字索引法“consumer”、”attitudes”使用词组索引法”consumerattitudes”使用混合索引法“consumer”、”attitudes”、“consumerattitudes”缺点为占用数据库储存空间36数字索引法(numericindexing)常用于栏位内所包含的内容均为数字时商情名录数据库之公司基本资料

公司资本额、人数、销售数据统计数据库可依据数字大小排列,进行各项排序、比较、计算37前组合索引v.s.后组合索引(1)前组合索引(pre-coordinateindexing),又通称为非操作型索引(non-manipulateindexing)索引者,在索引阶段即进行字词组合的检索方式纸本索引常用方法,并利用系统轮回法(systematicrotation)方式,将可能出现的词汇列出38前组合索引v.s.后组合索引(2)后组合索引(post-coordinateindexing),又通称为操作型索引(manipulateindexing)检索者,在检索阶段自行组合字词的检索方式39前组合索引v.s.后组合索引(3)索引词汇数据库使用者检索策略利用指导数据库使用者检索策略利用指导后组合前组合数据库使用者检索策略利用指导40布林逻辑--1ANDintersection交集ORunion集合NOTdifference差别ANDORNOT41布林逻辑--2优先级括号优先执行NOTANDOR(catsORdogs)NOTpetscatsdogspets42括号优先布林逻辑操作数的优先级,一般而言,括号必须优先执行,如果没有括号,则一般为NOT>AND>ORDialog:ss(catalogingorclassificationorindexing)andtheoryss(catalogingorclassificationorindexing)andtheory43切截法在设定字根后,加上各种特殊符合

”?”、”#”、”$”,则可检索到全部字根相同的字范例librar?

horse??

librar???

?computer

wom?n

用于复合语栏位检索更能彰显其功能如Bush,GeorgeHerbertWalker可不必担心标点符号或空格但若切截过广,会检索出许多不相关的资料44相近操作数w

限制单字出现的顺序information(w)theoryn

不限制单字出现的顺序,但利用阿拉伯数字限制二字之间的间隔Ronald(n)ReaganMarilyn(2n)Whitel

限制其前后字词必须属于同一个叙述语cancer(l)preventions

限制其前后字词必须出现在同一个副栏位中information(w)theory优先级:wnsl45相近操作数w主要功能在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论