




已阅读5页,还剩76页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,数据库基本概念在专利检索中的运用,陈卫明许瑛姚文闫小苏2007.7.23,.,2,目录,1、数据、信息和数据处理2、数据库系统概述3、关系型数据库的三种操作4、布尔逻辑运算(集合运算)5、三种字段类型,.,3,1、数据、信息和数据处理,1.1、三个世界按照数据库理论,有现实世界、信息世界、计算机世界等三个世界。现实世界的“客观事物”(事实、事件)在信息世界中抽象为“实体”,并定义了各种“属性”来描述“实体”。“实体”在计算机世界被描述成一条“记录”。客观事物-实体-记录,.,4,1、数据、信息和数据处理,1.2、数据(data)是一些符号,用来描述客观事物的特征。这些符号可以是数字形式、文字形式(以及图形、图像和声音等)。例如学生成绩、飞机班次、测量温度、(CPRS中的)发明人姓名、发明名称、文摘、优先权项、文献号、申请号、分类号、申请日、公开日等。,.,5,1、数据、信息和数据处理,1.3、信息(information)信息是经过加工(记载、分类、组织、关联、解释、提炼、消化理解)而具有使用价值的数据。(信息=数据+数据处理)有的信息由一个数据构成,比如分类号;有的信息由几个数据构成,比如优先权项、CPRS中的一条记录。数据和信息在形式上往往并无区别,尤其是那些由一个数据构成的信息。例如分类号。,.,6,一、数据、信息和数据处理,1.4、数据和信息的关系(信息是数据的内涵、二者是形与质的关系。)(数据是信息的载体,信息的表现形式仍是数据。)(信息是经过加工而具有使用价值的数据,信息=数据+数据处理。)数据只是把客观事物记录下来,并没有特定目的;而信息是有针对性的(某一问题、某一论点、某一特定目的)来收集、处理数据,用来作为决策或参考的依据。所以两者的差别在于是否存在某一特定目的。,.,7,1、数据、信息和数据处理,1.5、数据处理数据处理是指对各种类型的数据进行加工(收集、存储、分类、计算、检索、传输)的过程。数据处理的目的使之成为信息。数据处理通常也称为信息处理。,.,8,2、数据库系统概述,2.1、数据库(Datebase,DB)长期存放在外部存储设备(外存储器、外存介质)上、可以以各种方式进行组织、可以共享的数据(包括这些数据之间的联系)集合。(这些数据与应用程序例如VB相互独立),.,9,2、数据库系统概述,2.2、数据库系统(DatabaseSystem,DBS)数据库不能独立存在,是数据库系统的一部分。在实际应用中,人们所面对的其实是数据库系统。数据库系统具有管理和控制数据库的能力(输入、输出、组织数据)。,.,10,2、数据库系统概述,数据库系统包括:硬件(计算机)数据库(DB)数据库管理系统(DBMS,常用的数据库管理系统有FoxPro、Oracle、SYBASE、INFORMIX等,用来建立、管理、控制数据库)数据库管理员用户和应用程序,.,11,2、数据库系统概述,2.3、信息世界的术语实体(Entity)对应于现实世界中的“客观事物”。实体可以指代具体事物,如一个学生,一本书(一件专利文献);也可以指代抽象事件,如一场足球比赛。,.,12,2、数据库系统概述,属性(attribute)属性用来描述实体的特性。如学生实体可以用若干属性(学号、姓名、年龄、性别、出生日期、班级)来描述。属性的具体值称为属性值,如CN2745142Y(授权公告号)、马林(申请专利权人)、2004年9月16日2004.9.16(申请日)是属性值。,.,13,2、数据库系统概述,2.4、计算机世界的术语记录(record)、元组对应于信息世界的“实体”,二维表中的一行。字段(field)对应于信息世界的“属性”,二维表中的一列。每个字段有字段名(标头),例如“发明人”、“申请号”等等。字段值(value)、数据项对应于信息世界的“属性值”,二维表中的一格。关系(relation)、数据库文件,.,14,2、数据库系统概述,一个关系就是一个二维表,每个关系有一个关系名。一个关系可以存储为一个数据库文件。例如某专利文献数据库可以有专利号的表,发明名称的表,专利权人的表等。下面是一个模拟数据库,该表是由一个以上的表(关系)通过“关联”而成。,.,15,模拟数据库(不是真的),(一列表示一个属性),2、数据库系统概述,.,16,2、数据库系统概述,2.5、关系的三种类型一对一的关系(例如一个学生只有一个学号;再例如一件专利只有一个申请号)一对多的关系(例如某班主任老师可以有多个学生,再例如一个发明人可以有多件专利)多对多的关系(例如一个学生可以选修多门课,一门课可以供多名学生选修;再例如一个分类号之下可以有多件专利文献,一件专利也可以有多个分类号),.,17,2、数据库系统概述,2.6、数据库的三种类型数据模型是数据库结构的组织形式,目前数据库系统中常用的数据模型有三种:层次模型(HierarchicalModel):用树形结构表示数据及其联系的数据模型,树形结构只能表示一对多联系:,.,18,2、数据库系统概述,.,19,2、数据库系统概述,网状模型(NetworkModel):用网络结构表示数据及其联系的数据模型。网状模型可以直接表示多对多联系,但其中的结点间连线或指针更加复杂,因而数据结构更加复杂:,.,20,2、数据库系统概述,.,21,2、数据库系统概述,关系模型(RelationalModel):用关系表示的数据模型。关系是指由行与列构成的二维表,关系不但可以表示实体间一对多的联系,通过关系间的连接,也可以表示多对多的联系(见连接):,.,22,微机871班学生表(A),2、数据库系统概述,.,23,选修表(B),2、数据库系统概述,.,24,课程表(C),2、数据库系统概述,.,25,3、关系型数据库的三种操作,3.1、选择:从关系中找出满足给定条件的记录(元组),即在二维表中选行。(例(例如:对表A中李峰的选择)3.2、投影:从关系中找出若干字段(属性)组成新的关系,即在二维表中选列。(例如:对表B课程编号的投影)3.3、连接:将两个关系按某种条件提取部分(或全部)记录及部分(或全部)字段组合成新的关系。(例如:表B、表C按照课程编号关键字连接),.,26,连接而成的新表(D),3、关系型数据库的三种操作,.,27,4、布尔逻辑运算(集合运算),4.1、并(或、or)(AB)A集合和B集合所有元组合并,再删去重复的元组,这种运算称为“并”(或);所组成新的C集合,称为A、B的并集4.2、差(非、not)(A-B)A集合中删去(A集合中)与B集合相同(重复)的元组,这种运算称为“差”(非);所组成新的C集合称为A、B的差集4.3、交(与、and)(AB)既属于A集合又属于B集合的元组,这种运算称为“交”(与);所组成新的C集合,称为A、B的交集,.,28,交(,与,and),属于集合A且属于集合B的元素组成的集合C,叫做A,B的交集(属于A又属于B的元素组成的集合,AandB=C)例:A-汽车,B-发动机,C-即有汽车也有发动机的记录集caps中两词间空格,“and”,“+”,集合B,集合A,集合C,.,29,并(,或,or),属于集合A或属于集合B的元素组成的集合C,叫做A,B的并集(A,B所有元素合并,删除重复元素组成的集合,AorB=C)。例:A-汽车,B-发动机,C-仅有汽车的记录集,仅有发动机的记录集,即有汽车也有发动机的记录集。caps中用“or”,“,”,集合A,集合B,集合C,.,30,差(-,非,NOT,与非,ANDNOT),属于集合A而不属于集合B的元素组成的集合C,叫做A,B的差集(在A中排除属于B的元素后组成的集合,AnotB=C)例:A-汽车,B-发动机,C-从所有含汽车的记录集中去掉含发动机的记录集caps中用“without”,“not”,“#”,集合A,集合B,集合C,.,31,4、布尔逻辑运算(集合运算),4.4、差并(ornot、或非)从总集合排除B,再与A集合合并。三种情况4.4.1、A集合的所有元素都是B集合的元素时,还要考虑A集合与B集合哪个更大:4.4.1.1、如果A集合更大,或非结果=总集合;4.4.1.2、如果B集合更大,总集合被挖去部分B只填入了局部,有“空区”),.,32,4、布尔逻辑运算(集合运算),4.4.2、A集合的所有元素都不是B集合的元素,或非结果=总集合notB4.4.3、A集合的部分元素是B集合的元素,总集合被挖去部分B只填入局部,有“空区”),.,33,或非(4.1.1.1、A所有元素都是B的元素,且AB),.,34,总,或非(4.1.1.1、A所有元素都是B的元素,且AB),.,35,或非(4.1.1.2、A所有元素都是B的元素,且AYYMMDD),例如:850101020831;可用YYYY和YY;年月日格式;连续输入时可用“+”,.,79,5、三种字段类型,情形3:USPTO的“patentsearch”(ISD授权日PD公开日/APD申请日/PRIR优先权日),输入值间不能用or,“日”可用“$”,时间区间用“-”。授权专利数据库日期型输入值有多种输入格式:20030403、4-30-2003(月
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度财务人员个人转正工作总结(6篇)
- 电脑耗材培训课件
- 电脑知识培训计划表课件
- 高考小说探究的种类课件
- 第1课《消息二则:我三十万大军胜利南渡长江》课件 2025-2026学年统编版语文八年级上册
- sem考试试题及答案
- 电网安全知识培训课件
- 电网业务基础知识培训内容课件
- 电线的种类教学课件
- 2025医院消毒供应中心工作标准流程图表
- 实习实践促进大学生职业道德和职业素养的提升
- (高清版)TDT 1031.6-2011 土地复垦方案编制规程 第6部分:建设项目
- 遥感数字图像处理课件
- 检验科实验室生物安全培训课件
- 《宠物解剖生理》课程标准
- 山西航空公司招聘笔试真题
- 融合系餐厅可行性分析方案
- 电子商务法律风险与合规管理
- 缆索起重机检查评分
- 妊娠期并发产前子痫的处理培训课件
- 中国民族史纲要罗佑贤
评论
0/150
提交评论