数据库基本概念在专利检索中的运用陈卫明_第1页
数据库基本概念在专利检索中的运用陈卫明_第2页
数据库基本概念在专利检索中的运用陈卫明_第3页
数据库基本概念在专利检索中的运用陈卫明_第4页
数据库基本概念在专利检索中的运用陈卫明_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库基本概念在专利检索中的运用陈卫明 许瑛 姚文 闫小苏2007.7.23 1目录n 1、数据、信息和数据处理 n 2、数据库系统概述 n 3、关系型数据库的三种操作 n 4、布尔逻辑运算(集合运算)n 5、三种字段类型21、 数据、信息和数据处理n 1.1、三个世界n 按照数据库理论,有现实世界、信息世界、计算机世界等三个世界。n 现实世界的 “ 客观事物 ” (事实、事件) 在信息世界中抽象为 “ 实体 ” ,并定义了各种 “ 属性 ” 来描述 “ 实体 ” 。n “ 实体 ” 在计算机世界被描述成一条 “ 记录 ”。n 客观事物 -实体 -记录31、数据、信息和数据处理n 1.2、数据( data) 是一些符号,用来描述客观事物的特征。n 这些符号可以是数字形式、 文字形式(以及图形、图像和声音等)。n 例如 学生成绩、飞机班次、测量温度、( CPRS中的)发明人姓名、发明名称、文摘、优先权项、文献号、申请号、分类号、申请日、公开日等。41、数据、信息和数据处理n 1.3、信息( information)n 信息是经过加工(记载、分类、组织、关联、解释、提炼、消化理解)而具有使用价值的数据。(信息 =数据 +数据处理)n 有的信息由一个数据构成,比如分类号;有的信息由几个数据构成,比如优先权项、 CPRS中的一条记录。n 数据和信息在形式上往往并无区别,尤其是那些由一个数据构成的信息。例如分类号。5一、数据、信息和数据处理n 1.4、数据和信息的关系n (信息是数据的内涵、二者是形与质的关系。)n (数据是信息的载体,信息的表现形式仍是数据。)n (信息是经过加工而具有使用价值的数据,信息 =数据+数据处理。)n 数据只是把客观事物记录下来,并没有特定目的;而信息是有针对性的(某一问题、某一论点、某一特定目的)来收集、处理数据,用来作为决策或参考的依据。所以两者的差别在于是否存在某一 特定目的 。61、数据、信息和数据处理n 1.5、数据处理n 数据处理是指对各种类型的数据进行加工(收集、存储、分类、计算、检索、传输)的过程。n 数据处理的目的使之成为信息。n 数据处理通常也称为信息处理 。72、数据库系统概述n 2.1、数据库( Datebase, DB)n 长期存放在外部存储设备(外存储器、外存介质)上、可以以各种方式进行组织、可以共享的数据(包括这些数据之间的联系)集合。n (这些数据与应用程序 例如 VB相互独立)82、数据库系统概述n 2.2、数据库系统( Database System, DBS)n 数据库不能独立存在,是数据库系统的一部分。n 在实际应用中,人们所面对的其实是数据库系统。n 数据库系统具有管理和控制数据库的能力(输入、输出、组织数据)。92、数据库系统概述数据库系统包括:n 硬件(计算机)n 数据库( DB)n 数据库管理系统( DBMS, 常用的数据库管理系统有 FoxPro、 Oracle、 SYBASE、 INFORMIX等,用来建立、管理、控制数据库)n 数据库管理员n 用户和应用程序102、数据库系统概述n 2.3、信息世界的术语n 实体( Entity)对应于现实世界中的 “ 客观事物 ” 。实体可以指代具体事物,如一个学生,一本书 (一件专利文献) ;也可以指代抽象事件,如一场足球比赛。112、数据库系统概述n 属性( attribute)n 属性用来描述实体的特性。n 如学生实体可以用若干属性(学号、姓名、年龄、性别、出生日期、班级)来描述。n 属性的具体值称为属性值,如 CN2745142Y( 授权 公告号)、马林(申请 专利权 人)、2004年 9月 16日 2004.9.16(申请日)是属性值。122、数据库系统概述n 2.4、计算机世界的术语n 记录( record)、 元组对应于信息世界的 “ 实体 ” ,二维表中的一行。n 字段( field)对应于信息世界的 “ 属性 ” ,二维表中的一列。每个字段有字段名(标头),例如 “ 发明人 ” 、 “ 申请号 ”等等。n 字段值( value)、 数据项对应于信息世界的 “ 属性值 ” ,二维表中的一格。n 关系( relation)、 数据库文件132、数据库系统概述n 一个关系就是一个二维表,每个关系有一个关系名。一个关系可以存储为一个数据库文件。n 例如某专利文献数据库可以有专利号的表,发明名称的表,专利权人的表等。n 下面是一个模拟数据库,该表是由一个以上的表(关系)通过 “ 关联 ” 而成。14PN(字段名)TI PA IC PD 5000000(5000000)car G&M B60j31/0010/25/1998 (一行表示一条记录)( 5000001)computer IBM G06f3/00 01/02/2000 模拟数据库(不是真的) (一列表示一个属性 )2、数据库系统概述152、数据库系统概述n 2.5、 关系的三种类型n 一对一的关系(例如一个学生只有一个学号;再例如一件专利只有一个申请号)n 一对多的关系(例如某班主任老师可以有多个学生,再例如一个发明人可以有多件专利)n 多对多的关系(例如一个学生可以选修多门课,一门课可以供多名学生选修;再例如一个分类号之下可以有多件专利文献,一件专利也可以有多个分类号)162、数据库系统概述n 2.6、 数据库的三种类型n 数据模型是数据库结构的组织形式,目前数据库系统中常用的数据模型有三种:n 层次模型( Hierarchical Model): 用树形结构表示数据及其联系的数据模型,树形结构只能表示一对多联系 :17班主任(微机 871班)王小艳 李峰 张勇2、数据库系统概述182、数据库系统概述n 网状模型( Network Model): 用网络结构表示数据及其联系的数据模型。n 网状模型可以直接表示多对多联系,但其中的结点间连线或指针更加复杂,因而数据结构更加复杂:19dl001( 刑法)王小艳 李峰 张勇dl002( 声乐) dl003( 绘画)2、数据库系统概述202、数据库系统概述n 关系模型( Relational Model): 用关系表示的数据模型。n 关系是指由行与列构成的二维表,关系不但可以表示实体间一对多的联系,通过关系间的连接,也可以表示多对多的联系(见连接):21学号 姓名 年龄 性别 班级870101 王小艳 18 女 微机 871870102 李峰 18 男 微机 871870103 张勇 19 男 微机 871微机 871班学生表( A) 2、数据库系统概述22学号 课程编号870101(王) dl001( 刑)870101(王) dl002( 声)870102(李) dl001( 刑)870102(李) Dl002( 声)870103(张) Dl002( 声)870103(张) dl003( 画)选修表( B) 2、数据库系统概述23课程编号 课程名 授课教师 授课地点dl001 刑法 周火 主楼 102教室dl002 声乐 刘琴 主楼 102教室dl003 绘画 任安 主楼 504教室课程表( C) 2、数据库系统概述243、关系型数据库的三种操作n 3.1、选择:从关系中找出满足给定条件的记录(元组),即在二维表中选行。(例(例如:对表 A中李峰的选择)n 3.2、投影:从关系中找出若干字段(属性)组成新的关系,即在二维表中选列。(例如:对表 B课程编号的投影)n 3.3、连接:将两个关系按某种条件提取部分(或全部)记录及部分(或全部)字段组合成新的关系。(例如:表 B、 表 C按照课程编号 关键字 连接)25课程编号课程名授课教师 授课地点 学号dl001 刑法 周火 主楼 102教室 870101、870102dl002 声乐 刘琴 主楼 102教室 870101、870102、870103dl003 绘画 任安 主楼 504教室 870103连接而成的新表( D)3、关系型数据库的三种操作264、布尔逻辑运算(集合运算)n 4.1、并(或 、 or)( AB )n A集合和 B集合所有元组合并 , 再删去重复的元组 ,这种运算称为“ 并 ” (或);所组成新的 C集合,称为 A、 B的并集n 4.2、 差(非、 not)( A-B)n A集合中删去( A集合中) 与 B集合相同(重复)的元组 ,这种运算称为 “ 差 ” (非);所组成新的 C集合称为 A、 B的差集n 4.3、 交(与、 and)( AB )n 既属于 A集合又属于 B集合的元组 ,这种运算称为 “ 交 ” (与);所组成新的 C集合,称为 A、 B的交集27交( ,与, and)n 属于集合 A且属于集合 B的元素组成的集合 C, 叫做 A, B的交集 (属于 A又属于 B的元素组成的集合, A and B=C)n 例: A-汽车, B- 发动机, C-即有 汽车 也有 发动机 的记录集n caps中两词间空格,“and”, “+”集合 B集合 A集合 C28并( ,或 , or)n 属于集合 A或属于集合 B的元素组成的集合 C, 叫做 A, B的并集 ( A, B所有元素合并,删除重复元素组成的集合, A or B=C) 。n 例: A-汽车, B-发动机, C-仅有 汽车 的记录集,仅有 发动机 的记录集,即有 汽车 也有 发动机 的记录集 。n caps中用 “or

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论