大学计算机教程-计算与人工智能导论(第4版)课件 第5章 数据库与信息系统_第1页
大学计算机教程-计算与人工智能导论(第4版)课件 第5章 数据库与信息系统_第2页
大学计算机教程-计算与人工智能导论(第4版)课件 第5章 数据库与信息系统_第3页
大学计算机教程-计算与人工智能导论(第4版)课件 第5章 数据库与信息系统_第4页
大学计算机教程-计算与人工智能导论(第4版)课件 第5章 数据库与信息系统_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章数据库与信息系统5.1数据库基础5.2关系型数据库5.3新型数据库5.4计算机信息系统第5章数据库与信息系统5.1数据库基础数据处理是指数据的分类、组织、编码、存储、查询、统计、传输等操作,向人们提供有用的信息,所以,在许多场合不加区分地把数据处理称为信息处理。数据处理中的数据可以是数值型数据,也可以是字符、文字、图表、图形、图像、声音等非数值型数据5.1.1数据管理技术的发展

数据处理三个不同发展阶段人工管理阶段文件管理阶段数据库管理阶段人工管理阶段特点数据依附应用程序数据独立性差数据不能共享程序数据文件管理阶段数据库管理阶段数据库数据独立性强、冗余度小、安全可靠等优点5.1.2数据库系统一般认为数据库系统(DatabaseSystem-DBS)是数据库、数据库管理系统、应用程序、数据库管理系统赖以执行的计算机软硬件环境及数据库维护使用人员的总称。数据库数据库(DataBase-DB)是指按一定的数据结构进行组织的,可共享的,长期保存的相关信息的集合数据库中不仅保存了用户直接使用的数据,还保存了定义这些数据的数据类型、模式结构等数据——“元数据”学生登记表学生选课成绩表课程开设表DBMS数据库查询SQL命令男学生选课表格举姓名系别选课名成绩张雷计算机软件工程84.5张雷计算机数据库82周光明自动控制软件工程92周光明自动控制数学分析92.5周光明自动控制人工智能90钱欣管理工程数据库75钱欣管理工程人工智能70.5数据库管理系统数据库管理系统(DataBaseManagementSystem-DBMS)是对数据进行管理的软件系统,它是数据库系统的核心软件典型数据库管理系统:ORACLE、SQLSERVER、ACCESS、VFP以及自由软件MySQL等DBMS主要组成应用程序一般是指完成用户业务功能的利用高级语言编写的程序。高级语言可以是VB、DELPHI、POWERBUILDER等应用程序通过数据库提供的接口对数据库的数据进行增加、删除、修改、查询、统计等操作信息系统提供相应的图形用户界面.(菜单、按钮、窗口和对话框等,用户按需输入)DBMS

查询命令(SQL)

查询结果查询结果的展示计算机软硬件环境及相关人员

计算机软硬件环境是指数据库管理系统、应用程序赖以执行的环境。包括计算机硬件设备、网络设备、操作系统及应用系统开发工具等相关人员是指在数据库系统的设计、开发、维护、使用过程中,所有参与的人员。数据库管理员(DataBaseAdministrator-DBA)负责对数据库进行有效的管理和控制,解决系统设计和运行中出现的问题5.1.3数据系统特点数据的结构化数据库数据是按照一定的数据结构来组织、描述和存储的数据库数据不仅反映数据本身,而且反映数据之间的联系数据冗余小克服系统中数据的重复存储,实现数据的整合、优化,大大降低数据的冗余度,保证数据的一致性

数据库(DB)数据系统特点—续数据共享面向系统、多个用户共同使用用户根据访问权限控制访问数据库数据的一个子集数据独立性强指数据独立于应用程序:逻辑独立性和物理独立性数据统一管理和控制数据库是由数据库管理系统进行统一管理和控制的,解决多用户数据共享问题数据库管理系统还要提供数据安全性、数据完整性、并发控制及故障恢复等功能5.1.4数据系统体系结构近年来,随着计算机网络技术、多媒体技术、面向对象技术的发展为数据库应用领域开辟了新的空间,数据库体系结构也随着其赖以执行的软硬件环境的变化而不断演变。集中式数据库系统早期的DBMS是以分时操作系统为运行环境,采用的是集中式数据库管理,用户通过终端或远程终端访问数据库系统。在这种系统中,数据是集中存储在本单位的主机上,数据的管理也是集中的。客户/服务器结构(C/S)客户是指用户使用的工作站,它直接面向用户,接收并处理任务服务器响应客户机的请求,完成对数据库的查询、更新操作,并将结果反馈给客户机查询SQL语句查询结果:男学生选课表数据库服务器客户机如:考试系统浏览器/服务器结构(B/S)浏览器/服务器结构有三个层次组成:Web浏览器、Web服务器和数据库服务器客户端只需安装通用的浏览器软件,应用系统只需安装在Web服务器端计算机网络数据库服务器DB客户机客户机客户机计算机网络数据库服务器DB客户机客户机客户机ODBC/JDBCWeb服务器/应用服务器查询结果:男学生选课表数据库服务器网页请求页面响应浏览器Web服务器查询SQL语句如:选课系统分布式数据库分布式数据库中,数据按其来源和用途,合理地分布在系统的多个地理位置不同的计算机结点上,使大部分数据能就近存取。数据在物理上分布,由系统统一管理5.1.5数据仓库与数据挖掘联机事务处理(OnLineTransactionProcessing,OLTP)一般是企业的管理信息系统(ManagementInformationSystem,MIS),完成企业各部门日常工作,反映企业当前的运行状态,如出入库登记、凭证录入、生产管理等联机分析处理(OnLineAnalyticalProcessing,OLAP)用于管理人员的决策分析,如决策支持系统(DecisionSupportSystem,DSS),经常要访问大量的历史数据,其目的是通过对这些历史数据的分析,从中提取管理决策所需要的重要信息数据仓库数据仓库(DataWarehouse,DW)是一种面向决策主题,由多个数据源集成,拥有当前及历史综合数据,随时间变化而变化,以读为主的数据集合。数据挖掘技术数据挖掘,也称知识发现,是指采用有效算法从大量的数据中提取潜在的、有效的、新颖的、具有潜在价值的规则、规律和知识的过程。它包括关联分析、分类分析、聚类分析和异常检测等数据挖掘技术作为一门新兴的研究领域,涉及诸如机器学习、模式识别、统计学、数据库和人工智能等众多学科数据挖掘的应用领域在金融业的应用--可以识别“合法”用户,还可监测到信用卡的恶性透支行为在保险业的应用--对不同行业的人、不同年龄段的人、处于不同社会层次的人,他们的保险金额度应该如何确定在零售业的应用--用于商场的市场定位、商品定价等决策

数据挖掘也应用于高科技研究领域、社会科学研究领域等5.2关系型数据库

5.1.1数据模型数据模型(DataModel)是现实世界数据特征的抽象,是用来描述数据的一组概念和定义层次模型网状模型关系模型其他模型:面向对象,语义模型等数据模型由数据结构、数据操作和数据约束条件三部分组成采用关系模型的数据库—关系型数据库关系数据模型关系型数据模型用二维表表示事物和事物之间的联系每一张二维表称为一个关系(Relation)或者表(Table),用来表示客观世界中的事物。它由表名、行和列组成,每一行称为一个元组,每一列称为一个属性PC机上使用的关系数据库有VisualFoxpro,Access等,大中型数据库有Oracle,Sybase,SQLServer等。关系例子关系模式:学生基本情况(*学号,姓名,性别,出生日期,院系,专业,备注)学生成绩(*学号,姓名,*课程,成绩)主键:学生基本情况关系中,“学号”为主键,学生成绩关系中,(“学号”,“课程”)属性组为主键学号姓名性别出生日期院系专业备注00010101李林男1981-8-4中文院现代汉语

01020102高山男1982-4-20计算机系计算机应用党员01020201林一风女1983-5-2计算机系计算机应用

01010201朱元元女1982-7-15中文院新闻班长学号姓名课程成绩00010101李林大学英语8400010101李林计算机信息技术9200010101李林大学语文8201010201朱元元大学英语7001010201朱元元计算机信息技术8701010201朱元元大学语文55学生基本情况学生成绩联系现实世界中的事物是有联系的,在关系数据模型中,表与表之间的联系有三种:一对一联系一对多联系多对多联系一对一实例:一个学生只有个身份证编号。一对多实例:一个班级有多个学生。多对多实例:多对多就是双向一对多,一个学生可以选择多门课,一门课也有多名学生。5.2.2数据库设计数据库系统的分析与设计阶段;数据库系统的实施、运行与维护阶段数据库设计的基本任务一是根据一个单位的信息需求、处理需求和具体数据库管理系统及软硬件环境,设计出数据模式以及应用程序信息需求是指一个单位所需要的数据及其结构。处理需求是指一个单位经常进行的数据处理数据库设计数据库设计是对客观世界数据的抽象过程现实世界到概念系统的抽象概念系统到计算机系统的抽象数据库设计一般分为四步需求分析概念设计逻辑设计和物理设计需求分析需求分析是对用户提出的各种要求加以分析,对各种原始数据加以综合、整理,以确定应用系统的信息需求、处理需求、安全及完整性要求等,是对系统设计目标的界定。概念设计概念结构设计是对用户需求进行进一步抽象、归纳,并形成独立于具体DBMS和软硬件环境的概念设计模型,数据库的概念结构通常用E-R模型等来刻划学生成绩管理E-R模型逻辑设计逻辑设计是将概念结构进一步转化为某个具体的DBMS所支持的数据模型,然后再对数据模型的结构进行适当调整和优化,形成合理的全局逻辑结构即基本表,并设计出用户视图学生成绩关系模式专业(专业代号,专业名称)院系(院系代码,院系名称)课程(课程代码,课程名称)学生(学号,姓名,性别,出生日期,院系代码,专业代码,备注)选课(学号,课程代码,成绩)物理设计数据库物理设计就是为给定的逻辑结构模型选取一个最合适的应用环境的物理结构,以便在时间和空间效率等方面达到设计要求如数据存放位置的规划、数据库分区的设计、索引存取方式的选择等都是数据库物理设计的内容总之,数据库设计过程具有一定的规律和标准,通常采用“自顶向下、逐步求精”的设计原则5.2.3关系型数据库的基本操作在关系数据库系统中,常用的关系操作有并、交、差、插入、删除、更新、选择、投影和连接SQL即结构化查询语言,是用来定义、操作、查询和控制数据库的语言,实现关系操作。选择选择操作是一元操作。它应用于一个关系并产生另一个新关系。新关系中的元组(行)是原关系中元组的子集SNO

SNAME

DEPART

SEX

BDATE

HEIGHT

A041

周光明

自动控制

1990-8-10

1.7

C005

张雷

计算机

1991-6-30

1.75

C008

王宁

计算机

1990-8-20

1.62

M038

李霞霞

应用数学

1992-10-20

1.65

R098

钱欣

管理工程

1990-5-16

1.8

选择选择SNO

SNAME

DEPART

SEX

BDATE

HEIGHT

A041

周光明

自动控制

1990-8-10

1.7

C005

张雷

计算机

1991-6-30

1.75

R098

钱欣

管理工程

1990-5-16

1.8

投影投影操作是一元操作,它作用于一个关系并产生另一个新关系。新关系中的属性(列)是原关系中属性的子集投影投影SNO

CNO

GRADE

A041

CC112

92

A041

ME234

92.5

A041

MS211

90

C005

CC112

84.5

C005

CS202

82

M038

ME234

85

R098

CS202

75

R098

MS211

70.5

SNO

CNO

A041

CC112

A041

ME234

A041

MS211

C005

CC112

C005

CS202

M038

ME234

R098

CS202

R098

MS211

SC连接连接操作是一个二元操作。它基于共有属性把两个关系组合起来。连接操作比较复杂并有较多的变化连接连接SNO

CNO

GRADE

A041

CC112

92

A041

ME234

92.5

A041

MS211

90

C005

CC112

84.5

C005

CS202

82

M038

ME234

85

R098

CS202

75

R098

MS211

70.5

SNO

SNAME

DEPART

SEX

BDATE

HEIGHT

A041

周光明

自动控制

1990-8-10

1.7

C005

张雷

计算机

1991-6-30

1.75

C008

王宁

计算机

1990-8-20

1.62

M038

李霞霞

应用数学

1992-10-20

1.65

R098

钱欣

管理工程

1990-5-16

1.8

SNO

SNAME

DEPART

SEX

DDATE

HEIGHT

CNO

GRADE

A041

周光明

自动控制

1990-8-10

1.7

CC112

92

A041

周光明

自动控制

1990-8-10

1.7

ME234

92.5

A041

周光明

自动控制

1990-8-10

1.7

MS211

90

C005

张雷

计算机

1991-6-30

1.75

CC112

84.5

C005

张雷

计算机

1991-6-30

1.75

CS202

82

M038

李霞霞

应用数学

1992-10-20

1.65

ME234

85

R098

钱欣

管理工程

1990-5-16

1.8

CS202

75

R098

钱欣

管理工程

1990-5-16

1.8

MS211

70.5

SSC5.2.4SQL语言SQL即结构化查询语言,是用来定义、操作、查询和控制数据库的语言,它是关系型数据库标准语言,具有功能丰富、使用方便灵活、语言简单易学等特点SQL查询语句SELECT[ALL|DISTINCT][TOP(表达式)]……

说明要查询的数据FROM[数据库名!]<表名>

说明数据来源 [[INNER|LEFT[OUTER]|RIGHT[OUTER]]说明与其他表联接方式JOIN数据库名!表名ON<联接条件>]WHERE……

说明查询的条件[GROUPBY……] 对查询结果进行分组[HAVING……] 限定分组满足的条件[ORDERBY……] 对查询结果进行排序[UNION[ALL]……] 对多个查询结果进行合并SQL语句例子例1.查询学生表中所有字段。SELECT*FROM学生注意:*是通配符,代表全部字段列表。例2.查询学生表中所有学号和姓名。SELECT学号,姓名FROM学生注意:字段名之间要用英文逗号分隔。SQL语句例子例3.从成绩表中查询所有成绩>85分的学号

SELECTDISTINCT学号FROM选课WHERE成绩>85

注意:DISTINCT用于去掉重复值。例4.查询至少有一门课程成绩大于85的学生姓名SELECT姓名FROM学生,选课WHERE选课.成绩>85and学生.学号=选课.学号SQL语句例子例5.在学生表中查询所有姓李的学生。SELECT*FROM学生WHERE姓名LIKE“李*”注意:“李*”中的“*”匹配多个任意符号,“?”匹配一个任意符号例6.统计每门课程的名称、平均成绩。SELECT课程.课程名称,AVG(选课.成绩)as“平均成绩”FROM课程,选课WHERE选课.课程代码=课程.课程代码GROUPBY课程.课程名称SQL语句例子例7.删除学生表中所有“男”同学记录。DELETEFROM学生WHERE学生.性别="男"

注意:若省略WHERE子句,将对表中全部记录进行删除

例8.将成绩表中所有课程代号为“0001”的成绩增加5分。UPDATE选课SET成绩=成绩+5WHERE课程代号="0001"

5.3新型数据库

随着云计算和大数据时代的到来,行业数据和移动互联网应用对数据处理的实时性和规模提出了更高的要求。例如:淘宝每天处理千万量级交易笔数,50GB汇总结果,7亿条日志记录,1.5PB原始数据记录FaceBook每天处理27亿次Like按钮点击,上传3亿张图片,由人工或系统自动执行的请求达到7万次,吸收超过500TB新数据

数据处理需求与传统数据库平合硬件扩展的差距不断扩大,传统的数据库性能和TB级数据处理规模已不能满足海量数据的实时处理需求5.3.1结构化数据与非结构化数据结构化数据明确定义数据模型,如:如金融、电子商务、医疗等数据库管理系统非结构化数据是指没有明确格式和组织的数据如:社交媒体数据、日志文件、摄像头采集的视频数据等值得说明的是,也将办公文档、Web网页的数据称为半结构化数据。这类数据采用XML格式或HTML格式存储数据,具有一定的结构性5.3.2NoSQL数据库技术对于论坛、博客、微信、微博等互联网类应用场景一般较多采用非关系型数据库技术NoSQLNoSQL抛弃了关系型数据库复杂的关系操作、事务处理等功能,仅提供简单的键值对(Key,Value)数据的存储与查询,换取高扩展性和高性能技术创新有以下两点简单的数据操作换取高效响应,NoSQL仅支持按照Key(关键字)来存储和查询Value(数据)多种一致性策略满足业务需求,NoSQL支持弱一致性和最终一致性等多种策略5.4计算机信息系统5.4.1计算机系统概述一般来说,计算机信息系统是指一类以提供信息服务为主要目的的数据密集型、人机交互的计算机应用系统主要特点数据密集数据持久数据共享服务多样信息管理系统如:教务系统、图书馆管理系统办公自动化系统如:政务系统企业生产制造系统如:ERP电子商务如:淘宝、拼多多激光照排技术49信息系统的结构

实现业务功能的流程、规则、策略和程序.向用户显示信息处理结果.如:Web浏览器界面.支持系统运行的硬件,系统软件和网络.各类数据信息,资源管理系统.主要有数据库管理系统,数据库等.基于数据库的信息系统组成(应用表现层业务逻辑层资源管理层)

基于数据库的信息系统(DBS)5.4.2信息系统开发

计算机信息系统的开发是一项系统工程,涉及多学科综合技术。其开发周期长、投资大、风险大,比一般的技术工程有更大的难度和复杂性大型软件系统开发成本高,可靠性差,开发周期长,往往产品还不能如期发布,产品发布后,还存在着这样那样的问题,这就是所谓的“软件危机”常用的信息系统开发方法结构化生命周期方法原型法面向对象方法CASE方法等结构化生命周期方法(瀑布模型)从管理、技术、经济和社会等方面进行可行性分析,编写可行性报告系统要做什么?系统要如何做?一是创建数据库模式和存储结构,并载入初始数据;二是程序设计即程序编码,实现软件设计中提出的各模块功能测试包括模块测试、系统测试和验收测试,软件测试方法有黑盒法测试和白盒法测试纠错性维护、适应性维护、完善性维护5.4.3典型信息系统

计算机信息系统种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论