江苏自学考试12577智能数据处理_第1页
江苏自学考试12577智能数据处理_第2页
江苏自学考试12577智能数据处理_第3页
江苏自学考试12577智能数据处理_第4页
江苏自学考试12577智能数据处理_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高纲1543江苏省高等教育自学考试大纲12577智能数据处理 南京信息工程大学编江苏省高等教育自学考试委员会办公室 课程性质及课程目标一、课程性质和特点本课程是针对物联网工程专业开设的专业必修课,是为从事科学研究、理论研究、工程实践提供基本知识储备和基本训练的基础理论性课程。本课程以工程化手段为特点介绍设计处理、分析和应用方法及技术,是物联网工程学科的重要内容、核心及趋势。课程以“设计-知识-服务”为主线,以数据的智能处理、分析和服务的代表性方法及技术为重点。围绕着主线,重点讲述了关系数据库的设计及查询优化,信息检索及搜索引擎、数据管理、数据挖掘及数据仓库、服务等。通过本课程内容的学习,能够使

2、学生对数据的处理、分析和服务的工程化方法有较为系统和完整的理解。以这些内容作为对智能数据处理技术的代表和延伸,旨在传递概念、方法和技术内涵及理论,为学生进一步学习和研究面向数据科学的方法和技术提供支撑。 本课程的目的主要是培养学生对数据科学研究的兴趣和数据处理的初步能力。培养学生分析数据及处理数据的基本能力,并提高数据服务实践应用的能力。通过本课程的学习,将使得学生能够从工程的角度理解数据科学:它包括了数据处理技术,以及数据分析技术和数据服务技术;既有数据查询和优化、事务和工作流管理及数据库架构等基层内容,也包括数据挖掘及知识发现、时空数据、元数据和社会数据分析等经典问题,另外还包括概率数据、

3、云计算和大数据管理等前言课题。最后,通过本课程的学习,还将加深物联网工程专业的学生对本专业基本理论的理解及科学解决各专业相关问题的能力。二、课程目标1. 要求学生能够全面、深入理解和熟练掌握数据处理的基本技术,掌握结构化、半结构化和结构化数据的存储、查询和优化方法。了解数据挖掘、知识发现和数据仓库的概念和结构。了解服务的基本概念。2. 要求学生把握数据科学领域的前沿,通过课程的学习能够尝试追踪层出不穷、内涵日益丰富、热点不断演变的数据科学。3. 要求学生能够从工程化的角度去掌握数据科学,对“数据()知识()服务()”这一数据科学及工程领域研究和应用的趋势和主线能够有清晰的认识。了解信息技术的核

4、心和未来发展的方向即为基于数据的网络信息服务。三、及相关课程的联系及区别本课程先修课程应涉及计算机文化基础、计算机程序设计、数据结构、管理信息系统、数据库原理及应用、计算机网络等。后继课程有算法设计、信息系统分析及设计、操作系统、软件工程等。本课程及其他课程的区别为:本课程立足于理论,且及实际环节紧密结合,需要更多关注各种网络应用及新技术。四、课程的重点和难点课程的重点之一是关系数据库查询优化技术,包括数据库设计、面向复杂应用的数据查询、基于索引的查询优化、基于数据库模式反规范化和视图物化的查询优化、基于数据查询语句重写的查询优化;重点之二是信息检索,包括信息检索的基本原理、信息检索模型的形式

5、、布尔模型、向量空间模型、经典概率模型、文本信息检索中的文本洗预处理、文本信息的倒排索引、布尔检索、相关反馈和提问式扩展、信息检索、信息检索评价指标;课程的次重点是数据管理,包括简介、数据模型和解析;次重点之二是数据挖掘,包括数据挖掘概念和数据清理;次重点之三是数据仓库,包括数据仓库概念和体系结构。课程的一般重点是服务,包括服务的基本概念和服务技术架构等。课程的难点是几种信息检索模型、文本信息检索和信息检索。 考核目标本大纲在考核目标中,按照识记、领会、简单应用和综合应用四个层次规定其应达到的能力层次要求。四个能力层次是递升的关系,后者必须建立在前者的基础上。各能力层次的含义是:识记():要求

6、考生能够识别和记忆本课程中有关数据处理(包括数据库、信息检索、数据管理)、数据分析(包括数据挖掘、数据仓库)、数据服务()的概念性内容(如基本概念、定义、定理、背景知识、特性等),并能够根据考核的不同要求,做正确的表述、选择和判断。领会():要求考生能够领会和理解本课程中关于关系数据库查询优化、信息检索、数据挖掘和数据仓库的概念及特性的内涵及外延,理解数据库设计的概念、信息检索的原理,语法基本知识、数据模型和解析,能够鉴别关于概念和特性的似是而非的说法;理解相关知识的区别和联系,并能根据考核的不同要求分析各种不同领域所使用的数据处理和分析技术。简单应用():要求考生能够根据已知的计算机知识和数

7、据库技术对模型进行处理,转化为关系模型;能够对基于索引的查询优化、基于数据库模式反规范化和视图物化的查询优化、基于数据查询语句重写的查询优化进行简单分析,考虑其性能优劣和可靠性。能够利用搜索引擎的基本原理来分析其关键技术,对其中的信息检索的性能进行初步的评估。此外,还可运用本课程中的少量知识点,利用简单的模型分析和解决一般应用问题,如简单的计算和验证检索效率及其他性能指标等。综合应用():要求考生能够处理具体、实际的数据处理技术,能探究解决问题的方法,并进行推导。对数据库查询优化,能够综合三种优化方法,选择合适的优化途径;对信息检索,能够利用文本信息检索中的倒排索引和布尔索引的方法来分析文本信

8、息检索的解决途径。在深入理解和熟练掌握数据库查询优化内容和信息检索内容的基础上,能够在数据处理的基础上提升到数据分析和数据服务的层面,能够对数据处理技术举一反三。 课程内容及考核要求第1章关系数据库查询优化一、学习目的及要求本章主要学习数据处理中的数据库设计方法和优化技术,针对查询进行数据库性能优化。本章以数据查询优化为主线,以数据的具体用途为出发点,讨论几种有代表性的关系数据库查询优化方法:索引的创建和选择、数据库模式的反规范化和视图物化以及查询语句的重写。通过本章的学习,要求学生重点关注和掌握四个问题,首先是对索引的创建和选择问题,要求学生清楚何时、在何属性上创建索引;其次是数据库模式的反

9、规范化问题,要求学生以代价最小化为目标,根据数据的使用模式对良构关系进行合理的合并调整;第三是视图物化问题,要求学生掌握针对频繁查询进行视图反复完全实体化的方法,根据数据操作的类型和频度考虑将视图对应的查询结构存储到磁盘上,提高查询效率;最后是查询语句的重写,要求学生能够针对实际查询中执行比预计的慢得多的情况,能够分析数据库管理系统查询执行计划性能低下的原因,并定位到查询语句编写方面的问题。学生需要理解在结果相同的前提下对查询语句的结构进行调整的方法。本章是课程的重点,要求学生重视本章知识内容的熟悉和掌握2、 课程内容1. 领会数据库设计的基本概念2. 掌握模型和关系模型3. 掌握从模型到关系

10、模型的转换4. 了解关系规范化概念5. 领会连接查询、嵌套查询和集合查询6. 领会视图、存储过程和触发器的作用7. 掌握基于索引的查询优化8. 掌握数据库模式反规范化查询优化方法9. 领会视图物化的查询优化方法10.掌握数据查询语句重写的查询优化三、考核知识点及考核要求1. 数据库设计识记:(1)数据库设计的基本概念和设计步骤、模型、关系模型、关系规范化的概念;(2)关系数据模型中的完整性约束,外键是否为空的判定准则,良构关系的的判断标准;(3)第1范式、第2范式、第3范式的概念。领会: 模型到关系模型的转换、不满足第2范式时存在的问题。2. 面向复杂应用的数据查询识记:(1)连接查询、嵌套查

11、询和集合查询的概念和连接语法;(2)视图、存储过程和触发器的概念、语法、适用场所。领会:(1)连接查询、嵌套查询和集合查询的性能表现及相互关系。重点考核连接查询在查询操作中的代表作用;(2)视图、存储过程和触发器的作用、性能表现及相互关系,触发器的优点,存储过程的优点。3. 查询优化识记:(1)索引的基本概念、索引的类型、索引创建的语法、索引的使用方法;(2)数据库模式反规范化概念、视图物化概念。领会:(1)基于索引的查询优化性能影响、代价、权衡;(2)聚集索引和非聚集索引在创建时间、删除时间、存储空间三个方面的性能比较,覆盖索引有意义所需要满足的条件,索引选择和应用的一般原则,以存储和处理为

12、中心的系统整体开销、索引选择的基本原则和规律、构建新索引时考虑的三个基本要素和步骤;(3)规范化的关系模式对查询操作在性能上的影响、关系模式反规范化的一般步骤、选择反规范化的查询优化方案的基本原则、实施反规范化时确保数据同步、一致性、维护数据库完整性所使用的三种方法;(4)理解视图物化的两个角度;(5)基于数据查询语句重写的查询优化中,几种典型的查询重写方法。四、本章重点、难点本章重点为面向复杂应用的数据查询和查询优化,本章难点为面向复杂应用的数据查询。第2章信息检索一、学习目的及要求本章主要学习数据处理中的信息检索技术。信息检索是一个具有鲜明交叉研究特性、及数据科学相关的学科领域,本章从计算

13、机科学领域的视角,面向信息检索工具的原理及方法,针对信息检索领域中的三个关键问题,讨论信息检索建模、系统设计及实现的支持技术。通过本章学习,要求学生熟悉三个方面的知识:首先掌握如何从信息检索问题的核心和本质出发,忽略实现细节,构建以信息分析为中心的模型,这是信息检索建模问题,也即信息检索的基础;其次学会根据自然语言文本中词汇的频率和分布情况进行文本信息的预处理、构建检索模型、实现高效准确的文本检索,这是文本信息检索问题,这部分内容是信息检索和搜索引擎的主要组成部分;第三是针对当前以用户为中心的2.0时代,资源具有海量数据、分散无序、动态变化、形式多样、非结构化或半结构、质量控制缺乏、使用方式个

14、性化等特点,要求学生学会构建有效的搜索引擎,这是信息检索问题,也是信息检索技术的重要应用领域;最后,要求学生熟悉衡量检索系统效率的性能指标,了解各种检索技术优劣的性能比较法、理解改进现有检索系统和开发新兴应用领域的技术,这是信息检索评价问题,也是信息检索领域一项有前景的研究内容。本章是课程的重点和难点所在,要求学生高度重视本章知识内容的熟悉和掌握。对相关知识从识记概念到领会技术和算法内涵到掌握计算方法进行应用处理都要全面深入学习和掌握。二、课程内容1. 掌握信息检索的基本概念和基本原理2. 领会信息检索的相关性学科和研究内容3. 领会信息检索的发展史4. 掌握信息检索系统的形式表示5. 掌握信

15、息检索中的布尔模型和向量空间模型6. 领会经典概率模型7. 掌握文本信息检索中词汇的频率域数量分布规律8. 掌握文本信息预处理9. 掌握文本信息的倒排索引10.掌握布尔检索11.领会相关反馈和提问式扩展12.掌握信息搜索的概念13.掌握搜索引擎的工作原理14.掌握搜索引擎的关键技术15.掌握信息检索评价指标16.掌握单个查询的评价指标17.掌握多个查询的评价指标18.领会面向用户的评价指标19.领会搜索引擎性能评价指标20.领会评测三、考核知识点及考核要求1. 信息检索概述识记:信息检索的基本概念、信息检索的基本原理、信息检索的基本流程(两个步骤)。领会:信息检索的主要研究内容、信息检索的发展

16、史。2. 信息检索模型识记:信息检索系统的形式表示(四元组和解释)、词频的概念、匹配函数的概念。领会:匹配函数的选择所考虑的原则、布尔模型的思想、布尔模型的优缺点、词的分布、向量空间模型的优点、经典概率模型的基本思想、经典概率模型的基本假设、概率模型的优点。应用:布尔模型中利用析取范式和匹配函数求及提问式相关的文档、求解包含若干个文档的索引词集所对应的向量文档、词的权重、匹配函数的计算及检索结果的确定及排序。3. 文本信息检索识记:词汇频率及齐普夫分布模型,齐普夫定律、词汇数量及分布模型、倒排文件的概念、布尔逻辑运算符、检索提问式等价处理方法。领会:文本信息预处理操作、文本信息的倒排索引、倒排

17、索引的建立、倒排索引的使用、倒排索引的维护、多种布尔运算符下,检索系统进行检索运算的规则、逆波兰式处理的基本思想、相关反馈的步骤。应用:倒排索引的使用(利用倒排索引查找单词)。4. 信息检索识记:信息搜索的概念、的概念。领会:搜索引擎的工作原理、数据收集和预处理的过程、数据检索和信息挖掘的过程、数据预处理中的网页去重(发现重复或近似网页对搜索引擎的好处、网页去重所包含的技术要点、网页去重方法分类)、使用方法判断重复网页的步骤、数据检索中的结果排序、基于网页链接结构分析的相关排序、算法(特点、基本观点、计算公式)、算法(两类网页、基本思想、的不足之处)、算法和算法的比较(相似、差异)。应用:基于

18、计算各个网页的值。5. 信息检索评价指标识记:信息检索评价的基本步骤、单个查询的评价指标及公式(查全率和查准率、查全率查准率曲线、调和平均数、E测度指标)、多个查询的评价指标及公式(平均查准率、平均查准率均值、微平均查准率)、面向用户的评价指标(覆盖率、新颖率、相对查全率、查全努力)。领会:评价和比较检索系统的检索性能时所需要的条件、搜索引擎性能评价指标、评测。应用:单个查询的查全率计算、单个查询的查准率计算、多个查询的平均查准率均值计算、多个查询的微平均查准率计算。四、本章重点、难点本章重点为信息检索模型中的布尔模型、向量空间模型,文本信息检索中的文本信息预处理、文本信息的倒排索引、布尔检索

19、,信息检索中搜索引擎的工作原理和关键技术、信息检索评价指标、单个查询和多个查询的评价指标。本章难点为信息检索模型中的布尔模型、向量空间模型,文本信息检索中的文本信息预处理、文本信息的倒排索引、布尔检索。第3章数据管理一、学习目的及要求本章主要学习数据处理中的数据管理。作为万维网上信息表示、信息传输和交换的基本形式,主要进行半结构化的数据处理,本身是一种标记语言,有特色的数据类型、表达式和函数库等语法。本章针对数据管理的模型和编程基础及具体任务,讨论数据建模、语法和数据处理的代表性支撑技术。通过本章学习,要求学生掌握半结构化数据的结构,熟悉的基本概念,简单了解的语法,掌握数据模型中的半结构化数据

20、以及数据模型,了解数据处理部分的解析内容,熟悉数据库性能评测的性能基准,了解性能评测数据集。领会关于数据管理的两个问题:第一,如何构建一种具有一般性的逻辑模型,以描述半结构化数据的结构、约束和操作,这是数据建模问题,是半结构化数据存储、查询及应用的基础;第二,从数据库的角度,如何有效地进行数据库的存储、索引、查询、及优化,这是数据处理问题,是数据管理的具体任务,也是数据库系统研究的主要内容。本章是数据处理中针对半结构化数据进行处理的技术,考核要求较低。相对其他两类数据处理,即基于结构化数据处理和信息检索,本章以基本概念的识记、基本模型及技术的领会为主。二、课程内容1. 领会数据管理前言概述2.

21、 熟悉语法简介3. 了解文档结构中的基本语法要素4. 了解和查询语言的基本概念5. 领会数据模型,掌握结构化、半结构化和非结构化数据的概念6. 了解数据处理汇总的解析7. 了解数据库性能评测三、考核知识点及考核要求1. 语法识记:基本概念、定义、基本语法要素。领会:文档的基本组成部分,的主要优点,在实际应用中具有的性质和用途、和查询语言。2. 数据模型识记:结构化、半结构化、非结构化的数据。领会:半结构化数据的特点、对象交换模型、半结构化数据和数据、数据模型三要素。3. 数据处理识记:四类解析技术。领会:、。4. 数据库性能评测识记:两类数据库性能基准。四、本章重点、难点本章重点为基本概念、文

22、档结构中的语法要素、半结构化数据、数据模型、解析、数据库性能评测。本章难点为半结构化数据、数据模型、解析。第4章数据挖掘一、学习目的及要求本章主要学习数据分析中的数据挖掘,以数据挖掘过程和算法为主线,介绍数据挖掘的概念、代表性预处理和挖掘方法。数据挖掘建立在多个学科的基础之上,是人工智能和数据库领域的重要内容。传统的数据挖掘主要针对趋势和行为自动预测、关联、聚类、关联规则、特征、变化和偏差分析以及挖掘等方法,而本章迎合当前数据挖掘方法和技术不断向支持大数据分析方向发展、衍生的趋势,针对非结构化数据大量出现的实际情况,数据分析和处理技术上,增加了这部分数据的挖掘方法和技术的内容。预处理、挖掘、评

23、估和应用,是数据挖掘的基本流程。在学习中,要把握住数据挖掘的主线进行研究及掌握。通过本章学习,要求学生数据挖掘的概念,了解数据挖掘的内涵,领会数据挖掘的任务,掌握数据挖掘的过程,领会数据清理的基本思想,掌握数据清理的三个步骤,领会相似重复数据、不完整数据、错误数据的数据清理方法,了解数据分析的两种方法,了解数据分类分析和数据聚类分析的概念和目的。总体来说,要了解以下四个问题:第一,通过填补数据、消除异常数据、平滑噪声数据以及纠正不一致的数据,来保证数据质量,这是数据清理问题,是数据挖掘和数据仓库构建预处理的重要内容;第二,在给定其他变量的条件下对感兴趣的未知变量值做出预测,这是数据的分类问题;

24、第三,将数据对象分解或划分为多个类或簇,使同一个类中的数据对象之间具有较高的相似度、但及其他类中的数据又有较大的差异,这是句聚类问题;第四,通过实验来测试数据挖掘算法的性能,验证算法的有效性和有用性,这是算法评价问题。本章属于数据科学的前沿知识部分,涉及到多个交叉学科和多种基础知识,作为数据处理的延伸性内容,对学生的考核要求不高,以基本概念、基本知识的识记,相关技术的简单领会为主。二、课程内容1. 领会数据挖掘前言2. 领会数据挖掘基本的内涵和任务3. 掌握数据挖掘的过程4. 了解数据质量管理的基本思想5. 领会数据清理流程6. 掌握数据清理的三个步骤7. 领会相似重复数据、不完整数据、错误数

25、据的数据清理方法7. 了解数据分析的两种方法8. 了解数据分类分析的概念和目的9. 了解数据聚类分析的概念和目的三、考核知识点及考核要求1. 数据挖掘概述识记:数据挖掘的过程。领会:数据挖掘的内涵、数据挖掘的几类主要任务、数据挖掘的过程中确定分析对象、数据准备、数据挖掘、结果评价、结果应用、数据预处理的几个步骤。2. 数据清理识记:数据质量、全面数据质量管理及其四个环节的任务。领会:影响数据质量的几个方面因素、数据清理的步骤、 数据清理方法中的相似重复数据清理(问题提出、识别、清理算法)、不完整数据清理(问题、填充方法及举例)、错误数据清理(问题、清理步骤)。3. 数据分析识记:聚类的概念、分

26、类的概念。领会:数据分类的目的、聚类的目的。四、本章重点、难点本章重点为数据挖掘的过程,数据清理流程和数据清理方法。难点为相似重复数据、不完整数据、错误数据的数据清理方法。第5章数据仓库一、学习目的及要求本章主要学习数据分析中的数据仓库,以数据仓库的构建和应用为主线,学习数据仓库的概念、体系结构技术。数据仓库主要为现实应用提供数据支持,并为缩小数据和信息之间的鸿沟提供桥梁,它是企业信息集成和辅助决策应用的关键技术之一。通过数据仓库基础知识的学习,学生要对数据分析的前言知识有一些简单的了解,对云计算、移动通信及海量数据管理技术及电子商务应用之间的发展和相辅相成的关系有一些基本的认识,为解决数据和

27、信息之间的孤岛、数据处理的高级应用和数据科学的理论研究作铺垫。通过本章的学习,要求学生熟悉数据仓库的基本概念、领会操作性系统和信息型系统的概念并掌握两者的差异,领会数据仓库体系结构,对一般的两层结构、独立数据集市的数据仓库体系结构、依赖数据集市和操作型数据存储体系结构的三层结构、逻辑数据集市和实时数据仓库体系结构有较为清晰的认识,了解联机分析处理的基本概念。总体而言,要领会三个方面的问题:第一,熟悉数据库及数据仓库、操作型处理及分析型处理,阐述这些概念的本质、区别及联系,这是数据仓库定义问题;第二,不同数据源中的数据流入数据仓库后进行分析处理,提供多样的数据应用,数据及在数据仓库内的数据转换和

28、流动过程,可以认为是数据仓库的“流水线”,根据实际需求和分析任务设计数据流入流出数据仓库的架构,是数据仓库构建和体系结构问题,也是数据仓库相关应用的基础和关键。第三,数据仓库的真正价值体现在基于数据仓库的数据应用,根据不同的系统架构及存储模式进行数据的检索和处理以完成客户提出的数据分析任务,是联机分析处理问题,也是实现报表展示、即席查询、数据挖掘和数据分析等应用的基础。本章旨在提升学生数据处理的能力。作为数据处理的延伸性内容,对学生的考核要求中等偏低,以基本概念、基本知识的识记,相关技术的了解和领会为主。二、课程内容1. 了解数据仓库的基本概念2. 领会操作型系统和信息型系统3. 领会数据仓库

29、体系结构,对一般的两层结构、独立数据集市的数据仓库体系结构、依赖数据集市和操作型数据存储体系结构的三层结构、逻辑数据集市和实时数据仓库体系结构有较为清晰的认识,重点把握依赖数据集市和操作型数据存储体系结构的三层结构、逻辑数据集市和实时数据仓库体系结构两种结构4. 了解联机分析处理的概念三、考核知识点及考核要求1.数据仓库概述识记:数据仓库的基本概念、数据仓库的四个重要特征。领会:从操作性系统到信息型系统、数据仓库的工具包括的功能部件。2 .数据仓库体系结构识记:数据集市的概念、依赖数据集市的概念、逻辑数据集市的概念、操作型数据存储的概念、逻辑数据集市的概念。领会:一般的两层体系结构的四个基本步

30、骤、基于数据集市的数据仓库体系结构、基于依赖数据集市的操作型数据存储体系结构-三层结构、逻辑数据集市和实时数据仓库体系结构(两个角度出发的特征)、数据仓库和数据集市在不同方面的区别。3.联机分析处理识记:的概念。四、本章重点、难点本章重点为数据仓库的体系结构,包括一般的两层结构、独立数据集市的数据仓库体系结构、依赖数据集市和操作型数据存储体系结构的三层结构、逻辑数据集市和实时数据仓库体系结构。难点为依赖数据集市和操作型数据存储体系结构的三层结构、逻辑数据集市和实时数据仓库体系结构。第6章服务一、学习目的及要求本章主要学习数据服务中的服务。是数据服务的一种典型应用,目前对服务的研究和应用,从底层

31、的分布式计算和互联网协议、到中间层的服务部署及发布、再到上层的服务组合及应用集成,具有丰富的内容。本章以面向应用的服务管理为出发点,围绕自动服务发现及组合的支撑计算,在中间层之上讨论服务的架构及技术。本章的学习目标是通过服务的学习,对数据处理的最终目标数据服务有较为清晰的理解,熟悉服务的特点:面向应用、高综合性和高集成度;了解服务研究及应用中的关键问题是服务质量以及自动服务发现及组合。此外通过服务中计算和技术的融合,体会数据处理和数据服务之间的关系。通过本章的学习,要求学生了解的基本概念,熟悉基于服务的电子商务应用集成模式,领会技术架构,了解的简介,领会服务质量中,几种的度量尺度,了解服务安全

32、问题,了解安全标准模型中安全机制概述内容。总体而言,要领会以下三个问题:第一,在基于服务的模型中,可以清晰地区分服务提供者、服务请求者和服务代理,这些参及者之间通过标准的协议进行通信,服务之间也具有高度的独立性和松散耦合性,各参及者的内部结构、协议及底层信息对用户透明,这是服务的技术架构和标准协议问题,是服务应用的基础;第二,在基于现有的计算资源开发基于服务的应用时,如何衡量服务的好坏,如何选择可用的、合适的服务,这是服务质量问题;第三,在服务的组合和协调中,需要保证服务的安全性,建立安全模型,使安全保证成为服务中一个自动完成的部分,这是服务安全问题。本章内容属于数据服务部分,属于数据处理的应

33、用领域,旨在提升学生数据处理的能力。作为数据处理的延伸性内容,对学生的考核要求中等偏高,在基本概念、基本知识的识记之外,对相关技术的领会也有较多要求。二、课程内容1. 了解企业应用集成及电子商务中的需求及挑战2. 领会基于服务的电子商务应用集成模式3. 了解服务技术架构中面向服务的架构4. 了解服务技术架构中服务体系结构5. 了解服务协议栈6. 了解服务开发的生命周期和开发方案7. “软件即服务”理念8. 了解、和的基本概念9. 了解服务质量中几种的几种度量尺度10. 熟悉服务质量度量方法的基本思想11.了解服务安全问题12. 领会服务安全标准和模型中服务安全机制概述三、考核知识点及考核要求1

34、. 服务识记:面向服务的架构()、服务体系结构的三个参及者及三种基本操作、“软件即服务”定义。领会: 服务的基本概念、基于服务的电子商务应用集成模式(代价、优越性)、服务技术架构(面向服务的架构、服务体系结构、服务协议栈、服务开发的生命周期和开发方案、“软件即服务”理念)、服务及基于的应用程序的差异、服务的主要特点。2. 服务的标准协议识记:简介(基本属性)、定义、简介。领会:的简介、使用的分布式应用。3. 服务质量识记:服务质量概念。领会:的度量尺度、服务质量度量(基本思想等)。4. 服务安全识记:服务安全机制。领会:服务安全问题(问题、安全性威胁)、安全性标准、服务安全性模型和体系结构。四

35、、本章重点、难点本章重点为服务技术架构、服务安全。本章难点为服务技术架构。第7章数据密集型计算(不作考核要求) 有关说明和实施要求一、自学考试大纲的目的和作用课程自学考试大纲是根据专业自学考试计划的要求,结合自学考试的特点而确定。其目的是对个人自学、社会助学和课程考试命题进行指导和规定。课程自学考试大纲明确了课程学习的内容以及深广度,规定了课程自学考试的范围和标准。因此,它是编写自学考试教材和辅导书的依据,是社会助学组织进行自学辅导的依据,是自学者学习教材、掌握课程内容知识范围和程度的依据,也是进行自学考试命题的依据。二、课程自学考试大纲及教材的关系课程自学考试大纲是进行学习和考核的依据,教材

36、是学习掌握课程知识的基本内容及范围,教材的内容是大纲所规定的课程知识和内容的扩展及发挥。课程内容在教材中可以体现一定的深度或难度,但在大纲中对考核的要求一定要适当。大纲及教材所体现的课程内容应基本一致;大纲里面的课程内容和考核知识点,教材里一般也要有。反过来教材里有的内容,大纲里就不一定体现。(注:如果教材是推荐选用的,其中有的内容及大纲要求不一致的地方,应以大纲规定为准。)三、关于自学教材本课程使用教材为:数据工程处理、分析及服务,岳昆编著,清华大学出版社,2013年12月第一版。四、关于自学要求和自学方法的指导本大纲的课程基本要求是依据专业考试计划和专业培养目标而确定的。课程基本要求还明确

37、了课程的基本内容,以及对基本内容掌握的程度。基本要求中的知识点构成了课程内容的主体部分。因此,课程基本内容掌握程度、课程考核知识点是高等教育自学考试考核的主要内容。为有效地指导个人自学和社会助学,本大纲已指明了课程的重点和难点,在章节的基本要求中一般也指明了章节内容的重点和难点。本课程共6学分(包括实验内容学分)根据学习对象成人在职业余自学的情况,并结合本专业的要求、本课程的特点,本大纲提出如下学习方法:1.在全面系统学习的基础上,从工程化的角度把握数据处理、数据分析、数据服务的基本概念、基础知识、基本方法和技能。本课程内容涉及到数据科学三个方面,知识范围比较广泛。自学者应在全面系统学习各章节

38、内容,深刻领会从数据处理到数据分析到数据服务逐步扩充的理论;识记其中的基本概念、基础知识、基本方法和技能,并能够进行初级的应用。2.本教材共7章,其中纳入考核要求的为前六章,各章内容相对独立又有一定的关联,大致分为数据处理篇、数据分析篇和数据服务篇三部分。关系数据库查询优化、信息检索和数据管理这三章属于数据服务篇;数据挖掘和数据仓库属于数据分析篇;服务和数据密集型计算属于数据服务篇。建议学生在自学时一个知识模块所涉及的几个章节时,应该串起来学习,以便加强整体上的把握和理解。此外,数据密集型计算属于高级应用部分,不纳入考核范围之内。3.智能数据处理是一门理论性为基础,实践性为内核的课程。因此,自

39、学时应注重理论及实践的结合,借助基础知识和实践背景知识以增强对本课程的感性认识,切忌死记硬背,在关系数据库查询优化中通过应用实践操作来更深刻地领会教材内容,将知识内容转化为自身的素质,以提高自己数据处理和应用的综合能力。五、应考指导1.如何学习。很好的计划和组织是学习成功的法宝。如果自学者正在接受培训学习,一定要跟紧课程并完成作业。为了在考试中作出满意的回答,必须对所学课程内容有很好的理解。使用“行动计划表”来监控学习进展。阅读课本时可以做读书笔记。如有需要重点注意的内容,可以用彩笔来标注。如:红色代表重点;绿色代表需要深入研究的领域;黄色代表可以运用在工作之中。可以在空白处记录相关资料、文章

40、。另外,本课程有较多新颖的内容,涉及数据科学的方方面面,考生可以适当借助因特网工具或文献工具,查阅及课程相关的背景知识和前沿领域的最新发展。2.如何考试。卷面整洁非常重要。书写工整,段落及间距合理,卷面赏心悦目有助于教师评分,教师只能为他能看懂的内容打分。回答所提出的问题。要回答所问的问题,而不是回答自己乐意回答的问题。避免超过问题的范围3.如何处理紧张情绪。正确处理对失败的惧怕,要正面思考。如果可能,请教已经通过该科目考试的人,问他们一些问题。做深呼吸放松,这有助于使头脑清醒,缓解紧张情绪。考试前合理膳食,保持旺盛精力,保持冷静。4.如何克服心理障碍。这是一个普遍问题。如果在考试中出现这种情

41、况,试试下列方法:使用“线索”纸条。进入考场之前,将记忆“线索”记在纸条上,但不能将纸条带进考场,因此当阅读考卷时,一旦有了思路就快速记下。按自己的步调进行答卷。为每个考题或部分分配合理时间,并按此时间安排进行。六、对社会助学的要求1.社会助学者应根据大纲规定的考试内容和考核目标,认真钻研指定教材,明确本课程及其他课程不同的特点和学习要求,对自学应考者进行切实有效的辅导,引导他们防止自学中的各种偏向,把握社会助学的正确方向。2.要正确处理基本知识的应用能力的关系,努力引导自学应考者将识记、领会同应用联系起来,把基本知识转化为实际工作能力,在辅导的基础上,着重培养和提高自学应考者的素质和思想水平

42、。3.要正确处理重点和一般的关系。课程内容有重点及一般之分,但考试内容是全面的,而且重点及一般是相互影响的,不是截然分开的。社会助学者应指导自学应考者全面系统的学习教材,掌握全部考试内容和考核知识点,在此基础上再突出重点。总之,要把重点学习同兼顾一般结合起来,不要孤立地抓重点,把自学应考者引向猜题押题七、对考核内容的说明1.本课程要求考生学习和掌握的知识点内容都作为考核的内容。课程中各章的内容均由若干知识点组成,在自学考试中成为考核知识点。因此,课程自学考试大纲中所规定的考试内容是以分解为考核知识点的方式给出的。由于各知识点在课程中的地位、作用以及知识自身的特点不同,自学考试将对各知识点分别按四个认知(或叫能力)层次确定其考核要求。2.按照重要性程度不同,考核内容分为重点内容、次重点内容、一般内容,在本课程试卷中对不同考核内容要求的分数比例大致为:重点内容占60%,次重点内容占30%,一般内容占10%。3.课程分为三个主要的部分,分别为数据处理篇(前3章)、数据分析篇(第4和第5章)、数据服务篇(第6章),考试试卷中所占的比例大约分别为:50%、30%和20%,其中数据处理篇分为关系数据库查询优化、信息检索和数据管理,在这部分的比例大约分别为:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论