第3章 安全信息分析技术(安全信息工程)_第1页
第3章 安全信息分析技术(安全信息工程)_第2页
第3章 安全信息分析技术(安全信息工程)_第3页
第3章 安全信息分析技术(安全信息工程)_第4页
第3章 安全信息分析技术(安全信息工程)_第5页
已阅读5页,还剩142页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主讲:杨应迪安全信息工程E-mail:39330480学时:44Del:1395546042013 安全信息分析技术获取加工展示信 息23 安全信息分析技术加工怎么加工合理加工信 息无序问题有序化定性问题定量化 定量问题程序化 33 安全信息分析技术定量分析定性分析半定量分析信 息非结构化半结构化结构化43 安全信息分析技术文字分析图表分析可视化分析信 息虚拟现实53 安全信息分析技术时间分析空间分析时空分析信 息多维分析二维分析三维分析63 安全信息分析技术人工分析计算机辅助分析计算机分析智能化信 息7第3章 安全信息分析技术3.1 统计分析技术3.2 机器学习方法3.3 不确定性理论3.4

2、 数据库技术3.5 可视化技术课时:683 安全信息分析技术 从现代安全生产管理的实际需要和总的发展趋势分析,把现代的计算机技术与安全科学管理技术有机地结合,综合运用安全系统管理理论及事故分析预测决策技术,将会大大促进安全预测理论及方法技术的进一步提高。 “安全第一,预防为主”,预测是预防的前提,预测是决策的基础,工业事故的预测预防及其辅助决策分析评价已成为现代安全管理的核心。93 安全信息分析技术 趋势是由客观事物内在因素所决定的,内在的必然因素对客观事物的各个时期都起着普遍的、长期的、决定性的作用,并且使各个时期的发展水平沿着一个方向,即上升或下降持续发展,由此形成客观事物在较长时期比较稳

3、定发展变化线索和基本规律。 长期趋势一方面由内在因素所决定,呈现稳定的发展变化;另一方面在具体的时间条件下,它又受外在的偶然因素的影响,表现为上下起伏波动,变化规律不明显。正是由于这种暂时的外在偶然因素的影响,在短时间内难以认识与掌握客观事物发展的基本规律,需要从相当长的时期内进行观察和分析。因为在较长时期内外在的偶然因素影响会相互抵消。103 安全信息分析技术水平型趋势型113 安全信息分析技术周期变动型随机型 随机型时间序列模式是指时间序列所呈现的变化趋势走向升降不定、没有一定的规律可循的变动势态。这种现象往往是由于某些偶然因素引起的,如经济现象中的不规则变动、政治变动以及自然气候的突变等

4、因素所致。对于这类时间序列模式,很难运用时间序列预测方法做出预测,但有时也可通过某种统计处理,消除不规则因素影响,找出事物的固有变化规律,从而进行分析预测。 12 信息统计是指以某一特定单位对信息或其相关媒介进行统一的计量。信息统计分析技术是利用统计学方法对信息进行统计分析,以数据来描述和揭示信息的数量特征和变化规律,从而达到一定研究目的的一种分析研究方法。 信息统计是安全信息研究的基础工作,信息统计数据是开展信息定量研究的必要条件,运用信息统计分析方法可以反映信息的增长变化、分布特征、流通状况、利用程度,揭示信息的数量变化规律,为信息单位的信息管理提供依据。3.1统计分析技术定义定时信息统计

5、定量信息统计定性信息统计 133.1统计分析技术电力143.1统计分析技术建筑153.1统计分析技术交通163.1统计分析技术煤矿173.1统计分析技术户外183.1统计分析技术全省19 我国煤炭在能源格局中占主导地位, 大概占94%, 若保持每年8. 9% 的增速, 2020年将占世界消耗的1/2, 因此, 煤炭对我国有着很大的战略意义, 给国家和人民带来了巨大利益, 然而我国的煤矿事故却是世界上主要采煤国家煤矿死亡总人数的4倍以上, 是世界上煤矿事故最严重的国家之一, 这些事故给人们带来了巨大身心伤害和心理伤害。在煤矿事故中, 尤以瓦斯事故最为严重, 占煤矿总事故的30%以上。就2007

6、- 2010 年间的煤矿瓦斯事故为依据, 从瓦斯事故类型, 发生时间、发生地域等不同方面对瓦斯事故进行分析。 3.1统计分析技术煤矿重大瓦斯爆炸事故致因的概率分析及启示201)时间序列分析2)回归分析3)相关分析4)主成分分析5)聚类分析6)判别分析3.1统计分析技术方法21 时间序列分析 (Time series analysis) 是指历史时间序列所反映的某种可以识别的事物变动趋势形态。 3.1统计分析技术时间序列分析定义一是承认事物发展的延续性。二是考虑到事物发展的随机性。 223.1统计分析技术时间序列分析时间序列组成因素长期趋势(T) 季节变动(S) 循环波动(C) 不规则变动(I)

7、 组成要素 这4种因素的综合模式有加法模式、乘法模式和混合模式。若以表示时间序列(=1,2,3,表示采样时刻),则加法模式的时间序列是上述4种变动因素的相加,=(T)+(C)+(S)+(I);而乘法模式的则是上述4种变动因素的相乘,=(T)(C)(S)(I)。 时间序列法分为两类:不细分4种变动因素而直接利用时间序列数据建立数学模型,进行预测。对4种变动因素有侧重地进行预处理,从而派生出剔除季节变动法、移动平均法、指数平滑法、自回归法、时间函数拟合法等具体预测方法。233.1统计分析技术时间序列分析组成要素大气压变化243.1统计分析技术时间序列分析第一步:用观测、调查、统计、抽样等方法取得被

8、观测系统时间序列动态数据; 第二步:根据动态数据作相关图,进行相关分析,求自相关函数;第三步:辨识合适的随机模型,进行曲线拟合,即用通用随机模型去拟合时间序列的观测数据。步骤25系统描述 系统分析 预测未来 决策和控制 3.1统计分析技术时间序列分析主要用途263.1统计分析技术时间序列分析常用算法算术平均法移动平均法滑动平均法指数滑动平均法27运用算术平均法求平均数,进行预测有两种形式:以最后一年的每月平均值或数年的每月平均值,作为次年的每月预测值;以观察期的每月平均值作为预测期对应月份的预测值。 算术平均法简易法3.1统计分析技术时间序列分析常用算法283.1统计分析技术时间序列分析常用算

9、法 加权算术平均法是根据观察期各数据重要性(时间顺序数)的不同,分别给以不同的权数加以平均,计算出观测值的加权算术平均数,以这一数字作为预测未来期间该变量预测值的一种趋势预测方法。 采用这种方法来确定预测值,目的是为了适当扩大重要数据对预测值的影响作用。 归一化处理 算术平均法加权法29移动平均法3.1统计分析技术时间序列分析常用算法移动平均法(Moving Average Method)是根据时间序列,逐项推移,依次计算包含一定项数的序时平均数,以此进行预测的方法。模式是: 可以看出,所谓“移动”,是因为总是对近期的历史资料数据取平均,随着时间推移,不断引进新的数据,而“平均”则起到了“滤波

10、”作用,滤掉了随机波动。30移动平均法3.1统计分析技术时间序列分析常用算法移动平均法包括一次移动平均法、加权移动平均法和二次移动平均法 。一次移动平均法加权移动平均法二次移动平均法31移动平均法3.1统计分析技术时间序列分析常用算法直接式 计算公式有三个变形:直接式、循环式及误差改正式。 32移动平均法3.1统计分析技术时间序列分析常用算法循环式 循环式是递推的方法,预测值用新的观测值和旧预测值计算。加进新观测值Xt之后,变成:33移动平均法3.1统计分析技术时间序列分析常用算法误差改正式 计算误差的符号是e,算式是:343.1统计分析技术时间序列分析常用算法滑动平均法(移动) 监控系统观测

11、的参数值时间序列是由长期趋势、周期变动和不规则变动交织运动的综合结果,如果要测定出长期趋势,就要将时间序列中的其他影响因素消除掉,以便使长期趋势分离出来。 滑动平均数预测是一种局部固定平均数模型, 它是对N项原始序列,取K 项滑动平均来反映序列的变动轨迹,模式是:353.1统计分析技术时间序列分析常用算法滑动平均法滑动平均法的优点是对资料中的随机波动进行了有效的平滑,但是确定滑动平均的项数是一个非常重要的问题。因为项数的多少直接影响到数列的修匀程度。一般项数越多,修匀的作用越大,反之越小。然而,如果序列的基本轨迹正在发生变化,则k宜小不宜大,否则会平滑掉数列的基本轨迹。363.1统计分析技术时

12、间序列分析常用算法指数滑动平均法 滑动平均线其实是对各平均项等权值进行平均,但实际上各项的影响作用并不相等,从理论上讲越接近预测期的数据对准确预测的贡献越大。指数平滑弥补了滑动平均的这一不足,它采用折扣因子对序列观察值进行指数加权,权数分配的原则是由近及远递减分配。 指数平滑是利用现有数据的加权平均数来构造趋势方程的统计方法。指数平滑值和平滑系数是该法的两个主要参数。指数平滑值是指如下公式推导的数值: 373.1统计分析技术时间序列分析常用算法383.1统计分析技术时间序列分析案例基于监测系统的瓦斯与煤突出实时预报研究 393.1统计分析技术回归分析预测法定义非典模型40 回归分析预测法,是在

13、分析某种现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量关系大多表现为相关关系。因此,回归分析预测法是一种重要的预测方法,当我们在对某种现象未来发展状况和水平进行预测时,如果能将影响预测对象的主要因素找到,并且能够取得其数量资料,就可以采用回归分析预测法进行预测。它是一种具体的、行之有效的、实用价值很高的常用预测方法。3.1统计分析技术回归分析预测法定义413.1统计分析技术回归预测法1)根据预测目标,确定自变量和因变量2)收集历史数据3)分析变量间的关系,建立回归预测模型4)进行相关分析,用最小二乘法进行回归5

14、)检验回归预测模型,计算预测误差 6)计算并确定预测值 步骤海因里希法则423.1统计分析技术回归预测法433.1统计分析技术回归预测法44 依据相关关系中自变量的个数不同分类,可分为一元回归分析预测法和多元回归分析预测法。在一元回归分析预测法中,自变量只有一个,而在多元回归分析预测法中,自变量有两个以上。3.1统计分析技术回归分析预测法分类453.1统计分析技术回归预测法依据自变量和因变量之间的相关关系不同,可分为线性回归预测和非线性回归预测。分类463.1统计分析技术回归预测法473.1统计分析技术回归预测法483.1统计分析技术相关分析法相关分析法是测定安全事故因素之间相关关系的规律性,

15、并据以进行预测和控制事故的分析方法。493.1统计分析技术相关分析法两个变量都必须是随机的;而回归分析则要求因变量必须是随机的,自变量则不能是随机的,而是规定的值,这与在回归方程中用给定的自变量值来估计平均的因变量值是一致的。防止虚假相关和虚假回归。在对两个时间数列进行相关分析和回归分析时,常因各期指标值受时间因素的强烈影响而损伤了所需要的随机性;也有时两个时间数列表面上似有同升同降的变动,实际上并无本质联系。对这类资料求出的高度相关系数或回归联系,往往是一种假象。503.1统计分析技术主成分分析法主成分分析(Principal Component Analysis,PCA), 将多个变量通过

16、线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析513.1统计分析技术主成分分析法聚类分析判别分析是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。523.2机器学习方法53 机器学习则是计算机获取知识的重要途径和人工智能的重要标志,是一门研究怎样用计算机来模拟或实现人类学习活动的学科,是研究如何使机器通过识别和利用现有知识来获取新知识和新技能。 一般认为,机器学习是一个有特定目的的知识获取过程,其内部表现为从未知到已知这样一个知识增长过程,其外部表现为系统的某些性

17、能和适应性的改善,使得系统能完成原来不能完成或更好地完成原来可以完成的任务。它既注重知识本身的增加,也注重获取知识技能的提高。3.2机器学习方法543.2机器学习方法基本结构环境、学习、知识库、执行 553.2机器学习方法研究方向 机器学习的研究目标大致有三个方向: 第一个方向是基础性训究,发展各种适合机器特点的学习理沦,探讨所有可能的学习方法,比较人类学习与机器学习的异同与联系; 第二个方向是以模拟人类的学习过程出发,试图建立学习的认识生理学模型,这个方向与认知科学的发展密切相关; 第三个方向是应用研究,建立各种实用的学习系统或知识获取辅助工具,在人工智能科学的应用领域建立自动获取知识系统,

18、积累经验,完善知识库与控制知识,进而能使机器的智能水平像人类一样。563.2机器学习方法学习方法(1)规则归纳(2)案例学习方法(3)遗传算法(4)免疫算法(5)蚁群算法(6)决策树方法机械学习 归纳学习 类比学习 解释学习知识发现 决策树学习神经网络学习57机械式学习是基于记忆和检索的方法,学习方法很简单,但学习系统需要几种能力: 能实现有组织的存储信息; 能进行信息结合; 能控制检索方向。 对于机械式学习,需要注意三个重要的问题:存储组织信息、环境的稳定性与存储信息的适用性以及存储与计算之间的权衡。机械式学习的学习程序不具有推理能力,只是将所有的信息存入计算机来增加新知识,其实质上是用存储

19、空间换取处理时间,虽然节省了计算时间,但却多占用存储空间。当因学习而积累的知识逐渐增多时,占用的空间就会越来越大,检索的效率也将随之下降。所以,在机械式学习中要全面权衡时间与空间的关系。3.2机器学习方法机械学习58 决策树是决策过程的一种有序的概率图解表示,因此,决策树分析决策方法又称概率分析决策方法,是风险型决策中的基本方法之一。 决策树法是一种演绎性方法,它将决策对象按其因果关系分解成连续的层次与单元,以图的形式进行决策分析,由于这种决策图形似树枝,故俗称“决策树”。3.2机器学习方法决策树法学习决策树59 方块表示决策点,从它引出的分支叫方案分支,分支数即为可能的行动方案数。 圆圈表示

20、方案节点(也称自然状态点),从它引出的分支叫概率分支,每条分支的上面注明了自然状态(客观条件)及其概率值,分支数即为可能出现的自然状态数。 三角表示结果节点(也称“末梢”),它旁边的数值是每一方案在相应状态下的收益值。3.2机器学习方法决策树法学习决策树60 某厂因生产上的需要,考虑自行研制一个新的安全装置。首先,这个研制项目是否要向上级公司申报,如果准备申报,则需要申报的费用5000元,不准备申报,则可省去这笔费用,这一事件决策者完全可以决定,这是一个主观抉择环节。如果决定向上申报,上级公司批准的概率为0.8,而不批准的概率为0.2,这种不能由决策者自身抉择的环节称为客观随机抉择环节。接下来

21、是采取“本厂独立完成”形式还是由“外单位协作完成”形式来研制这一安全装置、这也是主观抉择环节。每种形式都有失败可能,如果研制成功(无论哪一种形式),能有6万元的效益;若采用“独立完成”形式,则研制费用为2.5万元。成功概率为0.7,失败概率为0.3;若采用“外厂协作”形式,则支付研制费用为4万元,成功概率为0.9、失败概率为0.1。3.2机器学习方法决策树法学习决策树示例61 首先画出决策树,见下图所示。 然后根据上述数据计算各结果点的收益值(收益效益费用),并填在“”符号旁。 3.2机器学习方法决策树法学习决策树示例62独立研制成功的收益: 6052530(千元)独立研制失败的收益: 052

22、530(千元)协作研制成功的收益; 6054015(干元)协作研制失败的收益: 054045(干元)3.2机器学习方法决策树法学习决策树示例63按照期望值公式计算期望价值: 式中,Vi事件i的条件价值; Pi特定事件i的发生概率; n事件总数。独力研制成功的期望值: E(V6)0.7*30+0.3*(-30)=12协作研制成功的期望值: E(V7)0.9*15+0.1*(-45)=93.2机器学习方法决策树法学习决策树示例64 根据期望值决策准则,决策目标,如果决策目标是收益最大,则采用期望值最大的行动方案,如果决策目标是使损失最小,则选定期望值最小的行动方案。本例选用期望值大者。即选用独立研

23、制形式。接下去在节点4处填入12数值,在下方结果结点5旁填入5(申报费),计算申报环节的期望值: E(V2)0.8*12+0.2*(-5)=8.53.2机器学习方法决策树法学习决策树示例65适用问题的特征实例由“属性-值”对表示目标函数具有离散的输出值可能需要析取的描述训练数据可以包含错误训练数据可以包含缺少属性值的实例分类问题核心任务是把样例分类到各可能的离散值对应的类别3.2机器学习方法决策树法学习适用的问题66大多数决策树学习算法是一种核心算法的变体采用自顶向下的贪婪搜索遍历可能的决策树空间贪心算法算法代表: ID33.2机器学习方法决策树法学习学习算法ID3的思想自顶向下构造决策树从“

24、哪一个属性将在树的根节点被测试”开始使用统计测试来确定每一个实例属性单独分类训练样例的能力ID3的过程分类能力最好的属性被选作树的根节点根节点的每个可能值产生一个分支训练样例排列到适当的分支重复上面的过程67ID3(Examples, Target_attribute, Attributes)创建树的root节点如果Examples都为正,返回label=+的单节点树root如果Examples都为反,返回label=-的单节点树root如果Attributes为空,那么返回单节点root,label=Examples中最普遍的Target_attribute值否则开始AAttributes中

25、分类examples能力最好的属性root的决策属性A对于A的每个可能值vi在root下加一个新的分支对应测试A=vi令Examplesvi为Examples中满足A属性值为vi的子集如果Examplesvi为空在这个新分支下加一个叶子节点,节点的label=Examples中最普遍的Target_attribute值否则在新分支下加一个子树ID3( Examplesvi,Target_attribute,Attributes-A)结束返回root3.2机器学习方法决策树法学习学习算法概要683.2机器学习方法决策树法学习学习算法示例693.2机器学习方法决策树法学习学习算法示例70过度拟合对

26、于一个假设,当存在其他的假设对训练样例的拟合比它差,但事实上在实例的整个分布上表现得却更好时,我们说这个假设过度拟合训练样例定义:给定一个假设空间H,一个假设hH,如果存在其他的假设hH,使得在训练样例上h的错误率比h小,但在整个实例分布上h的错误率比h小,那么就说假设h过度拟合训练数据。3.2机器学习方法决策树法学习学习算法过度拟合数据713.2机器学习方法决策树法学习学习算法过度拟合数据72导致过度拟合的原因训练样例含有随机错误或噪声当训练数据没有噪声时,过度拟合也有可能发生特别是当少量的样例被关联到叶子节点时,很可能出现巧合的规律性,使得一些属性恰巧可以很好地分割样例,但却与实际的目标函

27、数并无关系。3.2机器学习方法决策树法学习学习算法避免过度拟合数据73避免过度拟合的方法及早停止树增长后修剪法两种方法的特点第一种方法更直观第一种方法中,精确地估计何时停止树增长很困难第二种方法被证明在实践中更成功3.2机器学习方法决策树法学习学习算法避免过度拟合数据74避免过度拟合的关键使用什么样的准则来确定最终正确树的规模解决方法使用与训练样例截然不同的一套分离的样例,来评估通过后修剪方法从树上修建节点的效用。使用所有可用数据进行训练,但进行统计测试来估计扩展(或修剪)一个特定的节点是否有可能改善在训练集合外的实例上的性能。使用一个明确的标准来衡量训练样例和决策树的复杂度,当这个编码的长度

28、最小时停止树增长。3.2机器学习方法决策树法学习学习算法避免过度拟合数据75方法评述第一种方法是最普通的,常被称为训练和验证集法。可用数据分成两个样例集合:训练集合,形成学习到的假设验证集合,评估这个假设在后续数据上的精度方法的动机:即使学习器可能会被训练集合误导,但验证集合不大可能表现出同样的随机波动验证集合应该足够大,以便它本身可提供具有统计意义的实例样本。常见的做法是,样例的三分之二作训练集合,三分之一作验证集合。3.2机器学习方法决策树法学习学习算法避免过度拟合数据76 人工神经网络(Artificial Neural Networks,简写为ANN)也简称为神经网络(NN),它是一种

29、模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。 3.2机器学习方法神经网络学习77 神经网络的学习,也就是训练过程,指的是输入层神经元接收输入信息,传递给中间层神经元,最后传递到输出层神经元,由输出层输出信息处理结果的过程。 在这个过程中,神经网络通过不断调整网络的权值和阈值,达到学习、训练的目的,当网络输出的误差减少到可以接受的程度,或者预先设定的学习次数后,学习就可以停止了。3.2机器学习方法神经网络学习78研究内容:(1)生物原型研究(2)建立理论模型(3)网络模型与算法研究(4

30、)人工神经网络应用系统工作原理: 人工神经网络是由大量的简单基本元件神经元相互联接而成的自适应非线性动态系统。每个神经元的结构和功能比较简单,但大量神经元组合产生的系统行为却非常复杂。 人工神经网络反映了人脑功能的若干基本特性,但并非生物系统的逼真描述,只是某种模仿、简化和抽象。3.2机器学习方法神经网络学习79 与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。基于神经网络的煤炭自燃预测预报技术研究3.2机器学习方法神经网络学习80 即量子物理基本定则,由海森堡提出的理论,

31、其表述为:人们永远不能准确知道粒子的位置和速度;对其中一个知道得越精确,则对另一个就知道得越不准确。也可理解为一个趋于完美的事件它也只能无穷大的接近100而不能达到100,而那0.001%则可能会使它原本趋于完美的完美变得不再完美;从而改变该事件,使该事件变成另一个相对的只能无穷大的接近100而不能达到100的新事件;即一切皆有可能。3.3不确定性理论81(1)模糊逻辑(2)灰色理论(3)粗糙集理论(4)证据理论(5)贝叶斯网络(6)可拓理论3.3不确定性理论方法82 模糊数学又称Fuzzy 数学,是研究和处理模糊性现象的一种数学理论和方法。在1965 年美国控制论学者L.A.扎德发表论文模糊

32、集合,标志着这门新学科的诞生。现代数学建立在集合论的基础上。一组对象确定一组属性,人们可以通过指明属性来说明概念,也可以通过指明对象来说明。符合概念的那些对象的全体叫做这个概念的外延,外延实际上就是集合。一切现实的理论系统都有可能纳入集合描述的数学框架。3.3不确定性理论模糊数学83举例说明在日常生活中,经常遇到许多模糊事物,没有分明的数量界限,要使用一些模糊的词句来形容、描述。比如,比较年轻、高个、大胖子、好、漂亮、善、热、远。这些概念是不可以简单地用是、非或数字来表示的。在人们的工作经验中,往往也有许多模糊的东西。例如,要确定一炉钢水是否已经炼好,除了要知道钢水的温度、成分比例和冶炼时间等

33、精确信息外,还需要参考钢水颜色、沸腾情况等模糊信息。因此,除了很早就有涉及误差的计算数学之外,还需要模糊数学。3.3不确定性理论模糊数学84课堂教学的评价模型问题背景 对教师的课堂教学进行评价,是教师评价的一个方面。由于课堂教学优良的度量是模糊的,因此很难明确地界定。 教师的课堂教学是一种复杂的智力活动与劳动,不仅涉及到所授课程的知识,而且旁及教育学、心理学、语言学等。跟教师的工作热情、工作态度和业务水平有相当的关系。 因此,要考虑在抓住课堂教学的主要因素和讲授的基本要求后,设计评定量表,采用先定性,后定量,次量化的方法进行模糊评价。3.3不确定性理论模糊数学85课堂教学的评价模型课堂教学主要

34、因素和基本要求课堂教学的主要因素和基本要求构成集合 U =u0,u1,u2,u3,u4,u5,u6,u7,u8,u9评语构成集合V=v1,v2,v3,v4,v5 v1=很好 v2=好 v3=较好 v4=差 v5=很差3.3不确定性理论模糊数学86课堂教学的评价模型表1 课堂教学定性表举例说明问题u9主次有所区分u8注意前后呼应u7讲授内容熟练u6内容正确无误u5讲度掌握适中u4条理清楚好记u3板书工整得当u2讲话清晰从容ul仪态端庄亲切u0很差v5差 v4较好v3好 v2很好vl 评 语教学要求3.3不确定性理论模糊数学87课堂教学的评价模型表2 课堂教学定量表u95u94u93u92u91c

35、9u9c8u8c7u7c6u6c5u5c4u4c3u3c2u2c1u1u05u04u03u02u01c0u0v5v4v3v2v1权数项目3.3不确定性理论模糊数学88课堂教学的评价模型教学定性表和定量表的得到根据统计表1的结果,填写课堂教学定量表(表2)表2中,uij (i=0,1, ,9; j=1, ,5)为表1中 uivj栏中打“”的数目。令n为所收回的定性表1的有效张数,构造矩阵A A=(aij)105其中 aij=uij/n (i=0,1,2,.,9;j=1,2,.,5) 3.3不确定性理论模糊数学89课堂教学的评价模型第一次量化模型 确定权向量C的每一个分量ci(i=0,1,,9)

36、要求 ci0, (i=0,1,9); ci=1比如取 c0=0.10,c1=0.11,c2=0.11, c3=0.09, c4=0.08 c5=0.08,c6=0.09,c7=0.10,c8=0.12, c9=0.12于是作 D = CA D=(d1,d2,d3,d4,d5) 其中 dj=i ciaij (j=1,2,3,4,5)填写第一次量化表3d5d4d3d2d1很差差较好好很好3.3不确定性理论模糊数学90课堂教学的评价模型第二次量化模型 确定常数, 1, 2, 3 且 0.75 1, 0.5 1 23 较好 d1+1d2 , d1+1d2+ 2d3 好d1 , d1+1d2 很好d1

37、则课堂教学评价为如果符合下列条件3.3不确定性理论模糊数学91课堂教学的评价模型说明 通过建立模糊数学模型对教师的课堂教学进行评价,不仅能客观反映教师素质的真实情况,而且能使定性描述定量化。 整个计算步骤明确、判断简便,还能够分出程度差异,替代了不科学的“印象”评价,是有现实意义的。3.3不确定性理论模糊数学92矿井通风系统可靠性评价3.3不确定性理论模糊数学93 按国际惯例,控制论中,信息多少常以颜色深浅来表示。信息充足、确定(已知)的为白色,信息缺乏、不确定(未知)的为黑色,部分确定与部分不确定的为灰色。那些既有已知参数又有未知参数的系统,如:人体就是既有白色参数(已知的外型参数)又有黑色

38、参数(未知的人体穴位功能)的灰色系统。 灰色系统论的作用,其理论作用是: 1)实践中摸索出来的规律过去不容易用一般控制理论解释的,可以用新系统理论进行解释、提高,从而使软件更完整、深入、量化; 2)可以得到新的控制系统; 3)有助于促进社会系统与经济系统的量化研究。3.3不确定性理论灰色理论94相对于一定认识层次,内部信息部分已知、部分未知的系统,即信息不完全的系统。控制论中常借助颜色来表示,研究者对系统内部信息和对系统本身的了解及认识程度。“黑”表示信息完全缺乏,“白”表示信息完全、“灰”表示信息不充分、不完全。黑、白、灰是相对于一定认识层次而言的,因而具有相对性。白色系统是全开放性的、黑色

39、系统是全封闭性的。灰色系统则介于两者之间,是半开放半封闭性的。3.3不确定性理论灰色理论基于灰色系统的建筑施工安全管理系统95应用举例 例:利用灰色关联分析对6位教师工作状况进行综合评价 1)评价指标包括:专业素质、外语水平、教学工作量、科研成果、论文、著作与出勤。3.3不确定性理论灰色理论示例962)对原始数据经处理后得到以下数值,见下表 编号专业外语教学量科研论文著作出勤1898752927875738397966474688843658669838689576483.3不确定性理论灰色理论示例973)确定参考数据列: 4)计算 , 见下表编号专业外语教学量科研论文著作出勤11012370

40、22124161302032524311146351330061610422513.3不确定性理论灰色理论示例985)求最值6) 取计算,得 3.3不确定性理论灰色理论示例99同理得出其它各值,见下表编号10.7781.0000.7780.6360.4670.3331.00020.636 0.778 0.636 0.467 0.636 0.368 0.778 31.000 0.636 1.000 0.538 0.538 0.412 0.636 40.538 0.778 0.778 0.778 0.412 0.368 0.538 50.778 0.538 0.538 1.000 0.778 0.

41、368 0.778 60.778 1.000 0.467 0.636 0.538 0.412 0.778 3.3不确定性理论灰色理论示例1007)分别计算每个人各指标关联系数的均值(关联序): 8)如果不考虑各指标权重(认为各指标同等重要),六个被评价对象由好到劣依次为1号,5号,3号,6号,2号,4号即 3.3不确定性理论灰色理论示例101混沌理论(Chaos theory)是一种兼具质性思考与量化分析的方法,用以探讨动态系统中(如:人口移动、化学反应、气象变化、社会行为等)无法用单一的数据关系,而必须用整体、连续的数据关系才能加以解释及预测之行为。3.3不确定性理论混沌理论丢失一个钉子,坏

42、了一只蹄铁;坏了一只蹄铁,折了一匹战马;折了一匹战马,伤了一位骑士;伤了一位骑士,输了一场战斗;输了一场战斗,输了一场战争;输了一场战争,亡了一个帝国。102混沌现象起因于物体不断以某种规则复制前一阶段的运动状态,而产生无法预测的随机效果。所谓“差之毫厘,失之千里”正是此一现象的最佳批注。具体而言,混沌现象发生于易变动的物体或系统,该物体在行动之初极为单纯,但经过一定规则的连续变动之后,却产生始料所未及的后果,也就是混沌状态。但是此种混沌状态不同于一般杂乱无章的的混乱状况,此一混沌现象经过长期及完整分析之后,可以从中理出某种规则出来。混沌现象虽然最先用于解释自然界,但是在人文及社会领域中因为事

43、物之间相互牵引,混沌现象尤为多见。如股票市场的起伏、人生的平坦曲折、教育的复杂过程。3.3不确定性理论混沌理论1033.3不确定性理论混沌理论混沌理论还有一个是发展人格,他有三个原则:1)能量永远会遵循阻力最小的途径2)始终存在着通常不可见的根本结构,这个结构决定阻力最小的途径。3)这种始终存在而通常不可见的根本结构,不仅可以被发现,而且可以被改变。基于分形_混沌理论的煤与瓦斯突出预测研究104 预测的对象是工业系统工作状态的安全预测。 其方法是对工业生产短期微观事故状态预测拟选用模糊马尔柯夫链预测法,其特点是系统某一时刻状态仅与上一时刻状态有关,而与以前时刻状态无关。 其t+1时刻的状态预测

44、模型表示为: Psik = maxPsi1, Psi2, . , Psi1原理3.3不确定性理论马尔柯夫链1053.3不确定性理论马尔柯夫链1063.3不确定性理论马尔柯夫链1073.3不确定性理论马尔柯夫链1083.3不确定性理论马尔柯夫链1093.3不确定性理论马尔柯夫链1103.3不确定性理论马尔柯夫链111112 数据库技术是信息系统的一个核心技术。是一种计算机辅助管理数据的方法,它研究如何组织和存储数据,如何高效地获取和处理数据。3.4数据库技术数据结构化 较高的数据独立性 数据共享 方便的用户接口 较强的数据控制能力 1133.4数据库技术新技术分布式数据库技术 面向对象数据库技术

45、 多媒体数据库 数据仓库 1143.4数据库技术数据仓库技术数据仓库技术(Data Warehousing)是基于信息系统业务发展的需要,基于数据库系统技术发展而来,并逐步独立的一系列新的应用技术。 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。 为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。 1153.4数据库技术数据仓库技术 数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据

46、库的。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。数据仓库是数据库技术的一种新的应用,而且到目前为止,数据仓库还是用关系数据库管理系统来管理其中的数据。1163.4数据库技术数据仓库技术特征1)面向主题2)集成化特性3)数据不可更新4)随时间不断变化5)汇总的;6)大容量;7)非规范化的;8)元数据;1173.4数据库技术联机分析技术联机分析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的

47、要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。. 1183.4数据库技术数据挖掘技术数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 119数据的特征知识的特征算法的特征矿山(数据)挖掘工具(算法)金子(知识)3.4数据

48、库技术数据挖掘技术120数据挖掘-从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构;数据挖掘大部分的价值在于利用数据挖掘技术改善预测模型。数据挖掘数据库越来越大有价值的知识可怕的数据3.4数据库技术数据挖掘技术1213.4数据库技术数据挖掘技术方法1)神经网络2)遗传算法3)决策树方法4)粗集方法5)统计分析方法6)模糊集方法122 可视化(Visualization)是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及到计算机图形学、图像处理、

49、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。目前正在飞速发展的虚拟现实技术也是以图形图像的可视化技术为依托的。3.5 可视化技术1233.5 可视化技术1243.5 可视化技术科学可视化计算或采集数据1253.5 可视化技术数据可视化非空间数据1263.5 可视化技术信息可视化非数值型信息1273.5 可视化技术知识可视化复杂知识关系1283.5 可视化技术 重要意义交互性多维性可视性1293.5 可视化技术 重要意义交互性多维性可视性1303.5 可视化技术 信息可视化功能增加认知资源,如用来提高人类的工作记忆能力;易化对于各种关系的知觉推理,否则归纳起来会更加困难;对大量的潜在事件加以知觉监控;一种便于操作的,不同于静态图的媒介,从而成就对数值空间的探索;加强对于各种模式的识别。1313.5 可视化技术 信息可视化面对的问题问题1323.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论