计算机数理统计软件在化学化工中的应用_第1页
计算机数理统计软件在化学化工中的应用_第2页
计算机数理统计软件在化学化工中的应用_第3页
计算机数理统计软件在化学化工中的应用_第4页
计算机数理统计软件在化学化工中的应用_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机数理统计软件在化学化工中的应用第一页,共四十九页,编辑于2023年,星期一数理统计在材料科学中的应用概述数理统计的科学意义数据的科学性数据的代表性数据的可靠性数理统计的理论基础统计规律统计理论数理统计方法及其应用领域第二页,共四十九页,编辑于2023年,星期一本章将要讲授的内容第一节:数理统计方法涵盖的主要内容和常见数理统计软件第二节:STATISTICA软件的功能和操作环境第三节:实验设计第四节:实验数据的可靠性分析第五节:实验数据的相关性分析第六节:实验结果的表述方法第三页,共四十九页,编辑于2023年,星期一第一节数理统计方法涵盖的内容和常见数理统计软件实验设计方法:数据的可靠性分析:数据间相关性分析:实验数据的表述方法:第四页,共四十九页,编辑于2023年,星期一实验设计方法:实验设计的目的:在实验科学中以最小的代价换取最有科学意义的实验结果。使实验数据具有最大限度的代表性,实践上常用于获取最佳工艺参数。实验设计的内容:是一种数学方法,数学意义上的实验设计与具体的实验设计不同,具有普遍意义。常用的实验设计方法:黄金分割法、正交试验法、均匀法、神经网络法、因子套法等第五页,共四十九页,编辑于2023年,星期一数据可靠性分析可靠性分析的目的:回答获得的实验数据的可靠性、准确性有多高??可靠性分析的主要内容:包括可信度分析、相关性分析、误差估计等。科学合理的数据分析是得出科学结论的基本保证常用的数据可靠性分析方法:误差分析、T检验,F检验,P检验等,基于方差分析第六页,共四十九页,编辑于2023年,星期一实验参数的变量分析变量分析的目的:了解自变量(条件)与因变量(结果)之间关系的统计方法,可以了解不同变量影响的程度和方向,也称为相关性分析。变量分析的主要内容:单变量分析和多变量分析,变量分析的主要方法:包括回归分析、判别分析、因子分析、主成分分析、聚类分析、生存分析等六个大的分支。第七页,共四十九页,编辑于2023年,星期一变量之间的相关性分析相关性分析的目的:寻找变量之间的交互关系,如正相关、负相关,指数相关、对数相关等,相关分析的内容:是判别变量之间的一致性和协同性问题。相关分析的主要方法:变量分析中的多数方法都可以应用第八页,共四十九页,编辑于2023年,星期一常见数理统计软件STATISTICA:自然科学SPSS(StatisticalPackageforSocialSciences):医学,社会学和自然科学SAS(StatisticalAnalysisSystem):社会科学,经济学BMDP(BioMedicalDataProcessing):生物医学第九页,共四十九页,编辑于2023年,星期一第二节STATISTICA软件功能和操作环境

操作环境:Windows3.x操作平台。经过使用测试,该软件能非常好地工作于Windows95和98。具有VGA或SVGA显卡,支持鼠标操作,CPU386以上.软件共有6张3寸高密软盘,解压缩安装之后,占用约13MB硬盘。软件功能:基本统计方法和统计表、非参数检验和连续与非连续分布分析、单变量和多变量方差分析模块、线性回归分析、非线性估计、时间序列和预测、组群分析模块、数据与文件管理、因素分析、典型标准分析、多维尺度分析、可信度分析、判别分析、对数线性分析、残余值分析、质量控制、过程分析、实验设计、编程命令语言模块第十页,共四十九页,编辑于2023年,星期一模块的基本功能简介STATISTICA6.0是美国StatSoft公司发行的一款功能强大的统计分析软件,其统计分析功能丝毫不亚于SPSS7.0,其制作统计图形的能力甚至还优于SPSS7.0。

数据统计分析项目主要有:

1.BasicStatisticsandTables(基本统计方法与统计表):包括描述性统计,相关性分析,独立或非独立样本的t检验,频数统计表,概率计算及其他差异显著性检验(两个均值或百分率的检验)等。这是用的最多的统计分析项目,一般简单的统计分析靠它就可以圆满解决问题。

2.Nonparametrics/Distrib(非参数性统计分析):包括Chi-square卡方检验,Kolmogorov-smirnov检验,Wilcoxon配对符号等级检验,两个独立样本Mann-Whitney检验,多个相关样本CochranQ检验和多个独立样本Kruskal-Wallis检验等等。

3.ANOVA/MANOVA(单变量和多变量方差分析):有多因素方差分析、协方差分析和重复测量方差分析等。两个以上样本平均数差异显著性检验,就要靠这个方差分析。

4.MultipRegression(多元回归分析):逐步回归分析,固定非线性分析,残差分析和基于回归模型的预测等。如果您要调查研究人的智商是否与吃鱼和吃豆腐有关,就可以用回归法来分析。

第十一页,共四十九页,编辑于2023年,星期一5.NonlinearEstimation(非线性估计):包括一般非线性模型,逐步Logit分析,最大可能性估计等。

6.TimeSeries/Forecasting(时间序列及预测):有关时间序列、探察、模型和预测技术选择等。

7.ClusterAnalysis(聚类分析):包括K-Means聚类,双边联合聚类等。聚类分析实质上是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类。是物以类聚的一种统计分析方法。

8.FactorAnalysis(因子分析):初始因子模型、旋转因子模型等。例如,学生的各科成绩受智力、计算能力、表达能力和灵活性等因子的影响,虽然可以通过考试或检查等手段获得学生的各科成绩,但那些对各科成绩起支配作用的因子的状态不能直接测定到,这时候因子分析就派上用场了。

9.CanonicalAnalysis(典型分析):典型相关性分析,典型因子协效应分析。主要用于研究两组多变量之间的相关性。第十二页,共四十九页,编辑于2023年,星期一10.MultidimensionalScaling(多维比例分析):多维距离或相似性估计等。

11.Reliability/ItemAnalysis(可靠性/项目分析):包括trachoric相关性分析,Crobachα系数,分半(split-half)信度分析等。假如您希望有可靠的交通工具,在任何时间、地点、对任何人,它都应该是可靠的,此种测试手段的可靠性显然是需要的。

12.DiscriminantAnalysis(判别分析):逐步判别法,分类统计等。判别分析的任务是根据已掌握的一批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体。如在环境检测中,根据对某地区的环境污染的综合测定结果判断该地区属于哪一种污染类型等。

13.Log-linearAnalysis(逻辑线性分析):包括多维列联表、残差统计和自动最优模型选择等。

14SurvivalAnalysis(生存分析)。第十三页,共四十九页,编辑于2023年,星期一STATISTICA软件的操作界面主菜单窗口:Sta_win.exe统计模块菜单,用图形和文字表示

窗口的右面为所选模块的动态注释,描述模块的用途和功能窗口下方由四个按钮组成一组选项,分别用于执行进入选择模块(SwitchTo),编排主菜单顺序(CustomizeList),关闭主菜单并转入选择模块(End&SwitchTo)和取消选择并关闭主菜单(Cancel)。双击所选模块或用鼠标点击SwitchTo,将进入所选择模块操作窗口。其窗口类型依据转入的模块不同而不同。

第十四页,共四十九页,编辑于2023年,星期一STATISTICA软件的基本操作处理数据的输入:用数据与文件管理模块操作基本统计操作:基本统计与图表模块是最基本的统计工具:包括8个选项;Descriptivestatistics(描述性统计参数计算)、Correlationmatrices(相关矩阵)、t-testforindependentsamples(独立样本的t检验)、t-testfordependentsamples(相关样本的t-检验)、Breakdown&one-wayANOVA(分组和一维方差分析)、Frequencytables(频率表)、Tablesandbanners(表格编辑)、Probabilitycalculator(概率计算)。结果的显示和输出:数理统计的结果可以用图形、表格、文本文件和报告的形式给出,提供二维图形(2DGraphs)、三维序列图形(3DSequentialGraphs)、三维XYZ函数图形(3DXYZGraphs)、多维图形和图标(nDGraphs&Icons)、分类图形(CategorizedGraphs)的绘制功能。报告分成简短报告(Brief)、短报告(Short)、中报告(Medium)和长报告(Long)四种

第十五页,共四十九页,编辑于2023年,星期一STATISTICA软件的基本操作处理数据的输入:用数据与文件管理模块操作Datamanagement/MFM操作窗口:提供了16个选项

Createnewdatafile窗口:确定输入数据的各项参数点击OK,将进入数据输入表:依次对应输入自变量和因变量。用右键单击变量名称位置,可以打开变量名称输入窗口输入变量名称。

第十六页,共四十九页,编辑于2023年,星期一第三节计算机在化学实验设计中的应用

试验设计主要包括科学实验方案的确定和实验数据的分析处理两部分,前者主要解决用最小代价获取最有代表性数据,后者主要解决从获得的实验数据中得出科学结论提供的设计方法包括双水平因子设计(two-levelfactoricaldesigns),响应曲面设计(responsesurfacedesigns),拉丁方设计(LatinSquaresdesigns)、Taquchi鲁棒设计(TaquchiRobustdesigns)四种方法。实验设计具有实验方案自动生成、能够处理相对复杂的实验数据、分析结果可以用不同方式输出。

第十七页,共四十九页,编辑于2023年,星期一双水平因子设计(two-levelfactoricaldesigns)

特点:主要解决那些影响因素多,且与结果之间的相互关系是单调的实验设计问题。能够给出各因素的影响大小和影响方向。适合进行初步影响因素筛选试验设计建立实验设计表:从主窗口中选择ExperimentalDesign(实验设计),在实验设计的菜单窗口中选择2**(K-p)design(two-levelfactorialdesigns)(双水平因子设计)。

在对话窗口设定实验因子数、实验操作数和实验组数,给出实验设计表在实验设计表中添加一个空栏用于记载因变量(实验结果),并标注变量名称数据分析:选择Analyzeastudy,将进入实验设计的数据分析模块。在数据处理模块中首先要在对话窗口中填入或选择适当参数。分析结果的输出,包括变量分析标、协同作用标、关系曲线等。第十八页,共四十九页,编辑于2023年,星期一操作步骤确定考察因子因子

水平温度摄氏度(1)时间小时(2)压力大气压(3)浓度摩尔(4)水分%(5)氧气%(6)配比A/B(7)1100110.10.012121201.531.00.1202输入实验设计参数第十九页,共四十九页,编辑于2023年,星期一实验设计表参数设定第二十页,共四十九页,编辑于2023年,星期一得到的实验设计表第二十一页,共四十九页,编辑于2023年,星期一经过调整的7因子双水平实验设计表

第二十二页,共四十九页,编辑于2023年,星期一合成反应实验结果表

Run12345678910111213141516收率78885666707580846977908586958386进行数据分析第二十三页,共四十九页,编辑于2023年,星期一合成反应双水平因子实验的变量分析数据表

第二十四页,共四十九页,编辑于2023年,星期一合成反应双水平因子实验因子影响和协同作用表

第二十五页,共四十九页,编辑于2023年,星期一响应曲面设计(responsesurfacedesigns)

功能:响应曲面实验设计法适合那些自变量与因变量之间具有非线性关系,必须使用三个以上的水平的实验设计,是一种多因子、多水平,可以给出因子间交叉作用的实验设计方法。建立实验设计表:选择Experimentdesign,在实验设计方法选择窗口中选择响应曲面设计(Responsesurfacedesign),在响应曲面实验设计参数设定窗口中设定参数,并给出实验设计表在实验设计表增加的空栏中填入实验结果。数据分析:本实验设计方法增加了Contourplot(等高线图)、Surfaceplot(曲面图)和Parameterestimates&ANOVA(参数估计和变量分析)三个选项,输出结果包括变量分析表、参数估计表和响应因子混合作用矩阵表。第二十六页,共四十九页,编辑于2023年,星期一拉丁方实验设计法(LatinSquareDesigns)

功能:拉丁方实验设计法适合于多水平(多于2),影响因子不多且因子之间不存在交叉影响,或者交叉影响可以忽略的场合,根据实验考察的影响因素(因子)数目多少,可以分为拉丁方LatinSquare(三因子)、正交拉丁方Greco-LatinSquare(四因子),超正交拉丁方Hyper-GrecoLatinSuare(多于四个因子)。拉丁方特点:1)行数等于列数,构成一个正方型。2)填入表格中的因子必须保证每一行或每一列都包含每个因子的每一个水平,且该水平仅能出现一次。正交拉丁方为两个拉丁方组合而成,超正交拉丁方为多个拉丁方组合而成。每个影响因子可以采用的水平数可以在3-9之间选择,水平数目不同,可供选择的拉丁方数目不同。第二十七页,共四十九页,编辑于2023年,星期一适合拉丁方实验设计的条件多因子,多水平,影响因子之间不存在或可以忽略交叉影响。可以用较少的试验次数,获得满意实验数据。实验数据分析可以通过图形和表格给出。比如:考察驾驶员,汽车和燃料添加剂种类对燃油消耗量的影响关系,可以认为驾驶员,汽车和汽油添加剂之间不存在交叉影响,可以选择拉丁方设计法。采用三因子,四水平,有如下拉丁方供选择:

CarDriver12341ABDC2DCAB字母代表不同燃油添加剂,需要16次试验完成

3BDCA而完全试验需要4X4X4=64次

4CABD第二十八页,共四十九页,编辑于2023年,星期一拉丁方的组合正交拉丁方组合:abcABCaAbBcCbca+CAB=bCcAaBcabBCAcBaCBa超正交拉丁方的组合可以采用同样方法将三个以上的拉丁方组合而成。第二十九页,共四十九页,编辑于2023年,星期一拉丁方可选数目与影响因子数目的关系水平数拉丁方数可供选择其他方案

321正交拉丁方

432正交拉丁方

1超正交拉丁方

546正交拉丁方

4超正交拉丁方

61仅提供拉丁方

721正交拉丁方

821正交拉丁方

921正交拉丁方第三十页,共四十九页,编辑于2023年,星期一拉丁方实验设计基本过程建立实验设计表:在实验设计模块中选择拉丁方设计模块(LatinSquares,Greco-LatinSquares),在给出的对话窗中选择建立试验设计表(generatedesign)。在设计(design)选项中选择影响因子数目,通过水平数目(numbersoflevel)按钮选择考察的水平数目,点击OK后进入下一个对话框,加一个因变量空栏并给出设计表。

分析结果以表格和图表形式给出。第三十一页,共四十九页,编辑于2023年,星期一操作步骤实验因子和水平表

1234乙炔/空气A0.5/61.0/81.5/102.0/12燃烧器高度mmB15913进样速度ml/minC2.45.77.17.5灯电流mAD6101420第三十二页,共四十九页,编辑于2023年,星期一四水平正交拉丁方表

A1A2A3A4B1C1D1C3D4C4D2C2D3B2C2D2C4D3C3D1C1D4B3C3D3C1D2C2D4C4D1B4C4D4C2D1C1D3C3D2第三十三页,共四十九页,编辑于2023年,星期一给出实验设计表第三十四页,共四十九页,编辑于2023年,星期一分析结果第三十五页,共四十九页,编辑于2023年,星期一实验数据的可靠性分析

目的:实验中溢出值的判断,实验误差的估计,实验误差的分布和置信区间的设置

实验误差分析:用标准偏差或变异系数衡量,实验误差的分布用最大值和最小值,以及平均值与真值差表示,测量值可靠性的判断用置信度和置信区间表示一致性检验—t检验:不同实验室或不同分析方法对同一样品检测值是否一致的统计检验,用两者的标准偏差,平均值差和t值以及p值表示

第三十六页,共四十九页,编辑于2023年,星期一实验误差分析举例气相色谱进样准确度分析:进样10次分别测定峰面积有如下数据:142.1,147.0,146.2,145.2,143.8,146.2,147.3,150.3,149.9,151.8(平方毫米),进行误差分析。采用基本统计模块中描述性统计分析,得到以下结果:第三十七页,共四十九页,编辑于2023年,星期一两种分析方法数据一致性检验采用基本统计模块中独立变量的t检验

方法进行数据分析,得到如下结果:极谱法2.212.332.142.272.202.102.25原子吸收法2.202.142.322.252.302.252.28采用原子吸收法和极谱法测定某材料中锌的含量,结果如下:对这两种分析方法的一致性进行分析。第三十八页,共四十九页,编辑于2023年,星期一第三十九页,共四十九页,编辑于2023年,星期一多样品间一致性及误差分析分析目的:检查不同样本之间是否存在系统偏差,比较不同样本的误差大小。采用基本统计模块的非独立变量t-检验方法。不同实验室重量法测定钨中镍含量结果统计表实验室测定值平均值12345611.0651.0811.0811.0641.1071.0771.07921.0731.0811.0771.0501.0771.0771.07231.0801.0901.0701.0801.0901.1001.08541.0971.1091.0731.0891.0971.0971.09451.0531.0551.0501.0591.0531.0611.05561.0841.0441.0841.0761.0931.0731.07671.0611.0501.0471.1181.0571.0781.06881.0521.0611.0731.0361.0481.0401.05291.2031.0491.3161.1181.3221.4831.248第四十页,共四十九页,编辑于2023年,星期一给出的变量分析表和误差分析图第四十一页,共四十九页,编辑于2023年,星期一变量间相关性分析

实验科学中数据的相关性分析可以采用回归分析解决

回归分析包括:线性回归分析:一元线性回归、多元线性回归。非线性回归:包括对数回归、指数回归、概率回归、分段线性回归和自定义回归分析回归的结果:回归方程、相关度R和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论