版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机在材料科学中
的应用概论计算机在材料科学中
的应用概论1材料的分类有机高分子材料:有机分子、聚合物(塑料、橡胶、黏合剂、涂料、纤维)、高聚物(非晶态、晶态、液晶、合金)生物活性材料:谷氨酸被颉氨酸取代导致镰刀型贫血症、DNA、基因组金属材料:有色金属、黑色金属、合金材料无机非金属材料:从硅酸盐材料到功能材料、半导体复合物:有机金属化合物(五十年代的二戊铁)材料的分类有机高分子材料:有机分子、聚合物(塑料、橡胶、黏合2材料研究的层次材料工程:制备工艺与用途材料科学:化学组成、性能、显微结构材料化学:元素组成、分子结构、化学键材料物理:电子结构、场力、能量材料研究的层次材料工程:制备工艺与用途3计算机技术在材料中的应用材料物理计算材料化学计算材料结构与性能计算材料工艺设计材料工艺控制材料数据库材料数据挖掘计算机技术在材料中的应用材料物理计算4举例陶瓷材料设计金属材料设计耐火材料设计防腐蚀材料设计功能材料设计电池材料设计材料性能预报举例陶瓷材料设计5计算机在材料科学中的应用计算机辅助试验设计:正交设计与均匀设计实验数据的处理与分析:准确度与精确度数学模型的建立与评价:最小二乘与回归分析数学规划与配方计算:规划的解法与配方实例基于计算机的实验模拟:应用实例材料性能的预报与评估:应用实例材料化学的理论计算:模式识别、人工神经网络、遗传算法材料物理的理论研究:量子力学与量子化学新材料的设计与开发:进展计算机在材料科学中的应用计算机辅助试验设计:正交设计与均匀设6计算机辅助试验设计计算机辅助试验设计7试验设计之源起20世纪30年代,由于农业试验的需要,R.A.Fisher在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支F.Yates,R.C.Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛1960年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,使得试验设计得到广泛的普及与应用试验设计之源起20世纪30年代,由于农业试验的需要,R.A.8国内试验设计简史60年代由华罗庚教授倡导与普及的“优选法”,即国外的斐波那契方法70年代我国的数理统计学者在工业部门中普及的“正交设计”法都是人们熟悉的试验设计法70年代末期由方开泰教授和王元教授倡导和推广的均匀设计也是一种常用的试验设计方法。“优选法”是单变量的最优调试法,“正交设计”是基于拉丁方理论和群论的多因素试验设计方法,“均匀设计”则是基于数论方法的另一种多因素试验设计方法。
国内试验设计简史60年代由华罗庚教授倡导与普及的“优选法”,9利益所在试验设计得好,会事半功倍,反之就会事倍功半了。好的试验设计方案可以大大减少试验次数,得到充分的信息,简化数据处理过程,节省人力、物力和时间。正确合理的试验设计,可以使试验结果的可靠性显著提高。试验设计还可以为迅速寻求参数的优化数值和选择最佳工艺方案指明方向。材料科学与材料工业中经常会出现各种试验设计问题,例如配方试验或称混料试验(ExperimentswithMixtures),就是在材料科学中经常遇到的问题之一。
利益所在试验设计得好,会事半功倍,反之就会事倍功半了。好的试10基本概念指标:在试验设计中,人们把判断试验效果好坏所采用的标准称为试验指标,或简称为指标因素:或称为因子,有可能影响试验指标的条件,称作因素。通常情况下固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素水平:或称为处理,能影响试验指标的因素,通常人为地给予控制、分组,在统计学上,统称其为因子的水平基本概念指标:在试验设计中,人们把判断试验效果好坏所采用的标11基本要求进行不同处理的实验单元间,要有相同的系统要有明确的试验目的、恰当的指标要挑选因子,适当确定水平。使试验范围尽可能大一点,试验范围太小的缺点是不容易获得比已有条件有显著改善的结果。每一个因素的水平个数最好适当多一些,水平的间隔大小和生产控制精度是密切相关的。同时,因素和水平的含意可以是广义的处理实验数据要能配上相应的数理统计方法,以达到预期的试验目的基本要求进行不同处理的实验单元间,要有相同的系统12因素的主效应和因素间的交互效应
各因素的水平所对应的目标值称为主效应,各个因素除了对目标值有独立的影响外,还可能共同对目标值产生作用,即交互作用。交互作用通常表现为因素的乘积对指标的影响,其系数为正称为正交互作用,其系数为负称为负交互作用。
因素的主效应和因素间的交互效应各因素的水平所对应的目标值称13计算机在材料科学中的应用课件14试验设计方法的发展过程
全面试验法将每一个因素的不同水平组合做同样数目的试验。一般说m个因子n个水平的全面试验需要做nm次试验。当因素的个数不多,每个因数的水平数也不多时,用全面试验的方法,并且通过数据分析可以获得较为丰富的结果,结论也比较精确。当因素较多,水平数较大时,全面试验要求的试验数目可能非常大,虽然最后能够早出最好的搭配方案,但费时费工,往往不可能实现,因此除了一些比较简单的情况外,一般不进行全面试验
试验设计方法的发展过程
全面试验法将每一个因素的不同水平组15简单对比法又称孤立因素法,是将因子中只变化一个,其余的固定,然后逐步地得到好的搭配的方法。`这种方法一般也能得到一定的效果,而且比全面试验的次数少,但也有缺点,就是对待各因子和水平不是均等的。并且先固定那些因子,后变化那些因子,都会影响试验结果,因此最后的结果是不是最好的,还不能充分肯定
简单对比法又称孤立因素法,是将因子中只变化一个,其余的固定,16随机试验法完全随机试验法:是一种最基本的试验设计,即各因素的水平完全随机分配随机区试验法:在划分区间后,用随机数字表或抽签法来确定顺序的试验设计方案随机试验法17拉丁方试验法将一定数的文字排成正方形,每个文字在各行各列都出现一次而且只出现一次,这样的方格称为拉丁方。第一行与第一列相同的顺序排列的拉丁方称为标准型拉丁方。对于因子数多于3的实验,实验数将随着因子数的增加而快速地增加,采用拉丁方试验法,可以大大减少实验数。组成拉丁方区的必要条件是,在拉丁方区内行数等于列数等于水平数。拉丁方是供不存在交互作用的因子的实验设计用的。拉丁方设计的主要目的是研究单因素不同水平对实验结果的影响。
拉丁方试验法将一定数的文字排成正方形,每个文字在各行各列都出18拉丁方举例3*3拉丁方ABCBCACAB4*4拉丁方ABCDBADCCDABDCBA拉丁方举例3*3拉丁方19正交拉丁方法正交拉丁方是指两个或两个阶数相同的拉丁方之间呈正交关系而言的正交拉丁方试验一般在5*5,7*7,8*8中进行正交拉丁方的个数不超过拉丁方字母的个数减1对于6*6的拉丁方,则不存在正交拉丁方法,拉丁方或正交拉丁方试验,可用随机法安排试验正交拉丁方法正交拉丁方是指两个或两个阶数相同的拉丁方之间呈正20正交试验设计及其数据分析正交试验设计及其数据分析21正交试验设计正交试验设计方法,就是利用数理统计学与正交性原理,从大量的试验点挑选适量的具有代表性、典型性的点,应用“正交表”合理安排试验的一种科学的试验设计方法。统计学家将正交设计通过一系列表格来实现,这些表格叫做正交表,记为Lt(me),其中L表示正交表,t表示总共做t次试验,m表示每个因素都有m个水平,e表示表中有e列,最多可以安排e个因素。正交试验设计正交试验设计方法,就是利用数理统计学与正交性原理22常用正交表二水平正交表:L4(23),L8(27),L16(215),L32(231)三水平正交表:L9(34),L27(313)四水平正交表:L16(45)五水平正交表:L25(56)混合水平的表:L8(424),L12(2331),L16(4423),L16(4326),L16(4229),L16(41212),L18(8128),L18(2137)常用正交表二水平正交表:L4(23),L8(27),L16(23正交表L9(34)No.1234111112122231333421235223162312731328321393321正交表L9(34)No.1224正交设计的特征正交设计是利用数学上的正交性确定的设计方法,本质上具有“均匀分散、整齐可比”的特点。具体表现为:水平均匀性:每个因子和因子的每个水平都是均匀分配的搭配的均匀性:每个因子的各个水平出现的次数都是相同的,任何两个因子的搭配也都以相同的次数出现正交设计的特征正交设计是利用数学上的正交性确定的设计方法,本25正交试验点的分布正交试验点的分布26正交试验过程就是在确定指标、因子和水平后,用正交表安排试验方案。它主要要求解决三个方面的问题分析因子与指标的关系,即当因子变化时,指标是怎样变化。找出这种变化的规律,可以利用它能动地指导生产分析因子影响指标的主次,即分析哪个因子是影响指标的主要因素,哪些是次要因素。找出主要影响因素常常是生产中关键问题之一寻找好的生产工艺,即找到每个因子各取什么水平,会得到最好的指标。也就是选出最优方案,这是生产中最需要解决的问题正交试验过程就是在确定指标、因子和水平后,用正交表安排试验方27用正交表安排试验的步骤根据因子数和水平数以及试验条件的限制,选择合适的正交表将各因子放到表头的各列中将各因子的水平安排到相应的表格中形成试验方案
用正交表安排试验的步骤根据因子数和水平数以及试验条件的限制,28正交试验设计的评价正交试验设计缺点在于它只适合于水平数不多的试验。通常情况每个因子有q个水平,用正交表安排试验,至少要作q2次试验,当q较多时,q2非常大,很多情况无法进行试验正交试验设计只考虑全局平衡,只得到可能的优化方向正交试验设计的评价正交试验设计缺点在于它只适合于水平数不多的29直观分析利用正交表进行试验设计并分析结果一般有两种方法,即直观分析与方差分析。直观分析就是通过计算将各个因子、水平对试验结果质量指标影响的大小,用图形表示出来,通过直观分析,综合比较,以确定最优化试验方案的方法。直观分析利用正交表进行试验设计并分析结果一般有两种方法,即30直观分析的目的因子与指标的变化规律,从k1,k2,k3与因子的关系图来考察
因子影响指标的主次顺序,从极差R来考察,R越大,影响越大选顶最优方案,看各个因子中哪些水平的平均指标最高,来获得最优方案以实验验证最优方案
直观分析的目的因子与指标的变化规律,从k1,k2,k3与因子31正交试验设计直观分析例题研究温度、压力、配比及时间四个因子对某种材料质量指标的影响:温度取430、450、4700C,压力取10、20、30kg,配比取3%、5%、7%,时间取1、2、3小时,质量指标越大越好正交试验设计直观分析例题研究温度、压力、配比及时间四个因子对32设计试验根据因子和水平数选用可以安排四因子、三水平的正交表L9(34)将温度、压力、时间和配比随机安排在正交表的各个列上安排各因素的水平得到试验方案
设计试验根据因子和水平数选用可以安排四因子、三水平的正交表L33计算机在材料科学中的应用课件34直观分析对各个因子的每个水平所对应的质量指标求和得到K1,K2,K3在每一列中计算的K1,K2,K3平均值k1,k2,k3
在每一列中计算极差,即用每一列的k1,k2,k3中最大者减去最小者所得到的值,记为R用每一个因子的k值对该因子的水平作图,观察各个因子与指标的变化规律
直观分析对各个因子的每个水平所对应的质量指标求和得到K1,35计算机在材料科学中的应用课件36分析结果由极差R决定因子影响指标的主次顺序:温度>压力>时间>配比选择最优方案:由各个因子中平均指标最高的水平组合而成试验方案: A3B2C2D3实验验证优选方案
分析结果由极差R决定因子影响指标的主次顺序:温度>压力>时间37正交试验设计程序流程程序说明开始控制读入数据读入因子数、水平数、试验数、指标数数组定维读入正交设计因子、水平数字信息和指标信息计算并打印K值选择最大K值和最小K值计算并打印因子极差R打印直观分析图结束正交试验设计程序流程程序说明38多指标试验设计的分析方法在实际问题中,用来衡量试验效果的指标往往不止一个,而是多个,这类试验叫做多指标试验,进行多指标试验设计的分析方法有综合评分法和综合平衡法:综合评分法:是将多指标化为一个评分指标来进行直观分析的方法综合平衡法是先分别将各个指标按单指标进行计算和分析,再将各指标的分析结果进行综合平衡,以得到“最优”试验方案综合评分法和综合平衡法所得到的结论,一般是一致的,在实际应用中综合评分法用得较多,因为计算上比较方便多指标试验设计的分析方法在实际问题中,用来衡量试验效果的指标39综合评分法的程序设计程序说明开始控制读入数据读入因子数、水平数、试验数、指标数数组定维读入正交设计因子、水平数字信息和指标信息综合评分计算并打印k值和K值选择最大K值和最小K值计算并打印因子极差R打印直观分析图结束综合评分法的程序设计程序说明40综合平衡法的程序设计开始程序说明数据控制进入循环进行每个单指标的直观分析并打印相应图形结束综合平衡法的程序设计开始41注意有些试验中有的因子可以取较多的水平,但是也有的因子受条件的限制,不能多选水平,这就遇到水平数不同的情况。解决不同水平数问题的方法:可以直接用不同水平混合型的正交表;也可以采用拟水平方法,即将水平一律补齐为相同水平再加以解决。对于因子间有相互作用,即存在交互作用的正交试验设计,采用专门的有交互作用的正交表。交互作用放在哪一列上,由二列间交互作用表决定。
注意有些试验中有的因子可以取较多的水平,但是也有的因子受42方差分析直观分析方法,其优点是简单、直观、计算量较小。但是,直观分析不能给出误差大小的估计,也就不能知道结果的精度。方差分析可以弥补直观分析的不足之处。在一批实验数据中,数据的算术平均值代表了数据的平均水平,反映了数据的集中性;而数据的方差,反映了数据的波动性,即数据的分散性,方差大小表明数据变化的显著程度,而数据变化的显著程度,又反映了因素对指标影响的大小。
方差分析直观分析方法,其优点是简单、直观、计算量较小。但是,43T8钢淬火试验(四因素二水平)
其中A和B有交互作用,而且需要考虑其误差,测试淬火硬度,硬度越大越好。
T8钢淬火试验(四因素二水平)其中A和B有交互作用,而且需44正交表的选择共计考虑7个因素,每个因素有两个水平,因此选用L8(27)进行试验设计。首先进行表头设计正交表的选择共计考虑7个因素,每个因素有两个水平,因此选用L45正交试验设计、实验结果与方差分析正交试验设计、实验结果与方差分析46计算过程表中Ti=mi-(T/8)(i=1,2)以A因素为例,令硬度值分别为Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8,则IA=Y1+Y2+Y3+Y4,IIA=Y5+Y6+Y7+Y8T=Y1+Y2+Y3+Y4+Y5+Y6+Y7+Y8SA=4[((IA/4)-(T/8))2+((IIA/4)-(T/8))2]=4[(IA
2+IIA
2)/16-T(IA+IIA)/16+T2/32]=4[(IA
2+IIA
2)/16-T2/32]=(IA
2+IIA
2)/4–T2/8即:S=(I2+II2)/4–T2/8由此计算出:SA=121/8,SB=81/8,SA*B=361/8,SC=81/8,SD=81/8,SE=9/8+25/8=34/8计算过程表中Ti=mi-(T/8)(i=1,2)47因素对指标影响
用F检验法检验各个因素对指标影响的显著性:F
=(各因素方差/因素方差的自由度):(误差方差/误差方差自由度)即:F=(S/f)/(Se/fe)由此计算结果如下表:
因素对指标影响用F检验法检验各个因素对指标影响的显著性:48分析结果查表可以得到F检验值:F0.25(1,2)=2.57,F0.05(1,2)=18.51,F0.01(1,2)=98.5F值大的因素对指标的影响大,F值小的因素对指标的影响小。由此可以得到,C和A*B对硬度指标的影响较显著,A和B、D的影响依次减小。筛选最优方案:C是最显著因素,先选C,C列的m2>m1,故此选C2方案;A*B也是显著因素,A*B的m2>m1,选二水平得到A、B的搭配A1B2或A2B1,A比B重要,先选A,A的m1>m2,故选定A1B2;D不显著,可以选D2,因此最优方案是A1B2C2D2。
分析结果查表可以得到F检验值:F0.25(1,2)=2.5749方差分析的程序流程程序说明开始控制读入数据J=P:YesorNo读入Ai,Bi,Ci,Di和指标Yi(I=1,…,M)计算指标加和Y0=ΣY/O计算各因子对指标的影响K(I,J)(I=1,2;J=1,…,N)计算H(I,J)=K(I,J)*K(I,J);U(I,J)=K(I,J)/(O/M)T(I,J)=U(I,J)-Y0计算S(J)=[H(I,J)+H(I,J)]/N-[Y(0)*Y(0)]/O误差E=S(5)+S(6)计算各因子F值,并对显著性因子,打印“*”标记结束方差分析的程序流程程序说明50均匀试验设计均匀试验设计51均匀设计的缘起所有的试验设计方法本质上就是在试验的范围内给出挑选代表点的方法。正交设计是根据正交性准则来挑选代表点,使得这些点能反映试验范围内各因素和试验指标间的关系。正交设计在挑选代表点时有两个特点:均匀分散,整齐可比。均匀分散时试验点有代表性;整齐可比便于试验数据的分析。为了保证整齐可比的特点,正交设计至少要求做q2次试验。若要减少试验的数目,只有去掉整齐可比的要求。均匀设计就是只考虑试验点在试验范围内均匀散布的一种试验设计方法。均匀设计的缘起所有的试验设计方法本质上就是在试验的范围内给出52均匀设计表每一个均匀设计表都有一个代号Un(qs)或Un*(qs),其中“U”表示均匀设计,“n”表示要做n次试验,q表示每个因素有q个水平,s表示该表有s列;U的右上角加“*”和不加“*”代表两种不同类型的均匀设计表,通常加“*”的均匀设计表有更好的均匀性,应优先选用。但是不加“*”的均匀设计表表能安排更多的因素,所以当因素数s较大,且超过加“*”的均匀设计表的使用范围时,可使用不加“*”的均匀设计表每一个均匀设计表都附有一个使用表,它指示我们如何从均匀设计表中选用适当的列,以及由这些列所组成的试验方案的均匀度。使用表最后一列D表示刻划均匀度的偏差(discrepancy),偏差值越小,表示均匀度越好
均匀设计表每一个均匀设计表都有一个代号Un(qs)或Un*(53均匀设计的特征均匀设计有其独特的布点方式,其特点表现在:
每个因素的每个水平做一次且只做一次试验任何两个因素的试验点点在平面的格子上,每行每列有且仅有一个试验点均匀设计表的任何两列组成的试验方案一般并不等价,因此每个均匀设计表必须有一个使用表当因素的水平数增加时,试验数按水平数的增加量在增加
均匀设计实验结果需要应用回归分析方法来处理,由于没有正交性,不能使用直观分析或方差分析性质(1)和(2)反映了试验安排的均衡性,即对各因素,每个因素的每个水平一视同仁;均匀设计的特征均匀设计有其独特的布点方式,其特点表现在:54均匀设计表U6*(64)及其使用表
均匀设计表U6*(64)及其使用表55均匀设计表U7(74)及其使用表
均匀设计表U7(74)及其使用表56均匀设计表U7*(74)及其使用表
均匀设计表U7*(74)及其使用表57均匀设计举例在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比(A)、吡啶量(B)和反应时间(C)三个因素,它们各取了7个水平如下:
A:1.0,1.4,1.8,2.2,2.6,3.0,3.4B(ml):10,13,16,19,22,25,28C(h):0.5,1.0,1.5,2.0,2.5,3.0,3.5均匀设计举例在阿魏酸的合成工艺考察中,为了提高产量,选取了原58试验方案的确定根据3个因素和7个水平,我们可以选取均匀设计表U7*(74)或U7(74),由它们的使用表可以查到,当s=3时,两个表的偏差分别为0.2132和0.3721,故应当选用U7*(74)来安排试验,其试验方案列于下表。该方案是将A、B、C分别放在U7*(74)表的后3列而获得的。
试验方案的确定根据3个因素和7个水平,我们可以选取均匀设计表59试验方案试验方案60试验数据分析回归分析拟合出指标与各个因素的关系式Y=f(x1,x2,…,xn)Y=a1*x1+a2*x2+…+anxn通过关系式揭示指标与各个因素之间的定性关系或定量关系:系数的大小决定因素对指标影响的大小,系数的正负决定因素对指标影响的趋势非线性关系式表征交互作用影响或非线性因素的影响最优工艺条件的确定:用各种最优化算法求关系式的极值;用微积分算法求极值;条件有限时可以用网格求极值试验数据分析回归分析拟合出指标与各个因素的关系式61正交设计与均匀设计的比较正交设计和均匀设计是目前最流行的两种试验设计的方法,它们各有所长,互相补充,给使用者提供了更多的选择正交设计具有正交性,如果试验按它设计,可以估计出因素的主效应,有时也能估计出它们的交互效应均匀设计是非正交设计,它不可能估计出方差分析模型中的主效应和交互效应,但是它可以估计出回归模型中因素的主效应和交互效应正交设计与均匀设计的比较正交设计和均匀设计是目前最流行的两种62进一步的比较正交设计用于水平数不高的试验,因为它的试验数至少是水平数的平方;均匀设计适合于多因素多水平试验均匀设计提供的均匀设计表在选用时有较多的灵活性均匀设计的试验次数随水平数呈连续性增加,正交设计呈跳跃性增加正交设计的数据分析程式简单,直观分析可以给出试验指标随每个因素的水平变化的规律;均匀设计的数据处理要用回归分析来处理,计算复杂,必须有计算机的帮助,进一步的比较正交设计用于水平数不高的试验,因为它的试验数至少63试验数相同时的偏差的比较试验数相同时的偏差的比较64水平数相同时偏差的比较水平数相同时偏差的比较65偏差相近时试验次数的比较偏差相近时试验次数的比较66数据特征
与实验数据的取舍数据特征
与实验数据的取舍67有效数字实验数据有效位数的确定的正确作法是所取位数除末一位数字为测量时的可疑数或估计数外,其余各位数字都是准确可靠的,通常末一位可疑数字上下可以有一个单位的误差,这样的数字称作有效数字。有效数字实验数据有效位数的确定的正确作法是所取位数除末一位数68舍入误差舍入误差是人为的引入误差,引入一种人为的误差总是希望它在多次实践中的均值基本上等于零才好。古典的“四舍五入”法则并不是具有所期望的性质。其舍入误差的期望值等于第n+1位单位的二分之一,此乃其结症所在。为了适应生产与科学技术工作的需要,国家《数学修约规则》规定了“四舍六入五单双”的法则:四舍六入五考虑,五后非零必进一;五后皆零视奇偶,五前为偶应舍去,五前为奇则进一。舍入误差舍入误差是人为的引入误差,引入一种人为的误差总是希望69有效数字的确定方法在加减计算中,各数所保留的小数点后的位数,应与所给各数中小数点后位数最少的相同在乘除法计算中,应以有效数字最少的或百分误差最大的数字为准,对其它各数值按上述取舍规则处理后,再进行乘除运算,所得积或商的精确度也不应该大于相乘、除各数值中精确度最小的数字的精确度在对数计算中,真数与对数的有效位数相同在计算均值时,若为四个或多于四个数平均时,则平均数的有效位数可增加一位对常数、e及、等的有效数字位数,可以根据需要任意确定界限数值不得修约有效数字的确定方法在加减计算中,各数所保留的小数点后的位数,70数据的表示方法实验数据是实验信息与结果的记录,要准确、简明、形象地表示出来,通常可以采用列表、作图和经验公式三种方法来表示数据的表示方法实验数据是实验信息与结果的记录,要准确、简明、71列表法列表法的优点在于,简单易作,简明紧凑,便于比较。一般常用的有统计式、定性式、定量式及函数式,后两种用的较多。实验数据列表时应当注意:表的名称与项目要简明,必要时可在表名下或下加附注说明数据来源,编列的表号应写在表名之前,表中的项目应包括名称及单位,一般应采用符号表示之,表中主项代表自变量,负项代表因变量数字的写法应注意整齐统一、正确有效数字应当取舍适当自变量应取整数或其它较方便的数值,按递增或递减的顺序排列如果实验数据的自变量与因变量都不够规则,不便应用列表法列表法列表法的优点在于,简单易作,简明紧凑,便于比较。一般常72作图法作图法优点在于,形象简明,便于直观比较。作图法的坐标有直角坐标法、单对数坐标、双对数坐标、三角坐标、极坐标及立体坐标等,最常用的是直角坐标。作图法应当注意:横坐标代表自变量,纵坐标代表因变量,坐标分度应使坐标纸的最小分格相应于实验数据的精确度,应尽量将变数加以变换,使所得图形为直线或近似直线用实验数据描点时,应能表示出实验数据的误差范围,同一坐标纸内描绘几条曲线时,不同曲线的描点应用不同画法予以区别根据各描点作曲线时,如数据过少不足以确定自变量和因变量之间关系时,最好将各点用直线连接,如果描点足够多,描出光滑连续曲线,不必通过所有各点,特别是两端的描点,但是应使曲线尽可能地与所有各点相接近,并使两边的点数及点与曲线的距离乘积的总和近于相等。
作图法作图法优点在于,形象简明,便于直观比较。作图法的坐标有73经验公式表示法经验公式表示法是用一个方程式来表示实验数据或实验数据曲线:经验公式的选择一般没有简便的方法可获得一个理想的公式,通常是根据解析几何原理和经验来推测公式应有的形式;经验公式中常数的求法:经验公式中常数的求法有图解法、选点法、平均法、最小二乘法等多种方法经验公式表示法经验公式表示法是用一个方程式来表示实验数据或实74数字特征的计算与检验数据是实验的信息,是事物内在规律性的外部表现。研究、处理数据是为了认识事物的内在规律,以促进科学研究和指导生产。事物的本质,现象的内在规律,往往隐藏在大量的数据之中。因此,对数据做科学的整理与分析,去粗存精,去伪存真,方能得到由表及里的科学认识数字特征的计算与检验数据是实验的信息,是事物内在规律性的外75位置特征参数的计算实验数据的位置特征参数是用来描述实验数据的平均位置与特定位置的,其中常用的有算术平均值、均方根均值、计权均值、中位值、几何平均值等位置特征参数的计算实验数据的位置特征参数是用来描述实验数据76算术平均值算术平均值一般用表示,是实验数据x1,x2,…,xn的代数和除以样本量N,即
用来表示总体的平均水平常常同一观测值在同一测量过程中出现多次。如果观测的实验数据xi,重复出现vi次,则vi即为
算术平均值算术平均值一般用表示,是实验数据x1,x2,…,x77均方根均值均方根均值简称均方根值,用下式表示如果观测值xi重复出现频率为vi时,则均方根均值均方根均值简称均方根值,用下式表示78计权均值又称加权均值,对同一物理量用不同方法或设备,或由不同人员进行测量,在计算均值时常对可靠的数值给以比较大的比重(),所得平均值称作计权均值(加权均值),即其中1,2,…,n为给予各观测值的相应比重,称作权数。权数不能任意给定,必须考虑各有关因素,权衡该观测值的可靠程度,予以恰当的处理计权均值又称加权均值,对同一物理量用不同方法或设备,或由不同79几何平均值几何平均值是将n个观测值联乘后并开n次方所得的数值,即如果以对数形式表示,则平均值类型的选择主要取决于一组观测值的分布类型几何平均值几何平均值是将n个观测值联乘后并开n次方所得的数值80平均值的计算方法平均值的计算方法有直接算法、递推算法和二次均值算法三种,以算术平均值为例直接算法平均值的计算方法平均值的计算方法有直接算法、递推算法和二次均81平均值的计算方法递推算法二次均值算法平均值的计算方法递推算法82离散特征参数的计算样本的离散特征参数是用来描述数据的分散程度,常用的离散特征参数有极差、标准差、标准均差及变异系数等离散特征参数的计算样本的离散特征参数是用来描述数据的分散程83极差极差(L)是一个最简单的离散特征参数,它是样本中数据的最大值(Xmax)与最小值(Xmin)之差L=Xmax-Xmin
由于极差L是由个别的实验数据所决定的,未能充分利用数据提供的信息,其代表性较差极差极差(L)是一个最简单的离散特征参数,它是样本中数据的最84方差(s2)与标准差方差标准差对于有限个数的样本,应以代替较为合适,即方差(s2)与标准差方差85标准均差和变异系数标准均差变异系数方差、标准均差及变异系数都是以均值为中心的离散特征参数,尤其以方差的计算与应用最为普遍标准均差和变异系数标准均差86离散特征参数的算法离散特征参数的算法主要有直接算法、递推算法和移去均值算法,以方差为例直接算法递推算法,令和,则移去均值算法式中用二次均值法求出离散特征参数的算法离散特征参数的算法主要有直接算法、递推算法87分布特征参数的计算分布特征参数是用作描述实验数据的概率密度函数f(x)图形特征的,常用的有偏度系数(G1)与峰度系数(G2)分布特征参数的计算分布特征参数是用作描述实验数据的概率密度88标准偏度系数通常用标准偏度系数(G1),作为分布不对称的检验按照G1取值符号的不同,可分为负偏度分布、对称分布及正偏度分布。标准偏度系数G1的直观意义如下图标准偏度系数通常用标准偏度系数(G1),作为分布不对称的检验89峰度系数
G2作为分布特征的另一重要参数,描述概率密度函数f(x)图形顶峰的凸平度。按照G2取值符号的不同,可以看出G2=0时为标准正态分布。G2>0时,顶端的凸度大,当G2<0时,顶峰的凸度小峰度系数G2作为分布特征的另一重要参数,描述概率密度函数f90相关特征参数的计算通常计算相关特征参数,用意描述实验数据相互之间或实验数据Xi与实验编号i之间可能存在的相关关系相关特征参数的计算通常计算相关特征参数,用意描述实验数据相91线性时关系数的计算如果把实验数据Xi的下标编号i视为实验观测进行的相对时间,从而分析Xi与相对实验时间i之间的关系。为研究实验数据Xi有无随时间i改变的系统误差与趋势性变化的存在,提供定量依据Rxt数值的大小,表示了实验数据Xi与时间i之间可能存在的线形关系的强弱线性时关系数的计算如果把实验数据Xi的下标编号i视为实验观测92线性相关系数的计算R(j)为总体相关系数(j)的估计值。总体相关系数(J)作为实验数据各次实验之间相关性的一个定量测度,若(J)=0时,表示各次实验之间相互独立;若(J)0时,表示实验数据间存在的线性相关关系的强弱。就是说相关系数(J)给出了由Xi线性预报Xi+j的可能性大小。R(J)给出了(J)的渐近无偏估计值其中j=1,2,3,……kk<<N线性相关系数的计算R(j)为总体相关系数(j)的估计值。93异常数据的剔除在一批实验数据中,如果混杂有异常数据,则必然会歪曲实验结果。因此,必须正确地剔除异常数据(或称作坏值)。另一方面,由于在特定条件下进行实验量测的随机波动,致使测量数据有一定的分散性。如果人为的丢掉一些误差较大的,但不属于异常的数据,这样会造成虚假的高精度异常数据的剔除在一批实验数据中,如果混杂有异常数据,则必然94异常数据的判别与剔除方法人们对异常数据的判别与剔除,往往采用两种方法:物理判别法:在实验过程中,人们根据常识或经验,判别由于震动、误读、…等原因造成的坏值,随时发现,随时剔除统计判别法:给定一置信概率,并确定一个置信限,凡超过此限制的误差,就认为它不属于随机误差范围,系属异常数据,应予剔除如何利用计算机对实验数据进行检查、判别、统计推断,指出实验数据中的可疑点,剔除异常数据,这是实验数据中的一项重要任务,至今仍然未得到很好解决异常数据的判别与剔除方法人们对异常数据的判别与剔除,往往采用95拉依达(Pauta)准则
如果实验数据的总体x是正态分布的,则有其中,和分别表示正态总体的数学期望和标准差。因此,在实验数据中出现大于+3或小于-3数据点的概率是很小的。根据上式,对于大于+3或小于-3的实验数据,作为异常数据予以剔除拉依达(Pauta)准则如果实验数据的总体x是正态分布的,96拉依达(Pauta)准则对于实验数据x1,x2,……,xn,算出均值、残差Vi和标准差
(i=1,2,……,n)若某个测量值xd的残差vd(1dn)满足下式
3作为极限误差,则认为xd是异常数据应予以剔除
拉依达(Pauta)准则对于实验数据x1,x2,……,97肖维勒(Chauvenl)准则若某个测量值xd的残差vd(1dn)满足下式
xd被判定为异常数据,应予以剔除。其中n由下表查出另外还有格拉布斯(Grubbs)准则、狄克逊(Dixon)准则、t检验准则(罗马诺夫斯基准则)等经验准则肖维勒(Chauvenl)准则若某个测量值xd的残差vd(98漏失数据的弥补
经过试验设计,进行方差分析的数据都是通过精心安排获得的,有时不幸因试验做坏了或丢失了某些数据,而又无法重做时,弥补数据的方法通常有两种:当试验有重复并且每一处理至少有一个数据没有丢失时,丢失的数据可以用未丢失的数据的平均值代替如果试验无法重复,则可用计算离差平方和的方法来弥补漏失数据的弥补经过试验设计,进行方差分析的数据都是通过精心99举例
举例100题解对应于处理A2B1和A4B2丢失的数据,分别记作a与b,令总离差平方和组间离差平方和剩余离差平方和Le为Le=LT-LA-LB
题解对应于处理A2B1和A4B2丢失的数据,分别记作101题解对a和b进行估计,应使得Le最小,故此需要Le对a和b的偏导为0,即化简得到:6a+b=18.2a+6b=6.1解方程得到:a=2.95,b=0.53用a,b弥补A2B1处理和A4B2处理的漏失数据。值得注意的是,这种情形中误差的自由度减少,会降低各种检验的灵敏度题解对a和b进行估计,应使得Le最小,故此需要Le102实验数据的误差分析
实验数据的误差分析103实验数据中的误差在整理试验数据时,首先应该对原始数据的可靠性进行客观的评定。任何实验中都或多或少地存在一定的误差。误差是随机变量,服从正态分布,不管采用多么精确的仪器都无法避免误差。评定实验数据的误差,分析实验数据中误差的来源,找出造成误差的主要因素,可以针对性地准备实验方案,减少实验误差,提高实验精度。实验数据中的误差在整理试验数据时,首先应该对原始数据的可靠性104绝对误差数量的测定值(近似值)与真(实)值(准确值)之差,称为此测定值的误差。测定值用x表示,真值用X表示,其绝对误差为x:x-xXx+x通常以最大绝对误差来表示绝对误差:x-
x-xXx+xx+任何量的绝对误差和最大绝对误差都是名数,其单位与实验数据的单位相同。绝对误差数量的测定值(近似值)与真(实)值(准确值)之差,105相对误差绝对误差与所测量的值相比较,得到相对误差x,通常也是用最大相对误差来表示相对误差Ex:x=(x/X)100%Ex=(/x)100%相对误差是不名数,与所测量的量的因次无关。相对误差绝对误差与所测量的值相比较,得到相对误差x,通常也106系统误差系统误差亦称常差,它在反复测定的情况下保持同一数值与同一符号,单纯增加测定的次数是无法减少这种误差的影响的,这种误差也不可能用实验误差的一般数学理论加以计算,如果事先不知道修正值,可能在一系列测量中形成这种误差。系统误差决定实验的准确度。系统误差系统误差亦称常差,它在反复测定的情况下保持同一数值与107偶然误差偶然误差是任何实验中都有的,它不能从实验中消除,但是服从统计规律(概率理论)。偶然误差在反复测定时,表现为大小、符号上各不相同,可以说是无意引入的随机误差。偶然误差可以通过数学处理被发现并且予以定量,实验数据的精确度主要取决于偶然误差。偶然误差偶然误差是任何实验中都有的,它不能从实验中消除,但是108偶然误差的特征正误差与负误差绝对值相等时,出现的概率也相等在一定的测定条件中,偶然误差的绝对值不超过某一限度绝对值小的误差比绝对值大的误差在测定中出现的概率大随着同一个量的等精度测定次数的增加,偶然误差的算术平均值将越来越趋近于零偶然误差的特征正误差与负误差绝对值相等时,出现的概率也相等109实验误差产生的原因实验误差的大小首先取决于选择的研究方案,不同的方案有不同的误差实验设备和仪器的精密程度实验过程与所拟订的理想制度的偏差过失误差实验误差产生的原因实验误差的大小首先取决于选择的研究方案,不110误差的表示方法常见的误差表示法除绝对误差和相对误差外,还有范围误差、算术平均误差、均方误差和或然误差等四种表示方法范围误差:一组测定值中最高值与最低值之差,以此说明误差变化的范围。范围误差的最大缺点是显示不出与测量次数的关系,而测量次数却与真值的近似程度密切相关误差的表示方法常见的误差表示法除绝对误差和相对误差外,还有111算术平均误差n为测定次数,di为测定值与平均值之偏差。算术平均误差的缺点是,无法表达出各次测量实验数据之间彼此符合的程度算术平均误差112均方误差称标准误差,当测定次数n为无穷大时在有限次测定中均方误差是最常用的一种表示精确度的方法,它不但与一组测定值中每一个数据有关,而且对其中较大误差或较小误差敏感性很强,能较明显地反映出较大的个别误差。实验越精确,其标准误差越小均方误差称标准误差,当测定次数n为无穷大时113或然误差也称概差,常用表示,它所代表的意义是在一组测定值中若不计正负号,误差大于的测定值与误差小于的测定值将各占测定次数的50%,也就是说,在一组测定值中误差落在+和-之间的测定次数占总测定次数的一半。它与均方误差的关系是=0.6745
或然误差也称概差,常用表示,它所代表的意义是在一组测定值114真值与平均值实验误差是难于避免的,因此真值是无法测量得到的。在控制系统误差的条件下,只有通过增加实验次数,可以减少偶然误差,获得真值的近似值。换言之,真值是指测定次数无限多时求得的平均值,当测定次数有限时,其平均值近似于真值,成为最佳近似值。通常使用的平均值有算术平均值、加权平均值、对数平均值、均方根平均值、几何平均值和调和平均值等。平均值类型的选择主要决定于实验数据的分布类型真值与平均值实验误差是难于避免的,因此真值是无法测量得到的115算术平均值如果测定值的分布服从正态分布,算术平均值即为一组等精度测量中的最佳值或最可信赖值算术平均值如果测定值的分布服从正态分布,算术平均值即为一组116加权平均值对同一物理量用不同的方法测定,或由熟练程度不同的研究人员测定,计算平均值时常希望对比较可靠的数据予以突出,即将其权适当加大,这种平均值则称为加权平均值加权平均值对同一物理量用不同的方法测定,或由熟练程度不同的117数学期望将权理解为测定值xi在很大的测量总数n中出现的频率,如果代之以概率Pi,则有或者此时的加权平均值等于它的数学期望x0
数学期望将权理解为测定值xi在很大的测量总数n中出现的频率,118均方根平均值n个正的或负的变量x1,x2,…,xn,其均方根均值定义为均方根平均值n个正的或负的变量x1,x2,…,xn,其119几何平均值几何平均值是将n个正的量x1,x2,…,xn连乘再开n次所求得的值,定义如下或用对数表示为当对一组测定值xi取对数后所得的图形的分布曲线更加对称时,常用几何平均值几何平均值几何平均值是将n个正的量x1,x2,…,xn120对数平均值在实验数据分布曲线具有对数特征的情况下,表征平均值的量需要采用对数平均值。两个量x1、x2的对数平均值为变量的对数平均值总小于算术平均值,如果变量相差甚微时,可以用算术平均值代替对数平均值,而引起的误差不大对数平均值在实验数据分布曲线具有对数特征的情况下,表征平均121调和平均值如果量H的倒数等于量x1,x2,…,xn的倒数的算术平均值,即则H称为n个正量的调和平均值。调和平均值常用在需要牵涉到与一些量的倒数有关的场合。其值常小于几何平均值和算术平均值调和平均值如果量H的倒数等于量x1,x2,…,xn的倒122近似值及其在简单运算中的误差
在整理数据的任何运算中,由于原始数据只是真值的近似值,显然,计算结果亦将是具有一定误差的近似值。而且原始数据中的误差越大,则计算结果越不精确。如果原始数据中的误差为已知时,则计算结果的误差亦可定量求出。但是,计算结果不能提高数据的准确度。估计计算结果的知识是重要的,因为有了这种知识,不仅使我们能估计出计算结果的准确度,而且常可以简化计算,以及确定从手册中所查出数据应取的位数,从而使计算结果的误差不超过规定的限度。近似值及其在简单运算中的误差在整理数据的任何运算中,由于原123和的误差
对于一系列实验数据其和为则有
相对误差为或者写为由此可见,+必介于各项相对误差中最大值与最小值之间和的误差对于一系列实验数据124差的误差差的误差几乎与和式相同,设x=x1-x2
此时相对误差为需要注意避免x1、x2相差较小时的相对误差差的误差差的误差几乎与和式相同,设125乘积的误差
设则对照有相对误差为乘积的误差设126商的误差设取商后得到所以相对误差凡是连乘连除所得结果的相对误差,近似地等于各个数的相对差之和。因此,乘法与除法的运算进行得越多,则计算结果的相对误差越大。几十次乘除后,其结果的有效数字位数比原始数据中位数最少的还要少一位到两位
商的误差设127幂的误差设则其乘幂应为依二次项定理展开,即如果取其前两项,则有相对误差为绝对误差为或者
幂的误差设128根的误差设决定的误差,由二项式展开,取一次近似,得到:相对误差为绝对误差为或者因为幂升高急剧降低结果的准确度,因此,对在进一步计算中幂次升高的量,在测定中就应该特别注意。相反,要开方的量,在测定时可取较小的准确度
根的误差设决定129误差理论的基本问题误差理论中除了直接测定量的误差问题,常常需要解决的是间接测定值,即函数的误差理论,设有函数
以dx1表示x1的绝对误差,dx2表示x2的绝对误差,……,则可以得到函数误差的一般式
或者函数误差理论有三个基本课题:正问题(直接问题)、反问题和决定最有利的测定条件
误差理论的基本问题误差理论中除了直接测定量的误差问题,常常需130误差理论的正问题正问题就是函数关系以及自变量误差均为已知,求函数误差的问题,分述如下:对于一元函数,设y=f(x),则或亦即将函数展成泰勒级数:若取前两项,则得:即故相对误差为绝对误差为误差理论的正问题正问题就是函数关系以及自变量误差均为已知,131二元函数的正问题设y=f(x1,x2)则展成泰勒级数取前两项得到:最大绝对误差最大相对误差二元函数的正问题设y=f(x1,x2)则132常见函数的正问题设x、u、w为测定值,a、b、c为常数,则在下列函数中可用上式求相对误差,并估计配合得最不利的情况(1)两边取对数,得到lny=lna+lnx+lnw-lnu
微分得到相对误差为常见函数的正问题设x、u、w为测定值,a、b、c为常数,则在133常见函数的正问题(2)
lny=alnx+blnw+clnu(3)y=xulny=ulnx
常见函数的正问题(2)134常见函数的正问题(4)y=x+ulny=ln(x+u)(5)y=x-ulny=ln(x-u)(6)y=eaxlny=ax(7)y=abxlny=bxlna常见函数的正问题(4)y=x+ulny=ln(135常见函数的正问题(8)y=lgxy=0.43429lnxlny=ln(0.43429lnx)=ln0.43429+ln(lnx)常用对数的绝对误差接近于该数相对误差的一半(9)y=sinxlny=lnsinx其它函数,依次类推常见函数的正问题(8)y=lgx136多元函数的正问题对于多元函数,设y=f(x1,x2,…,xn),用数学归纳法即可知,绝对误差为相对误差将以上两式中的微分符号d换成差分符号,改写成差分式多元函数的正问题对于多元函数,设y=f(x1,x2,…,137误差理论的反问题
反问题就是如何根据函数给定的误差,来确定自变量误差的问题。此时已知条件是函数关系和函数误差。实际上,此类问题计算的结果往往可以回答:按照一定的研究方案进行实验时,应该怎样选取测定仪器的精密度的问题。与正问题不同的是,此类问题并非什么函数都能顺利解决的。从基本关系式出发现在dy是已知的,又由前述知其绝对误差为相对误差为由此可以看出,即使dy为已知,仍然无法得知dxi之值,因为它可以有无穷多个值与之项对应误差理论的反问题反问题就是如何根据函数给定的误差,来确定自138误差等传播原则一种实际可行的方案是假设各项对总误差dy的影响相同,根据这个假设,问题就变为确定的了,即认为下式成立或者由此得出其次按等传播原则,其相对误差亦可同理得出通常还需注意,在间接测定值(指一般函数)中并不全由直接测定值所组成,有时还包括若干常量,如等,其绝对误差可以任意选定。待定出绝对误差以后,再决定应取数字的位数,从而保证函数误差在给定的范围以内误差等传播原则一种实际可行的方案是假设各项对总误差dy的影139例题已知某气体的容积可按下式计算V=V0(1+aT)式中:V0为在00C时的容积;t为气体的温度,0C;=1/273,为体积膨胀系数。现欲按照上式推算1000C时的容积,要求误差不超过1%,问测量V0,,T时应该具有怎样的准确度?例题已知某气体的容积可按下式计算140题解上式的相对误差为因为则因此按照误差等传播原则,即设量V0、和T在测量时具有相同的误差,则
亦即因而,为了使小于1%,则各已知量的误差不超过1/1.54=0.65%即可。这样,就为我们选择这些量的测量仪器的精密度提供了条件题解上式的相对误差为141决定最有利的测定条件函数误差理论的第三类问题为确定合适的实验条件,在此条件下,可以得到函数y的最优概值(与真值最好的接近),亦即求出测量误差的最小所必须的条件如果引用数学上求函数极小值的方法,就可以求出此条件,而且可喜的是,一般函数均具有最小值由数学分析的知识,求相对误差最小值的条件为求解上述联立方程以求出x1,x2,…xn,原则上即可以保证y为最小时各测定值所应具有的条件决定最有利的测定条件函数误差理论的第三类问题为确定合适的实142实验的计算误差与实际误差如果在实验之前先经过计算和估计误差,那么就出现了计算误差与实际误差之间的关系问题。问题的实质是,由于通常实验的最大误差是经过计算得出的,因而,数据的分散范围必然位于的范围以内。然而,在实际上,实验时不可能所有不利因素均同时发生,故下列不等式总是成立:计算的准确度<=实验的准确度即实验的误差小于或等于计算的误差实验的计算误差与实际误差如果在实验之前先经过计算和估计误差143计算误差与实际误差偏差的原因如果实验中出现违背这个必定原则的现象时,应予以检查。通常其原因可能是未执行规定的实验条件或者仪器出毛病,以及使用不当等所造成误差来源分析不正确因此,得出实验数据后,要用实验数据来核验事前的理论计算以及个别实验条件的执行情况。如果发现问题,应当予以彻底查验计算误差与实际误差偏差的原因如果实验中出现违背这个必定原则的144误差分析在科学研究中的重要性实验的误差分析在科学研究中是至关重要的,但是可惜它还未引起人们的足够重视,有些初参加科研的人,往往不能掌握这一积极的武器,这对科学技术现代化是十分不利的。注重误差分析和来源,往往可以成倍地提高实验的准确度详尽地单独查明实验误差的来源,就有可能使研究人员了解整个实验中具有决定意义的实验部分,从而可以对它特别注意和细心控制单独研究实验误差的来源,不但可以在既定的实验方案中提高其质量,同时还可以找出最合理的研究方法及主要方案。因此,研究人员必须及时将用实验方法得到的数据加以客观评定,借以不断地改善其实验质量或改变研究方法误差分析在科学研究中的重要性实验的误差分析在科学研究中是至关145实验精度的评定
实验精度的评定146准确度与精确度实验的准确度是指所测数据与真值偏差的大小,而精确度指的是在数据测定中重复性的高低。在一组测定中如果准确度较高,则精确度必高,但是其逆定理并不成立。准确度与精确度实验的准确度是指所测数据与真值偏差的大小,而精147实验精确度的表示方法确定实验的精确度经常使用算术平均误差作为度量,即以各个测量结果与算术平均值之偏差,即残差来衡量实验的精确度。有时也可以用比较他们之间的最大残差量max来评定实验的精确度。均方差也常用于作为评定实验精确度的标准,即计算均方误差使得有可能注意到最大残差量的影响,因此,均方误差较小,表示实验数据的分布较密---密集分布在狭窄的误差范围以内,即说明测定的质量很高
实验精确度的表示方法确定实验的精确度经常使用算术平均误差作为148例题评估下列四组数据的精确度(1)5.2,5.4,5.1,5.2,5.0(2)5.0,5.2,5.0,5.1,5.1(3)5.2,5.1,5.1,5.2,5.5(4)5.2,5.0,5.3,5.0,5.3例题评估下列四组数据的精确度149题解第一组:第二组:第三组:3=0.15第四组:4=0.135通过比较算术平均误差和最大残差,可以确定第二组数据精确度最高,第一组数据其次,但是无法确定第三、四组数据的精确度,只有依据均方差才可以确定第四组数据的精确度高于第三组数据的精确度题解第一组:150精确度中的误差问题误差本身有系统误差与偶然误差之分,而且其中偶然误差无法消除。因此,要深入地评定实验质量,必须从偶然误差的随机性出发研究误差,否则整理数据时无法决定数据取舍。在同一条件下用同一方法进行实验时,其数据中存在的偶然误差应符合下列概率论公理
偶然误差的绝对值不能超过一定的界限,否则其概率为零,此界限为正负无穷大()绝对值相等的正负误差,其出现的概率亦相等绝对值小的偶然误差比绝对值大的偶然误差出现的概率大,绝对值最小的误差出现的概率最大
精确度中的误差问题误差本身有系统误差与偶然误差之分,而且其151单样品误差和整体误差假设为被测量的算术平均值与被测量真值X之间的差,并称之为测定结果的偶然误差,此时用表示各次所得测定值与真值X之差,称这些差值为个别测定或整个实验的偶然误差等式两边加和得到与下式相比较可以得到
单样品误差和整体误差假设为被测量的算术平均值与被测量真值X152结论测定结果的偶然误差就等于全部个别计算的偶然误差的算术平均值在测定次数无限增加的条件下,算术平均值就等于测定量的真值,而残差就等于相应的偶然误差全部关于偶然误差的理论推导和假说,在测定次数足够多的条件下,均可以适用于残差,由于被测量的真值和偶然误差都为未知,所以,这一条更显重要结论测定结果的偶然误差就等于全部个别计算的偶然误差的算术平153高斯误差分布定律高斯首先研究了偶然误差的数学表达形式,根据概率论和高等数学的定理找出了此函数的具体形式为代入概率积分后可以进一步得出此即误差方程,亦称为高斯误差分布定律,其中为均方误差,h为精确度指标,根据此方程画出的曲线称为误差曲线或高斯正态分布曲线高斯误差分布定律高斯首先研究了偶然误差的数学表达形式,根据概154由于在测定次数无限多的条件下,残差就等于偶然误差,那么,在测定次数极多的条件下,偶然误差的正态分布曲线对残差来说也应当是正确的。但事实上,测定次数是有限的,而且曲线就与偶然误差的正态分布曲线有所不同。如果按照多次测定的实验数据绘制的误差的分布曲线与正态分布相差很远,就表明在这些实验数据中存在系统误差,必须予以消除,如果相差很小,则为纯偶然误差。由于在测定次数无限多的条件下,残差就等于偶然误差,那么,在测155对分布曲线的影响数据的均方误差越小,e指数的绝对值越大,y减小得越快,曲线下降得越急,而在x=0处的y值也越大;反之,越大,曲线下降得更缓慢,而在x=0处的y值越小。由此可以看出,值越小,小的偶然误差出现的次数越多,测定精度也越高;当越大时,就会经常遇到大的偶然误差,即测定的精度也越差。故此,一组测定值的均方误差,完全能够表达出测定数据的精确度,亦表征着测定结果的可靠程度。对分布曲线的影响数据的均方误差越小,e指数的绝对值越大156h对分布曲线的影响h值大的曲线是奇峰突起的狭长曲线,这意味着一个精确度高的实验,因为小误差出现的概率极大;h值小的曲线低坦,这意味着实验精确度较低,因为大小误差出现的概率相差不明显;h值居中的,则表明实验精确度亦适中。故此,h可以作为实验精确度指标,由其值的大小即可以得知实验精确度的高低,而曲线下面的面积之值必等于1,即有:h对分布曲线的影响h值大的曲线是奇峰突起的狭长曲线,这意味着157计算机在材料科学中的应用课件158与h的关系假设一组测量中测定的次数为n,各个测定值的误差为X-xi,它们同时出现的概率是如果想从上式中求h的最优概值,需要将上式对h求导并令其导数值为0,于是可以得到均方误差或标准误差与精确度指标h的关系:与h的关系假设一组测量中测定的次数为n,各个测定值的误差为159按照高斯误差定律规定,由于偶然误差的存在,在一组具有同一精确度的许多测定值中,最佳值乃是能使各测定值的误差的平方和为最小的那个值。这也称为最小二乘法原理。由于小误差出现的概率远比大误差出现的概率大,在一组测定数据中,最优概值即是概率P最大时求出的那个值。从P的表达式中可以看出,要想P达到最大,e的指数项必然最小,亦即和式为最小,这就是说,必须在一组测定中误差的平方和为最小按照高斯误差定律规定,由于偶然误差的存在,在一组具有同一精确160其充分必要条件是由此得知最优概值即是算术平均值其充分必要条件是161残差的两种性质各残差的代数和为零。此性质可用来检验算术平均值计算的正确与否,只有当用近似法计算算术平均值时,才会出现很小的差别残差平方和具有最小的值残差的两种性质各残差的代数和为零。此性质可用来检验算术平均162测定次数n有限的情况平均值不等于真值,这时进行如下处理:假设为真值与算术平均值之差,即另一方面
两边平方并加和得到
测定次数n有限的情况平均值不等于真值,这时进行如下处理:假设163测定次数n有限的情况下的测定次数n有限的情况下的164最大可能误差如果已知一系列测定值的算术平均值,即可以计算出其精确度指标h,根据正态分布函数的公式就可以确定在区间由-r到+r,即时个别测定误差的概率为,
此为拉普拉斯函数(x),所以可以缩写为
当r已知时,可以根据计算出t,并查表得出误差介于(-r,+r)范围内的概率最大可能误差如果已知一系列测定值的算术平均值,即可以计165假设一组测定数据中,已知其均方误差为,那么任一观测值的误差介于之间的概率可依据下式计算出来当测定值的误差介于范围时,概率为50%,即为或然误差一个误差出现在以外的概率有0.3%,通常测定次数有限的情况下,实验误差落在之外的可能性极小,故此,为最大可能误差,也称为3规则。基于此,可以认为超出的误差已经不属于偶然误差,而是系统误差或者过失误差,这就是我们判断误差是偶然误差还是系统误差的根据,也是判断用不同方法测定同一个量时其结果是否相符的理论基础假设一组测定数据中,已知其均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司主题教育调研报告
- 低血糖的急救训练
- 2026云南楚雄州南华县龙川小学本部临聘音乐教师招聘1人考试备考试题及答案解析
- 押运公司方案
- 2025年四川汽车职业技术学院单招职业适应性测试试题及答案解析
- 2026广西来宾市象州县妇幼保健院公开招聘3人笔试备考试题及答案解析
- 2026年度周口市招聘基层卫生专业技术人员984人笔试备考题库及答案解析
- 2025年山东理工职业学院单招职业适应性测试题库及答案解析
- 2026广东云浮市新兴县林业局招聘1人考试备考题库及答案解析
- 2025年兰州外语职业学院单招职业技能考试题库及答案解析
- 湘教版八年级上册初二数学全册单元测试卷(含期中期末试卷)
- 2023年常州市社区工作者招聘考试真题
- 机场人脸识别安检方案介绍
- 产业经济学-王俊豪主编
- YS/T 690-2009天花吊顶用铝及铝合金板、带材
- GB/T 5782-2016六角头螺栓
- GB/T 4937.3-2012半导体器件机械和气候试验方法第3部分:外部目检
- GB/T 4456-2008包装用聚乙烯吹塑薄膜
- GB/T 41-20161型六角螺母C级
- GB/T 3075-2021金属材料疲劳试验轴向力控制方法
- GB/T 29128-2012船舶固定式气体灭火系统通用要求
评论
0/150
提交评论