版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、*试验设计与数据处理的发展概况试验设计与数据处理的发展概况 20世纪世纪20年代,英国生物统计学家及数学家费歇年代,英国生物统计学家及数学家费歇(RAFisher)提出了)提出了方差分析方差分析 20世纪世纪50年代,日本统计学家田口玄一将试验设计中应用年代,日本统计学家田口玄一将试验设计中应用最广的最广的正交设计正交设计表格化表格化 数学家华罗庚教授也在国内积极倡导和普及的数学家华罗庚教授也在国内积极倡导和普及的“优选法优选法” 我国数学家王元和方开泰于我国数学家王元和方开泰于1978年首先提出了年首先提出了均匀设计均匀设计 绪论绪论本课程研究内容:本课程研究内容: 研究如何合理地安排实验,
2、有效地获得实验研究如何合理地安排实验,有效地获得实验数据,然后对实验数据进行综合的科学分析,以数据,然后对实验数据进行综合的科学分析,以求尽快达到优化实验的目的。求尽快达到优化实验的目的。本课程开设的目的:本课程开设的目的: 将数学的纯理论转向实际应用,利用数学工将数学的纯理论转向实际应用,利用数学工具解决实际的化学、化工及环境专业问题,无论具解决实际的化学、化工及环境专业问题,无论是对于目前大家即将面临的专业课学习、毕业论是对于目前大家即将面临的专业课学习、毕业论文实验,还是将来的生产实践,都是很有必要的。文实验,还是将来的生产实践,都是很有必要的。试验设计与数据处理试验设计与数据处理所要解
3、决的问题所要解决的问题 在自然界中,有很多的现象是没有一个特定的规律在自然界中,有很多的现象是没有一个特定的规律即即没有一个数学模型,是不能用我们以前所学的知识所能解没有一个数学模型,是不能用我们以前所学的知识所能解决的,在我们化学研究领域更是如此。比如我们在材料研决的,在我们化学研究领域更是如此。比如我们在材料研究中,要研制一种新型纳米材料,它是由许多种原材料配究中,要研制一种新型纳米材料,它是由许多种原材料配合,再通过一定的反应过程而成。可以用多少种材料来配合,再通过一定的反应过程而成。可以用多少种材料来配料,需要什么样的反应条件,这都是未知数。而且没有一料,需要什么样的反应条件,这都是未
4、知数。而且没有一定的规律可言。那就需要我们进行大量的试验来寻找它的定的规律可言。那就需要我们进行大量的试验来寻找它的配方及反应条件。试验设计所要作的工作就是用最少的试配方及反应条件。试验设计所要作的工作就是用最少的试验次数,尽快找出这些参数的最佳范围。数据处理是对试验次数,尽快找出这些参数的最佳范围。数据处理是对试验数据进行分析后,去掉那些对试验影响不大的因素,来验数据进行分析后,去掉那些对试验影响不大的因素,来确定最佳的试验方案确定最佳的试验方案。二、关于实验设计与数据处理二、关于实验设计与数据处理本课程中主要应用的是数理统计中的统计方法理论,主要考本课程中主要应用的是数理统计中的统计方法理
5、论,主要考虑的是与实验设计有关的分析并解释实验结果的统计方法。虑的是与实验设计有关的分析并解释实验结果的统计方法。如误差检验、方差分析、回归分析等。如误差检验、方差分析、回归分析等。凡是涉及到数据的问题,只要数据中包含有相当大的实验误凡是涉及到数据的问题,只要数据中包含有相当大的实验误差,则获得满意结果的唯一稳妥的处理方法就是统计方法,差,则获得满意结果的唯一稳妥的处理方法就是统计方法,除此之外别无他择。除此之外别无他择。统计方法统计方法应当作为从事工业生产的科技人员所必须掌握的一应当作为从事工业生产的科技人员所必须掌握的一门技术,用来有效地处理工业生产中的各种问题。门技术,用来有效地处理工业
6、生产中的各种问题。鉴于此,本课程重点讲授鉴于此,本课程重点讲授应用统计学理论来解决化学、化工应用统计学理论来解决化学、化工及环境科学与工程中的遇到的实验问题。及环境科学与工程中的遇到的实验问题。举例说明统计学在环境科学中的应用:举例说明统计学在环境科学中的应用:“化工厂经常把有毒废弃物排放到附近的河流中,这些有毒化化工厂经常把有毒废弃物排放到附近的河流中,这些有毒化学品对栖息在河流中的动植物往往会产生有害的影响。众所学品对栖息在河流中的动植物往往会产生有害的影响。众所周知的周知的DDT就对鱼类特别有害。对生活在某河流中的鱼类进就对鱼类特别有害。对生活在某河流中的鱼类进行行DDT含量的调查曾是一
7、项研究工作的一部分。该河流是一含量的调查曾是一项研究工作的一部分。该河流是一条东西流向的河流,穿过一个水库,生态学家担心受污染的条东西流向的河流,穿过一个水库,生态学家担心受污染的鱼会从河口迁移到水库危及那里的依赖鱼类生存的其他野生鱼会从河口迁移到水库危及那里的依赖鱼类生存的其他野生动物。该河干流及其支流的鱼是否被动物。该河干流及其支流的鱼是否被DDT污染?受污染的鱼污染?受污染的鱼能迁移到上游多远的地方?(提出了假设)能迁移到上游多远的地方?(提出了假设) 为了回答这个问题,调查组沿着该河干流和支流进行了实地为了回答这个问题,调查组沿着该河干流和支流进行了实地考察,在不同的地段采集鱼样共考察
8、,在不同的地段采集鱼样共144条(由假设拟定抽样调条(由假设拟定抽样调查的方案);对采集来的鱼样进行分类、称重、测量长度,查的方案);对采集来的鱼样进行分类、称重、测量长度,然后用有机溶剂提取鱼肉中的然后用有机溶剂提取鱼肉中的DDT,测定鱼肉中的,测定鱼肉中的DDT含含量(从调查和试验中获取数据)。很明显,这项调查并不是量(从调查和试验中获取数据)。很明显,这项调查并不是去捕捞河里所有的鱼,去捕捞河里所有的鱼,144个个DDT测定值代表着从河中之鱼测定值代表着从河中之鱼DDT含量这个总体中收集的一个样本,利用收集到的数据可含量这个总体中收集的一个样本,利用收集到的数据可以比较不同地段和不同鱼种
9、之间鱼肉中以比较不同地段和不同鱼种之间鱼肉中DDT的含量,并确定的含量,并确定鱼的长度和重量与鱼的长度和重量与DDT含量之间是否有定量关系等等(分析含量之间是否有定量关系等等(分析数据数据从样本推断总体)。从样本推断总体)。 此例题说明了对环境问题的分析程序是:提出假设此例题说明了对环境问题的分析程序是:提出假设采样采样获取数据获取数据分析数据分析数据从样本推断总体。从样本推断总体。涉及到的一些基本术语:涉及到的一些基本术语:总体总体:欲研究对象的全体,又称母体欲研究对象的全体,又称母体个体个体:组成总体的每个单元为个体(总体单位)组成总体的每个单元为个体(总体单位)样本样本:总体的一部分,即
10、从总体中抽取的部分总体的一部分,即从总体中抽取的部分 个体(子样)个体(子样)数据数据(data):对研究对象进行调查和观察的结果。对研究对象进行调查和观察的结果。 (定性数据、定量数据)(定性数据、定量数据)变量变量(variable):具有变异性的特征或性状的量具有变异性的特征或性状的量变量:采集地点、鱼种、鱼长、鱼重、鱼中变量:采集地点、鱼种、鱼长、鱼重、鱼中DDT的浓度的浓度定量数据:鱼长、鱼重、定量数据:鱼长、鱼重、DDT浓度产生的数据浓度产生的数据定性数据:采集地点、鱼种变量产生的数据定性数据:采集地点、鱼种变量产生的数据试验设计与数据处理的意义试验设计与数据处理的意义试验设计的目
11、的试验设计的目的: 合理地安排试验合理地安排试验,力求用较少的试验次数获得较好结果力求用较少的试验次数获得较好结果 例:某试验研究了例:某试验研究了3个影响因素:个影响因素: A:A1,A2,A3 B:B1,B2,B3 C:C1,C2,C3 全面试验:全面试验:27次次 正交试验:正交试验:9次次数据处理的目的数据处理的目的通过误差分析,评判试验数据的可靠性;通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,提高试确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;验效率;确定试验因素与试验结果之间存在的近似函数关系,并确定试验因素与试验结果之间存在的近似函数关
12、系,并能对试验结果进行预测和优化;能对试验结果进行预测和优化;试验因素对试验结果的影响规律,为控制试验提供思路;试验因素对试验结果的影响规律,为控制试验提供思路;确定最优试验方案或配方。确定最优试验方案或配方。实验可归纳为以下几种类型:实验可归纳为以下几种类型:(1)物化性质研究:)物化性质研究: 一般不常用统计方法;一般不常用统计方法;(2)产品、原料等的常规分析:)产品、原料等的常规分析: 系统误差大于随机误差,对误差需进行一定的设计,系统误差大于随机误差,对误差需进行一定的设计,若想获得可靠的估计值,最好的方法就是采用统计方法;若想获得可靠的估计值,最好的方法就是采用统计方法;(3)材料
13、特性试验:)材料特性试验: 随机误差较大,随机误差较大, 为了获得可靠的估计值,必须从相当为了获得可靠的估计值,必须从相当数量的观测值中取均值,凡是涉及此类实验的研究工作,数量的观测值中取均值,凡是涉及此类实验的研究工作,均需采用统计法的合理设计;均需采用统计法的合理设计;(4)过程研究:)过程研究:主要涉及的是各种实验条件的优化实验,主要涉及的是各种实验条件的优化实验,需要对各种条件变化对过程的影响进行系统性研究,需要需要对各种条件变化对过程的影响进行系统性研究,需要用到统计法的实验设计与数据处理知识。用到统计法的实验设计与数据处理知识。本课程的讲授内容安排本课程的讲授内容安排(1)数据处理
14、基础:)数据处理基础:误差理论、数据的表误差理论、数据的表示方法;示方法;(2)数据处理部分:)数据处理部分:有限数据的统计处理、有限数据的统计处理、方差分析、回归分析;方差分析、回归分析;(3)实验设计部分:)实验设计部分:优选法实验设计、正优选法实验设计、正交实验设计。交实验设计。4、教材、教材试验设计与数据处理试验设计与数据处理(第二版),李(第二版),李云雁、胡传荣编著,化工出版社,云雁、胡传荣编著,化工出版社,2008第1章 试验数据的误差分析第1章 试验数据的误差分析1、 数据测量 1.1 1.1 数据测量的基本概念数据测量的基本概念 (1) (1) 物理量物理量物理量是反映任何物
15、理现象的状态及其过程特征的数值量。任何物理量是反映任何物理现象的状态及其过程特征的数值量。任何物理量一般都有如下特点:物理量都是有相应的单位,数值为物理量一般都有如下特点:物理量都是有相应的单位,数值为1 1的物理量称为单位物理量;同一物理量可以用不同的物理单位来的物理量称为单位物理量;同一物理量可以用不同的物理单位来描述,如能量可以用焦耳、千瓦小时等不同单位来表述。描述,如能量可以用焦耳、千瓦小时等不同单位来表述。(2)(2)测量测量以确定量值为目的的一组操作。操作的结果可得到量值,即得到以确定量值为目的的一组操作。操作的结果可得到量值,即得到数据,这组操作称为测量。例如:用米尺测得桌子的长
16、度为数据,这组操作称为测量。例如:用米尺测得桌子的长度为1.21.2米。米。(3)(3)测量结果测量结果测量结果就是根据已有的信息和条件对被测量物理量的最佳估计,测量结果就是根据已有的信息和条件对被测量物理量的最佳估计,既是物理量真值的最佳估计。在测量结果的完整表述中,应包括既是物理量真值的最佳估计。在测量结果的完整表述中,应包括测量误差,必要时还应给出自由度及置信概率。测量结果具有重测量误差,必要时还应给出自由度及置信概率。测量结果具有重复性和复现性。复性和复现性。重复性是指在相同测量条件下,对同一被物理量进行连续多次测量所重复性是指在相同测量条件下,对同一被物理量进行连续多次测量所得结果之
17、间的一致性。相同测量条件既称之为得结果之间的一致性。相同测量条件既称之为“重复性条件重复性条件”主要包主要包括:相同的测量程序、相同的测量仪器、相同的观测者、相同的地点、括:相同的测量程序、相同的测量仪器、相同的观测者、相同的地点、在短期内的重复测量、相同的测量环境。若每次的测量条件相同,则在短期内的重复测量、相同的测量环境。若每次的测量条件相同,则在一定的误差范围内,每一次测量结果的可靠性是相同的,这些测量在一定的误差范围内,每一次测量结果的可靠性是相同的,这些测量值服从同一分布。值服从同一分布。复现性是指在改变测量条件下,对被测量进行多次测量时,每一次测复现性是指在改变测量条件下,对被测量
18、进行多次测量时,每一次测量结果之间的一致性。即在一定的误差范围内,每一次测量结果的可量结果之间的一致性。即在一定的误差范围内,每一次测量结果的可靠性是相同的,这些测量值服从同一分布。靠性是相同的,这些测量值服从同一分布。(4)(4)测量方法测量方法根据给定的测量原理,在测量中所用的并按类别描述的一组操作逻辑根据给定的测量原理,在测量中所用的并按类别描述的一组操作逻辑次序和划分方法,常见的有替代法、微差法、零位法、异号法等。次序和划分方法,常见的有替代法、微差法、零位法、异号法等。数据测量就是用单位物理量去描述或表示某一未知的同类物理量的大数据测量就是用单位物理量去描述或表示某一未知的同类物理量
19、的大小。小。1. 2 1. 2 数据测量的分类数据测量的分类 一、按计量的性质分为:检定、检验和校准一、按计量的性质分为:检定、检验和校准检定:由法定计量部门检定:由法定计量部门, ,为确定和证实计量器具是否完全满足检定规程的要求而进行的为确定和证实计量器具是否完全满足检定规程的要求而进行的全部工作。检定是由国家法定计量部门所进行的测量,在我国主要是由各级计量院所全部工作。检定是由国家法定计量部门所进行的测量,在我国主要是由各级计量院所以及授权的实验室来完成,是我国开展量值传递最常用的方法。检定必须严格按照检以及授权的实验室来完成,是我国开展量值传递最常用的方法。检定必须严格按照检定规程运作,
20、对所检仪器给出符合性判断,既给出合格还是不合格的结论,而该结论定规程运作,对所检仪器给出符合性判断,既给出合格还是不合格的结论,而该结论具有法律效应。检定方法一般分为整体检定法和分项检定法两种。具有法律效应。检定方法一般分为整体检定法和分项检定法两种。检测:对给定的产品、材料、设备、生物体、物理现象、工艺过程或服务,按照一定检测:对给定的产品、材料、设备、生物体、物理现象、工艺过程或服务,按照一定的程序确定一种或多种特性或性能的技术操作。检测通常是依据相关标准对产品的质的程序确定一种或多种特性或性能的技术操作。检测通常是依据相关标准对产品的质量进行检验,检验结果一般记录在称为检测报告或检测证书
21、的文件中。量进行检验,检验结果一般记录在称为检测报告或检测证书的文件中。校准校准: :在规定条件下,为确定测量仪器或测量系统所指示的量值,或实物量具或参考物在规定条件下,为确定测量仪器或测量系统所指示的量值,或实物量具或参考物质所代表的量值,与对应的由标准所呈现的量值之间关系的一组操作。质所代表的量值,与对应的由标准所呈现的量值之间关系的一组操作。二、按测量目的的分类分为:定值测量和参数检验二、按测量目的的分类分为:定值测量和参数检验定值测量定值测量: :按一种不确定度确定参数实际值的测量。其目的是确定被测量的量值是多少按一种不确定度确定参数实际值的测量。其目的是确定被测量的量值是多少, ,
22、通常预先限定允许的测量误差。通常预先限定允许的测量误差。参数检验:以技术标准、规范或检定规程为依据,判断参数是否合格的测量。其目的参数检验:以技术标准、规范或检定规程为依据,判断参数是否合格的测量。其目的是判断被检参数是否合格,通常预先限定参数允许变化的范围(如公差等)。是判断被检参数是否合格,通常预先限定参数允许变化的范围(如公差等)。 三、按测量值获得的方法分为:三、按测量值获得的方法分为:直接测量、间接测量和组合测量直接测量、间接测量和组合测量(一)直接测量法(一)直接测量法 用一个预先标定好的测量仪器去直接测量未用一个预先标定好的测量仪器去直接测量未知物理量的大小。如用万用表去测量电压
23、、电阻、知物理量的大小。如用万用表去测量电压、电阻、电流等;用圈尺去测量长度;用磅称测量重量等。电流等;用圈尺去测量长度;用磅称测量重量等。 直接测量可表示为直接测量可表示为 y = xy = x 式中式中 y y 表示被测量的未知量,表示被测量的未知量,x x 为直接测得的量。为直接测得的量。 在由若干基本物理单位导出的物理量中,有在由若干基本物理单位导出的物理量中,有相当多的量是无法用仪表直接测出的,如粉磨效相当多的量是无法用仪表直接测出的,如粉磨效率、选粉机的效率等。此时只能用间接测量法进率、选粉机的效率等。此时只能用间接测量法进行测量。行测量。 (二)间接测量法(二)间接测量法把直接测
24、量代入某一特定的函数关系式中,通过计算求出未知把直接测量代入某一特定的函数关系式中,通过计算求出未知物理量的大小,这种方法物理量的大小,这种方法间接测量法。间接测量法。 例如,用毕托管测量气流速度例如,用毕托管测量气流速度 ,直接测量压差值,直接测量压差值 h。计算计算 的特定函数关系式为的特定函数关系式为 11210002hg (12)式中:式中: h U h U 型差压计的读数;型差压计的读数; 毕托管速度系数;毕托管速度系数; g g 重力加速度;重力加速度; 流体和差压计中流体密度。流体和差压计中流体密度。21,间接测量通用的函数关系式为间接测量通用的函数关系式为式中:式中:y 间接测
25、量量,间接测量量, 直接测量量。直接测量量。),(21xxfy ,21xx(三)组合测量法(三)组合测量法 要测量出要测量出x和和y,分别对,分别对x+y和和x-y进行直接测量,得到进行直接测量,得到测量值分别为测量值分别为l1和和l2,可得测量方程组:,可得测量方程组: 解方程组得: 组合测量可以用如下的通用联立方程组表示 0),(0),(0),(21212121221211nnnnyyyxxfyyyxxfyyyxxf式中:f1、f2、fn 表示组合测量中的函数关系 x1 、x2、 直接测量的物理量 y1、y2、 未知的物理量 误差分析(误差分析(error analysis) :对原始数据
26、的可靠性进:对原始数据的可靠性进行客观的评定行客观的评定 误差(误差(error) :试验中获得的试验值与它的客观真实:试验中获得的试验值与它的客观真实值在数值上的不一致值在数值上的不一致 试验结果都具有误差,误差自始至终存在于一切科学试验结果都具有误差,误差自始至终存在于一切科学实验过程中实验过程中 客观真实值客观真实值真值真值1.3 误差的概念误差的概念1.3.1 真值与平均值真值与平均值 真值(真值(true value) 真值:在某一时刻和某一状态下,某量的真值:在某一时刻和某一状态下,某量的客观值客观值或或实际值实际值 真值一般是未知的真值一般是未知的 相对的意义上来
27、说,真值又是已知的相对的意义上来说,真值又是已知的 平面三角形三内角之和恒为平面三角形三内角之和恒为180 国家标准样品的标称值国家标准样品的标称值 国际上公认的计量值国际上公认的计量值 高精度仪器所测之值高精度仪器所测之值 多次试验值的平均值多次试验值的平均值 平均值(平均值(mean) (1)算术平均值()算术平均值(arithmetic mean)121.ninixxxxxnnn 等精度试验值等精度试验值适合:适合:n 试验值服从正态分布试验值服从正态分布(2)加权平均值)加权平均值(weighted mean) 适合不同试验值的精度或可靠性不一致时适合不同试验值的精度或可
28、靠性不一致时1 1221121.Wniinninniiw xw xw xw xxwwwwwi权重权重加权和加权和(3)对数平均值()对数平均值(logarithmic mean)说明:说明: 若数据的分布具有对数特性,则宜使用对数平均值若数据的分布具有对数特性,则宜使用对数平均值 对数平均值对数平均值算术平均值算术平均值 如果如果1/2x1/x22 时,可用算术平均值代替时,可用算术平均值代替121221121221lnlnlnlnLxxxxxxxxxxxxx设两个数:设两个数:x10,x2 0 ,则,则(4)几何平均值()几何平均值(geometric mean) 当一组试验值取对数后所得数
29、据的分布曲线更加对称当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。时,宜采用几何平均值。 几何平均值几何平均值算术平均值算术平均值11212.(.)Gnnnnxx xxx xx设有设有n个正试验值:个正试验值:x1,x2,xn,则,则(5)调和平均值()调和平均值(harmonic mean) 常用在涉及到与一些量的倒数有关的场合常用在涉及到与一些量的倒数有关的场合 调和平均值调和平均值几何平均值几何平均值算术平均值算术平均值1121111.1ninixxxxHnn设有设有n个正试验值:个正试验值:x1,x2,xn,则:,则:1.3.2 误差的基本概念误差的基本概念1.3
30、.2.1 绝对误差(绝对误差(absolute error) (1)定义)定义 绝对误差试验值真值绝对误差试验值真值 或或maxtxxxx txxx (2)说明)说明n真值未知,绝对误差也未知真值未知,绝对误差也未知n 可以估计出绝对误差的范围:可以估计出绝对误差的范围:绝对误差限或绝对误差上界绝对误差限或绝对误差上界 或或maxtxxx 绝对误差估算方法:绝对误差估算方法: 最小刻度的一半为绝对误差;最小刻度的一半为绝对误差; 最小刻度为最大绝对误差;最小刻度为最大绝对误差; 根据仪表精度等级计算:根据仪表精度等级计算: 绝对误差绝对误差=量程量程精度等级精度等级% 相对误差(
31、相对误差(relative error) (1)定义:)定义:绝对误差相对误差真值tRttxxxExx或或 或或RxEx(2)说明:)说明:n 真值未知,常将真值未知,常将x与试验值或平均值之比作为相对误差:与试验值或平均值之比作为相对误差:RxEx或或n 可以估计出相对误差的大小范围:可以估计出相对误差的大小范围:maxRttxxExx相对误差限或相对误差上界相对误差限或相对误差上界 n 相对误差常常表示为百分数(相对误差常常表示为百分数(%)或千分数()或千分数() (1)tRxxE 算术平均误差算术平均误差 (average discrepancy) 定义式:定义式:11n
32、niiiixxdnn n可以反映一组试验数据的误差大小可以反映一组试验数据的误差大小 ixx试验值试验值与算术平均值与算术平均值之间的偏差之间的偏差 id 标准误差标准误差 (standard error) 当试验次数当试验次数n无穷大时,总体标准差:无穷大时,总体标准差:222111()() /nnniiiiiixxxxnnn22221111()() /111nnnniiiiiiiidxxxxnsnnnn 试验次数为有限次时,样本标准差:试验次数为有限次时,样本标准差:n表示试验值的精密度,标准差表示试验值的精密度,标准差,试验数据精密度,试验数据精密度(1)定义:)定义:以不
33、可预知的规律变化着的误差,绝对误差时以不可预知的规律变化着的误差,绝对误差时正时负,时大时小正时负,时大时小(2)产生的原因:)产生的原因: 偶然因素偶然因素(3)特点:具有统计规律)特点:具有统计规律小误差比大误差出现机会多小误差比大误差出现机会多正、负误差出现的次数近似相等正、负误差出现的次数近似相等当试验次数足够多时,误差的平均值趋向于零当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差可以通过增加试验次数减小随机误差随机误差不可完全避免的随机误差不可完全避免的 1.4 试验数据误差的来源及分类试验数据误差的来源及分类1.4.2 系统误差(系统误差(systema
34、tic error) (1)定义:)定义: 一定试验条件下,由某个或某些因素按照某一一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差确定的规律起作用而形成的误差 (2)产生的原因:)产生的原因:多方面多方面(3)特点:)特点: 系统误差大小及其符号在同一试验中是恒定的系统误差大小及其符号在同一试验中是恒定的 它不能通过多次试验被发现,也不能通过取多次试验值的它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小平均值而减小 只要对系统误差产生的原因有了充分的认识,才能对它进只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。行校正,或设法消除。 1
35、.4.3 过失误差过失误差 (mistake )(1)定义:)定义: 一种显然与事实不符的误差一种显然与事实不符的误差(2)产生的原因:)产生的原因: 实验人员粗心大意造成实验人员粗心大意造成 (3)特点:)特点: 可以完全避免可以完全避免 没有一定的规律没有一定的规律 1.4.1 精密度(精密度(precision) (1)含义:)含义: 反映了随机误差大小的程度反映了随机误差大小的程度 在一定的试验条件下,多次试验值的彼此符合程度在一定的试验条件下,多次试验值的彼此符合程度 例:甲:例:甲:11.45,11.46,11.45,11.44 乙:乙:11.39,11.45,11.46,11.5
36、0(2)说明:)说明: 可以通过增加试验次数而达到提高数据精密度的目的可以通过增加试验次数而达到提高数据精密度的目的 试验数据的精密度是建立在数据用途基础之上的试验数据的精密度是建立在数据用途基础之上的 试验过程足够精密,则只需少量几次试验就能满足要求试验过程足够精密,则只需少量几次试验就能满足要求 1.5 试验数据的精准度试验数据的精准度 (3)精密度判断)精密度判断 极差(极差(range)222111()() /nnniiiiiixxxxnnnmaxminRxx标准差(标准差(standard error)222111()() /11nnniiiiiixxxxnsnnR,精密度,精密度标
37、准差标准差,精密度,精密度方差(方差(variance) 标准差的平方:标准差的平方: 样本方差(样本方差( s2 ) 总体方差(总体方差(2 ) 方差方差,精密度,精密度1.4.2 正确度(正确度(correctness) (1)含义:反映系统误差的大小)含义:反映系统误差的大小(2)正确度与精密度的关系:)正确度与精密度的关系:n 精密度不好,但当试验次数相当多时,有时也会得到精密度不好,但当试验次数相当多时,有时也会得到好的正确度好的正确度 n 精密度高并不意味着正确度也高精密度高并不意味着正确度也高 (a)(b)(c)1.4.3 准确度(准确度(accuracy) (1)含义:)含义:
38、 反映了系统误差和随机误差的综合反映了系统误差和随机误差的综合 表示了试验结果与真值的一致程度表示了试验结果与真值的一致程度(2)三者关系)三者关系 无系统误差的试验无系统误差的试验 精密度精密度 :ABC正确度:正确度: ABC准确度:准确度: ABC 有系统误差的试验有系统误差的试验 精密度精密度 :A B C 准确度:准确度: A B C ,A B,C1.5.1 随机误差的检验随机误差的检验 1.5 试验数据误差的统计假设检验试验数据误差的统计假设检验 2检验(检验( 2-test) (1)目的:)目的:对试验数据的随机误差或精密度进行检验。对试验数据的随机误差或精密度进行
39、检验。 在试验数据的总体方差在试验数据的总体方差2已知的情况下,已知的情况下,(2)检验步骤:)检验步骤:若试验数据若试验数据12,nx xx服从正态分布,则服从正态分布,则 计算统计量计算统计量2222(1)ns查临界值查临界值2()df 1dfn2服从自由度为服从自由度为的的分布分布显著性水平显著性水平 一般取一般取0.01或或0.05,表示有显著差异的概率,表示有显著差异的概率n 双侧(尾)检验双侧(尾)检验(two-sided/tailed test) :222122检验检验 若若则判断两方差无显著差异,否则有显著差异则判断两方差无显著差异,否则有显著差异 单侧(尾)检验单侧(尾)检验
40、(one-sided/tailed test) : 左侧(尾)检验左侧(尾)检验 :22(1)()df则判断该方差与原总体方差无显著减小,否则有显著减小则判断该方差与原总体方差无显著减小,否则有显著减小 右侧(尾)检验右侧(尾)检验 22()df则判断该方差与原总体方差无显著增大,否则有显著增大则判断该方差与原总体方差无显著增大,否则有显著增大 若若若若 F检验检验(F-test) (1)目的:)目的: 对两组具有正态分布的试验数据之间的精密度进行比较对两组具有正态分布的试验数据之间的精密度进行比较 (2)检验步骤检验步骤计算统计量计算统计量1(1)(1)(1)12,nxxx2(
41、2)(2)(2)12,nxxx21s21s设有两组试验数据:设有两组试验数据:都服从正态分布,样本方差分别为都服从正态分布,样本方差分别为和和和和,则,则2122sFs111dfn221dfn第一自由度为第一自由度为第二自由度为第二自由度为服从服从F分布,分布, 查临界值查临界值给定的显著水平给定的显著水平111dfn221dfn查查F分布表分布表临界值临界值n 双侧(尾)检验双侧(尾)检验(two-sided/tailed test) :检验检验 若若则判断两方差无显著差异,否则有显著差异则判断两方差无显著差异,否则有显著差异 1212(1)22(,)(,)Fdf dfFFdf df 单侧(
42、尾)检验单侧(尾)检验(one-sided/tailed test) : 左侧(尾)检验左侧(尾)检验 :则判断该判断方差则判断该判断方差1 1比方差比方差2 2无显著减小,否则有显著减小无显著减小,否则有显著减小 右侧(尾)检验右侧(尾)检验 则判断该方差则判断该方差1比方差比方差2无显著增大,否则有显著增大无显著增大,否则有显著增大 若若若若(1)12(,)FFdf df12(,)FF df df1.5.2 系统误差的检验系统误差的检验 t检验法检验法 (1)平均值与给定值比较)平均值与给定值比较 目的:检验服从正态分布数据的算术平均值是否与给定值目的:检验服从正态分布数据的
43、算术平均值是否与给定值有显著差异有显著差异检验步骤:检验步骤: 计算统计量:计算统计量: 0 xtns服从自由度服从自由度1dfn的的t分布分布(t-distribution) 0给定值(可以是真值、期望值或标准值)给定值(可以是真值、期望值或标准值) 双侧检验双侧检验 :若若2tt则可判断该平均值与给定值无显著差异,否则就有显著差异则可判断该平均值与给定值无显著差异,否则就有显著差异 n 单侧检验单侧检验 左侧检验左侧检验 0t tt若若且且则判断该平均值与给定值无显著减小,否则有显著减小则判断该平均值与给定值无显著减小,否则有显著减小 右侧检验右侧检验 0t tt若若且且则判断该平均值与给
44、定值无显著增大,否则有显著增大则判断该平均值与给定值无显著增大,否则有显著增大 (2)两个平均值的比较)两个平均值的比较 目的:判断两组服从正态分布数据的算术平均值有无显著目的:判断两组服从正态分布数据的算术平均值有无显著差异差异计算统计量:计算统计量: 两组数据的方差无显著差异时两组数据的方差无显著差异时 121212xxn ntsnn服从自由度服从自由度122dfnn的的t分布分布 s合并标准差:合并标准差:22112212(1)(1)2nsnssnn 两组数据的精密度或方差有显著差异时两组数据的精密度或方差有显著差异时 12221212xxtssnn服从服从t t分布,其自由度为:分布,
45、其自由度为: 22211222222112212()2()()(1)(1)snsndfsnsnnn t检验检验 双侧检验双侧检验 :若若2tt则可判断两平均值无显著差异,否则就有显著差异则可判断两平均值无显著差异,否则就有显著差异 n 单侧检验单侧检验 左侧检验左侧检验 0t tt若若且且则判断该平均值则判断该平均值1较平均值较平均值2无显著减小,否则有显著减小无显著减小,否则有显著减小 右侧检验右侧检验 0t tt若若且且则判断该平均值则判断该平均值1较平均值较平均值2无显著增大,否则有显著增大无显著增大,否则有显著增大 (3)成对数据的比较)成对数据的比较 目的:试验数据是成对出现,判断两
46、种方法、两种仪器目的:试验数据是成对出现,判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差或两分析人员的测定结果之间是否存在系统误差计算统计量:计算统计量: 0dddtns成对测定值之差的算术平均值:成对测定值之差的算术平均值: d0d零或其他指定值零或其他指定值 11nniiiixxddnnds n对试验值之差值的样本标准差:对试验值之差值的样本标准差: 21()1niidddsn服从自由度为服从自由度为1dfn的的t分布分布 t检验检验 若若2tt否则两组数据之间存在显著的系统误差否则两组数据之间存在显著的系统误差 ,则成对数据之间不存在显著的系统误差,则成对数据之间不存在
47、显著的系统误差, 秩和检验法(秩和检验法(rank sum test)(1)目的:两组数据或两种试验方法之间是否存在系统误差、)目的:两组数据或两种试验方法之间是否存在系统误差、两种方法是否等效等两种方法是否等效等 ,不要求数据具有正态分布,不要求数据具有正态分布 (2)内容:)内容: 设有两组试验数据,相互独立设有两组试验数据,相互独立 ,n1,n2分别是两组数据的个分别是两组数据的个数数 ,假定,假定 n1n2; 将这个试验数据混在一起,按从小到大的次序排列将这个试验数据混在一起,按从小到大的次序排列 每个试验值在序列中的次序叫作该值的每个试验值在序列中的次序叫作该值的秩(秩
48、(rank) 将属于第将属于第1组数据的秩相加,其和记为组数据的秩相加,其和记为R1 R1第第1组数据的组数据的秩和(秩和(rank sum) 如果两组数据之间无显著差异,则如果两组数据之间无显著差异,则R1就不应该太大或太小就不应该太大或太小 查秩和临界值表:查秩和临界值表: 根据显著性水平根据显著性水平 和和n1,n2,可查得,可查得R1的上下限的上下限T2和和T1 检验:检验: 如果如果R1T2 或或R1 T1,则认为两组数据有显著差异,另,则认为两组数据有显著差异,另一组数据有系统误差一组数据有系统误差 如果如果T1R1T2,则两组数据无显著差异,另一组数据,则两组数据无显著差异,另一
49、组数据也无系统误差也无系统误差 (3)例:)例: 设甲、乙两组测定值为:设甲、乙两组测定值为: 甲:甲:8.6,10.0,9.9,8.8,9.1,9.1 乙:乙:8.7,8.4,9.2,8.9,7.4,8.0,7.3,8.1,6.8已知甲组数据无系统误差,试用秩和检验法检验乙组测已知甲组数据无系统误差,试用秩和检验法检验乙组测定值是否有系统误差。(定值是否有系统误差。( 0.05)解解:(1)排序:)排序:秩秩1234567891011.511.5131415甲甲9.19.910.0乙乙8.08.99.2(2)求秩和)求秩和R1 R1=79
50、11.511.5141568(3)查秩和临界值表)查秩和临界值表 对于对于 0.05, n1=6,n2=9得得 T1=33,T263,R1T2 故:两组数据有显著差异,乙组测定值有系统误差故:两组数据有显著差异,乙组测定值有系统误差 秩和临界值表秩和临界值表 1.5.3 异常值的检验异常值的检验 可疑数据、离群值、异常值可疑数据、离群值、异常值 一般处理原则为:一般处理原则为: 在试验过程中,若发现异常数据,应停止试验,分析原因,在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误及时纠正错误 试验结束后,在分析试验结果时,如发现异常数据,则应试验结束后,在分析试验结果时,如发现异
51、常数据,则应先找出产生差异的原因,再对其进行取舍先找出产生差异的原因,再对其进行取舍 在分析试验结果时,如不清楚产生异常值的确切原因,则在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据进行应对数据进行统计处理统计处理;若数据较少,则可重做一组数据;若数据较少,则可重做一组数据 对于舍去的数据,在试验报告中应注明舍去的原因或所选对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计方法用的统计方法 拉依达(拉依达( )检验法)检验法内容:内容: 可疑数据可疑数据xp ,若,若32pxxss或则应将该试验值剔除。则应将该试验值剔除。 说明:说明:n计算平均值及标准偏差
52、计算平均值及标准偏差s 时,应包括可疑值在内时,应包括可疑值在内n 3s相当于显著水平相当于显著水平 0.01,2s相当于显著水平相当于显著水平 0.05 Pauta 可疑数据应逐一检验,不能同时检验多个数据可疑数据应逐一检验,不能同时检验多个数据 首先检验偏差最大的数首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数剔除一个数后,如果还要检验下一个数 ,应重新计算平,应重新计算平均值及标准偏差均值及标准偏差 方法简单,无须查表方法简单,无须查表 该检验法适用于试验次数较多或要求不高时该检验法适用于试验次数较多或要求不高时3s3s为界时,要求为界时,要求n n10102s2s为界时,要求
53、为界时,要求n n5 5 有一组分析测试数据:有一组分析测试数据:0.128,0.129,0.131,0.133,0.135,0.138,0.141,0.142,0.145,0.148,0.167,问其中,问其中偏差较大的偏差较大的0.167这一数据是否应被舍去这一数据是否应被舍去? ( 0.01)解:(解:(1)计算)计算例:例:0.140,0.01116xs(2)计算偏差)计算偏差 ,xs0.1670.1400.027pxx(3)比较)比较 3s30.011160.03350.027 故按拉依达准则,当故按拉依达准则,当 0.01时,时,0.167这一可疑值不应舍去这一可疑值不应舍去 (2
54、)格拉布斯()格拉布斯(Grubbs)检验法)检验法 内容:内容: 可疑数据可疑数据xp ,若,若 则应将该值剔除。则应将该值剔除。(, )nGGrubbs检验临界值检验临界值 ( , )ppndxxGs格拉布斯(格拉布斯(Grubbs)检验临界值)检验临界值G( ,n)表表说明:说明: 计算平均值及标准偏差计算平均值及标准偏差s 时,应包括可疑值在内时,应包括可疑值在内 可疑数据应逐一检验,不能同时检验多个数据可疑数据应逐一检验,不能同时检验多个数据 首先检验偏差最大的数首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数剔除一个数后,如果还要检验下一个数 ,应重新计算平,应重新计算平均
55、值及标准偏差均值及标准偏差 能适用于试验数据较少时能适用于试验数据较少时 格拉布斯准则也可以用于检验两个数据偏小,或两个数据格拉布斯准则也可以用于检验两个数据偏小,或两个数据偏大的情况偏大的情况 例:例:(3)狄克逊()狄克逊(Dixon)检验法检验法 单侧情形单侧情形 将将n个试验数据按从小到大的顺序排列:个试验数据按从小到大的顺序排列: x1x2xn-1xn 如果有异常值存在,必然出现在两端,即如果有异常值存在,必然出现在两端,即x1 或或xn 计算出统计量计算出统计量D或或Dn检验高端异常值检验高端异常值检验低端异常值检验低端异常值378101113143011nnnxxDxx211nx
56、xDxx12nnnxxDxx2111nxxDxx22nnnxxDxx3111nxxDxx23nnnxxDxx3121nxxDxx统计量统计量D计算公式计算公式双侧情形双侧情形 计算计算D和和 D 查双侧临界值查双侧临界值 1( )Dnn 检验检验 当当 DD1( )DDn,判断判断nx为异常值为异常值 当当 DD1( )DDn,判断判断1x为异常值为异常值 检验检验xn时,当时,当 1( )DDn时,可剔除时,可剔除xn 检验检验x1时,当时,当 时,可剔除时,可剔除x11( )DDn查查单侧临界值单侧临界值 检验检验说明说明 适用于试验数据较少时的检验,计算量较适用于试验数据较少时的检验,计
57、算量较小小 单侧检验时,单侧检验时,可疑数据应逐一检验,不能可疑数据应逐一检验,不能同时检验多个数据同时检验多个数据 剔除一个数后,如果还要检验下一个数剔除一个数后,如果还要检验下一个数 ,应重新排序应重新排序 1.6.1 有效数字(有效数字(significance figure) 能够代表一定物理量的数字能够代表一定物理量的数字 有效数字的位数可反映试验或试验仪表的精度有效数字的位数可反映试验或试验仪表的精度 数据中小数点的位置不影响有效数字的位数数据中小数点的位置不影响有效数字的位数例如:例如:50,0.050m,5.0104m 第一个非第一个非0数前的数字都不是有效数字,而第一个非数前
58、的数字都不是有效数字,而第一个非0数后数后的数字都是有效数字的数字都是有效数字例如:例如: 29和和29.00 第一位数字等于或大于第一位数字等于或大于8,则可以多计一位,则可以多计一位例如:例如:9.99 1.6 有效数字和试验结果的表示有效数字和试验结果的表示1.6.2 有效数字的运算有效数字的运算(1)加、减运算:)加、减运算: 与其中小数点后位数最少的相同与其中小数点后位数最少的相同(2)乘、除运算)乘、除运算 以各乘、除数中有效数字位数最少的为准以各乘、除数中有效数字位数最少的为准(3)乘方、开方运算:)乘方、开方运算: 与其底数的相同:与其底数的相同: 例如:例如:2.42=5.8
59、(4)对数运算:)对数运算: 与其真数的相同与其真数的相同 例如例如ln6.841.92;lg0.000044(5)在)在4个以上数的平均值计算中,平均值的有效数字可增个以上数的平均值计算中,平均值的有效数字可增加一位加一位(6)所有取自手册上的数据,其有效数字位数按实际需要)所有取自手册上的数据,其有效数字位数按实际需要取,但原始数据如有限制,则应服从原始数据。取,但原始数据如有限制,则应服从原始数据。(7)一些常数的有效数字的位数可以认为是无限制的)一些常数的有效数字的位数可以认为是无限制的 例如,圆周率例如,圆周率、重力加速度、重力加速度g g、1/31/3等等(8)一般在工程计算中,取
60、)一般在工程计算中,取23位有效数字位有效数字1.6.3 有效数字的修约规则有效数字的修约规则 4:舍去:舍去 5,且其后跟有非零数字,且其后跟有非零数字 ,进,进1位位例如:例如:3.14159 3.142 5,其右无数字或皆为,其右无数字或皆为0时,时,“尾留双尾留双”: 若所保留的末位数字为奇数则进若所保留的末位数字为奇数则进1 若所保留的末位数字为偶数则舍弃若所保留的末位数字为偶数则舍弃例如:例如:3.1415 3.142 1.3665 1.3661.7 误差的传递误差的传递 误差的传递:根据直接测量值的误差来计算间接测量值的误差的传递:根据直接测量值的误差来计算间接测量值的误差误差1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年租房市场的数字化模式分析
- 2026春招:循环经济题库及答案
- 2026年未来建筑中的动态照明系统
- 2026春招:销售专员真题及答案
- 费用管控课件
- 贷款业务常见培训课件
- 妇产科无痛分娩技术汇报
- 货物运输安全培训提纲课件
- 货物升降机安全培训记录课件
- 货梯使用专项安全培训课件
- 微生物标本接种课件
- 园林绿化施工现场组织机构与职责
- 检察院书记员考试题库及答案
- 爆破作业危险性较大分部分项工程清单及安全措施
- 体育工作会议汇报
- 学校合并教师安置方案(3篇)
- 智慧边防AI大模型数字化平台规划设计方案
- 网约车行业合规管理制度
- 六年级上册语文1-8单元习作范文
- 血液透析心律失常护理专题
- 认知科学中的注意力机制研究-洞察阐释
评论
0/150
提交评论