版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、试验设计与数据处理试验设计与数据处理韩韩 京龙京龙试验设计与数据处理试验设计与数据处理参考参考资资料料1, ,实验设计实验设计与数据与数据处处理(第二版)理(第二版) 李云雁李云雁 胡传荣胡传荣 编著编著 化学工化学工业业出版社出版社 2, ,实验设计实验设计与数据与数据处处理理 罗传义罗传义 时景荣时景荣 编著编著 吉林人民出版社吉林人民出版社 0.10.1 试验设计与数据处理的发展概况试验设计与数据处理的发展概况 2020世纪世纪2020年代,英国生物统计学家及数学家费年代,英国生物统计学家及数学家费歇(歇(R RA AFisherFisher)提出了)提出了方差分析方差分析 2020世纪
2、世纪5050年代,日本统计学家田口玄一将试验年代,日本统计学家田口玄一将试验设计中应用最广的设计中应用最广的正交设计正交设计表格化表格化 数学家华罗庚教授也在国内积极倡导和普及的数学家华罗庚教授也在国内积极倡导和普及的“优选法优选法” 我国数学家王元和方开泰于我国数学家王元和方开泰于19781978年首先提出了年首先提出了均匀设计均匀设计 0.2 0.2 试验设计与数据处理的意义试验设计与数据处理的意义0.2.1 0.2.1 试验设计的目的试验设计的目的: 合理地安排试验合理地安排试验, ,力求用较少的试验次数获得较好结果力求用较少的试验次数获得较好结果 例:某试验研究了例:某试验研究了3 3
3、个影响因素:个影响因素: A A:A1A1,A2A2,A3A3 B B:B1B1,B2B2,B3B3 C C:C1C1,C2C2,C3C3 全面试验:全面试验:2727次次 正交试验:正交试验:9 9次次0.2.2 数据数据处处理的目的理的目的通过误差分析,评判试验数据的可靠性;通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;提高试验效率;确定试验因素与试验结果之间存在的近似函数确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;关系,并能对试验结果进行预测和优化;试验因素对试验结果的
4、影响规律,为控制试验试验因素对试验结果的影响规律,为控制试验提供思路;提供思路;确定最优试验方案或配方。确定最优试验方案或配方。 实验设计与数据处理应用对象实验设计与数据处理应用对象毕业论毕业论文文设计设计毕业论毕业论文写作文写作科研工作者科研工作者企业管理人员企业管理人员工程技术人员工程技术人员大学生大学生硕士研究生硕士研究生博士研究生博士研究生试验设计是根据试验目的所定试验设计是根据试验目的所定 试验试验目的目的单因素试验设计单因素试验设计多因素试验设计多因素试验设计随机试验设计随机试验设计正交试验设计正交试验设计确定确定科技科技论论文科研文科研报报告告毕业论毕业论文文试验试验目的目的试验
5、设计试验设计取得数据取得数据数据数据处处理理得出得出结论结论完成完成论论文文写作全写作全过过程程数据处理形式数据处理方法统计统计分析分析图图像像处处理理音像音像处处理理表表图图图图像像音像音像数据处理用途科研科研论论文文学学术发术发表表开开发发新技新技术术行政部行政部门门提供依据提供依据学学术术研研讨讨会(会(举举例例说说明)明)热量热量1 12 23 34 45 56 67 7反反应速应速度度0.5 0.5 0.7 0.7 0.9 0.9 1.1 1.1 1.2 1.2 1.2 1.2 0.9 0.9 学术研讨会(举例说明学术研讨会(举例说明1)学术研讨会(举例说明学术研讨会(举例说明2)日
6、期日期6/56/5 6/106/106/156/156/206/206/256/256/306/307/57/57/107/10降雨量降雨量20205 53 32002003 30 01001002020硝硝态氮态氮 280280 180180 降雨量与硝降雨量与硝态态氮流失情况氮流失情况调查调查科技科技论论文文 科研科研报报告告 毕业论毕业论文文写写 作作 流流 程程题题目目目的目的实验实验材料与分析方法材料与分析方法结结果与考果与考查查结论结论第一章第一章 误误差理差理论论误差误差:由于受主客观因素的影响由于受主客观因素的影响,实验中测得的值与真实实验中测得的值与真实值并不完全一致值并不完
7、全一致。这种差异在数值上的表现即为这种差异在数值上的表现即为误差误差。研究误差的目的研究误差的目的: :1.1.正确处理实验数据正确处理实验数据。得到更接近真实值的最佳结果得到更接近真实值的最佳结果。2.2.合理选取所得结果的误差合理选取所得结果的误差。减小主观因素的影响减小主观因素的影响, ,以以免免对生产对生产造成危害造成危害。也不能算得过份大也不能算得过份大, ,以免造成人以免造成人力物力的浪费力物力的浪费。3.3.合理选择实验仪器、条件和方法合理选择实验仪器、条件和方法, ,以便降低系统误差。以便降低系统误差。确保实验的准确度和精密度。确保实验的准确度和精密度。真真值值与与试验试验数据
8、的位置特征参数数据的位置特征参数真真值值: 理理论论上上说说,真真值值是指是指测测定次数无限多定次数无限多时时求得求得 的平均的平均值值叫叫真真值值。 。真真值值1.理理论论真真值值:理理论设计论设计和理和理论论公式表达公式表达值值等等。 。2.计计量学量学约约定真定真值值:国国际际会会议议或国或国际组织际组织上公上公认认的的 量量值值。 。3.相相对对真真值值:国家国家标标准准样样品的品的标标准准值值或用或用标标准准仪仪器器 测测定的定的值值。 。真值与试验数据的位置特征参数真值与试验数据的位置特征参数 2.试验试验数据的位置特征参数数据的位置特征参数 2.1算数平均算数平均值值( (ari
9、thmetic mean) )试验数据的位置特征参数是试验数据的位置特征参数是表示试验数据的集中性的指标表示试验数据的集中性的指标 算数平均算数平均值值的一个重要性的一个重要性质质,就是若,就是若测测定定值值的分布服从的分布服从正正态态分布,分布,则则算数平均值即为一组等精度测量中的最佳值,算数平均值即为一组等精度测量中的最佳值,或称为最可信赖值或称为最可信赖值。 。121.ninixxxxxnnn 等精度试验值等精度试验值适合:适合:n 试验值服从正态分布试验值服从正态分布2.2加加权权算数平均算数平均值值(weighted mean) 真值与试验数据的位置特征参数真值与试验数据的位置特征参
10、数 权权可以理解可以理解为测为测定定值值 在很大的在很大的测测量量总总数数N中出中出现现的的频频率率nj/N,如代之以概率如代之以概率Pj来表示来表示,则则加全算数平均数可改写加全算数平均数可改写为为niiiwxpx11 1221121.Wniinninniiw xw xw xw xxwwwwwi权重权重加权和加权和 适合不同试验值的精度或可靠性不一致时适合不同试验值的精度或可靠性不一致时2.3对对数平均数平均值值( (logarithmic mean) ) 在化学反在化学反应应,热热量量传递传递及及质质量量传递传递中中,其分布曲其分布曲线线多具有多具有对对数的特性。在数的特性。在这这中情况下
11、表征平均中情况下表征平均值值的量就的量就应该应该用用对对数数平均平均值值来表示。来表示。真值与试验数据的位置特征参数真值与试验数据的位置特征参数21212121lnlnlnxxxxxxxxxi设两个数:设两个数:x10,x2 0 ,则,则说说明:明: 若数据的分布具有若数据的分布具有对对数特性,数特性,则则宜使用宜使用对对数平均数平均值值 对对数平均数平均值值算算术术平均平均值值 如果如果1/2x1/x22 时时,可用算,可用算术术平均平均值值代替代替,误差不超过误差不超过4%2.4 几何平均数几何平均数几何平均几何平均值值是将是将n个个测测定定值值相乘后在开相乘后在开n次方所得的次方所得的值
12、值。 。当一当一组试验值组试验值取取对对数后所得数据的分布曲数后所得数据的分布曲线线更加更加对对称称 时时, , 宜采用几何平均宜采用几何平均值值。 。几何平均几何平均值值算算术术平均平均值值11212.(.)Gnnnnxx xxx xx设有设有n个正试验值:个正试验值:x1,x2,xn,则,则2.5 调调和平均和平均值值( (harmonic mean) )常用在涉及到与一些量的倒数有关的常用在涉及到与一些量的倒数有关的场场合合调调和平均和平均值值几何平均几何平均值值算算术术平均平均值值1121111.1ninixxxxHnn设有设有n个正试验值:个正试验值:x1,x2,xn,则:,则:误误
13、差的表示方法差的表示方法1.绝对误绝对误差差( (absolute error) ) 误误差的差的绝对值绝对值愈小愈小,则测则测定定值值与真与真值值愈接近愈接近,测测定定值值的准确度愈高的准确度愈高,反之相反反之相反。 。绝对误绝对误差是反差是反应测应测定定值值偏离真偏离真值值的大小的大小。 。( (1)定)定义义 绝对误绝对误差差试验值试验值真真值值 或或txxx m axtxxxx (2)说明)说明n真值未知,绝对误差也未知真值未知,绝对误差也未知n 可以估计出绝对误差的范围:可以估计出绝对误差的范围:绝对误差限或绝对误差上界绝对误差限或绝对误差上界 或或maxtxxx 例例: :用标准仪
14、器测得某物理量为用标准仪器测得某物理量为1.728(g)(1.728(g)(可看作是真值可看作是真值A),A),而一台而一台普通仪器测得该物理量为普通仪器测得该物理量为1.730(g),1.730(g),则测量值的绝对误差为则测量值的绝对误差为 x=1.730-1.728=0.002(g)x=1.730-1.728=0.002(g)若另一次测量值为若另一次测量值为1.725(g),1.725(g),其绝对误差为其绝对误差为 x=1.725-1.728=-0.003(g)x=1.725-1.728=-0.003(g) 我们经常用的分析天平等都有本身的仪器所允许的最大误差范围我们经常用的分析天平等
15、都有本身的仪器所允许的最大误差范围。 如分析天平的允许误差范围是如分析天平的允许误差范围是0.0001(g),0.0001(g),我们把这个误差范围又我们把这个误差范围又称最大绝对误差称最大绝对误差。最大绝对误差的量值前面一般都加最大绝对误差的量值前面一般都加“”号号, ,这是与这是与绝对误差的定义是不同的绝对误差的定义是不同的。1.绝对误绝对误差差(absolute error) 误误差的表示方法差的表示方法2.相相对误对误差差( (relative error) ) 是指绝对误差在真值中所占的百分率是指绝对误差在真值中所占的百分率,既既误差的表示方法误差的表示方法%100AxEx 误误差差
16、较较小小时时,测测定定值值x与真与真值值A接近接近, 用用绝对误绝对误差与差与测测定定值值之比作之比作为为相相对误对误差差。 。%100 xxEx 最大相最大相对误对误差差:最大最大绝对误绝对误差差计计算出的相算出的相对误对误差差。 。n 真真值值未知,常将未知,常将x与与试验值试验值或平均或平均值值之比作之比作为为相相对误对误差:差:或或xxExxxEx 例例:用分析天平用分析天平测测得土壤得土壤样样品品为为4.1854(g),而半微量天平而半微量天平测测得的量得的量为为4.18544(g)(可看作是真值可看作是真值A),求相求相对误对误差和最大相差和最大相对误对误差差?解解: 相对误差相对
17、误差: Ex x=(x x/A)*100%x x=x x-A=4.1854-4.18544=-0.00004(g)Ex x=(-0.00004/4.18544 )*100%=-0.001%当当x x接近于接近于A时时, 用用x x代替真值代替真值A Ex x=(-0.00004/4.1854 )*100%=-0.001%2.相相对误对误差差(relative error) 误差的表示方法误差的表示方法2.相相对误对误差差( (relative error) ) *同一同一仪仪器的被器的被测测量的量的最大最大绝对误绝对误差是相同的差是相同的。但是。但是,被被测测量的量的相相对对 误误差是不同的差
18、是不同的。 。 例例:测测得一物理量分得一物理量分别为别为102(g)和和5(g),天平的最大天平的最大绝对误绝对误差差为为1(g),而相而相对误对误差分差分别为别为 E102=(1)/102*100%=1% E5=(1)/5*100%=20% 为为了了获获得更准确的得更准确的结结果果,在相同条件下需要在相同条件下需要进进行多次重复行多次重复测测定。定。这这叫叫平衡平衡测测定定或或等精度等精度测测定定。 。误差的表示方法误差的表示方法3.极差极差(range) 一一组测组测定定值值中最高中最高值值和最低和最低值值之差之差,叫极差叫极差。 。误差的表示方法误差的表示方法maxminRxxR,精密
19、度,精密度 虽然用极差反映随机误差的精度不高,但由于它是计算方便,虽然用极差反映随机误差的精度不高,但由于它是计算方便,在快速检验中仍然得到广泛的应用在快速检验中仍然得到广泛的应用算算术术平均平均误误差差(average discrepancy) 算算术术平均平均误误差(或称差(或称为为平均偏差)平均偏差)简简称称为为平均平均误误差。差。其定其定义为义为误差的表示方法误差的表示方法11nniiiixxdnn ixx试验值试验值与算术平均值与算术平均值之间的偏差之间的偏差 id 可以反映一组试验数据的误差大小可以反映一组试验数据的误差大小 误差的表示方法误差的表示方法标标准差准差(standar
20、d error) 标标准差是准差是标标准准误误差的差的简简称,又称称,又称为标为标准偏差准偏差。 。当当测测定定值值的次数无的次数无穷时穷时,其定,其定义为义为 当当试验试验次数次数n无无穷穷大大时时, ,总总体体标标准差:准差:222111()() /nnniiiiiixxxxnnn22221111()() /111nnnniiiiiiiidxxxxnsnnn 试验次数为有限次时,样本标准差:试验次数为有限次时,样本标准差: 表示试验值的精密度,标准差表示试验值的精密度,标准差,试验数据精密度,试验数据精密度误差的表示方法误差的表示方法 标标准偏差与所准偏差与所测测定定值值中的每一个数据有关
21、,而且中的每一个数据有关,而且对对其中其中较较大大误误差或差或较较小小误误差敏感性很差敏感性很强强。 。能明能明显显反反映出映出较较大的个大的个别误别误差差。 。实验实验愈精确愈精确标标准准误误差愈小差愈小。 。反映相反映相对对于平均于平均值值的离散程度的离散程度。 。一般一般统计统计分析中分析中经经常用到常用到标标准差准差。 。标标准差准差(standard error)误差的来源及分类误差的来源及分类 我我们们在做科学研究的在做科学研究的时时候候,得到准确数据是非常重要得到准确数据是非常重要的一个科研的一个科研环节环节。 。实验实验工作始工作始终终不能做到没有不能做到没有误误差差,测测定定
22、值值永永远远是真是真值值的近似的近似值值。 。误误差根据其性差根据其性质质可分可分为为系系统误统误差差、 、随机随机误误差差和和过过失失误误差差。 。1, .1, .随机随机误误差差( (偶然偶然误误差差) ) :由于很多无法估由于很多无法估计计的的, ,各种各各种各样样的随机原因所引起的的随机原因所引起的误误差。随机差。随机误误差量差量值值的大小的大小, ,往往往往用用标标准差准差S S来表示。来表示。2, 过过失失误误差差:实验实验工作中粗枝大叶工作中粗枝大叶,操作不正确所引起的操作不正确所引起的 误误差差。 。误差的来源及分类误差的来源及分类系系统误统误差差方法方法误误差差(理理论误论误
23、差差):这这是由于是由于测测量方法本身形成的量方法本身形成的误误差差,或者由于或者由于 测测量所依据的理量所依据的理论论本身不完善等原因而本身不完善等原因而导导致的致的误误差差。 。 例例:土壤有效磷的土壤有效磷的测测定有两种方法第一种方法定有两种方法第一种方法为为0.5M NaHCO3浸浸提提-钼锑钼锑抗比色法抗比色法,第二种方法第二种方法为为0.3N NH4F-0.025N HCl浸提浸提-钼锑抗钼锑抗比色法比色法两两种浸提剂测得的土壤有效磷指标种浸提剂测得的土壤有效磷指标有效磷指有效磷指标标0.3N NH4F-0.025N HCl0.3N NH4F-0.025N HCl法法0.5M Na
24、HCO30.5M NaHCO3法法低低0-150-150-50-5中中16-3016-300-60-6高高30301010仪仪器器误误差差:仪仪器本身不器本身不够够准确或未准确或未经经校准所引起的校准所引起的误误差差。 。(仪仪器的器的 零点不准零点不准,精密度不高精密度不高,磨磨损损等原因引起的等原因引起的误误差差)操作操作误误差差:由于操作人由于操作人员员的主的主观观原因所造成的原因所造成的误误差差。 。 3, 系系统误统误差差:由于由于实验过实验过程中某些程中某些经经常常发发生的原因造成的。在同一生的原因造成的。在同一条件下重复条件下重复测测定定时时,它会重复出它会重复出现现。 。误差的
25、来源及分类误差的来源及分类(1 1)定义定义:以不可预知的规律变化着的误差,绝对误:以不可预知的规律变化着的误差,绝对误差时正时负,时大时小差时正时负,时大时小(2 2)产生的原因产生的原因:偶然因素:偶然因素(3 3)特点特点:具有统计规律:具有统计规律小误差比大误差出现机会多小误差比大误差出现机会多正、负误差出现的次数近似相等正、负误差出现的次数近似相等当试验次数足够多时,误差的平均值趋向于零当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差可以通过增加试验次数减小随机误差随机误差不可完全避免的随机误差不可完全避免的 误差的来源及分类误差的来源及分类2 2 系统误差
26、(系统误差(systematic errorsystematic error) ( (1) )定定义义: : 一定试验条件下,由某个或某些因素按照某一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差一确定的规律起作用而形成的误差 ( (2) )产产生的原因生的原因: :多方面多方面( (3) )特点:特点: 系统误差大小及其符号在同一试验中是恒定的系统误差大小及其符号在同一试验中是恒定的 它不能通过多次试验被发现,也不能通过取多次试验它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小值的平均值而减小 只要对系统误差产生的原因有了充分的认识,才能对只要对系统误差产生
27、的原因有了充分的认识,才能对它进行校正,或设法消除。它进行校正,或设法消除。 3 过过失失误误差差 ( (mistake ) )( (1) )定定义义: : 一种显然与事实不符的误差一种显然与事实不符的误差( (2) )产产生的原因生的原因: : 实验人员粗心大意造成实验人员粗心大意造成 ( (3) )特点特点: : 可以完全避免可以完全避免 没有一定的规律没有一定的规律 误差的来源及分类误差的来源及分类实验实验数据的精准度数据的精准度 1.精密度(精密度(precision) :表示在等精度的重复表示在等精度的重复测测定中定中,各各测测定定值值与其平均与其平均值值接近的程度接近的程度,或者或
28、者说说各各测测定定值值相互接近的程度相互接近的程度。 。精密度通常用精密度通常用标标准差准差S和相和相对标对标准差准差C VS/ (变变异系数异系数)来来量度量度。 。精密度一般用来表示精密度一般用来表示随机随机误误差差的大小的大小。 。x( (1)含)含义义: : 在一定的在一定的试验试验条件下,多次条件下,多次试验值试验值的彼此符合程度的彼此符合程度 例:甲:例:甲:11.45,11.46,11.45,11.44 乙:乙:11.39,11.45,11.48,11.50( (2) )说说明:明: 可以通可以通过过增加增加试验试验次数而达到提高数据精密度的目的次数而达到提高数据精密度的目的 试
29、验试验数据的精密度是建立在数据用途基数据的精密度是建立在数据用途基础础之上的之上的 试验过试验过程足程足够够精密,精密,则则只需少量几次只需少量几次试验试验就能就能满满足要求足要求 (3)精密度判断)精密度判断 极差(极差(range) )222111()() /nnniiiiiixxxxnnnmaxminRxx标准差(标准差(standard error)222111()() /11nnniiiiiixxxxnsnnR,精密度,精密度标准差标准差,精密度,精密度实验实验数据的精准度数据的精准度1.精密度(精密度(precision) )方差(方差(variance) ) 标标准差的平方:准差
30、的平方: 样样本方差(本方差( s2 ) ) 总总体方差(体方差(2 ) )(3)精密度判断)精密度判断 实验实验数据的精准度数据的精准度1.精密度(精密度(precision) )方差方差,精密度,精密度2 正确度(正确度(correctness) ) ( (1)含)含义义:大量:大量测试结测试结果的(算果的(算术术)平均)平均值值与真与真值值或参照或参照值值之之间间的一的一致程度。它反映系致程度。它反映系统误统误差的大小。差的大小。( (2)正确度与精密度的关系:)正确度与精密度的关系:n 精密度不好,但当试验次数相当多时,有时也会得到精密度不好,但当试验次数相当多时,有时也会得到好的正确
31、度好的正确度 n 精密度高并不意味着正确度也高精密度高并不意味着正确度也高 (a)(b)(c)实验实验数据的精准度数据的精准度 表示所得表示所得测测定定结结果与真果与真值值或或标标准准值值接近的程度接近的程度。 。在多次等精在多次等精度度测测定中定中,测测定定结结果一般用平均果一般用平均值值来表示来表示。 。这时这时准确度就表示平准确度就表示平均均值值与真与真值值的接近程度的接近程度。 。准确度一般用准确度一般用绝对误差绝对误差或或相对误差相对误差来来表示表示。 。实验实验数据的精准度数据的精准度3 准确度(准确度(accuracy) ) 三者关系三者关系无系统误差的试验无系统误差的试验 精密
32、度精密度 :ABC正确度:正确度: ABC准确度:准确度: ABC精密度精密度 :A B C 准确度:准确度: A B C ,A B,C 三者关系三者关系有系统误差的试验有系统误差的试验 实验实验数据的精准度数据的精准度 准确度与精密度的关系准确度与精密度的关系 准确度与精密度是不同的准确度与精密度是不同的。 。准确度指准确度指测测定定值值与真与真值值接近接近的程度的程度。 。精密度指精密度指测测定定值值与平均与平均值值接近的程度接近的程度。 。测测定的精定的精密度不好密度不好,就不可能有良好的准确度就不可能有良好的准确度。 。精密度好的精密度好的测测定定,即即使准确度不高使准确度不高,但能找
33、到系但能找到系统误统误差差产产生的原因并加以校正生的原因并加以校正,就能得到准确的就能得到准确的结结果果。 。实验实验数据的精准度数据的精准度随机随机误误差的差的统计统计分布分布1.频频数分布数分布 随机随机误误差是具有差是具有统计规统计规律的律的,服从一定的服从一定的统计统计分布分布规规律。律。表表 频数分布表频数分布表 分分组组7373747474747474757575757676767676767777其他其他频数频数0 03 33 312122525383825253 33 30 01 1 例例:通过实验测得通过实验测得113个数据个数据,经整理得以下频数分布表经整理得以下频数分布表
34、。2.随机随机误误差的特性差的特性 若若测测定中不存在系定中不存在系统误统误差差,则测则测定的平均定的平均值值可作可作为为被被测测量的真量的真值值的估的估计值计值。同。同样样条件条件,同同样样方法方法进进行很多次的行很多次的测测定定时时,随机随机误误差有以下特性差有以下特性: 随机误差的统计分布随机误差的统计分布 (1)对对称性称性:绝对值绝对值相等的正相等的正误误差和差和负误负误差出差出现现的次数大的次数大 致相等致相等。 。 (2)单峰性单峰性:绝对值大的误差出现的次数少绝对值大的误差出现的次数少,而绝对值小的误而绝对值小的误 差出现的次数多差出现的次数多。 (3)有界性有界性:在一定试验
35、条件下的有限测定中在一定试验条件下的有限测定中,其误差的绝其误差的绝 对值不会超过一定的界限对值不会超过一定的界限。 (4)抵偿性抵偿性:在同一条件下对同一个量进行测定在同一条件下对同一个量进行测定,其误差的其误差的 算术平均值随着测定次数的无限增加而趋于零算术平均值随着测定次数的无限增加而趋于零,既误差既误差 平均值极限为零平均值极限为零。3.1随机随机误误差的正差的正态态分布分布 随机随机误误差的出差的出现现是遵循正是遵循正态态分布分布规规律的。各个律的。各个测测得得值值出出现现的概率密的概率密度分布可以用正度分布可以用正态态分布函数来表达。分布函数来表达。随机误差的统计分布随机误差的统计
36、分布: :表示测量值表示测量值:总总体均体均值值,既无限次既无限次测测定数据定数据 的平均的平均值值: :正正态态分布的分布的总总体体标标准差准差2: :正正态态分布的方差分布的方差f(x)12正正态态分布密度函数分布密度函数222)(21)(xexf随机误差的统计分布随机误差的统计分布3.2正正态态分布曲分布曲线线的特性的特性 (一一)正正态态分布曲分布曲线线是以是以算数平均数算数平均数为为原点原点, 向左右向左右两側作两側作对对称分布称分布, 所以它是一所以它是一个个对对称曲称曲线线。 。(二(二)从原点从原点=0所所竖竖立的立的 纵轴纵轴是最大是最大值值(y0) 。 。 (三三)正正态态
37、分布的多数分布的多数测测定定值值集中于算集中于算术术平均数平均数附近附近, 离平均离平均数越数越远远, 其相其相应应的次数越少的次数越少; 且在且在 相等相等处处具有相等次具有相等次数数;在在 以上其次数极少。以上其次数极少。 (四四) 正正态态分布曲分布曲线线在在 处处有有“ “拐点拐点” ”曲曲线线两尾向左右两尾向左右伸展伸展, 永不接触横永不接触横轴轴, 所以当所以当x时时, 分布曲分布曲线线以以x轴为渐轴为渐进线进线, 因之曲因之曲线线全距从全距从到到 。 。 fN(x)-1+168.26-2+2-3+395.46 x 3 x1 x3.2正正态态分布曲分布曲线线的特性的特性 (五五)正
38、正态态分布曲分布曲线线是以参数是以参数和和的不同而表的不同而表现为现为一系列曲一系列曲线线, 所以它是一个曲所以它是一个曲线线系系统统而不而不仅仅仅仅是一个曲是一个曲线线。 。确定它在确定它在x轴轴上的上的位置位置, 而而确定它的确定它的变变异度异度, 不同不同和和的正的正态总态总体具有不同的曲体具有不同的曲线线位置和位置和变变异度异度, 所以任何一个特定正所以任何一个特定正态态曲曲线线必必须须在其在其和和确定确定后才能确定。后才能确定。随机误差的统计分布随机误差的统计分布0 0-1-1-2-2-3-31 12 23 34 45 50、 、1、 、2的正的正态态分布分布0 01231、 、2、
39、 、3的正的正态态分布分布 (六六)正正态态分布曲分布曲线线与与x轴轴之之间间的的总总面面积积等于等于1, 因此在曲因此在曲线线下下x轴轴的任何定的任何定值值, 例如从例如从x=x1到到x=x2之之间间的面的面积积, 等于等于x落在落在这这个区个区间间内内的概率的概率。 。 4.随机随机误误差的区差的区间间概率概率 正正态态分布曲分布曲线线和横和横轴轴所所夹夹的面的面积积表示全部数据出表示全部数据出现现概概率的率的总总和和显显然然应应当是当是100%,既既为为1。 。记为记为随机误差的统计分布随机误差的统计分布( (4.1) ) 测测定定值值x x出出现现在区在区间间a,ba,b的概率的概率P
40、 P(a(a )就等于直就等于直线线x x=a,=a,x x=b=b与正与正态态分布曲分布曲线线, ,坐坐标标横横轴轴所包所包围围的面的面积积 , ,即即(4.2)ab121)(222)(dxexpxdxebxaPbax222)(21)(上式公式中的横坐上式公式中的横坐标标x x改用改用u表示表示, , u定定义为义为(4.3) 这这便是均便是均值为值为,标标准差准差为为的正的正态态分布分布变变成了均成了均值为值为0,标标准差准差为为1的的标标准正准正态态分布分布,其分布密度涵数其分布密度涵数变为变为(4.4)随机误差的统计分布随机误差的统计分布 4.随机随机误误差的区差的区间间概率概率 dx
41、ebxaPbax222)(21)(xu2221)(ueuf随机误差的统计分布随机误差的统计分布 在本在本书书附附录录B-1列有正列有正态态分布表分布表,计计算出不同算出不同u值值的的f( (u)曲)曲线线所包所包围围的面的面积积的的值值。表中。表中给给出的出的积积分分值为值为duekuPakua2221)(( (4.5) ) 例例:某某测测定定值值的的误误差服从正差服从正态态分布分布,以知以知测测定定标标准差准差2.5,求求测测定定值值的的误误差位于区差位于区间间(-3,3)的概率的概率。 。xu 解解: :由由题题意意,x ,xa a-=-3, x-=-3, xb b-=3 -=3 。 。按
42、式按式 进进行行变换变换2 . 15 . 2)3()(xua2 . 15 . 23)(xub随机误差的统计分布随机误差的统计分布于是原于是原题题化化为为求求u处处于区于区间间(-1.2,1.2)的表准正的表准正态态分布的概率分布的概率。 。1.2-1.21由附由附录录B-1查查得得ka=1.2的概率的概率, P( (u1.2) )= =0.1151由于正由于正态态分布的分布的对对称性称性P( (u1.2) )和和P( (u-1.2) )的概率是相同的的概率是相同的。 。所以所以, u处处于区于区间间(-1.2,1.2)的的标标准正准正态态分布的概率是分布的概率是:1-2*0.1151=0.76
43、98随机误差的统计分布随机误差的统计分布于是原于是原题题化化为为求求u处处于区于区间间(-1,1)的的标标准正准正态态分布的概率分布的概率。 。由附由附录录B-1查查得得ka=1的概率的概率, P( (u1) )= =0.1587所以所以, u处于区间处于区间(-1,1)的标准正态分布的概率是的标准正态分布的概率是:1-2*0.1587=0.6828同同样样,误差位于区间误差位于区间(-2, 2), (-3, 3)的概率分别为的概率分别为 P(u2)1-2 P( (u2)12*0.02280.9544P(u2)1-2 P( (u3)12*0.001350.9973例例:求测定值的误差位于区间求
44、测定值的误差位于区间(-, )的概率的概率。解解:由题意由题意,x-= 。 u(x-)/ 1随机误差的统计分布随机误差的统计分布 从以上的结果可以看出从以上的结果可以看出, ,测定值的误差落在区间测定值的误差落在区间(-3,3)(-3,3)的概率是很大的的概率是很大的, ,接近于接近于1 1。而落在这个而落在这个区间以外的概率是区间以外的概率是1-0.9973=0.0027,1-0.9973=0.0027,就是说就是说10001000次次测定中测定中, ,出现误差的绝对值大于三倍标准差的机会出现误差的绝对值大于三倍标准差的机会不超过三次不超过三次。所以所以, ,把误差的绝对值等于三倍表准把误差
45、的绝对值等于三倍表准差称为差称为最大误差最大误差。例例:假假设设x乃一随机乃一随机变变数具有正数具有正态态分布分布,平均数平均数30,标标准差准差=5,试计试计算算X小于小于26,小于小于40的概率的概率,区区间间(26,40)的概率以及大于的概率以及大于40概率。概率。解解:1.首先首先计计算小于算小于26的概率。的概率。随机误差的统计分布随机误差的统计分布-0.800.80 必必须须先将先将x转换为转换为u值值,把本例的正把本例的正态态分布分布转换成标准正态分布转换成标准正态分布。 。由由公式公式(4.3) u=(x-) )/ 得得 u=( (x-30)/5=(26-30)/5=-0.8;
46、这样这样原原题题化化为为求求u处处于区于区间间(-,-0.8)的概率的概率。 。因为正态分布的对称性因为正态分布的对称性, P(u -0.8)的概率等于的概率等于P(u 0.8) )的概率的概率。 。查查附附录录B-1正正态态分布表分布表0.8可得可得P(x26) )=0.2119dxexPx262)(2221)26(解解:2.小于小于40的概率的概率,同同样样u=(x-30)/5=(40-30)/5=2.0。 。 P(u2.0) )=1- P(u2.0) )查查附附录录B-1,u=2.0时时P(u2.0) )=0.0228 P(u2.0) )=1- P(u2.0) )=0.9772,所以小于
47、所以小于40的概率的概率 P( (x40)=0.9772。 。随机误差的统计分布随机误差的统计分布02.03. 3.处处于区于区间间(26,40)(26,40)的概率的概率P(26x40)=P(-0.8u40)=1-P(x5以后以后,子子样样均均值值的的标标准差随准差随n的的增大而减小得很慢增大而减小得很慢。 。这这就是就是说说,单单靠增加靠增加观测观测次数来提高次数来提高实验实验的精密的精密度度是不是不够够的的。 。这这就意味着就意味着, 要把更多的精力用来改要把更多的精力用来改进测试进测试技技术术, 往往比重往往比重复老一套的复老一套的测试测试精度不高的精度不高的测测量更有意量更有意义义。
48、 。因此因此, 在在实际测实际测定某一量定某一量时时, 由于多方面条件的限制由于多方面条件的限制, 重复重复测测定的次数定的次数n很少超很少超过过50次次, 一般在一般在320次左右。次左右。xxSx 实验数据整理实验数据整理4. 平均平均值值与与标标准差的基本性准差的基本性质质性性质质1. 对对子子样样的每一个的每一个值值同乘以一常数同乘以一常数a,由此得到的平均由此得到的平均值值或或标标准差要准差要相相应应地除以地除以这这个常数个常数a, 才是原子才是原子样样的平均的平均值值或或标标准差准差。 。对对性性质质1的的证证明如下明如下: 设设 , 证证明明jaxx xax1SaS 1,证证明明
49、: 因因为为 njnjjjxaaxnxnx1111所以所以xax 1实验数据整理实验数据整理4. 平均平均值值与与标标准差的基本性准差的基本性质质SaS 1证证明明因因为为 njjxxnS1211 njjxaaxn1211 aSxxnanjj 1211所以所以SaS 1实验数据整理实验数据整理4. 平均平均值值与与标标准差的基本性准差的基本性质质性性质质2. 2. 对对子子样样的每一个的每一个值值同加一个常数同加一个常数b, 由此得到的由此得到的标标准差与原子准差与原子样样的的标标准差相同准差相同, 而得到的平均而得到的平均值值要减去要减去这这个常数个常数b, 才是原子才是原子样样的平均的平均
50、值值。 。对对性性质质2的的证证明如下明如下: 设设 , 证证明明 ,bxxj bxx SS 证证明明: 因因为为 njnjnjjjjbxnbnxnbxnxnx1111111所以所以bxx 实验数据整理实验数据整理bxax 14. 平均平均值值与与标标准差的基本性准差的基本性质质证证明明 S=SS=S证证明明: 因因为为 njjxxnS1211 njjbxbxn1211 njjxxn1211所以所以SS 实验数据整理实验数据整理根据子根据子样样平均平均值值与与标标准差的上述性准差的上述性质质, 我我们们对对一些太大一些太大,太小或有小数的太小或有小数的测测定定值进值进行有行有关关变换变换,可使
51、子可使子样样平均平均值值与与标标准差的准差的计计算算简简化化。 。常用的常用的变换变换公式公式为为: bxaxjj 相相应应地有地有SaS 1实验数据整理实验数据整理5. 平均平均值值与与标标准差的算法准差的算法 由于算由于算术术平均平均值值与与标标准差在数据准差在数据处处理中占有特殊的地位理中占有特殊的地位, 所以在所以在实实际际运算中碰到运算中碰到计计算算算算术术平均平均值值与与标标准差的机会特准差的机会特别别多多。 。介介绍绍几种算法几种算法1) 直接公式法直接公式法按算按算术术平均平均值值的原始定的原始定义义式和式和标标准差的原始定准差的原始定义义式式计计算的方法算的方法。 。 例例:
52、 分析容渣中二氧化硅的含量分析容渣中二氧化硅的含量, 4次次测测定定值值分分别为别为28.5, 28.6, 28.2, 28.3。 。求求测测定定结结果的平均果的平均值值与与标标准差准差。 。解解: njjxnx140.283 .282 .286 .285 .28411 18. 02 . 01 . 02 . 01 . 03111222212 njjxxnS5. 平均平均值值与与标标准差的算法准差的算法2) )计计算算标标准差的准差的导导出公式法出公式法为为了提高了提高计计算精度和算精度和简简化化计计算其算其间间,我我们们可以可以导导出以下公式出以下公式 njjjnjjxxxxnxxnS1221
53、221111 2112211xnxxxnnjnjjj njjxnxnxxn122211 njjxnxn12211 njnjjjxnxnS1212111或者写成或者写成实验数据整理实验数据整理 njjxnx11代入代入5. 平均平均值值与与标标准差的算法准差的算法 例例: 分析容渣中而氧化硅的含量分析容渣中而氧化硅的含量, 4次次测测定定值值分分别为别为28.5, 28.6, 28.2, 28.3。 。求求测测定定结结果的果的标标准差准差。 。 njnjjjxnxnS1212111解解: 利用公式利用公式 416 .1132 .283 .286 .285 .28jjx 412222234.322
54、62 .283 .286 .285 .28jjx 18. 06 .1134134.32261412 S实验数据整理实验数据整理5. 平均平均值值与与标标准差的算法准差的算法3) 平均平均值值与与标标准差的准差的简简易算法易算法bxax 1 当原始数据有效数字位数很多当原始数据有效数字位数很多时时, 一种一种简简便的便的计计算方法是将原始数据算方法是将原始数据按按 进进行行变换变换,计计算出算出变换变换后数据的平均后数据的平均值值和和标标准差准差,最后按比例最后按比例 和和 分分别别将平均将平均值值和和标标准差准差还还原原。 。 SaS 1 bxaxjj 选择选择b的原的原则则是是测测定量的数据
55、中出定量的数据中出现频现频率最多的数或是接近平均率最多的数或是接近平均值值的一个任意数的一个任意数。 。选择选择a的原则是使变换后的数据为有效数字最少的的原则是使变换后的数据为有效数字最少的整数整数。 。实验数据整理实验数据整理例例: 测测得某得某污污水水样样的的pH值值如下表所示如下表所示。 。求求这组这组数据的平均数据的平均值值与与标标准差准差。 。5. 平均平均值值与与标标准差的算法准差的算法3) 平均平均值值与与标标准差的准差的简简易算法易算法 1 12.712.71-5-525252 22.762.760 00 03 32.792.793 39 94 42.782.782 24 45
56、 52.762.760 00 06 62.822.826 636367 72.782.782 24 48 82.742.74-2-24 49 92.762.760 00 010102.742.74-2-24 4 4 48686序号序号)(pHxjjx 2jx 实验数据整理实验数据整理解解: b=2.76, a=100, 即即 76.2100 jjxx njjx1,4 njjx1286 njnjjjxnxnS1212111 1.341018611012 031.01 .310011 SaS njjxnx14 .01041764. 276. 21004 . 01 bxaxSx和和求求 :6. 6.
57、 均均值值的置信区的置信区间间 用相同的方法重复用相同的方法重复测测定某一量定某一量,在消除系在消除系统误统误差的情况下差的情况下,测测定定值值的算的算术术平均平均值值,可作可作为这为这个量的真个量的真值值的估的估计值计值 。 。测测定次数愈多定次数愈多,即子即子样样容量容量n愈大愈大,平均平均值值与真与真值值就越接近就越接近。 。当当测测定次数无定次数无穷时穷时,平均平均值值就是就是这这个量的真个量的真值值。 。当然当然,实际实际上上测测定无定无穷穷多次是做不到的多次是做不到的。 。我我们们可以根据有限次可以根据有限次测测定数据的平均定数据的平均值值 去估去估计计真真值值 。 。但但毕毕竟是
58、竟是 。 。那么子那么子样样平均平均值值与与总总体平均体平均值值到底相差多少呢到底相差多少呢?这这就需就需要估要估计计其其误误差差。 。我我们们令均令均值值的估的估计计量量 的的误误差的差的绝对值为绝对值为 x xx x 我我们给们给出一个置信概率出一个置信概率(或称置信度或称置信度),求求总总体均体均值值在在这这个置信概率个置信概率下的所在范下的所在范围围(区区间间),这这个范个范围围称称为为置信区置信区间间。 。可以用下式表示可以用下式表示的估的估计计量量 xp或等价地写成或等价地写成 1xp这这个公式表示估个公式表示估计计量的量的误误差落在区差落在区间间(-,)中的概率中的概率为为(1-
59、) 。 。 再再进进一步写成一步写成 1xxp公式表示在置信概率公式表示在置信概率为为(1-)时时的均的均值值的置信区的置信区间间是是 xx,实验数据整理实验数据整理置信区置信区间间表示估表示估计结计结果的果的精确程度精确程度,置信概率置信概率则则表示表示结结果的果的可靠程度可靠程度。 。6. 6. 均均值值的置信区的置信区间间为为了确定均了确定均值值在某一置信概率下的置信区在某一置信概率下的置信区间间,需要需要计计算算 1xxp中的中的。 。这这里需要引入一个新的里需要引入一个新的变变量量。 。 nSxt/ 随机随机变变量量t有如下的概率密度函授有如下的概率密度函授 22112112nntn
60、nnt 这这个分布叫做具有自由度个分布叫做具有自由度为为f=n-1的的t分布分布。 。 t分布分布对对于于t=0是是对对称的称的,t分布的概率密度取决于子分布的概率密度取决于子样样的容量的容量n和和t 的的值值。 。利用利用t 分布可以分布可以导导出出1/, fattpnSnSxpxp实验数据整理实验数据整理6. 6. 均均值值的置信区的置信区间间即即 1, fttp式中式中nStf/, 所以所以ftnS, 结结合算合算术术平均平均值值的的标标准差准差的的计计算式算式nSSx 所以上式可写成所以上式可写成fxtS, 将式将式fxtS, 代入下式代入下式 1xxp得得 1,fxfxtSxtSxp
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 行政审批联席会议制度
- 行政审批首问负责制制度
- 装修公司合同审批制度
- 2026年演出经纪人之《演出经纪实务》考前冲刺练习题含答案详解(达标题)
- 证书使用审批制度规定
- 2025年武汉市汉阳区教育局招聘教师笔试试卷【附答案】
- 2025年演出经纪人之《演出经纪实务》考前冲刺测试卷及答案详解一套
- 2025年福建省《保密知识竞赛必刷100题》考试题库附参考答案详解(基础题)
- 2026 高血压病人饮食的豆腐皮糊搭配课件
- 2026年保密观知识竞赛题及参考答案详解(巩固)
- 二年级上册道法大单元全册教案
- SPC地板项目可行性研究报告-范文
- 小学课堂管理方法与技巧
- 《研学旅行课程设计》课件-1研学课程学生手册设计
- ISO27001最新版信息风险评估表
- 核电厂职业危害分析报告
- 写字楼物业各项应急预案
- 基于无人机的公路基础设施健康监测与安全预警系统设计
- 连云港市花果山风景区管理处2023年招聘工作人员笔试参考题库(共500题)答案详解版
- 市场监管总局直属事业单位招聘考试题库2023
- 从性别文化视角看网络文学中的男性生育题材
评论
0/150
提交评论