版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 数据处理数据处理误差及不确定度分析马元明目目 录录n误差原理与分析计算误差原理与分析计算 误差原理误差原理 误差传递误差传递 平均值原理平均值原理 异常数据剔除异常数据剔除n不确定度原理与分析计算不确定度原理与分析计算 不确定度原理不确定度原理 不确定度的合成不确定度的合成 不确定度合成例题不确定度合成例题n回归分析回归分析 直线回归直线回归 其他回归其他回归n量热误差分析量热误差分析 误差原理与分析计算误差原理与分析计算 误差原理误差原理 误差传递误差传递 平均值原理平均值原理 异常数据剔除异常数据剔除 绝对误差n测量绝对误差=测量值真值n示值误差=仪器示值真值n真值是指被测量的客观真实值
2、,一般都是未知的。仅特殊场合已知和最高基准可看作真值。n数据处理统计中将平行测量的期望值作为统计量的拟定真值,可证明当测量次数无限大时,子样的统计量是总体的统计量的无偏估计。xx相对误差n绝对误差与测量值相差小时用绝对误差,相差大时用相对误差。绝对误差绝对误差相对误差绝对误差很小真值测量值示值误差引用误差最大示值n引用误差的规定是用于仪器精度的评定。误差的普遍意义和关系n测量误差是不可避免的,只要误差在一定范围内就认为是正常的。n减小误差影响,提高测量精度。n对测量结果作出可靠性评定,即给出精确度的估计。定义量纲相对误差绝对误差 真值无反应测量效果绝对误差测量值真值与被测量相同结果的实际误差值
3、误差分类n系统误差:其值固定不变或按某种确定规律变化的误差。可重复表现,但规律性并不一定确知。n随机误差:有正有负,不可预知。具有随机变量的一切特征,可用统计方法做出估计,不能“修正”消除。n粗大误差:超出正常范围的随机大误差。在数据中应该去除。统计量和估计量 设总体以随机变量表示,容量为n的子样以随机变量(1 2 n)表示。现作子样的实值函数 T=T(1 2 n),则 T(1 2 n)也为一随机变量,称T的统计量。 为了估计总体某一参数,由子样(1 2 n)建立不带未知数的某一统计量T(1 2 n),当获得子样的某一具体观测值(l1 l2 ln)时,算出统计量的值T(l1 l2 ln)=t,
4、可作为估计值,则称T(1 2 n)为的估计值。 估计量的评价n无偏性 设t为未知数参数的估计量,若 E(t)= ,则t为的无偏估计量。 表明估计量t的波动中心为,此时只有随机误差,无系统误差。21( )ln( , ) D tnEf xn有效性 分散性用 E(t- )2衡量。 E(t- )2=D(t)表明无偏估计以方差较小为好,即较为有效。n一致性 估计量t依概率收敛于,则称t为的一致估计量。lim(|)0 xP t区间估计n对于未知数,除了要求它的点估计t外,还常常需要以一定的可靠程度估计出包含真值的某个区间,以及包含真值的概率。n参数若有Pt1 t2=1-a为置信概率。(t1,t2)为在置信
5、度P上的置信区间,说明有P的概率落在(t1,t2)范围内。置信区间的上下限常取为对称的。n区间估计有明确的可靠性含义。n置信度的大小应根据具体问题给出,一般取90%或95%。随机误差特征n正态分布概率密度n正态分布概率图n对称性n有界性n抵偿性n对f(x)的影响n平均分布n反正弦分布n截尾正态分布n三角分布三种分布的标准差以及各置信区间相应的概率分布标准差P()P(2)P(3)正态分布(or 仪器)/30.6830.9550.997三角分布 (or 仪器)/(6)(1/2)0.7580.9661均匀分布 (or 仪器)/(3)(1/2)0.57711随机误差特征n期望值E(x)n误差的分布中心
6、nE(C)=CnE(x1+x2)=E(x1)+E(x2)nE(C*x)=C*E(x)nE(x1*x2)=E(x1)*E(x2) 相互独立,协方差为0n方差D(x)n随机波动大小nD(C)=0nD(C* )=C2*D()nD( 1+ 2)=D( 1)+D( 2) +D( 1, 2) 系统误差检验方法 n通过实验对比(高精度和等精度)n通过理论分析判断(模型简化)n对测量数据的直接判断(线性和周期)n用统计方法进行判断 数据数目少时可靠性差 只能对系统误差存在判断,不能给出数值 误差传递 12( ,.)nyf x xxyyYiiixxX1212( ,.)(,.)nnyyYf x xxf XXX11
7、2212(,.)(,.)nnnyyYf Xx XxXxf XXX121201101120102012( ,.)(,.)() ().() ()(,.)()().()nnnnnnnnyf x xxfff XXXxXxXxxffff XXXxxxxxx误差传递n传递系数f/ xi按测量值计算。n优点:线性传递,计算简单。n缺点:当展开式高次项不可忽略时,应该按照定义式计算。12121212( ,.)(,.).nnnnyf x xxf XXXfffxxxxxx误差传递n当以相对误差表示各误差分量时,其传递关系为n测量结果总误差等于各原始误差乘以传递系数的代数和线性叠加法则。n误差作用独立性,一个误差结
8、果对其他误差因素无关,它们构成总误差的独立部分。n可用于已知系统误差的分析计算。n建立不确定度合成法则基本依据,精度分析基础。11inyixiifxyx传递系数的计算n微分法求传递系数n几何发求传递系数(可通过几何运算和解析几何计算转化为微分法)n按传动关系确定传递系数(已知一个方向的传递系数或总的传递系数,求其中一个) 用于y=f(x)测量y求x的传递系数的情况n计算说明定义法和线性叠加法则的误差大小差别。例题 112122s1212222ss1122121221s112212s1122122112RRRRRVRVVR +RRRVRRRV=VV=VVR + R +RRR +RRRRRVR +
9、 R +RRR +RVRR , RR(RRRR )R +R2 如图电路,设电阻,的误差分别为,分析的误差。解: 由图关系得 =由,引入的误差为()()()利用函数线性方法据算误差221sRs112212s1212211212-RRVVVVRR +RRR +RVVVV=RR(RRRR )RRR +R222,()()()R1R2 VsV算术平均值原理 对同一量进行多次等精度重复测量而得到的数据的处理。“等精度”指各次测量的标准差相同,并不是有相同的误差。 等精度多次重复测量结果xi的算术平均值作为被测量的估计量,具有一致性、无偏性和最优性。 算术平均值的误差(线性和、分布相同):12111(.)n
10、niixxxxxnn11niixxn等精度测量数据的残差和性质n残差=测量值算术平均值n性质1:残差代数和为0.n性质2:残差平方和最小。 与最小二乘法一致。iivxx10niiv21minniiv算术平均值的标准差对X进行n此重复测量,视各数据为独立随机变量:测量标准差可按残差估计标准差的贝塞尔公式估计12123211( )(.)()().()nD xDxxxD xD xD xnn22222121(.)nxn12.n1xn211niivsnxssn加权平均值原理 对某一量进行多次测量,每次的精度不同,可信度不同,采用加权平均值计算。“权”表示该数据相对其他数据的可信程度。 权的确定(一般化为
11、最可约数字):1 1221121.niinnipnniip xp xp xp xxpppp12i22221212i222121111:.:111:.:.:.:nnnnppppssssppp或单位权及单位标准差n若某一数据xk的权p=1,则pk称为单位权,而xk的标准差sk称为单位权标准差,记为s0.n将各残差vi分别乘以各自的权平方根,得加权残差,按加权残差计算的为单位权标准差。22221 12 20.n npspspss 0iisspiiivvpiipvxx2211011nnii iiivpvsnn加权算术平均值的精度估计1 12212.()().nnpnp xp xp xD xDppp22
12、21122212()().()()(.)nnpnp D xp D xp D xD xppp22222221122212.(.)nnpnpppxppp2222210200021212.(.).npnnpppxpppppp22210200.nppp01pxniip01pxniissp加权算术平均值的精度估计 两个计算值一般不同,主要由系统误差引起,一般后面的计算比较准确,特别是数据较多时。 不能指望通过平均值减少所有的系统误差,其标准差也不能全面地反映系统误差的影响。01pinxiipssp211(1)pniinxiipvsnp例题n根据文献报道,真空中光速及其标准差如下i12345678Ci(k
13、m) 299792.3299792.5299793.1299794.2299792.6299789.8299793.0299795.1Si(km)2.41.00.31.90.73.00.33.1n解:取各测量数据的权为:pi=1/si2,(i=1,2n) 计算加权平均值为 (piCi)/(pi)=299792.99CpCpCp2.734130.127*25.92k3Uk3*0.120.36CCn2iii=1nii=1 加权算术平均值标准差为p v s =(n-1)p若取置信系数为,则扩展不确定度为: s最后结果结果为 =299792.990.36 (km/s). 表明光速以99.7%的概率包含
14、在299792.63 km/s与299793.35 km/s之间。而最新测定为0=299792.458 km/s:标准差或扩展不确定度并未能完全反映所给结果的可信程度,因为在测量中存在系统误差,它并不像随机误差那样服从概率分布,所以结果产生偏移。故不能指望通过求算术平均值或加权平均值来减小系统误差,其标准差也不能全面反映系统误说明差的影响。 异常数据的剔除(I)一:莱以特准则 n次等精度测量,若某一数据的残差满足下列条件即为含粗大误差,应剔除。n局限性:测量数据较少时可靠性差,特别是当采用贝塞尔公式计算标准差时,若nr0(n,a)即为含粗大误差,应剔除。 当剔除一个数据后,其余应再次计算统计量
15、,检验可以数据。 优点:计算简便,有较好的使用效果。不确定度原理与分析计算不确定度原理与分析计算 不确定度原理不确定度原理 不确定度的合成不确定度的合成 不确定度合成例题不确定度合成例题 不确定概念n在多次重复测量中,可看出测量数据结果将在某一范围内在多次重复测量中,可看出测量数据结果将在某一范围内波动,从而展示了这种不确定性。测量结果可能的取值范波动,从而展示了这种不确定性。测量结果可能的取值范围越小,测量结果的可靠性越高。围越小,测量结果的可靠性越高。n测量的不确定度表示由于测量中存在误差而使被测量值不测量的不确定度表示由于测量中存在误差而使被测量值不能肯定的程度,它的大小表征测量结果的可
16、信程度,它是能肯定的程度,它的大小表征测量结果的可信程度,它是表征误差对测量结果影响程度的参数表征误差对测量结果影响程度的参数。某一确定的测量方。某一确定的测量方法具有确定的不确定度值。法具有确定的不确定度值。n表示测量结果的分散性,表征被测量的真值所处量值范围表示测量结果的分散性,表征被测量的真值所处量值范围的评定。的评定。n不确定度不是真误差,是以参数形式定量表示无法修正的不确定度不是真误差,是以参数形式定量表示无法修正的那部分误差的范围,表征合理赋予的被测量值的分散性参那部分误差的范围,表征合理赋予的被测量值的分散性参数数。表示以测量结果为中心的变化。表示以测量结果为中心的变化。n按是否
17、用统计方法求得,分为按是否用统计方法求得,分为A类和类和B类,都是标准不确定类,都是标准不确定度。度。不确定的表征参数n方差D或标准差S可作为测量不确定性的表征参数,反映了测量结果可能取值的分散程度。D或S小时,误差分布线高而窄,表明测量结果取值不确定的程度小而精度高。n实践中S常称为不确定度,用u表示:u=Sn也可用扩展不确定度U表示: U=k*u k称为包含因子,是相对于置信概率P的置信系 数,置信概率P为测量数据包含于区间(-ku,ku)的概率。不确定的表征参数n当u值可信度较高时,由选定的P值按正态分布确定k值(当被测量服从正态分布时)。n当u值可信度较低时(由小子样获得u),则应按t
18、分布确定k值。n不确定度也可以以相对量的形式给出:ux/x, Ux/x。n不确定度的合成结果不仅与各分量的不确定度有关,而且与误差间的相关性有关。n自由度指所给方差(标准差)的估计量中所含独立变量的个数。自由度越大,所给估计方差越可靠。当按t分布计算时,自由度必须涉及。统计方法估计不确定度(I)n一:矩法n估计的有偏性:n由上可得为无偏估计量。因此取:标准差为:有偏估计,开放后产生系统误差。21niivsn211niivsn2211()niivnEnn221()1niivEn2211niivsn统计方法估计不确定度(II)n二:赛贝尔公式 有偏估计,有系统误差,其值偏小,无偏形式修正如下:1/
19、Mn为修正系数,对于正态分布情形,其值见表。211niivsn21111niinnvssMMn统计方法估计不确定度(II)n由修正结果系数看,有偏性只有在测量数据较少时才有较明显。由此造成的影响可用估计量S的标准差Ss来评定: n很小时,所得的估计量S的分散性较大,但n增大时,这一分散性减小。2(1)ssSn统计方法估计不确定度(III)n三:极差法:n标准差估计:对于正态分布,dn值见表n测量数据较少时,极差法给出的结果为标准差的无偏估计,精度比贝塞尔公式给出的结果略高一些。maxminnWxxnnWsd统计方法估计不确定度(IV)n四:最大误差法:无偏估计,特别地可用于一次实验数据。n12
20、345678910152025301/Kn1.250.880.750.680.640.610.580.560.550.530.490.460.440.431/Kn1.771.020.830.740.680.640.610.590.570.510.480.460.44max1|insKmax1|insvK统计方法估计不确定度(V) n五:别捷尔斯公式: 无偏估计,精度与贝塞尔公式相近1|2(1)niivsn n1|1.253(1)niivsn n标准差不确定度合成n各误差分量相应的不确定度合成测量结果的总不确定度时,不应按线性关系叠加,而是采用方差求和的方法,并且还考虑到各误差分量的相关关系。
21、测量结果的总误差为各项原始误差的线性和:根据随机变量方差性质,其线性和方差为: 1nyiiiax211()()2nyiiklklik l nDa Dxa a D 22212niiklkkllik laaa2212niiklkkllik laaa标准差不确定度合成n相关项R反映了各项误差间的线性关联对标准差合成的影响。误差具有正相关关系时,其相互间的抵偿性减弱,此时,误差间的相关系数为正值,合成的总标准差偏大。反之,误差间具有负相关关系时,抵偿性增强,合成总标准差偏小。n当误差间具有最强的正相关关系时,相关系数为1,合成的标准差最大。若各项误差间均满足这一条件,即kl=1,则关系式可化简为:n当
22、误差间互不相关时,相关系数kl=0,此时标准差可化简为:221niiiaR22112|nniiklkklliiik liaaaa21()niiia标准差不确定度合成n实际中,以子样的标准差代替总样的标准差,且各误差间互不相关的情形是常能得到满足或近似满足的。因此:n系统分量的误差也用类似于随机误差的标准不确定度表示。且一般认为不确定系统误差与随机误差是不相关的,则合成的标准不确定度应为:n当系统误差相关项和随机误差相关项都为0时:2211()()nnririsjsjijua ua u2211()()nnririsjsjrjijua ua uRR21()mniiiua u22rsuuu21nc
23、iiuu标准差不确定度合成 可见,对于不确定度合成中的系数既是误差传递中的传递系数。12122222212212112211()()()2211()()2211()()222xxxDxDxDxu扩展不确定度合成n由上述扩展不确定度与标准不确定度关系得,在扩展不确定合成中,只要将扩展不确定度除以各自的置信系数后,按照标准不确定度合成,最后标准不确定度再乘以总的置信系数就可得总的扩展不确定度,这样可以避免扩展不确定的公式计算。n实际中,多数误差因素服从正态分布,非正态分布误差因素比重较小,此时总误差接近正态分布,k值按正态分布取。当各个误差和总误差都取相同的正态分布置信度时可以得到扩展不确定度的合
24、成公式与标准不确定度的公式相同。特殊地,当rkl=0时:n对于不确定的系统误差,其扩展不确定的合成可直接用“方和根”法。n对于单次测量结果,当测量误差服从正态分布,且互不相关时,不论是随机误差还是系统误差其扩展不确定度一律按统一方式合成。*Uk u21()niiiUa U例题 如图,测得l与a,计算h值。设a=35.42,l=48.62m测量扩展不确定度分别为:Ua=1,Ul=0.05m。求h的扩展不确定度。22212242lhUh(*)( *sec*)(35.42 *0.05)(48.62*sec 35.42 *1 *2.91*10)0.06htgUlUtgmm221l解: 由几何关系得:
25、h=l*tg=48.62m*tg35.42 =34.12m 根据测量实际情况,可认为和 都服从正态分布且互不相关,故 的扩展不确定度计算如下:= (a U ) +(a U )故结果为: =m34.120.06 alh算术平均值不确定度合成算术平均值标准差12123211( ) (.) ( )( ) .( )nD xDxxxD xD xD xnn 22222121(.)nxn12.n1xn则其不确定度为:221rsuuuNrcruuN总不确定度为:t分布n被测量x服从正态分布,其数学期望为,标准差为,即服从N( , )。nx的n个测量值平均值也服从正态分布:n若以子样标准差s代替总体分布的。 则
26、变量 服从自由度r=n-1的t分布。 对于子样的不确定度置信系数按正态分布取值一般有较大的误差。子样较小时,合成总扩展不确定度时,应按t分布确定k值。x( ,),(0,1)/NNNn即x/tsnt分布评定扩展不确定度 变形得x/tsn 此法给出的扩展不确定度具有确定的置信概率,而与估计标准s的可靠性无关,与按正态分布给出的扩展不确定度不同,此法克服了估计标准s可靠性的影响。 自由度表示不确定估计量所含信息的大小,反映了不确定估计量的可信程度,是不确定度小子样估计的重要参数。对于单次测量 令t=ta,则x-=应视为相应于置信概率P=1-a的扩展不确定度Up,有:/xtsntsx*paUts统计法
27、估计不确定度的自由度 等精度测量数据残差平方和 中所包含的变量vi的数目为n,残差为:11niiiiivxxxxn 计算式中的约束条件为 ,约束条件个数为1,所以残差平方和的自由度为:r=n-1 等精度测量数据数目为n,待求量数目为t,则残差平方和包含数目为n。为获得n个残差所列的t个方程,即约束条件为t。所以残差平方和的自由度为: r = n t 21niiv11niixxn非统计法估计不确定度的自由度 标准不确定度计算自由度 S(ui)表示ui的标准差(ui)的估计量 (ui)反映了ui的可信程度扩展不确定计算自由度UU扩展不确定度的估计区间,为U的扩展不确定度kU表示UU的包含因子221
28、11()*2( )2iius u或2()2UUkUU总不确定度的自由度 总标准不确定度的自由度取决于分量的自由度。 当各不确定度分量估计量ui的自由度i已知,按韦尔奇-萨特斯韦特公式计算合成标准不确定度uc的有效自由度。 各不确定度分量ui与总不确定uc的关系为:441cniiiuu22211|( )|nnciiiiiuuau x不确定度合成例题 为分析转台速率精度,测量时段T内的转角则可得角速度 ,设测得T=300s,=6.48*107,分析其相对扩展不确定度。T21TTT12211TTTT 式中,转角测量误差包括两部分,测量仪器光栅刻线误差1和角度伺服跟踪误差2.于是误差表达式写为:可得其
29、误差表达式为:n解:由测量方程T12311223T11223212322211,111TTTTTTTuuu 设,得相应的标准不确定度合成表达式为u = uuu式中u,u,u111U2UU222UUaUUkUUUUk30.640U20.2p99%40tt11光栅刻线的不确定度由其刻画工艺决定,为=0.6 ,该值的可靠性估计为0.2 ,即 =0.2由式 =可得的自由度为(正态分布)2 =2按置信概率,自由度查 分布表的临界值: =2.7111aktUu0.22k10取包含因子= =2.70,则标准不确定度为0.6 =2.70212U2UU222UUUUUU *20%5 *20%1kUUUUk351
30、12U11p99%112t2222伺服系统跟踪相应的扩展不确定度分析为=5 ,估计该值的不确定范围为20%,即的不确定度为: =由式 =可得的自由度为(正态分布)2 =2按置信概率,自由度查 分布表的临界值: 222aatktUu1.9k2 =2.63取包含因子= =2.63,则标准不确定度为5 =2.638T22252T6TT5*10T UTss()232 1.5*10()()112223*10P99%TTUUUTUKUUKUU-8-8-8-5基准源不确定度用作时段计量的基准相对误差,该值可变动范围可估计为:1*10 ,相应的扩展不确定度为:= *5*10 =300 *5*10 =1.5*1
31、0由式 =其自由度为: =按,=11a56tt1.5*105.7*102.63TaUstTTT2,查 分布表 =2.63U则标准不确定度为 U =K4132763211223T2221*0.227.34 *10/3001*1.96.34*10 /3006.48 *10*5.7*104.1 *10 /(300 )40112=1127.3Tussussusss1232123合成标准不确定度1u =T1u =Tu =T其自由度分别为:,合成得总不确定度为:u = uuu(42-32-3234 *10/s) +(6.34 *10 /s) +(4.1 *10 /s)7.6 *10 /s444412312
32、33444343432(7.6 *10/ )196(7.34 *10/ )(6.34 *10/ )(4.1 *10/ )40112112P99%196tta2.576U*2.58*7.6 *10/1.96 *10/uuuussssKuss总扩展不确定度自由度为:按,查 分布表则总扩展不确定度为:其相对扩展不28781.96 *10/9.1*106.48 *10 /3009.1*10P=99%2.58,196.sskrr确定为:UU=最后结果:相对扩展不确定度为U,置信概率为,包含因子自由度测量不确定度的微小分量n舍去某一个不确定度分量计算的总不确定度和没有舍去以前计算的总不确定度若很接近,则称
33、此不确定度为微小分量,可以在计算中略去不算。n原则:舍去后以不影响合成总不确定度的有效数字为限。通常按总不确定度的1/3来确定(合成后不确定偏差为0.5%)。不确定合成的意义n提高测量结果精确度 控制测量误差因素 选择有利的测量方法 控制最大误差分量 充分利用误差的抵偿性 为了有效提高测量精度,应从最大误差分量着手,控制最大误差分量,提高精度。在多次重复测量的算术平均值中,其标准差减小为测量标准差的(1/n)1/2,不等精度测量的条件下,按加权算术平均值原理处理测量数据。例题分析弓高弦法测量大直径的最佳条件。222Dsh222sDhhss Ds(1) hhhssU = (U ) +(1)U h
34、hshs1hshshh=D/2s=Dh0022222解: 测量方程以给出 =4测量的误差关系为=24其扩展不确定度为:24适当选择测量中的参数 与 ,使传递系数尽可能小。令 =04此时 4 既 =2这就是最佳条件,此时,传递系数为 ,传递系数也达到最小值,sh/2 =1.回归分析回归分析 直线回归直线回归 其他回归其他回归 一元线性回归ii1112221nnn12nxyyxxyxyxx,.yx.N(0,),nXX 000000 一元线性回归是处理随机变量和变量之间线性关系的一种方法,其数学模型为: =+式中,为待定系数, 为测量的随机误差=+=+当 值为相应有=+设测量误差服从同一正态分布且相
35、互独立,则利用最小二乘法估计参数, ,设估00bb y=bbx计量为, ,那么可得一元线性回归方程为: +nii 1iiiiiii0i22iii0i1110nniiii=1i=12ii=yyvvyyy(bbx )Q(yy )y(bybby-bxnbx yyxb=x )QxnnniiiQii2i值 的 大 小 反 映 全 部 观 测 值 与 回 归 线 的 偏某 一 观 测 值与 回 归 值之 差 用表 示 :+它 表 示 某 一 点 (x ,y )与 回 归 线 的 偏 离 程 度 。记 =v+,根 据 二 乘 原 理 , 应 使的 值 最 小 。 经 推 导程可 得 :离度niii=1nnn
36、2ii1i=1i 10= y=bb(xx)(yy)xxxxy(x)x-xyxxhh至 此 , 可 确 定 直 线 方 程 为 :+直 线 过 点 (, )2222222220/2221/21():1 (1)*1pInterceptIntercept*(2)*(2)*iiiayiayiyyRyynRAdjRAdjRRnpxxxxtnsxxslopetnsxxs 0yy相关系数:调节 squre( 为自变量个数)1截距抽样标准误差:s =s *n1置信区间:n置信区间:其中s 为拟合估计标准差:2i,2iiyyyn是对误差项的标准差 的估计,其值越小越靠近线。回归方程的方差分析11n22i=10i
37、0()()()2()2()()+()bbxbbx2(nniiiiiiiiinyyyyyyy2iinniii=1i=1i个观测值之间的差异 称离差 ,由两个因素引起。一是变量之间的线性依赖关系引起;二是由其他因素引起。 测量值之间的变化程度可用总离差平方和表示,记为: s=(y -y)yyyyyy把,y=代入,得yni=122)()=0U()Q=() UyxQyiiiiyyyynnii=1i=1y令y ,y称,。即回归平方和反映回归直线对均值的偏离情况剩余平方和反映测量值对回归直线的偏离情况随 变化产生的线性变化在总离差平方和中起的作用。 称,。即其他因素引起的 的变化在总离差平方和中所起的作用
38、。回归方程的方差分析xyyyyyxSUQSUQSUQySUQSUUQS,UU=bhS=hQ=S-U=h -bhn-11n-2,Q2s2U2Q2s2U回归平方和 相对于剩余平方和 的大小反映了回归效果的好坏。同时计算时有:设的自由度分别为,有关系:=+其中:sE =U则有方差:E =QE =E 可看为各种因素对离差影响的平均效应。E 可看为,-自变量的变化对离差影响的2Q。E 可看为其他因素对离差影响的平平均效应均效应。回归方程的显著性检验aaa0.01yxFF1FFFFFFFFFFUQ为定量说明 与 的线性密切程度,通常用 检验法,即计算U/统计量: =Q/U/对一元线性回归,有 =Q/(n-
39、2)计算检验步骤为(1)由上式计算出 值。(2)根据给定的显著性水平a=1-P从 表中查取临界值 (1,n-2)。(3)比较 值和临界值 。若(1,n-2),则回归效果显著,否则效果不显著。通常有以下几个等级: (1,n-2) 回归0.050.010.10FFFxFyF效果高度显著,称在0.01水平上显著。 (1,n-2)(1,n-2),称在0.05水平上显著。 (1,n-2),回对 的线性归效果不显著,关系不密切。重复测量数据检验回归方程拟合质量ELELEELLQQQQxQxyQQ Qy+QQQFny误差平方和失拟平方和反映测量误差的影响在剩余平方和中的比重,反映 对 剩余平方和 中还包含着
40、 对 的非线性影响,以及此外那些未加控制的因素的影响。通过重复测量的方法,把 分解为和。三者的关系为: =用误差平方和对失拟平方和进行 检验,即可以确定回归方程拟的非线性影响和其他因素对合的好坏。 设的影响。个测量点ELSUEL2112121211mS U+Q +Q() ,1() ,1() ,2() ,(1)mnijSjiniUinLiiQLimnEijiQEjiSyynmUmyyQmyynQyyn m,每个测量点进行重复测量 次,有: =,计算式如下:显著性检验的步骤 EL1LQL1EQE1aQLQEUE22EQQQFQ /FQ /1F F (,) (1)yx(2)yxU/ QUFFQ /
41、首先用误差平方和对失拟平方和进行检验,作变量 =、此时检验结果显著,失拟误差相对于测量误差不能忽略。说明:影响 的因素除 以外,至少还有一个不能忽略的因素。 与 不是线性关系,而是某种非线性关系。先用对进行检验,即=E2aUQEU33Q2aUQQF F (,)U/QUFFQ/F F (,)Qs =ssn-2如果即检验结果显著,说明测量误差很小。 再用对进行检验,即=如果即检验结果显著,说明剩余误差很小。若,( 给定),则回归方程可用。1aQLQEUEL2ELQEQL2aUQEQL2aUQEQL2FF (,()F F (,()(1)(2)、此时检验结果不显著,说明非线性误差很小,或者说测量误差等
42、随机误差因素起主要作用。 把和合并起来对 进行 2检验=如果即检验结果显著,方程可用。 如果即检验结果不显著,可能有如下情况:测量误差与非线性误差都很大。测Q(3)Qs()ns s量误差过大。回归直线斜率太小,接近水平。 对于(1)(2)情况,拟合结果不理想。 对于(3),若=给定 ,拟合方程可用。-2根据回归方程预报和控制因变量y的取值范围 Q00QQQQaxy xxyx xyys (y =b +bx )95.4%ys99.7%syss000000 在一定的显著水平 上确定与 对应的 的取值范围。如果 服从正态分布,对于每个确定的 , 的取值也服从正态分布。当 = ,值落在2区间内约为;落在
43、3 区间约为。把剩余标两条直线 y =b +bx-2和y =b +b准差作为预报精度的指标。 作可能出现的全部 有95.4%的点落在这两条x+2直线范围Q12Q2y2yxsyy,xxs1()syx()xxxsnxx10112202内。 控制指根据要求的 的取值范围,由回归直线确定自变量 的范围。y =b +bx -2如果 控制在yy 由解出 , ,便可确定范围。y =b +bx +2注意:(1)仅限于数据观测范围。(2)回归方程稳定的前提下。若方程不稳定,即标准差= 1+,则预报 值的精度与 有关,越接近平均值,精度越高,反之越低。利用回归方程进行估计和预测n回归分析主要目的是根据回归方程进行
44、因变量预测和自变量控制。其中包括点估计和区间估计。点估计即用回归方程直接求解,而区间估计需要置信度的计算。n区间估计包括: 1:由x0求出y的平均值的估计区间,称为置信区间。 2:由x0求出一系列yi值的估计区间,称为预测区间。y平均值的置信区间估计000000020y2022 y21000/xE(y )xxE(y ) E(y )s1 sxE(y )(1-a) yyniiaxxsnxxt001000 给定,为 的平均值或期望值;当时,y =+x为E(y0)的估计值,而y 一般精确不等于。y 推断的方差为:则,对于给定,在置信水平下的置信区间表示为:2022121*2yniiiiyxxsnxxy
45、ysn其中: y的个别值(yi)的区间估计0220210i200/221 yi1* 1nxy(1)1* 1nyyyniiayniissxxsxxaxxytsxx22ind2的个别之方差为: s 则对于给定, 在个别值的区间估计为: 一般y个别值预测区间比置信区间要宽一些。表明,y的平均值比预测y的个别值更精确。预测区间置信区间函数一元非线性回归n非线性关系的两种解决方法:一是通过变量代换,化曲线回归为直线回归,用一元线性回归方程的方法求解。二是通过级数展开,区间函数变成多项式的形式,把解曲线回归转化成解多项式回归。n对一元线性回归方程,可用相关系数R来衡量线性回归效果。11iin2ii2n2i
46、(y -y )R =1-(y -y)QUSS2回归方差R =1-总方差可化为直线的常用曲线bbx1bx11ab y=abx y=xyxyxy axy=abx y=lgyx =lgxa =lgay aey=abx y=lnya =lna1y aey=abx y=lnyx =a =lnaxy a+b*lgxy=abx x =l11双曲线 (,)幂函数 =(,)指数函数 =(,)负指数函数 =(,)对数函数 =(-xxgxSyy=abx y=xea bey-)11型曲线 =(,)+多元线性回归12n111111122221nnnny fx ,xxyxyx.yxXUQYSnmmn = (. )数学模型
47、: 同一元线性回归类似有=+逐步回归与多项式回归n逐步回归分析,指从一个自变量开始,按照每个自变量对因变量影响的显著程度的大小依次引入。如果由于新变量的引入,使先引入自变量的影响不再显著,则将先 前自变量剔除。这项工作进行到再没有影响显著的自变量可引入为止。n回归多项式可转化为多元线性回归方程。抛物线回归的幂次选择 称为M次抛物线回归。 抛物线的幂次可从一次线性关系配起,然后逐级提高幂次,每提高一级,进行一次方差分析,并对本级与前一级回归平方和之差进行一次检验。如果差异显著,再升一级;否则,认为前一级幂次已经恰当。0122.MMybb xb xb x幂次选择具体方法12012012222,.,
48、bbbQSQ()FFny yyyaaxQSyxxnnn2221i1ii1ii=1i=1i=1n22i22i=12121 设有一批观测值 第一次配一元回归直线 进行方差分析:U =(y -y)(y -y )(y -y) 第二次配简单抛物线 进行方差分析:U =(y -y),U 两回归平方和之差为: UU用对 UU 进行 检验,即2202Q /(3)F(1,3),yF(1,3),MaanFnyaaxFn21UU 如果即检验结果不显著,二次项对 影响不大,可以不增加。此时,回归方程为: 如果即检验结果显著,可继续配三次抛物线。直到第次检验结果不显著,则回归方程幂次为(M-1)次。量热误差分析量热误差
49、分析1212222221C241212222221C2224112112smgmm mm m +mmm2ss ,()()()2ss()()smmmmmmMmmMmm1212配溶液: 天平标准差 =0.1 (1)分开(归零)称:溶质质量 +溶剂质量+溶液质量+ 若配制质量浓度(kg/L)溶液密度 若配制摩尔浓度(mol/L) 若配制浓度为(mol/kg)2221C22241121122221241212222221V12241211221s()()21ss()()2ss ()()()(2)smMmmMmmmmmmmmmmmm 若配制质量分数 若配制体积分数 , 溶质密度不归零称: 经计算,以上
50、第二项都没有系数2.流动混合功率P的标准差 -200 -100 0 100 200Time,hour5101520P,nWTime BaselineHeat FlowPoutc(t) Pcalc(t) Pun(t)Pov(t)Calibr.const= 1.71162, 1.56815 Diff=8.38249%Time const= 104.665, 115.958 Diff=-10.7892% Drift=56.7201 Fluct=128.38 Error=131.476 nW/24hNoise: Raw=35.4065 nW Filt(0.1Hz)=10.2783 nW22mR22PmRru = Drift +Fluct1u*3uuuu()P基线漂移不确定度量程最小热量读取不确定度=4000系统未定分量标准差均匀分布计算则 的标准不确定为: 量程=4000= 焓计算公式标准不确定度分析2222fD
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年江苏省靖江市高二生物下册期末考试考试卷含完整答案(典优)
- 2025年辽宁省北票市高二生物下册期末考试检测卷【夺冠系列】附答案
- 2026年贵州省都匀市高二生物下册期末考试试卷附参考答案【黄金题型】
- 2025年青海省玉树市高二生物下册期末考试模拟卷附参考答案【黄金题型】
- 2025年云南省芒市高二生物下册期末考试试卷附参考答案(达标题)
- 2026年河南省济源市高二生物下册期末考试检测卷重点附答案
- 2026年浙江省慈溪市高二生物下册期末考试模拟卷【各地真题】附答案
- 2026年湖南省临湘市高二生物下册期末考试试卷及答案(各地真题)
- 2025年黑龙江省抚远市高二生物下册期末考试测试卷及完整答案【典优】
- 2026年湖南省武冈市高二生物下册期末考试检测卷【B卷】附答案
- 江苏省无锡市2025-2026学年五年级下学期6月数学期末调研试题(试卷+答案)
- 湖南省2026年全省政工专业知识考试(政治+中国近现代史)试题解析及核心考点
- 广东省中山市2024-2025学年高一地理上学期期末考试试试题含解析
- 天津市南开区2023-2024学年四年级下学期6月期末数学试题
- 2024年四川省凉山彝族自治州中考道德与法治真题(原卷版+解析版)
- 质量信得过班组汇报材料课件
- 学院监察工作试点的实施方案
- 中学数学教学设计研究的开题报告
- APD自动化腹膜透析机的使用
- 220kv输电线路工程建设监理实施细则
- 体育概论全部课件
评论
0/150
提交评论