简谈测量数据处理中的正态分布.docx_第1页
简谈测量数据处理中的正态分布.docx_第2页
简谈测量数据处理中的正态分布.docx_第3页
简谈测量数据处理中的正态分布.docx_第4页
简谈测量数据处理中的正态分布.docx_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

简谈测量数据处理中的正态分布 彭碧瑶 201312123010摘要:基于概率论与数理统计中的正态分布,在实际生产生活中应用广泛,其也可以在测量过程中得以应用。对于测量数据的处理,正态分布的分布方式与模型在误差分析过程发挥着巨大作用。0.引言在测量工作的进行过程中,对于部分客观存在的量,无论测量仪器多么精密、测量方法多么合理,其测量结果总会存在带小不同的差异,用术语来说便是误差。而这时,正态分布模型及其曲线在误差分析和数据处理便发挥了重要作用。1.高斯法导出的偶然误差曲线实际上,测量数据误差的产生原因有很多,正态分布也并不是都能适用的。而在测量过程中所产生的偶然误差(看似无规律)则恰好符合正态分布,因此对于偶然误差的分析与减小,正态分布便是不可或缺的处理数据方式。人们通过大量的实践,总结出偶然误差所具有的特点:具有界限:在固定的观测条件下,误差的绝对值有一定的限定,换句话说就是超出一定的界限值的误差,其出现的概率为零;聚集中间:绝对值较小的误差比绝对值较大的误差出现的概率大;左右对称:绝对值相等的正负误差出现的概率相等;互相抵偿:偶然误差的数学期望为零。因此,高斯结合实际测量,导出了偶然误差分布曲线的解析表达式,也就是一维正态分布的密度函数曲线的解析式。高斯法的一个关键是:当n时,l=lin即算术平均数趋近于该变量的数学期望。因此,可以认为观测值误差和观测值改正数v有相同的特性。设对某随机变量观测n次,出现n个误差1,2,n,其联合出现的概率为 P(1,2,n)=f(1)df(2)df(n)d出现这一组,而不出现其他一组,说明这一组误差联合出现的概率最大,上式有最大值,等价于G=f(1)f(2)f(n)=max或lnG=ln f(1)+lnf(2)+lnf(n)=lnf(v1)+ln f(v2)+ln f(vn)=max式中,vi=l-li是l=lin函数,不同的l有不同的vi。要在上式最大条件下找出l,或者说找到这样一个l,使一组v1,v2,vn出现的概率最大,因此将上式求导并令其等于零,即d(lnG)dl=dlnfv1d l+dlnfv2dl+dlnfvndl=0因为dvidl=1 再令dlnfvidvi=(vi)则有 (v1)v1v1+(v2)v2v2+(vi)vivi=0又因为 v1+v2+vi=0则必有 (v1)v1=(v2)v2=vivi=C=(v)v即 dlnf(v)=Cvdv lnf(v)=Cvdv=12Cv2+B f(v)=e12Cv2+B=Ae12Cv2q其中,A,C是两个待定的常数。因为v和具有相同的特性,将上式的v换成,即 f()= Ae12C2 因为因变量为2,上式为偶函数,即满足f()=f(-),又因为绝对值大,f()小,即为降函数,令12C=-h2 又由偶然误差性质知: -+f()d=1, -+Aeh22d=1令t=h,则dt=hd,有 A-+e-t2dt=1 Ah=1即 f(v)=he-h22 高斯称h为精确度。h值不同,曲线形状不同。由方差定义式得 2=-+2f()d 得 2=12h2 即h2=122由此可得 f()12e-222这就是偶然误差分布曲线的解析表达式,若将作为一般的随机变量并用x表示,则数学期望不等于零,设为,则由上式可知一维正态分布的密度函数曲线的表达式为 f(x)12e-(x-)222取f()的一价导数并令其等于零,即 f()12e-222(-222)=0当=0时,f(0)= 12为函数的最大值。取f()的二价导数并令其等于零,即 f()12e-222(2-1)=0由此求出的为曲线拐点的横坐标,其值为 拐=以上便是由高斯法导出偶然分布曲线的关系式以及特殊点。2.衡量误差的指标在上面我们已经推出了偶然误差分布曲线符合正态分布的表达式,那么其性质也可以和正态分布对应。在测量数据处理中,需要评定结果的精度,即指偶然误差分布的密集或离散程度,也就是离散度的大小。而精度的高低则与上式中的h和有关。在测量中定义按有限次数观测的偶然误差求得的标准差称为中误差,即。在的几何意义中,越小,上面曲线的形状越陡峭,曲线在纵轴方向的顶峰越高,在纵轴两侧越迅速逼近纵轴,表示大误差出现的频率越小,小误差出现的频率越大,偶然误差分布越集中,其对应的精度越高;反之,越大,上面曲线的形状越平缓,曲线在纵轴方向的定峰越低,在纵轴两侧越缓慢逼近纵轴,表示大误差出现的频率越大,小误差出现的频率越小,偶然误差分布越分散,其对应的精度越低。而在正态分布曲线具有两个拐点,其值为变量的数学期望,对于偶然误差而言,数学期望是零,所以拐点为。根据正态分布的性质,设以k倍的中误差作为区间,则偶然误差在此区间中出现的概率为P(k=21-k.其中函数为标准正态分布函数。当k=1.96时,有PX-1.96=21-1.96=0.05.由此逆事件概率为0.95.设=0.05为小概率事件。在一次实验中,它不应该出现。从母体中抽取的xi来自N,2,则xN,2/n。于是有PX-1.96/n=0.95这就是说,区间(x-1.96/n,x+1.96/n)包含母体均值m的概率为0.95。显然,概率越大,区间越小,就越能知道m位于何处。因此,这是一种估计方法,称为参数的区间估计。其中该区间称为95%置信区间,此区间的端点称为置信限,95%称为置信度。而x属于这个区间,就能认为x代表m;若x m+1.96/n,就是小概率事件竟然出现了,与常理不符,也就不满足XN,2。我们用x来估计母体均值m,一是代表m,一是不代表m,那么就要进行判断,进行检验。而假设检验所用的方法就是:先作一个假设,称为原假设,记为H0,然后找一个合适的统计量(子样值的函数),利用抽得的子样来计算统计量的数值。如果在原假设H0正确的条件下,此数值出现的概率很小,则根据小概率事件原理,拒绝或舍弃原假设,否则接受原假设。检验不同于数学定理的证明。一个定理不带有随机性;而假设是否被接受则受抽样随机性的影响,所以称为统计假设。若H0遭到拒绝,则实际上是接受了另一个假设,称为备选假设,记为H1。采用什么样的备选假设,应根据问题的具体性质来决定。假设检验就是在原假设和备选假设中作出选择,两者性质是一样的,并无重要与不重要之分。从假设检验的过程可以发现,其主要工作是母体分布的选定及其检验,参数估计和统计量的检验,而正态分布又是一个常用的母体分布模型,根据正态分布曲线以及其性质可以更好的进行假设检验,以求出所需要的参数。4.结语 科学的发展无不与测量息息相关,对自然界所发生的量变现象的研究,需要借助于各式各样的试验与测量来完成。而试验的结果会产生大量的观测数据。那么就需要正确熟练的处理数据,因此,正态分布在误差分析中的作用很重要,重要在于它是一种模型,简化了偶然误差处理过程,有助于更直观的分析和改正;其在数据其他处理中也可以发挥其模型直观的作用。更多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论