误差与数据处理_第1页
误差与数据处理_第2页
误差与数据处理_第3页
误差与数据处理_第4页
误差与数据处理_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.第1部分:数据、错误和统计计算,Outline,数据-信息-无法获取数据挖掘物理量的精确值;误差:实验误差随机误差(偶然误差)、系统误差、误差误差计算误差剪裁误差、舍入误差从计算误差(计算机数值计算的基本问题)开始计算实验误差-样本和整体-测量值、误差的统计规律性实验误差的修正(异常数据删除)参数估计、统计测试(整体不同分布)一般分布函数,数据(Data)、数据(Data):数字数据、非数字数据信息(Information)数据挖掘(Data Mining)模式识别人工智能.数学统计(理论)-统计计算(应用),数据和错误,实验错误数据源:测量(实验)Kolthoff验证:物理数量的确切值是不

2、可能的。加工误差(计算误差)计算过程是误差,误差分类,实验误差随机误差(偶然误差)得到随机因素造成的难以控制的误差;统计研究的焦点(正态分布)系统误差是由某些人为因素造成的,只有实验结果有明确的固定偏差时,才能进行统计试验,一般不能增加实验次数,消除误差明显扭曲实验结果的误差异常值、Outlier、统计研究的焦点!错误分类(Cont .),计算错误(处理错误)截断错误近似算法(无限系列近似)计算机字符长度限制舍入错误截断舍入(四舍五入)乘以,计算错误除以,数值计算研究的重点!例如:地球的表面积计算,数学模型:误差:地球被认为是球,简单的理想模型系统误差,人工误差测量设备误差如何测量地球的半径长

3、度r计算误差截断误差:公式中有不合理的数舍入误差:浮点计算,误差和统计计算,统计计算两种类型的误差!计算错误,计算机计算时发生的错误数计算机上舍入错误截断错误计算机算法的基本问题计算复杂性稳定性问题的并行性,数值计算的最基本概念!计算机上的数字表示法-浮点数,计算机上数字的表示方法,说明:计算机的数量不仅是有限数,还可以是有限精度,是实数集的子集。由(t,L,U)唯一确定的浮点数,f .数字,数字集f,数字实验-float gui.m (t=3,l=-4,U=3)f=(0330f=;for e=Emin : emax f=f(1 f)* 2 e;如果End,t=3,l=-4,u=3 EPS=1

4、/8=0.125,则表示1-2之间数字的1.125 1.250 1.375 1.500 1.625 1.750 1.825 2现在给定实数1.0625,如何表达?误差是多少?计算机上的数字表示-浮点数,结论:浮点数元音f中的元素分布受计算机字符长度限制,因此浮点数只能是有限集合,即字符长度增加,浮点集合增大。放学后练习:运行floatgui.m程序并观察可以通过调整(t,U,L)值表示的浮点集的变化,其中,只有不能直接表示的实数是“she”或“in”接近的浮点数。(t,U,L)给定后可以表示的浮点数(floatgui.m程序修改),计算机的数字表示-浮点数,结论:端数的数量确定EPS的大小,计

5、算机的精度l,u表示的浮点数的大小范围,计算机的数字表示-浮点数,IEEE双精度二进制数使用64位存储一个数字。每个0或1位的分配如下:结尾1结尾52次要代码11 t=52、-1023=s 1、x=x/2、pause (.02)、end x=1;while x x x x,x=2 * x,pause (.02),end x=1;while x x x x、x=x/2、pause(.02)、end、计算错误分析任务,3 .the classic quadrant formula says that the two roots of the quadrant equation use this f

6、ormula in MATLAB to compute both roots for a=1;b=-10000000;c=1 compare your computed results with roots(a b c)what happens if you try to compute the roots by hand or with a hand calculatoryou should find that the classic formula is good for computing one root,But not the other。so use it to compute o

7、ne root accurately and then use the fact that x1x 2=c/a to compute the other。计算错误分析任务,4 .the power series for sin x is this MATLAB function uses the series to compute sin x . functions=powers in(x)% powers in . it tries to compute sin x . functionst=x;n=1;While s t =ss=s t;T=-X. 2/(n 1) * (n 2)。* t;

8、n=n 2;end what causes the while loop to termin ate?answer the following questions for how accurate is the computed result?How many terms are required?what is the largest term in the series?what do you conclude about the use of floating-point arithmetic and power series to evaluate functions?实验误差和处理、

9、实验误差(Outline)随机误差-随机变量整体、样本整体数字特征样本特征量及其计算直方图-概率密度函数整体分布的估计和检验正则测试:QQ检验数据的转换和校正、随机误差和随机变量,随机误差无法控制的某些因素的随机波动而形成的误差也称为偶然误差;随机现象如果由于随机误差的存在,基本条件不变,迭代测量得到不同的结果。随机事件随机现象的结果(例如,从衡量标准中获取值)概率随机事件A的概率P(A)表示事件A发生的可能性大小。随机误差和随机变量,概率的公理系统随机事件a的概率满足必需事件u的概率为1。B互斥(不相交),P(A B)=P(A) P(B)频率n次尝试中随机事件A发生A次,F(A)=a/n是随

10、机事件A在n次尝试中发生的频率和概率。n为无穷大时,频率的限制是相应事件发生的概率,随机误差和随机变量是根据实验结果随机获取各种值的变量。(随机现象和随机变量的值)离散随机变量的某些随机变量只从离散点取值。例如掷骰子扔的点数,同时扔两个硬币正面出现的硬币数。连续随机变量具有将实数轴的连续区间(例如加工部件时的处理错误、炮弹落点到目标的距离、两个电话之间的时间间隔等)的概率描述为随机变量的值整体和样本的随机变量。用整体随机变量x的所有可能值构成研究的整个对象称为整体有限整体和无限整体随机变量的值的规律性-方差函数离散x是离散随机变量,列出了所有可能的值和获取此值的概率,并给出了x概率分布的一般离

11、散概率分布(共同概率分布)。请参见doc)、全部和采样、连续、公共连续概率分布和密度函数(公共概率分布)。请参阅doc),整体和样例、随机变量的数值特性(全部)是随机变量X值的基本统计特性数学期望(Expectation,平均值)E(X)方差d (x)和标准差协方差(Covariance)以及相关系数(corrers)doc),整体和范例以及从每个个别观测中取得的测量称为由个别取样n个个别组织聚集在一起构成整体观测的范例。其中观测次数n称为采样容量观测,整个x为一个值。样品容量为n的样品可以在同一群体的任意变量中视为n个不同的值。取得的值也称为范例观测。样本的双重性:在观察(采样)之前n个随机

12、变量(与原始变量相同的分布)观察(采样)之后n个观察(随机变量的值)、全部和样本。样品实验研究样品的目的,并推测整体特性如何生成样品的原因:无重放样品由简单随机样品组成的每个对象和由群体相同分布样品组成的每个对象彼此独立、全局、对象选择、样品、观察样品、样品观察、(数据)、数据处理、与样品相关的结论、推断、整体特性、统计、统计,考虑没有未知参数的样本函数,以集中整个和样本,统计中简单随机样本引起的全部信息。这些“没有未知参数的采样函数”的分布称为统计采样分布统计信息,(2)样例平均值,(4)样例分布,(5)样例标准偏差,(3)样例k阶中心力矩,(1)样例k阶原点力矩,注:常用样例统计信息,示例

13、统计信息的Matlab计算,平均平均平均平均平均平均平均平均分布Var标准偏差范围中值Mean示例:a=Range (100,1);mean(a);A=rannn (100000,1)mean(a);随机变量的概率分布,测量值-随机变量-概率分布?绘制直方图以查找最大值和最小值,极差r根据采样容量大小分组。大子10-20组,小采样(n=0增加时f(x)值降低-df(x)/dx=mf(x),x=0,随机误差的分布(密度函数)、高斯的操作(高斯,1777-1855)从饶日天体运动的理论导出随机误差分布的概率密度函数高斯分布(正态分布)、样本估计全部:使用参数估计、正态分布、相等分布的样本配置统计信

14、息进行估计!参数估计点估计-最大似然估计间隔估计,从样本中估计的全部:参数估计,最大似然估计,从样本中估计的全部:参数估计,最大似然估计,最大似然估计高斯分布,推导随机误差分布的密度函数,最大似然估计高斯分布,最大似然估计高斯分布,假设检验,假设检验的原理(请参阅:what-if test.doc)是测试的应用测量的正态概率分布等距直方图总体概率密度函数(前面介绍)等频率直方图拟合优度检验法QQ检验法(直线检验法),假设检验,等频率直方图拟合优度检验法,假设检查、QQ检查法、假设检查、QQ检查法(续)、假设检验,QQ检验法(续),假设检验,QQ检验法(续),假设检验,QQ检验法(续),假设检验,QQ检验法(数值测试),Matlab程序(源程序)经验分布函数:cdfplot正态假设检验:qqplot,normplot,假设检验,假设检验-QQ检验法示例:已知20名学生各科目的平均成绩为56,23,59

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论