误差理论与数据处理自主学习报告_第1页
误差理论与数据处理自主学习报告_第2页
误差理论与数据处理自主学习报告_第3页
误差理论与数据处理自主学习报告_第4页
误差理论与数据处理自主学习报告_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本科生自主学习报告误差理论与数据处理学生姓名 TOC o 1-5 h z 专业学号学院二。一九年五月y = b0 + b式中,为和b为回归方程的回归系数。实际测得值先与这个回归值之差就是剩余误差% =儿一?=儿一坛 一 bxt,t = 12 ,N应用最小二乘法求解回归系数,就是在使剩余误差平方和为最小的条件下求 解回归系数为和b,这种方法我们在第五章中已经熟悉了,用矩阵形式,令那么误差方程的矩阵形式为Y-Xb = V对照= 又,设测得值%的精度相等,那么有b =(xTxy1xTY计算上式的以下矩阵A = XTX = N维t=lN 、 % t=lN t蛭c = 4T =- %oi(l,N 2),

2、回归在0. 01的水平上高度显著。0.05(LN - 2)F Fo,oi(LN - 2),回归在 0. 05 的水平上显著。%io(l,N 2)F %o5(LN 2),回归在0. 1的水平上显著。F1 kAnp Anp :八夕1 %zf122 匕 l 17版 匕I n匕 li211 X X . W22iMX2iW不I )为 XkipolB=庆A-X f Y = 2乂1生即(X X)8 = x Y由于x,x满秩,故有6 = (X X)TX Y将上述过程用矩阵表示如下19寻找一组参数估计值,使得残差平方和最小nQ = Wee =(y-x6)(y-x6)i=l即求解方程组:U人,人瓦(y-X0)(丫

3、-xs)= 0/ / / / / / / /瓦(y Y - B x Y-Y X6 + 6 X x6) = 0等(y y - 2yx6 + 6xx6)= ox y + x x6 = o得至U:x,y = x,xg于是6 = (X X)_ Y正规方程组的另一种写法:对于正规方程组X,Y = X,X8将Y = xB + e带入得:X , XR + X e = x XB于是X/e = 0寸2 G = 0= O j = 12,k上面两个式子是多元线性回归模型正规方程组的另一种写法。二、回归方程的显著性和精度来源平方和臼由度方差F回 归 残 余M U=W(RP)2=2型小 t) = 1MU/MU/M a2

4、Q =一%)2 =lyyutN-M-1 = QN-M-1总C / J - LyyN-120三、每个自变量在多元回归中所起的作用问题:一个回归方程显著,并不意味着每个自变量对因变量y的影响都是重 要的,有些重要,有些次要,如何确定?解决方法:考察偏回归平方和外的F统计量衡量每个自变量为在回归中所起 的作用。偏回归平方和/ b/R = U U / =QiU-M个变量%1,%2,M所引起的回归平方和;U去除勺后的M-1个变量。用剩余平方和Q对它进行F检验::PJ1当代 七(LN - M 一 1)时,那么认为变量修对y的影响在a水平上显著。21第五章线性测量的参数最小二乘法处理测力计示值与测量时的温度

5、t的对应值独立测得如下表所示。t/151821242730F/N43.6143. 6343. 6843.7143. 7443. 78设t无误差,F值随t的变化呈线性关系F = kO + kt,试给出线性方程中系 数左。和k的最小二乘估计及其相应精度。A解:利用正规方程的矩阵形式求解,误差方程丫 = L - AX可写成W r1,21,3%15-18自左 一14 7 02 2 2 31111V2%刀6.%力6-43.61-43.6343.6843.7143.7443.781 1A= 1 1 1 -115-1821242730-可得夕=附 =L屋L = (AtA)-1AtL-K -式中c, 二 (A

6、/A)76135以19453195-135-i35ir i6 J1543.6143.63111111 43.6818 21 24 27 30J 43.7143.7443.7843.43240.01152A 将最正确估计值代入误差方程P = L AX,得43.43240.011520.0048-0.009760.005680.00112-0.003440.002为求出估计量的,k的精度,首先需要给出直接测量所得测量数据的精度。测量数据的精度也以标准差。来表示。因为无法求得。的真值,因而只能依据有限 次的测量结果给出。的估计值6,所谓给出精度估计,实际上是求出估计值6。一

7、、测量数据的精度估计1、等精度测量数据的精度估计对儿进行n次等精度测量,给出。2的估计量。可以证明QX1巧2)2是自由度 可一血的42变量。因而由此可知,去残差误差平方的平均值作为。2的估计量存2,那么所得户将对有系 统偏移,即将不是M无偏估计量。因为in)所以,可取八2(J作为。2的无偏估计量。因此测量数据的标准差的估计量为一般写成2、不等精度测量数据的精度估计不等精度测量的精度估计与等精度测量数据的精度估计相似,只是公式中的 剩余误差平方和变为加权的剩余误差平方和,那么2 EJUp”/=n t故测量数据的单位权标准差为(J =二、最小二乘估计量的精度估计最小二乘法所确定的估计量%1,%2,

8、,打的精度取决于测量数据的精度和线 性方程组所给出的函数关系。对给定的线性方程组,假设测量数据h。,品 的精度,就可以求最小二乘法估计值的精度。对于等精度测量最小二乘估计量的精度估计,设有正规方程W ail 卜=W ailail X1 + W QQi2 + , + W 五 Xti=lni=lni=lni=lnai2ail X1 + ai2ai2 %2 + l ai2ait xti=li=li=li=l2 ait k = W。江心1 X1 + E aitai2 x2 +f- W Q比Q比 Xti=li=li=li=l(*4)T =dn21利用上述不定乘数,可求得X1 =Ji + 2% + + n

9、ln其中:41 = dii0ii + di2a12 HF dltalt/=1121 + %2a22 + + 源田2t JL乙g4n = llanl + di2%i2 dltant由于,1/2,八为等精度。的相互独立的正态随机变量,那么222+2 + +4力)2 二 JL JL乙JL / L同理可得xi2 =狐。2。= 12*)那么相应的最小二乘估计值的标准差为GX1 = 00 xt = o如)式中,。为测量的数据的标准差。对于不等精度测量的精度估计,经过推导可得:ffxt = 0Vdtt J式中,。为单位权标准差。各不定乘数du,d22f,“由(*P/)T求得:(*PA)T =dii21di2

10、422ditd2t那么根据上面的推导,可得:dn41n222-3195945 L-135 135-63195= qa r = 3.380956d22 = 0.00635可得估计量的标准差为(jko = 0.00647,3.38095 = 0.00119(jkl =(t722 = 0.0 0 6 47V0.00635 = 0.000516第六章回归分析一、函数与相关人们通过实践,发现变量之间的关系可分为两种类型.函数关系确定性现象之间的关系常常表现为函数关系,即一种现象的数量确定以后 另一种现象的数量也随之完全确定,表现为一种严格的函数关系。当一个或几个 变量取一定的值时,另一个变量有确定值与之

11、对应,那么称这种关系为确定性的函 数关系,记为y=f(x),其中x称为自变量,y称为因变量。一只股票的成交额与该股票的成交量之间的关系,保持成交价格P不变的情 况下,当股票的成交量X确定后,其成交额丫也随之确定,三者之间的关系是: Y=PXO.相关关系事物或现象之间的关系是错综复杂的,但大致可以分为三种情况。第一种是 因果关系,这种关系说明的是事物之间相互依存,互为因果的关系,是事物之间 存在的一种必然关系,即一种引起与被引起的关系,因在前果在后的顺序是不能 颠倒的。第二种是共变关系,例如夏天冷饮的销量和中暑人数的关系。当天气炎 热时,两者都会增加,但通常我们不认为它们之间有什么因果关系。但事

12、实上两 者皆起因于天气炎热的因素,它们之间并没有直接的关系。第三种是相关关系, 即两类现象在开展变化的方向与大小方面存在一定的联系,但不是前面两种关系。具有相关关系的两种现象之间的关系是比拟复杂的,甚至可能包含有暂时甚 至可能包含有暂时尚未认识的因果关系以及共变关系在内。例如,同一组学生的 数学成绩和语文成绩的关系。事物或现象的相关种类可以从方向、形态及变量个数诸多方面划分。1、正相关、负相关和零相关正相关是指两列变量变动方向相同,一列变量由大到小或由小到大变化时, 另一列变量亦由大到小或由小到大变化。如身高与体重,身高越长,体重就越重。负相关是指两列变量变动方向相反,一列变量由大到小或由小到

13、大变化时, 另一列变量反而由小到大或由大到小变化。例如随着计算练习次数增加或练习时 间加长,计算错误就越少等等。零相关是指两列变量之间没有关系,即一列变量变动时,另一列变量作无规 律的变动,又称为无相关。如相貌与人的行为等现象之间的关系,都属于零相关。2、直线相关和曲线相关直线相关是指两列变量中的一列变量在增加(或减少)时,而另一列变量随 之而增加(或减少),或这一列变量在增加时,而另一列变量那么相应地减少。它 们之间存在一种直线关系,或线性相关。直线相关可用直线拟合。曲线相关是指两列伴随相变化的变量,未能形成直线关系。曲线相关有很多 种,不能用曲线拟合。3、完全相关、强相关和弱相关完全相关是

14、指两列变量的关系是一一对应,完全确立的关系。在坐标轴上描 绘两列变量时会形成一条直线。强相关又称高度相关,即当一列变量变化时,与之相应的另一列变量增大(或 减少)的可能性非常大。在坐标图上那么表现为散点图较为集中在某条直线的周围O弱相关又称低度相关,即当一列变量变化时,与之相对应的另一列变量增大 (或减少)的可能性较小。亦即两列变量之间虽然有一定的联系,但联系的紧密 程度较低。在坐标涂上表现出散点比拟分散地分布在某条直线的周围,如图lo二、回归分析的主要内容从一组数据出发,确定某些变量之间的定量关系式,即建立数学模型并估 计其中的未知参数。估计参数的常用方法是最小二乘法。对这些关系式的可信程度

15、进行检验。在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变 量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量加入模 型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。6利用所求的关系式对某一生产过程进行预测或控制。三、回归分析与最小二乘法的区别最小二乘法是基于既定模型对未知参数的一种估计方法,以函数残差和最小 的条件对未知参数进行估计。回归分析包括:建立带有参数的函数模型(即经验公式),通过最小二乘法、 最大似然估计法等方法对模型参数进行估计;讨论有关的点估计、区间估计、假 设检验等问题;通过函数模型进行预测等内容。总而言之,回归分析属于统计推断问题,最小二乘法是一种参数估计方法,在回归分析的模型建立阶段,可选择最小二乘法对参数进行估计。四、一元线性回归确定某段导线的电阻与温度之间的关系:x/19.025.030.036.040.047.050.0Y/Q76. 4578. 0079. 9081.0082. 3083. 9985. 35是找出它们之间的关系,并分析误差。1、回归方程为了研究电阻y与温度x之间的关系,把数据点在坐标纸上,这种图叫

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论