




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十二回归分(i)ym 之间的回归模型(经验公式(iii)xi (i 1,2,Lm) y (v)y在本第十二回归分(i)ym 之间的回归模型(经验公式(iii)xi (i 1,2,Lm) y (v)y在本章中所涉及的均是样本点变量类型的数据表。如果有m个变量mn次采样(或观测,得到nim) ,i 1,2,L,(则的数据表X 可以写成一个nm维的矩阵eT1 (xij MXTen式中e ) ,i 1,2,L,n ,被称为第iii1nn 2,L,xm),xj , j 1,2,L,xn1n1S (sij )mm (e x)(ek TkkR (r ij s ii -各位亲,插个小,如果,请跳过这一数学等
2、多项能力的体各位亲,插个小,如果,请跳过这一数学等多项能力的体现,是保研的通行证但是获奖是不容易本人, 8 次国家一等奖,14 6 18 号,算,实现算。1nkj xj(nkj ,i 1,2,L,n ; j 1,2,L,1nkj xj(nkj ,i 1,2,L,n ; j 1,2,L,1,即 x /1n1nsj (x 2) jij,ijij iijminxijiiji 1,2,Ln , j 1,2,Lmjy0 1x 01为回归系数, 是随机误差项,总是假设 N(0, ,则随2y N(0 1x, 2yx分别进行了nn(yi ,xi ),i 1,2,L,这n 对观测值之间的关系符合模yi 0 1x
3、i,i 1,2,L,量xi 是自变量在第i对应于xi ,yi 是一个量,它的随机性是由i造成的。i N(0, ),对于不2的观测,当i ji与j-用最小二乘法估计 01的值,即取 01的一组估计值 yi i xnQ( , )(y x 2i则n( , )用最小二乘法估计 01的值,即取 01的一组估计值 yi i xnQ( , )(y x 2i则n( , )(y x 2i0, 显然Q(0, 1) 0 ,且关于0, 1 可微,则由多元函数存在极值的必要条件n2(y x )1 0n2x (y x )1 11 yinnny0i n(x x)(y ii n(x x)2i y 1 xyx y x 1x ,
4、y 1iinn关于 1 的计算公式还有一个更直观的表示方法,(xi x)(yi n 1n(x x)2i-nn( (x x)(y isiiysnnn(x x)2(x x)2(y xiiinn1) ,sy 22y y) rxy xy2nixiyi nn( (x x)(y isiiysnnn(x x)2(x x)2(y xiiinn1) ,sy 22y y) rxy xy2nixiyi x 0y 0sx 1sy 1有 1 作为一个 1 nk 1i xi k k 。iin(x x)2i证明 nnn(xi x)(yi (xi x)yi y(xi i11nn(x x)2(x x)2iiny(xi x) y
5、(nx nx) xi ny1in(x x)2i 量yi (i 1,2,L,n)的线性组合,而yi 是相互独立、且服从1态分布的,所以 的抽样分布也服从正态分布1 11-nnE( ) k yi k E(y 1i nnnkiE(0 1xi) 0ki 1kixi kin(x x)2in(i x nnnnE( ) k yi k E(y 1i nnnkiE(0 1xi) 0ki 1kixi kin(x x)2in(i x nnki 1inn(x x)2(x x)2iiE() 1Var( 1) n(x x)2innnnk 2Var( ) k Var(y )i22 kk 1iiiii xi n k(x x)
6、2(iin2n)2 (x x)2i 11nc 1i 式中c c i 1,2,Ln ii11n E( ) c E(y ) Eyi) 0 1xi -nnnE( ) ( )c c 11 0i ci nn0,cixi 定义ci ki di ki 是式(6)di nnnnVar( ) k 2d k di nnnE( ) ( )c c 11 0i ci nn0,cixi 定义ci ki di ki 是式(6)di nnnnVar( ) k 2d k di 21iiii xi nnnn k )kk k i in(x x)2inncixi x nn11k 2inn(x x)2(x)2ii而n2 Var( ki
7、 21n(x x)2in Var( ) Var( )d11nnd 的最小值为零所以d 0时,1的方差最小但是只有当di 22iin时,即c k 时,才d 0。所以,最小二乘估计量 在所有无偏估计量中2i1同理,可以得出相应于点估计量 的统计性质。对于一元线性正态误差回归模0 体参数0 的无偏估计量, 1xVar( ) n20n(x x)2i-0 0 的线性无偏的最小方差估计量ei yi i ,i 1,2,L,nn(y x )1 i 0 0 的线性无偏的最小方差估计量ei yi i ,i 1,2,L,nn(y x )1 i n1n1yi yi nn(yi x)1 nnn ( x )1 3当第in
8、n这个结论由第二个正规方x (y x )0i1 4当第i 即ni nnn( x e xe 1 0ii5最小二乘回归线总是通过观测数据的重心(xy的。x 时,由式(5)1y x (y x) x 11-的模型(i x )yi i x i1 (或者说解释)yi 值的取值变化?回归方程的质量如何?误差多大?对这些,都必须ei yi i ,i 1,2,L,ne 1(y 的模型(i x )yi i x i1 (或者说解释)yi 值的取值变化?回归方程的质量如何?误差多大?对这些,都必须ei yi i ,i 1,2,L,ne 1(y y )nnnn MSE n(ei e2n2n(y y 2nn由于有ei 0
9、和xiei 0的约束,所以,残差平方和有(n2n 2(n2) 后得到的 MSE ,是总体回归模型中以证明,在e 除以 Var(i ) 的无偏估计量。n 1 S MSE eni y xi yi y 的变异呢?又有多大部分是无法用这个回归方程来解释y1, y2 ,L, yn 1ns (y 22in(102n nn(y 2si下面看一下s2s2之间的关系,-nnnn( y)2 (y) (y y)22(y y)(y 2iiiinn nnnn( y)2 (y) (y y)22(y y)(y 2iiiinn 1 1 nnn01 1 1 (y ) (y x)x ( 1 nnn(y)2(y y)2(y y i
10、i记nSST (y)2y 度为df niiTnSSRy y)2y x i1 dfR nSSEy y )2df n2ESST SSRSSE,dfT dfR yx注意到对于一个确定的样本(一组实现的观测值, SST 是一个定值。所以,可解释变异 SSR 越大,则必然有残差 SSE 越小。这个分解式可同时从两个方面说明拟合方SSE yi 判定系数是指可解释的变异占总变异的百分比,用 R2 表示,(1 SSE从判定系数的定义看, R2 有以下简单性质(1)0 R2 R2 1SSR SST ,也就是说,此时原数据的总变异完全可以由拟合值的变异来解释,并且残差为零(SSE 0,即拟合点与原数据完全吻合;R
11、2 0y-无关引起,这时SSE SST 的角度,说明原因变y 与拟合变y 的相关程度,从这个角度看,拟合变量 y 与原y 的相关度越大,拟合直线的优良度就越高。2nn(i ei y)(无关引起,这时SSE SST 的角度,说明原因变y 与拟合变y 的相关程度,从这个角度看,拟合变量 y 与原y 的相关度越大,拟合直线的优良度就越高。2nn(i ei y)(i (y iR 2 r (y,)2 i nnn(y y)2(y (y iiinnnei(yi y)eii yei 所以R2 又等于y 与拟合变量y 的相关系数平方还可以证明, R2 yx系数 的符号相同1yxyi 0 1xi i,i N(0,
12、 ),i 1,2,L,2对于一个实际观测的样本虽然可以用判定系数R2 说明 y 与 y 的相关程度,以肯定y与x的线性关系yxyi 0 1xi i,i 1,2,L,10nSSE(y y H0 1 0H0 yi 0 iy0 x 1因此,对所有的i 1,2,Ln -i n(y y)2 iSSE i n(y y)2 iSSE 个差额很大,说明增加了 x 的线性项后,拟合方程的误差大幅度减少,则应否定 H0 认为总体参数1 显著不为零。SSRF SSE/(nMSR SSR/dfR SSRMSE SSE/dfE SSE/(nH010SST SSRSSESSE SSR SSE/2 2(n2),SSR/2
13、2F MSR F(1,nyi xi 1F H0 H1分别是H0 :1 0,H1 :1 F 对于检验水平 ,按度(n1 1,n2 n2)查F分布表,得到界值F (1,n 2)。决策规则为FF(1n2)H0 1x的线性关y 。 yF F yi 0 1xi i-就是一个恰当的回归模型,事实上,当 H0 假设xF检验来完成的;另一个检的影响程度是否显著。这就是下面要 的t检验通过后,再进一步进行t101xi 变化一个yi 1就是一个恰当的回归模型,事实上,当 H0 假设xF检验来完成的;另一个检的影响程度是否显著。这就是下面要 的t检验通过后,再进一步进行t101xi 变化一个yi 11 N)n(x
14、x)2iVar( ) 1n(x x)2iS ( )21n(x x)2i t(nS( 1 111其分子( )1nMSE/(xi 2S ( 2 MSE 2(nn2/(x 1iSSE2 2(n2)-t(nS( 1 11H0 :1 0,H1 :1 t1 1检验统计量t11 0t(nS( 1 11H0 :1 0,H1 :1 t1 1检验统计量t11 0度为(n2的t对于给定的检验水平 ,则通过t分布表可查到统计量t1 的临界值t (n2)2t (n2)H0 12t (n2),H0 ,认为1显著不为零2了H0 ,认为1显著不为零时,又称1通过了t 检验t (n2)1112还可以确定1 的置信度为1 的置信
15、区间t (n2)S() t (n2)S( 2120进行显著性检验,并且求出它的置信区间。它的最0 的抽样分布为正态分布,即x1 N(0, n 20n(x x)2iVar(0 的估计量x1S ( ) 20nn(x x)2i t(nS( 0为检验 0 是否显著为零,提出假H0 :0 0,H1 :0 - 00 0时,检验统计量t0度为(n2的t对于给定的检验水平 ,则通过t分布表可查到统计量t0 的临界值t (n2)2t (n2)H 00 0时,检验统计量t0度为(n2的t对于给定的检验水平 ,则通过t分布表可查到统计量t0 的临界值t (n2)2t (n2)H0 02t (n2),H0 ,认为0显
16、著不为零2t (n2)1S( 20还可以确定0 的置信度为1 的置信区间 t (n2)S( ) t (n2)S( 22y0 1x1Lmxm N(0, 201,Lm, 2m 01,Lm现得到n 个独立观测数据yi xi1,Lxim i 1,Lnn m,由(20) 0 1xi1 Lmxim iN(0,2i 1,L, 记MLx1my1 LX M Y xnm Ln , T0mTL(20)Y X N(0, E 2nEn n-模型(20)01,Lmj ,使j j 时, j 0,1,2,Lm时,误差平方和nn (y x L Q21 m 0,j模型(20)01,Lmj ,使j j 时, j 0,1,2,Lm时
17、,误差平方和nn (y x L Q21 m 0,j 0,1,2,L,j得n2(y x L x )1 m n2(yi 0 1xi1 Lmxim)xij 0,j 1,2,L,nnnn0n1xi1 2xi2 Lmnnnnnx L y0i1 imi1 nnnnn0 x x L 2im iim (27) 代回原模型得到y 的估计y x Lm1而这组数据的拟合值为YX,拟合误差eYY称为残差,可作为随机误差 的nnQ e (y 2iii为残差平方和(或剩余平方和,即Q() - N(,2(XTX)1记(XTX) N(,2(XTX)1记(XTX)1 (c ij 对残差平方和QEQnm1)2Q2(nm由此得到
18、2 的无偏估Qsnm1s2 是剩余方差(残差的方差,s 称为剩余标准差n(iv)SST y y)2 inSSTQU,U (y y)2iiy 的影响。上面的分解中利用了正规方程组。y x1,Lxm 之间是否存在如模型(20)所示的线性关系是需要检验的,显然,如果所有的|j | ( j 1,Lm都很小y x1,Lxm 的线性关系就不H0 : j 0( j 1,L,H0 成立时由分解式(34)定义的UQ 满U/F F(m,nmQ/(nm下有分位数F(m,nm1),若FF (m,nm1),接。在显著性水平H0 注意 H0 y x1,Lxm 的线性关系不明显,可能存在非线性关系,y x1,L, xm R
19、2SR R y x ,Lx R 1m当上面的H0 时, j 不全为零,但是不排除其中若干个等于零。所以应-一步作如下m 个检验( j 0,1,Lm: ( j0j(31)式,j N(j, c ,c 是X X) 中的第j, 一步作如下m 个检验( j 0,1,Lm: ( j0j(31)式,j N(j, c ,c 是X X) 中的第j, js 代替 由(31)(33)式,当H ( j) 成立0 ctj t(nm1)Q/(nm对给定的 ,若|t |t (nm1Hj。02(37)j作区间估计(j 0,1,Lm1jj t (nm1)s cjj ,j t (nm1)s cjj 22s 。0m y0 ,y0
20、值(点估计)Lmy 1 给定 可以算出 y0区间(区间估计,结果较复杂,但当nx0i xi y0 0 0 22z 2 2y0 ei yi i (i 1,Lnei 服从均值为零的正态分布,所以若某个ei 的置信区间不包含零点,则认为这个regressY,X 为按(22)式排列的数据,b ,L m 0.05b,b为残差(向量)及其置信区间s 是用于检验回归模型的 -F pp残差及其置信区间可以用例1F pp残差及其置信区间可以用例1数据如下表1。2H0s (yx,再用回归分析对它进行检验。解 先画出散点图:y 0 regress和rcoplot编程如下: b s 1间是75.7755,199.22
21、45R2 0.7985F 27.7469p 0.0012s2 4.0883观察命令rcoplot(r,r含零点,第8 个点应视为异常点,将其剔除后重新计算,b s-120 140 190 130 155 175 125 145 180 x2 100 90 150 210 150 250 270 300 y102 100 120 x0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 y42.0 41.5 45.0 45.5 45.0 47.5 49.0 55.0 2 y x1 x2 有210个城市的销售 。试根据这些数据建立 yx1 x2 的关系(元商品在该市的销售量
22、解 y2 y x1 x2 有210个城市的销售 。试根据这些数据建立 yx1 x2 的关系(元商品在该市的销售量解 yx1 yx2 yx2 y 0 1x1 2x1=120 140 190 x2=100 110 90 145 180 270 300 y=102 120 69 b -sp0.0247,取 0.05时回归模型(42)0.01R20.6527 的置信区间包含了零点。下面试图用x1, x2 的二次函数改进它polyfit例将17至29岁的运动员每两岁一组分为7组每组两人测量其旋转定向能力以解 数据的散点图明显地呈现两端低中间高的形状,所以应拟合一条二次曲线。y a2x a x2y0=20
23、.48 25.13 26.15 30.0 20.3 24.35 28.11 26.3 31.4 26.92 25.7 -20.48 25.13 26.15 30.0 20.3 24.35 28.11 31.4 26.92 25.7 p=-即a2 0.2003a1 8.9782a0 72.2150。得到y的拟合值,值y的置信区间半径deltap=-即a2 0.2003a1 8.9782a0 72.2150。得到y的拟合值,值y的置信区间半径delta图yxy其中输入数据x,y分别为nm矩阵和n维向量,alpha为显著性水平 (0.5,mlinear(线性)y 0 1x1 L mmpurequad
24、ratic(纯二次)y x L x x1m jj jeraction(交叉y01x1 Lquadratic(完全二次)y 0 1x1 L k1 jkk1 j,k再作一遍例2 y 2x22 x1=120 140 190 x2=100 110 90 y=102 100 120 145 180 270 300 69 65 -x=x1图信区间,右边是 x2 (=188)固定时的曲线 yx2 ) 及其置信区x=x1图信区间,右边是 x2 (=188)固定时的曲线 yx2 ) 及其置信区间。用鼠标移动图中的x1x2 y就用这种画面可以回答例(元residuals(beta=-rmse-另一个菜单y b b
25、 x b x b x x b x2 b x1 2 3 1 4 5 5.1 y 1,Lm(而不是自变量) x 4 y 13-1,L5 3是三种反应物(n戊烷,异构戊烷)y是反应速度。今测得一组数据如表41,L5,并给出其置信1,L5 的参考值为(0.1,L5 3是三种反应物(n戊烷,异构戊烷)y是反应速度。今测得一组数据如表41,L5,并给出其置信1,L5 的参考值为(0.1,0.05,0.02,1,2。表n123456789 functionx0= 123456789beta=0.1,0.05,0.02,1,2; %回归系数的初值,任意取的 betahat,r,j=nlinfit(x,y,huaxue,beta); %r,j是下面命令用的信息 %回归系数及其置信区%y用 -可看到画面,并传出剩余标准差rmse= 0.19334.2 S x1,LxmS1 S S1 中有个自变量(l 可看到画面,并传出剩余标准差rmse= 0.19334.2 S x1,LxmS1 S S1 中有个自变量(l 1,LmS1y 构造的回归模型的误差平方和为QQs2 nS s1nl1通常回归模型中包含的自
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公园场地租赁协议书(19篇)
- 气候变化中介协议
- 建材工地交付标准协议
- 劳动合同应具备哪些条款(4篇)
- 短期市场推广保证金合同
- 商品协商买卖合同协议
- 商场电梯租赁协议书范本
- 咖啡鲜果采购合同协议
- 微电影制作拍摄合同协议
- 商业退出协议书模板
- 水利工程竣工自查报告
- 新疆维吾尔自治区新2024年中考数学模拟试卷附答案
- 2024年中国老年糖尿病诊疗指南解读(2024年版)
- 震后学校维修合同书
- 李白:《将进酒》经典省公开课一等奖全国示范课微课金奖课件
- 19S406建筑排水管道安装-塑料管道
- 教师如何有效地与家长沟通
- 第11课辽宋夏金元的经济社会与文化教学设计-高中历史必修中外历史纲要上册2
- 如何与客户建立有效的沟通
- 真空排水系统施工方案设计
- (完整版)建筑工程技术毕业论文
评论
0/150
提交评论