版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、在实际问题中我们常常会遇到多个变量同处于一个过程之中,它们互相联系、互相制约.在有的变量间有完全确定的函数关系,例如电压V、电阻R与电流I之间有关系式:V=IR;在圆面积S与半径R之间有关系式S=R2.,自然界众多的变量之间,除了以上所说的那种确定性的关系外,还有一类重要的关系,即所谓的相关关系.比如,人的身高与体重之间的关系.虽然一个人的身高并不能确定体重,但是总的说来,身高者,体重也大.我们称身高与体重这两个变量具有相关关系.,回归分析方法是一种常用的数理统计方法,是处理多个变量变之间相关的一种数学方法.,第四章 回归分析,实际上,由于实验误差的影响,即使是具有确定性关系的变量之间,也常表
2、现出某种程度的不确定性.,回归分析方法是处理变量间相关关系的有力工具.它不仅为建立变量间关系的数学表达式(经验公式)提供了一般的方法,而且还能判明所建立的经验公式的有效性,从而达到利用经验公式预测、控制等目的.因此,回归分析方法的应用越来越广泛,其方法本身也在不断丰富和发展.,在一元线性回归分析里,我们要考察随机变量Y与一个普通变量x之间的联系.,1.1 一元线性回归模型,对于有一定联系的两个变量:x与Y,通过观测或实验得到n对数据 (x1,Y1), (x2,Y2), .,(xn,Yn) 用什么方法可以得到这两个变量之间的经验公式呢?为此举例如下:,1 一元线性回归,例:维尼纶纤维的耐热水性能
3、好坏可以用指标“缩醛化度”Y(克分子%)来衡量.这个指标越高,耐热水性能也越好.而甲醛浓度是影响缩醛化度的重要因素.在生产中常用甲醛浓度x(克/升)去控制这一指标.为此必须找出它们之间的关系,现安排了一批试验,获得如下数据:,若重复这些试验,在同一甲醛浓度x下,所获得的缩醛化度Y不完全一致.这表明x与Y之间不能用一个完全确定的函数关系来表达.,y 31 30 29 28 27 26,18 20 22 24 26 28 30 x,散点与近似直线图,为了看出它们之间是否有关及存在什么样的关系,我们在直角坐标系下作出了这些点,从图上可看出:随甲醛浓度x的增加,缩醛化度Y也增加,且这些点近似在一条直线
4、附近,但又不完全在一条直线上.引起这些点与直线偏离的原因是由于在生产和测试过程中还存在一些不可控的因素,它们都在影响着试验结果.,这样我们可以把试验结果Y看成由两部分叠加而成:一部分是由x的线性函数引起,记为a+bx;另一部分是由随机因素引起,记为,即 Y=a+bx+ 一般假设随机误差N(0,2).即 Y N(a+bx,2),在Y=a+bx+中,x是一般变量,它可以精确测量或可以加以控制,Y是可观察其值的随机变量, N(0,2)是不可观察的随机变量, a,b是未知参数.,为了获得未知参数a,b的估计,需要进行若干次独立试验.设试验结果为 (x1,Y1), (x2,Y2), .,(xn,Yn),
5、则 Y1=a+bx1+1 1 N(0,2) Y2=a+bx2+2 2 N(0,2) Yn=a+bxn+n n N(0,2) 这里1,., n相互独立.这就是一元线性回归模型.,设给定n个点 (x1,y1),(x2,y2),(xn,yn) 那么对于平面上任意一条直线l: y=a+bx,1.2 经验公式与最小二乘法,我们用数量 yt-(a+bxt)2 来刻画点(xt,yt)到直线l的远近程度(利用解析几何知识不难看出,yt-(a+bxt)的几何意义是点(xt,yt)沿着平行于y轴的方向到l的最短距离,而不是沿着垂直于l的方向到l的最短距离).,就定量地描述了直线l跟这n个点的总的远近程度.这个量是
6、随着不同的直线而且变化,或是说是随不同的a与b而变化的,也就是说它是a,b的二元函数,记为Q(a,b):,于是,要找一条直线使得它总的来看最“接近”这n个点的问题,就转化为以下的问题:,并且这个解是唯一的.数学上还可证明,它们确实使Q(a,b)达到最小.,1.3 平方和分解公式与线性相关关系,对面n组数据(x1,y1),(x2,y2),(xn,yn),有,是y1,y2,yn这 n个数据的偏差平方和,它的大小描述了这n个数据的分散程度,记作lyy.,几个平方和的意义:,由此可知,它的几何意义是,在回归直线上,其横坐标为n的点的纵坐标.,平均数也是,由上面的分析可知,y1,y2,yn分散程度可以分
7、解为两部分ST=SR+SE,其中一部分是通过x对于Y的线性相关关系而引起的Y的分散性,另一部分是剩余部分引起的Y的分散性.,现在来回答x,Y之间是否存在线性相关关系的问题.不难想到把回归平方和SR与剩余平方和SE进行比较.即在数理统计中,选取统计量,来体现x与Y的线性相关关系的相对大小.若F值相当大,则表明x对Y的线性影响较大,这时可以认为x与Y之间有线性相关关系.反之,若F值较小,则没有理由认为x与Y之间有线性相关关系.,衡量F值的大小需要有一个定量的界限.可以证明在假定,Y1=a+bx1+1 Y2=a+bx2+2 Yn=a+bxn+n 下,此定量界限F就是自由度为1,n-2的F分布的临界值
8、,其中1,2,n服从N(0,2)的独立随机变量.,1.4 数学模型与相关性检验,F值究竟多大才能认为x与Y之间有线性相关关系呢?为此对数据结构提出下列假定: Y1=a+bx1+1 Y2=a+bx2+2 Yn=a+bxn+n 其中1,2,n服从N(0,2)的独立随机变量.,判断x与Y之间是否有线性相关关系,就是要检验假设 H0:b=0,对数据结构: Y1=a+bx1+1 Y2=a+bx2+2 Yn=a+bxn+n 其中1,2,n服从N(0,2)的独立随机变量.,如果b=0,则数学上可以证明 SR/22(1) SE/22(n-2) 且SR与SE相互独立.,由此可知,若H0:b=0成立,则,而且b偏
9、离0越远,即b的绝对值越大,F也越大.,相关性检验的一般程序:,(1)计算SR,SE,再计算F; (2)对于给定的显著性水平,查F(1,n-2); (3)若F F(1,n-2),则否定H0:b=0,即认为x与Y之间具有线性相关关系;否则,就认为x与Y之间不具有线性相关关系.,具体计算时常用以下公式:,例:为了了解某校学生的学习情况,现将该校7名学生期中考试的总成绩与期末考试的总成绩列表如下:,试作出期末分数与期中分数的回归方程.并作线性相关性检验.,解:为了简化计算,令,下面对该回归方程作线性相关性检验:,查F-分布表得: F0.05(1,5)=6.61,F0.01(1,5)=16.3,从而有
10、F0.05(1,5)F F0.01(1,5).故认为直线回归是显著的,但不是高度显著的.,1.5 预报与控制,设 Y=a+bx+ 其中N(0,2).,所谓预报问题就是问当x=x0时,Y=?,从数据(x1,y1),(x2,y2),(xn,yn)出发,利用最小二乘法得到了经验公式:,控制问题是预报问题的反问题.在此不多叙述.,2 曲线回归,对于线性类型的问题,可以用前面介绍的方法直接得到其经验公式,并对其线性相关性进行检验.然而,大量的实际问题并非线性类型,对于这种情况该如何处理呢?,在实际问题中,根据给出的一批数据,在直角坐标系中绘出其散点图,将散点图分布的形状与已知函数的图形进行比较,确定曲线
11、类型,再作变量替换,将曲线改为直线,然后通过求回归直线的方法来求出曲线.,3 多元线性回归,设随机变量Y与p个变量x1,x2,.,xp有关,它们之间满足: E(Y)=0+1x1+2x2+.+pxp 进一步假设 YN(0+1x1+2x2+.+pxp,2) 即,式中x1,x2,.,xp都是可精确测量或可控制的一般变量,Y是可观察的随机变量, 0,1,2,.,p是未知参数,是不可观察的随机误差.,假如我们要获得n组相互独立的样本: (Yi; x1i,x2i,.,xpi), i=1,2,.,n 则可知有数据结构,Yi=0+1x1i+2x2i+.+pxpi+ i i=1,2,.,n 其中i N(0, 2), i=1,2,.,n且相互独立.这就是 p元线性回归模型.,3.1 参数估计,若已给出样本观察值(yi; x1i,x2i,.,xpi), i=1,2,.,n.我们希望对参数0,1,2,.,p及2作出估计.,由于Q是0,1,2,.,p的一个非负二次型,故其极小值必存在,根据微积分的理论知道,这只需求解下列方程组:,所以正规方程用矩阵形式表示即为:,为了求2的估计,先给出几个名词,3.2 参数最小二乘估计的性质,3.3 假设检验,对多元线性回归模型,除了参数估计问题外,还有些假设检验问题:,y1,y2,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 本人承诺提升教育质量责任书(5篇)
- 品质提升与售后支持保障承诺函8篇
- 企业合规诚信经营与信用建设承诺函(6篇)
- 财务管理自动化报告生成工具月度财务数据分析版
- 企业招聘及人员配置标准工具集
- 用户服务满意度提升方案
- 2026届浙江省Q21联盟初三下学期第六次检测试题语文试题试卷含解析
- 甘肃省张掖市甘州中学2026年初三年级新起点考试语文试题含解析
- 健康信息可靠申报承诺函9篇范文
- 生物多样性保护与生态旅游手册
- T-GFIA 004-2026 特色(呼吸系统调养)森林康养服务规范
- 2026年春季湘少版(三起)四年级下册英语教学计划(含进度表)
- 新东方《中国学生出国留学发展报告》
- 2026年3月15日九江市五类人员面试真题及答案解析
- 文化旅游嘉年华主题活动方案
- 投资促进局内部控制制度
- 2026年常州机电职业技术学院单招职业倾向性测试题库附答案详解(a卷)
- 2026教育培训产业市场供需分析与未来发展预测研究报告
- 2026春统编版六年级道德与法治下册(全册)课时练习及答案(附目录)
- 2024版2026春新版三年级下册道德与法治全册教案教学设计
- 2026年安庆医药高等专科学校单招综合素质考试题库及答案1套
评论
0/150
提交评论