回归分析应用.ppt_第1页
回归分析应用.ppt_第2页
回归分析应用.ppt_第3页
回归分析应用.ppt_第4页
回归分析应用.ppt_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析应用,基于回归分析的火灾发生气象因子的研究,回归分析通过一个变量或一些变量的变化解释另一变量的变化。其主要内容和步骤是:首先根据理论和对问题的分析判断,将变量分为自变量和因变量;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验;统计检验通过后,最后是利用回归模型,根据自变量去估计、预测因变量。因为回归分析可以用作预测,所以我们做引入一篇以预测为主的论文基于回归分析的火灾发生气象因子的研究作为例子:,火灾的发生发展与湿度、风、温度、降水等气象条件都有密切关系。因为湿度影响太阳辐射强度,进而对地面和地表燃料的温度有影响,降水量直接影响可燃物的含水量,可燃物含水量越高,着火率越低;可燃物含水量越低,着火率越高。风起到加速蒸发、加快干燥,起助燃作用。风速越大,火灾蔓延越快。温度影响可燃物的着燃性,直接影响火灾扩散、燃烧速度等。大气温度的垂直变化也会影响大气对流的强弱,促使火灾发生与发展。,一个地区火灾的发生次数是与多种因素有关的,仅气象因素就包含了温度、湿度、风速、风向、雷电、雨冰雹等多个因素。若仅考虑一个因子对火灾发生次数的影响是不全面的,而且每个因子单独影响的总和并不能代表全部因子的综合影响,本文采用二元回归分析法,预测了火灾发生次数Y,与空气湿度x1,风速x2的关系。,建立回归模型的基本步骤为:,1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量2)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)。3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).4)按一定规则估计回归方程中的参数(如最小二乘法)。5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。,l模型的建立,火灾发生次数Y,空气湿度x1,风速x2建立二元回归方程为常数,和为x1和x2的系数,称为Y对x1和x2的回归系数。离差平方和:,通过样本数据建立回归方程之后,一般不能立即用于对实际问题的分析和预测,通常是进行各种统计检验,在这篇论文里一共用到了三种:回归方程的显著性检验,拟合优度检验,回归系数的显著性检验。大F检验:回归方程的显著性检验,线性回归方程能够较好的反映被解释变量和解释变量之间统计关系的前提是:被解释变量和解释变量之间确实存在显著的线性关系。回归方程的显著性检验正是要检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关系是否恰当。,2回归模型的检验,用最小二乘法求出的回归方程,不需要事先假设Y与X1和X2一定具有线性关系。就最小二乘法本身而言,对任意的一组数据都可以描述Y与X1和X2的关系,因此需判断Y与X1和X2的回归方程是否线性。如果在中,和都为零,说明X1和X2的变化对多用回归方程不能描述变量Y与变量X1和X2之间的关系。因此在相关性检验时,首先应检验和是否为零。,F检验,离差平方和的分解(三个平方和的意义)假设回归系数都为0,表明无论X取何值都不会引起Y的线性变化,他们之间不存在线性关系。总偏差平方和(SST)反映因变量的n个观察值与其均值的总离差回归平方和(SSR),反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和,由式中可以看出,它意在研究Y的SST中,SSR所占的比例是否大于SSE,如果占有较大比例。说明y与x线性关系明显,反之则不明显对于给定的数据求出SSR、SST,进而得到F的值。由统计量F可以找到临界值,Fa(2n3),a=0.5。当FFa(2n3)时,拒绝原假设,认为在显著水平a下,Y对X1和X2有显著的线性关系,即回归方程是显著的。反之,当FFa(2n3),认为回归方程不显著.,R2拟合优度检验,表示回归平方和占总离差平方和的比例,取值范围在0,1之间反映回归直线的拟合程度。R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差。判定系数等于相关系数的平方,即R2(r)2显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。在线性回归模型中,R2表示解析变量对预报变量变化的贡献率。,R2越接近1,表示回归的效果越好(因为R2越接近1,表示解析变量和预报变量的线性相关性越强)。如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。总的来说:相关指数R2是度量模型拟合效果的一种指标。在线性模型中,它代表自变量刻画预报变量的能力。,是Y与X1和X2相关系度量系数,可以证明,而且值越接近1,回归效果越好。公式为:,回归系数的显著性检验t检验,t检验是对各回归系数的显著性所进行的检验,(这是指在多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验。t检验还可以用来检验样本为来自一元正态分布的总体的期望,即均值;和检验样本为来自二元正态分布的总体的期望是否相等),T检验注意事项,要有严密的抽样设计随机、均衡、可比选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)正确理解P值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论