多元回归分析_第1页
多元回归分析_第2页
多元回归分析_第3页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、y与各自变量多兀回归分析影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。可以建立因变量Xj(j=1,2,3,削的多元线性回归模型:其中:b0是回归常数;bk(k=1,2,3,,误回归参数;e是随机误差。多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;X1为最多连续10天诱蛾量(头);X2为4月上、中旬百束小谷草把累计落卵量(块);X3为4月中旬降水量(毫米),X4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。分级别数值列成表2-1。预报量y:每平方米幼虫010头为1级,1120头为2级,2140头为3级,40头以上为4级。预报

2、因子:X1诱蛾量0300头为l级,301600头为2级,6011000头为3级,1000头以上为4级;X2卵量0150块为1级,15l300块为2级,301550块为3级,550块以上为4级;X3降水量010.0毫米为1级,10.113.2毫米为2级,13.317.0毫米为3级,17.0毫米以上为4级;X4雨日02天为1级,34天为2级,5天为3级,6天或6天以上为4级。表2-1x1X2X3X4y年蛾里级别卵量级别降水量级别雨日级别幼虫密度级别19601022411214.312110二11961300144030.111141196269936717.51119119631876467541

3、7.1474554196543118011.91211119664222201010r13二119678063510311.823228319761151240120.61217二1197171831460418.44424541972n8033630413.433226319735722280213.22421621974J2641330342.243219219751981165271.845口2331976J461214017.515328319777693640444.74324441978_n25516510101112数据保存在DATA6-5.SAV”文件中。1)准备分析数据在SP

4、SS数据编辑窗口中,创建年份”、蛾量”、卵量”、降水量”、两日”和幼虫密度”变量,并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量幻”、艾2”、艾3”、艾4”和y”,它们对应的分级数值可以在SPSS数据编辑窗口中通过计算产生。编辑后的数据显示如图2-1。图2-1或者打开已存在的数据文件DATA6-5.SAV”。2)启动线性回归过程单击SPSS主菜单的"Analyze下的aRegression中"Linear项,将打开如图2-2所示的线性回归过程窗口。图2-2线性回归对话窗口3)设置分析变量设置因变量:用鼠标选中左边变量列表中的幼虫密度y'变量,然后点击

5、“Dependent样左边的向右拉按钮,该变量就移到"Dependent因变量显示栏里。设置自变量:将左边变量列表中的蛾量x1”、卵量x2”、降水量x3”、两日x4'变量,选移到"Independent(S)自变量显示栏里。设置控制变量:本例子中不使用控制变量,所以不选择任何变量。选择标签变量:选择年份”为标签变量。选择加权变量:本例子没有加权变量,因此不作任何设置。4) 回归方式本例子中的4个预报因子变量是经过相关系数法选取出来的,在回归分析时不做筛选。因此在“Method框中选中“Enter选项,建立全回归模型。5) 设置输出统计量单击“Statistics按钮

6、,将打开如图2-3所示的对话框。该对话框用于设置相关参数。其中各项的意义分别为:图2-3"Statistics对话框 "RegressionCoefficients回归'系数选项:“Estimates输出回归系数和相关统计量。“Confidenceinterval回归系数的95%置信区间。“Covariancematrix回归系数的方差-协方差矩阵。本例子选择"Estimates出回归系数和相关统计量。 "Residual概差选项:"DurbinWatson"Durb-Watson检验。"Casewisediagno

7、stic出满足选择条件的观测量的相关信息。选择该项,下面两项处于可选状态:"Outliersoutsidestandarddeviations选择标准化残差的绝对值大于输入值的观测量;"Allcases择所有观测量。本例子都不选。 其它输入选项"Modelfit输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。"Rsquaredchange俞出'由于加入和剔除变量而引起的复相关系数平方的变化。"Descriptives输"出变量矩阵、标准差和相关系数单侧显著性水平矩阵。"Partandpartialco

8、rrelation相关系数和偏相关系数。"Collinearitydiagnostics显示单个变量和共线性分析的公差。本例子选择"Modelfit项。6)绘图选项在主对话框单击“Plots按钮,将打开如图2-4所示的对话框窗口。该对话框用于设置要绘制的图形的参数。图中的“X'和“Y'框用于选择X轴和Y轴相应的变量。图2-4"Plots绘图对话框窗口左上框中各项的意义分别为: “DEPENDNT因变量。 "ZPRED标准化预测值。 "ZRESID标准化残差。 "DRESID删除残差。 "ADJPRED调节预测

9、值。 "SRESID学生氏化残差。 "SDRESID学生氏化删除残差。aStandardizedResidualPlot殴置各变量的标准化残差图形输出。其中共包含两个选项:"Histogram用直方图显示标准化残差。"Normalprobabilityplots比较标准化残差与正态残差的分布示意图。"Produceallpartialplot偏残差图。"对每一个自变量生成其残差对因变量残差的散点图。本例子不作绘图,不选择。7)保存分析数据的选项在主对话框里单击"Save按钮,将打开如图2-5所示的对话框。图2-5"

10、Save明舌框"PredictedValues预测值栏选项:Unstandardized非标准化预测值。就会在当前数据文件中新添加一个以字符"PRE_JF头命名的变量,存放根据回归模型拟合的预测值。Standardized标准化预测值。Adjusted调整后预测值。S.E.ofmeanpredictions预测值的标准误。本例选中"Unstandardized非标准化预测值。 "Distanced巨离栏选项:Mahalanobis:距离。Cook's":COO腐。Leveragevalues:杠杆值。 "PredictionI

11、ntervals预测区间选项:Mean:区间的中心位置。Individual:观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符“LICI_开头命名的变量,存放预测区间下限值;以字符"UICI_开头命名的变量,存放预测区间上限值。ConfidenceInterval:置信度。本例不选。 "SavetoNewFile保存为新文件:选中aCoefficientstatistics项将回'归系数保存到指定的文件中。本例不选。 "ExportmodelinformationtoXMLfile导出统计过程中的回归模型信息到指定文件。本例不选。 "

12、Residuals'保存残差选项:"UnstandardizecHE标准化残差。"Standardize师准化残差。"Studentize谭生氏化残差。"Deletec删除残差。"Studentizeddelete骨生氏'化删除残差。本例不选。 "InfluenceStatistics统计量的影响。"DfBeta(s)删除一个特定的观测值所引起的回归系数的变化。aStandardizedDfBeta(s)标准化的DfBeta值。"DiFit删除一个特定的观测值所引起的预测值的变化。aStandard

13、izedDiFit标准化的DiFit值。"Covariancerati。删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。本例子不保存任何分析变量,不选择。8)其它选项在主对话框里单击"Options按钮,将打开如图2-6所示的对话框。图2-6"Options置对话框 aSteppingMethodCriteria框用于进行逐步回归时内部数值的设定。其中各项为:"UseprobabilityofF如果一个变量的F值的概率小于所设置的进入值(Entry),那么这个变量将被选入回归方程中;当变量的F值的概率大于设置的剔除值(Re

14、moval),则该变量将从回归方程中被剔除。由此可见,设置"UseprobabilityofF时,应使进入值小于剔除值。"UesFvalued果一个变量的F值大于所设置的进入值(Entry),那么这个变量将被选入回归方程中;当变量的F值小于设置的剔除值(Removal),则该变量将从回归方程中被剔除。同时,设置"UseFvalue寸,"应使进入值大于剔除值。本例是全回归不设置。 "Includeconstantinequation选择此项表示在回归方程中有常数项。本例选中"Includeconstantinequation选项在回归方

15、程中保留常数项。 "MissingValues框用于设置对缺失值的处理方法。其中各项为:"ExcludecaseslistwiseiU除所有含有缺失值的观测值。"Exchudecasespairwise剔除参与统计分析计算的变量中含有缺失值的观测量。"Replacewithmean用变量的均值取代缺失值。本例选中"Excludecaseslistwise。"9)提交执行在主对话框里单击“OK,提交执行,结果将显示在输出窗口中。主要结果见表2-2至表2-4。10)结果分析主要结果:表2-2表2-2是回归模型统计量:R是相关系数;RSqu

16、are相关系数的平方,又称判定系数,判定线性回归的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例);AdjustedRSquare调整后的判定系数;Std.ErroroftheEstimate估计标准误差。表2-3表2-3回归模型的方差分析表,F值为10.930,显著性概率是0.001,表明回归极显著。表2-4分析:建立回归模型:根据多元回归模型:把表6-9中非标准化回归系数”栏目中的“B列系数代入上式得预报方程:预测值的标准差可用剩余均方估计:回归方程的显著性检验:从表6-8方差分析表中得知:F统计量为10.93,系统自动检验的显著性水平为0.001。F(0.05,4,11)值为3.36,F(0.01,4,11)值为5.67,F(0.001,4,11)值为10.35。因此回归方程相关非常显著。(F值可在Excel中用FINV()函数获得)。回代检验需要作预报效果的验证时,在主对话框(图6-8)里单击“Save按钮,在打开如图3-6所示对话框里,选中aPredictedValues预测值选项栏中的"UnstandardizecHE标准化预测值选项。这样在过程运算时,就会在当前文件中新添加一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论