2015数据分析方法07+08-回归分析2_第1页
2015数据分析方法07+08-回归分析2_第2页
2015数据分析方法07+08-回归分析2_第3页
2015数据分析方法07+08-回归分析2_第4页
2015数据分析方法07+08-回归分析2_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.1

概述8.2

相关分析8.3

线性回归(重点)8.4曲线估计8.5非线性回归8.6二项Logisitc回归(重点)回归分析8.4曲线估计1曲线估计概述2曲线估计的基本操作3曲线估计的应用举例8.4.1曲线估计概述变量间的相关关系中,并不总是表现出线性关系,非线性关系也是极为常见的。变量之间的非线性关系可以划分为本质线性关系和本质非线性关系。本质线性关系是指变量关系形式上虽然呈非线性关系,但可通过变量变换为线性关系,并最终可通过线性回归分析建立线性模型。本质非线性关系是指变量关系不仅形式上呈非线性关系,而且也无法变换为线性关系。曲线估计是解决本质线性关系问题的。常见的本质线性模型有:1、二次曲线(Quadratic),方程为,变量变换后的方程为2、复合曲线(Compound),方程为,变量变换后的方程为3、增长曲线(Growth),方程为,变量变换后的方程为4、对数曲线(Logarithmic),方程为,变量变换后的线性方程为5、三次曲线(Cubic),方程为,变量变换后的方程为6、S曲线(S),方程为,变量变换后的方程为7、指数曲线(Exponential),方程为,变量变换后的线性方程为8、逆函数(Inverse),方程为变量变换后的方程为9、幂函数(Power),方程为变量变换后的方程为10、逻辑函数(Logistic),方程为变量变换后的线性方程为SPSS曲线估计中,首先,在不能明确究竟哪种模型更接近样本数据时,可在多种可选择的模型中选择几种模型;然后SPSS自动完成模型的参数估计,并输出回归方程显著性检验的F值和概率p值、判定系数R2等统计量;最后,以判定系数为主要依据选择其中的最优模型,并进行预测分析等。另外,SPSS曲线估计还可以以时间为解释变量实现时间序列的简单回归分析和趋势外推分析。可通过绘制并观察样本数据的散点图粗略确定被解释变量和解释变量之间的相关关系,为曲线拟合中的模型选择提供依据。SPSS曲线估计的基本操作步骤是:1)选择菜单Analyze

Regression

CurveEstimation,2)把被解释变量选到Dependent框.8.4.2曲线估计的基本操作相关回归分析(年人均消费支出和教育).sav3)曲线估计中的解释变量可以是相关因素变量也可是时间变量。如果解释变量为相关因素变量,则选择Variable选项,并把一个解释变量指定到Independent框;如果选择Time参数则表示解释变量为时间变量。4)在Models中选择几种模型。5)选择PlotModels选项绘制回归线;选择DisplayANOVAtable输出各个模型的方差分析表和各回归系数显著性检验结果。至此,完成了曲线估计的操作,SPSS将根据选择的模型自动进行曲线估计,并将结果显示到输出窗口中。1、教育支出的相关因素分析

为研究居民家庭教育支出和消费性支出之间的关系,收集到1978年至2002年全国人均消费性支出和教育支出的数据。首先绘制教育支出和消费性支出的散点图。观察散点图发现两变量之间呈非线性关系,可尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。其中,教育支出为被解释变量,消费性支出为解释变量。相关回归分析(年人均消费支出和教育).sav8.4.3曲线估计的应用举例2、分析和预测居民在外就餐的费用利用收集到1978年至2002年居民在外就餐消费的数据,对居民未来在外就餐的趋势进行分析和预测。首先绘制就餐费用的序列图,选择菜单Graphs-Sequence。得到的序列图表明自80年代以来居民在外就餐费用呈非线性增加,90年代中期以来增长速度明显加快,大致呈指数形式,可利用曲线估计进行分析。由于要进行预测,因此在曲线估计主窗口中要单击Save按钮,出现如下窗口:相关回归分析(年人均消费支出和教育).savSaveVariables框中:Predictedvalues表示保存预测值;Residual表示保存残差;Predictioninterval表示保存预测值默认95%置信区间的上下限值。Predictcases框中:只有当解释变量为时间时才可选该框中的选项。Predictfromestimationperiodthroughlastcase表示计算当前所有样本期内的预测值;Predictthrough表示计算指定样本期内的预测值,指定样本期在Observation框后输入。本例希望预测2003年和2004年的值,前面有25个样本,应在Observation框后输入27。最后一列输出了预测值,包括接下来两年的预测值8.5非线性回归(自学为主)1问题描述2基本操作3应用举例变量之间的非线性关系可以划分为本质线性关系和本质非线性关系。本质线性关系是指变量关系形式上虽然呈非线性关系,但可通过变量变换为线性关系,并最终可通过线性回归分析建立线性模型。本质非线性关系是指变量关系不仅形式上呈非线性关系,而且也无法变换为线性关系。此时就需要用非线回归方法来分析。8.5.1问题描述8.5.2-3基本操作与应用举例1)通过绘制并观察样本数据的散点图粗略确定被解释变量和解释变量之间的非线性模型形式,2)参数初始值的选择3)选择菜单分析

回归

非线性,4)把被解释变量选到因变量框,在模型表达式中写出非线性模型形式.5)再进行损失、约束、保存等设置相关回归分析(年人均消费支出和教育).sav参数设置非线性函数关系形式参数约束条件设置输出结果迭代记录参数估计结果回归方程显著性检验8.6二元Logit回归1问题描述2二项Logit回归模型3基本操作与应用举例多元回归分析中要求被解释变量是数值型变量,然而实际应用中被解释变量可能是二值性的分类变量。尤其是社会科学研究中,像这样被解释变量是0/1二值的分类变量的情况较为普遍。此时就需要用二项Logit回归方法来分析。8.6.1问题描述二项Logit回归模型的数学模型:

8.6.2二项Logit回归模型对于具有N个分类的品质变量,则需设置N-1个0/1虚拟变量8.6.3-基本操作与应用举例1)通过绘制并观察样本数据的散点图粗略确定被解释变量和解释变量之间的非线性模型形式,2)参数初始值的选择3)选择菜单分析

回归

二项Logitsitc,4)把被解释变量选到因变量框,解释变量选择到协变量框中,与普通回归类似.5)再进行分类、保存、选项等设置相关回归分析(消费行为logistic回归).sav主对话框操作-向前筛选策略(向前LR)子对话框解释变量中的分类变量设置需点击更改按钮变量编码结果逐步筛选策略(向前LR)-结果回归方程的显著性检验-对数似然比卡方检验回归系数的显著性检验年龄变量的p值大于0.05错判矩阵越小越好越接近1,模型拟合优度越高,类似回归中的R回归方程的显著性检验模型拟合优度:

p<a时认为模型拟合优度高,此处p>0.05,认为拟合优度较低预测分类图预测与实际不符8.7其它回归方法(自学)1多元Logit回归(因变量为多元变量)2有序回归(因变量为顺序变量)3Probit回归4最佳尺度回归5

两阶最小二乘法回归对于这些内容的SPSS应用,可进一步阅读参考书,杜强、贾丽艳,《SPSS统计分析从入门到精通》,人民邮电出版社,2011年该书中的第8章,回归分析。线性回归练习1以汽车销售数据数据为例(其中销售量数据为对数转换形式,其分布近似为正态分布,如此能更好地拟合线性回归):建立多元线性回归模型,分析汽车特征与销售量之间的关系,并利用回归结果给出改进汽车设计方案的建议,以促进销售量的提高。解释变量采用向前筛选策略,并做多重共线性、方差齐性和残差的自相关性检验。汽车销售数据.sav线性回归练习2以汽车销售数据数据为例(其中销售量数据为对数转换形式,其分布近似为正态分布,如此能更好地拟合线性回归):建立多元线性回归模型,分析汽车特征与销售量之间的关系,并利用回归结果给出改进汽车设计方案的建议,以促进销售量的提高。解释变量采用向后筛选策略,并做多重共线性、方差齐性和残差的自相关性检验。汽车销售数据.sav以高校科研研究数据为例:以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、获奖数X8;建立多元线性回归模型,分析它们之间的关系。解释变量采用逐步筛选策略,并做多重共线性、方差齐性和残差的自相关性检验。相关回归分析(高校科研研究).sav线性回归练习3以高校科研研究数据为例,建立回归方程研究以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、论文数X7、获奖数X8;建立多元线性回归模型,分析它们之间的关系。解释变量采用向前筛选策略,并做多重共线性、方差齐性和残差的自相关性检验。相关回归分析(高校科研研究).sav线性回归练习4根据收集的1978年至2002年的数据,分析在外就餐费用受年人均可支配收入的影响。(提示:首先绘制两者的散点图。再尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。)相关回归分析(年人均消费支出和教育).sav曲线回归练习1根据收集的1978年至2002年的数据,分析住房人均使用面积受年人均可支配收入的影响。(提示:首先绘制两者的散点图,再尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。)相关回归分析(年人均消费支出和教育).sav曲线回归练习2根据收集的1981年至2002年的数据,分析年人均可支配收入随时间的变化趋势。(提示:首先绘制两者的散点图。再尝试选择二次曲线、三次曲线、指数曲线模型,利用曲线估计进行本质线性模型分析。)相关回归分析(年人均消费支出和教育).sav曲线回归练习3根据收集的1981年至2002年的数据,分析住房人均使用面积随时间的变化趋势。(提示:首先绘制两者的散点图。再尝试选择对数、二次、三次曲线模型,利用曲线估计进行本质线性模型分析。)相关回归分析(年人均消费支出和教育).sav曲线回归练习4在居民储蓄调查

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论