




已阅读5页,还剩220页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
. SPSS回归分析,组成员:李标祝斌宋金泽周益丰贾洋,2,本章内容,7.1回归分析概述7.2线性回归分析7.3曲线估计回归分析7.4罗编回归分析7.5序数,概率回归分析7.6非线性,权重估计,二次最小二乘,最佳尺度回归分析,3,回归分析(regressionanalysis ) 关系参数的多元回归分析的多元回归分析参数与因子变量的关系类型,线性回归分析非线性回归分析,回归分析,4,回归分析一般步骤:利用回归方程式预测回归方程式,回归分析、 线性回归分析、一元线性回归方程反映因子变量与自变量的线性关系,直线方程Y=a bx的a和b确定时为一元回归线性方程。 经过相关分析,在直角坐标系上绘制了大量数据。 这些点不在直线上,但从中找出合适的直线,使从各散点到该直线的纵向距离之和最小化。 该直线为回归直线,该直线的方程式称为直线回归方程式。 注意:线性回归方程不同于函数的线性方程,线性回归方程的自变量x对应于变量y的可能值范围。 1 .一维线性回归分析的基本理论是将多个样本值(被解释为解释性变量)分组在坐标数据对(xi,yi )中,并且观察该数据对(xi,yi )的散布图以发现y和xi之间存在显着的线性关系,则应当考虑构建y和xi的一维线性回归模型其中,y=a bx ,y是要解释的变量,a是模型的截距项,b是要估计的参数,x是说明变量或随机误差项。 对于线性回归分析、一维线性模型,一般使用最小二乘估计法来估计相关参数(和无偏差的估计值和等),得到样本回归直线,将得到的样本回归直线作为整体回归的近似值是预测过程。 为确定所得样本回归直线是否近似于总回归,应对回归方程的线性关系进行适度检验、回归方程的有效性检验、回归系数的有效性检验(t检验)、残差分析等各种统计检验。 线性回归分析,回归方程的适合度检验(相关系数检验)一元线性回归的适合度检验采用R2统计量,称为判定系数或者决定系数,在数学上,被称为回归平方和(SSA )的总方差平方和(SST)R2在值0-1之间,R2越接近1,回归方程的采样数据点的适合度越高此外,线性回归分析、9、多线性回归的适合度检验使用统计量,被称为调整量的判断系数或调整量的决定系数,数学上,规定为式中,n-p-1、n-1分别为SSE和SST的自由度。 其取值范围和意义与一次回归式的R2相同。 回归方程的拟合优度检验(相关系数检验)、线性回归分析、回归方程的有效性检验(f检验),即平均SSA/平均SSE,f统计服从(1,n-2 )自由度的f分布。 SPSS自动计算与检验统计量的观测值对应的概率p值,如果p值小于给定的有效水平,则拒绝零假设,认为线性关系有效。 一维线性回归方程有效性检验的零假设为1=0,检验采用f统计量,其数学定义为:线性回归分析,11,回归方程有效性检验(f检验),多元线性回归方程有效性检验的零假设各自的偏回归系数同时为零,检验采用f统计量,其数学定义为:即平均SSA/平均SSA SPSS自动计算与检验统计量的观测值相对应的概率p值,如果p值小于给定的显着性水平,则拒绝零假设,应认为y和x的整体线性关系是显着的。线性回归分析、回归系数有效性检验(t检验)线性回归方程回归系数有效性检验的零假设为1=0,检验采用t统计量,其数学定义遵循t统计量为n-2自由度的t分布。 SPSS自动计算与t统计量的观测值相对应的概率p值,如果p值小于给定的显着性水平,则拒绝零假设,x对y有显着贡献,并且应认为线性关系是显着的。 线性回归分析,13,回归系数有效性检验(t检验),多线性回归方程回归系数有效性检验的零假设为i=0,检验采用t统计量,其数学定义为: ti统计量遵循n-p-1自由度的t分布。 SPSS自动计算与ti统计的观测值相对应的概率p值,如果p值小于给定的显着性水平,则拒绝零假设,认为xi对y有显着贡献,并且应将其保留在线性方程中。 (I=1,2,p )、线性回归分析、残差分析指的是由回归公式计算出的预测值与实际样本值之间的差值,即回归模型中的估计值。 如果回归方程可以很好地反映出变量的特征和变化规律,那么残差序列应该不包含明显的规律性和倾向性。 此外,线性回归分析,残差分析的平均值为0的正态分析残差平均值为0的正态分析,可以通过绘制残差图来分析,如果残差平均值为0,则残差图的点应该随机地散布在纵轴为0的横线的上下方向。 可以通过描绘标准化(或产生)残差的累积概率图来分析规范化,其中:线性回归分析,16,回归方程的统计检验残差分析,独立性分析残差序列的序列图具有采样周期(或时间)为横轴,残差为纵轴,并且当残差随着时间的经过而规律地变化时,存在恒定的正或负相关性。 计算残差的自相关系数在-1到1之间,取接近1的值表示序列具有正的自相关性。 DW(DurbinWatson )是DW的值在0到4之间,直观的判断标准是DW=4,残差序列是完全负的自相关的DW=2,完全没有自相关的DW=0,完全自相关。 线性回归分析、17、回归方程的统计检验残差分析;异方差分析图残差图表示当残差的方差趋于随着解释变量的值的增加而增加(或减小)时,出现了异方差现象。 另外,线性回归分析、18、回归方程式的统计检验残差分析个样本中的异常值和较强影响点(相对于y值)的归一化残差ZRE遵循残差为平均值为0的正态分布,因此能够根据3基准进行判断,首先,使残差归一化,把绝对值与3对应的观测值设为异常值。 生成残差SRE去除残差DRE (或生成残差SDRE )上述SRE、SDRE的直观判断基准与标准化残差ZRE相同. 19、线性回归分析、20、多元回归分析中其他问题变量的筛选问题说明了前向筛选策略中变量进入回归方程的过程,首先说明的变量和线性相关系数最高的变量进入方程,进行了各种检验,其馀变量中变量偏相关系数最高,通过检验的变量进入回归方程向后筛选策略变量并去除回归方程的过程,首先所有变量引入回归方程进行验证,然后在回归系数有效性检验中排除一个或多个非有效变量中t检验值最小的变量。 阶段筛选策略显示前向筛选与后向筛选策略的综合、线性回归分析、21、多元回归分析中其他问题变量的多重公共线性问题容忍度Tol容忍度值越接近1,多重公共线性越弱。 对SPSS变量复用协同线性的要求不是很严格,但是在容许度值太小时给出相应的警告信息。 分散式膨胀因子VIF膨胀因子是容忍度的倒数,越接近1,表示解释变量之间的多重共轭线性越弱。 通常,如果VIFi大于或等于10,则解释变量xi与其馀解释变量之间存在重大的多重公共线性。 特征根和方差比这里的特征根是相关系数矩阵的特征根。在最大特征量根远大于其他特征量根的值时,这些解释变量之间存在相当大的重复信息。 条件指数ki10ki100认为多重共线性强,ki100认为多重共线性严重,用线性回归分析、22、回归方程的统计检验残差分析异方差分析等级相关分析得到残差序列后,首先取绝对值,计算残差和解释变量的等级,最后计算spearmarman 具体过程见有关相关分析的章节。 线性回归分析、回归分析过程:第一,分析大量样本变量的观测值,确定变量之间的数学关系式;第二,分析回归方程的置信度,区分有效影响的参数和无效影响的参数线性回归分析,线性回归的使用条件:线性趋势,即参数与因素变量的关系是线性的。 这是因为变量y的可能值彼此独立。 反映在方程式中的是残差独立。 正态,即参数的线性组合,y应遵循正态分布。 反映在方程中的残差Ei遵循正态分布。 方差的均匀性、参数的任意线性组合、y的方差相同。 单元线性回归分析、2 .单元线性回归分析的SPSS操作打开【分析】【回归】【线性】,显示线性回归主对话框,进行SPSS程序命令操作后,设定各子对话框。 线性回归分析,(1)变量为该文本框选中的变量是线性回归模型的被解释变量,数值型是数值型。 要解释的变量如果是分类变量,则可以用二项或多变量Logistic模型等的建模来进行解析。 参数在此列表框中被选中的变量是线性模型的解释变量,数值类型一般是数值类型。 如果解释变量是分类变量或者定性变量,则可以用虚拟变量(伪变量)表示。 如果选择多个参数,则可以将参数拆分为块,然后使用“上一个”和“下一个”按钮为变量的每个子集指定不同的输入方法。 线性回归分析,总方差平方和,(2)在线性回归中选择变量的进入和排除方法,构建多个回归模型,进入的方法表示变量列表中的所有变量进入回归模型。 逐步地,对于已经包括在回归公式中的变量(其指示已经选择了具有最小概率的f统计的参数给回归模型的动态过程),如果f统计的概率已经足够高,那么该方法消除这些变量直到变量不再满足进入或消除的条件为止,并且方法结束删除。 指在建立回归模型之前设定一定的条件,并根据条件删除引数。 向后,该方法首先选择参数列表中的所有参数作为回归模型,依次删除,首先删除与因素变量具有最小部分相关性的变量,删除第一个变量,得到新的方程,接着删除与因素变量具有最小部分相关性的变量,直到方程中不满足删除条件的变量为止向前,这种方法与“向后”完全相反,按顺序选择参数作为回归模型。 首先,将与要因变量之间具有最大相关性的、满足选择条件的变量放入回归模型,考虑下一个变量并结束过程,直到下一个满足条件的变量消失为止。 线性回归分析,(3)选择变量此文本框主要用于指定分析案例的选择规则,如果回归分析包含选择规则中定义的案例,则需要进行设置。 线性回归:设置规则的子对话框以选择关系。分类变量具有“等于”和“不等于”关系,字符串类型变量使用“等于”关系,可以在“值”文本框中输入用于为特定数字或字符串选择事例的规则。在“值”中输入f表示只有女性事例进行分析。对于连续变量如果选择“不等于”,并在“值”中输入1,则回归分析仅包括具有无线服务的情况。 线性回归分析,(4)案例标签此文本框主要用于指定案例标签的变量。 (5)WLS权重该文本框表示加权最小二乘方,仅在判定回归模型的残差有偏差时采用加权最小二乘法,指定加权变量。 线性回归分析,(6)设定统计量按钮回归系数选项组:估计,选中此复选框,输出回归系数、标准误差、归一化系数库、t值和t的双尾有效级别。 选中信任区间、误差条形图的特征以及此复选框可以输出信任区间,为每个回归系数或协方差矩阵指定信任度,并在“级别”框中输入范围。 当选择协方差矩阵时,输出回归系数的方差-协方差矩阵,所述回归系数的方差-协方差矩阵为对角线以外的协方差,对角线为方差,并且还显示相关系数矩阵。 指定线性回归分析和残差选项组回归残差的验证方法。 Durbin-Watson是表示输出用于检查残差序列的自相关的D-W检查统计量的复选框。 案例诊断,此复选框用于诊断案例并输出案例,其中偏差值表示输出满足条件的案例偏差值。标准偏差用于指定偏差值满足标准偏差数倍的条件。所有案例都可以输出所有案例的残差选中线性回归分析和模型拟合度复选框,输出输入模型的变量和从模型中删除的变量,并显示复相关系数、R2和调整R2、估计的标准误差和方差分析表。 r侧的变化如果选中此复选框,则输出由于参数的添加或删除而引起的R2统计量的变更。 与某个变量相关联的r-2的变化越大,意味着该变量是一个非常好的预测变量。 说明如果选中此复选框,则输出回归分析中有效的事例数、平均值、每个变量的标准偏差,同时输出单尾有效级别的相关矩阵和每个相关系数的事例数。 线性回归分析,部分相关和偏相关此复选框表示输出部分相关和偏相关统计量。 其中:部分相关性是指,对于因素变量和某个参数,去除了模型的其他参数给该参数带来的线性效果之后的因素变量和参数的相关性。 变量添加到方程式中时,与R2的变更有关。 偏振相关是指在针对两个变量去除利用它们与其它变量的互相关的相关之后,这些变量之间的馀数相关。 对于因素变量和某个参数,模型中其他参数消除了上述两者的线性效果时两者间的相关关系。 公共线性诊断输出各变量的容许公差和公共线性诊断表。 线性回归分析、(7)绘图按钮设定“线性回归:图”对话框主要有助于验证正规性、线性、方差相等的假设,还可以检测偏差值、异常观测值、有影响的情况。 另外,源变量的列表中列出了因素变量(DEPENDNT )、归一化预测值(*ZPRED )、归一化残差(*zsresid )、稀疏残差(*DRESID )、调整后的预测值(*ADJPERD )、生成后的残差(*smresid )、生成后的删除残差(*SDRESID ) 线性回归分析,散点1之一此选项群组使用来源变数清单中的任何两个来建立散点图,并选取y轴变数作为y,x轴变数作为x。单击“下一步”绘制下一个图,单击“上一步”可返回到当前设置的图进行修改。 另外,标绘相对于标准化预测值的标准化残差,可以验证线性关系和均方差性。 归一化残差图此选项组用于创建归一化残差图,主要指定“直方图”和“归一化概念图”两种图,并将归一化残差的分布与正态分布进行比较。 生成所有部分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全教育培训部门课件
- 礼仪专业面试题库及答案
- 安全教育培训通知课件
- 安全教育培训质量不高课件
- 智慧城市能源系统2025年地热能供暖技术革新与挑战报告
- 农业产业化龙头企业在2025年产业融合与区域带动效应分析报告
- 安全教育培训计划表文库课件
- 新能源社区智能微电网2025年技术应用创新案例分享与启示报告
- 安全教育培训考卷课件
- 绿色供应链管理在环保纸张编织布制造业的应用与可持续发展2025年深度研究报告
- 2025年国际贸易业务员招聘考试试题集及答案
- 2025年建筑涂料采购专项合同
- 高考化学一轮复习:硫及其化合物(好题冲关)原卷版
- 2025年城市环境监测评估标准评估方案
- 2025年水面渔业养殖承包合同范本:水产养殖合作协议
- 水厂反恐知识培训内容课件
- 供应链金融操作指南
- 部编版语文六年级上册3《古诗词三首》(同步练习)(含答案)
- 2025-2026学年湘教版(2024)初中地理七年级上册教学计划及进度表
- 2025年重庆八中宏帆中学小升初自主招生数学试题(含答案详解)
- 公司金融学 课件 第三章:货币的时间价值
评论
0/150
提交评论