




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 7 回归分析实验报告 实验报告 实验课程: 信息分析 专班 业: 信息管理与信息系统 级: 学生姓名: 指导教师: 请 输 入 姓 名 完成时间: 2016 年6 月 28日 一实验目的 多元线性回归简单地说是涉及多个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。本实验要求掌握附带残差分析的多元线性回归理论与方法。 二实验环境 实验室 308 教室 三实验步骤与内 容 1打开应用统计学实验指导书,新建 excel 表 2打开 SPSS,将数据输入。 3调用 SPSS 主菜单的分析 回归 线性命令,打开线性回归对话框,指定因变量和自变量,以及回归方式;逐步回归 图 1 线性对话框 4.在统计栏中,选择估计以输出回归系数 B 的估计值、 t 统计量等,选择 Duribin-watson 以进行 DW 检验;选择模型拟合度输出拟合优度统计量值,如 R 、 F 统计量值2 / 7 等。 图 2 统计量栏 5在线性回归栏中选择 直方图和正态概率图以绘制标准化残差的直方图和残差分析与正态概率比较图,以标准化预测值为纵坐标,标准化残差值为横坐标,绘制残差与Y 的预测值的散点图,检验误差变量的方差是否为常数。 图 3 绘制栏 6.提交分析,并在输出窗口中查看结果,以及对结果进行分析。 系统在进行逐步分析的过程中产生了两个回归模型,模型 1先将与因变量线性关系的自变量地区人口引入模型,建立他们之间的一元线性关系。而后逐步引入其他变量,表 1 中模型 2表明将自变量人均收入引入,建立二元线性回归模型,可见地区人 口和人均收入对销售收入的影响同等重要。 从表 2中给出了两个模型各自的 R 和调整后的 R ,第一个模型中的销售收入中有 99%的变动可以用地区人口的变动解释,第二个模型中地区人口和人均收入的变动可以解释销售收入中 %的变动,显然第二个模型的拟合数据效果比较好一点。 此外,还给出了第二个模型的 DW简言之,按照 a=、n=15、 k=2,查表,得到 DW检验临界值 dl和 du分别为和,3 / 7 因为 du 表 3中给出了两个模型的 F检验值,查表可知当a=,自由度为时, F 检验的临界值为,第一个模型的 F 值为,远远大于 临界值,拒绝原假设,备择假设为真,即至少有一个 bi不等于 0,因此模型 1有效。当 a=,自由度为时, F 检验的临界值为,第二个模型的 F值为,模型 2也通过了有效性的检验。 实验一:线性回归分析 实验目的:通过本次试验掌握回归分析的基本思想和基本方法,理解最小二乘法的计算步骤,理解模型的设定T 检验,并能够根据检验结果对模型的合理性进行判断,进而改进模型。理解残差分析的意义和重要性,会对模型的回归残差进行正态型和独立性检验,从而能够判断模型是否符合回归分析的基本假设。 实验内容:用线性回归分析建 立以高血压作为被解释变量,其他变量作为解释变量的线性回归模型。分析高血压与其他变量之间的关系。 实验步骤: 1、选择 File | Open | Data 命令,打开 图 1-1 数据集 gaoxueya 的部分数据 2、 选择 Analyze | Regression | Linear命令,弹出 Linear Regression 对话框,如 图 1-2 所示。将左侧的血压选入右侧上方的Dependent 框中,作为被解释变量。再分别把年龄、体重、吸烟指数选入 Independent 框中,作为解释变量。在 Method4 / 7 下拉菜单中,指定自变量进入分析的方法。 图 1-2 线性回归分析对话框 3、单击 Statistics 按钮,弹出 Linear Regression : Statistics对话框,如图 1-3所示。 1-3 线性回归分析统计量对话框 4、单击 Continue 回到线性回归分析对话框。单击 Plots ,打开 Linear Regression:Plots 对话框,如图 1-4 所示。完成如下操作。 图 1-4 线性回归分析:图形对话框 5、单击 Continue ,回到线性回归分析对话框,单击 Save 按钮,打开 Linear Regression; Save 对话框,如图 1-5所示。完成如图操作。 图 1-5 线性回归分析:保存对话框 6、单击 Continue ,回到线性回归分析对话框,单击Options 按钮,打开 Linear Regression; Options 对话框,如图 1-6 所示。完成如下操作。 图 1-6 线性回归分析选项对话框 7、单击 Continue ,回到线性回归分析对话框,然后单击 OK,进入计算分析。 实验结论: 图 1-7 给出了基本的描述性统计量,图中显示各个变量的全部观测量的 Mean、和观测量总数 N。图 1-8 给出了相关系数矩阵表,其中显示 4 个自变量两两间的 Pearson 相5 / 7 关系数,以及相关关系等于 0的假设的单位显著性检验概率。 从表中看到因变量血压与自变量年龄、体重系数的相关系数依次为、,反 应高血压与年龄、体重系数具有显著的相关关系。说明年龄和体重系数对人是否患高血压有显著影响。相比而言,吸烟这个自变 量与因变量血压之间的相关系数较小,仅为,说明他们之间的线性关系不显著。说明吸烟对人是否患高血压不具显著影响。此外年龄与体重系数相关系数为,说明年龄与体重系数之间存在显著性相关关系。 图 7-9 给出了进入模型和被剔除的变量的信息,从表中我们可以看出, 3 个自变量都进入模型,说明我们的解释变量都是显著并且是有解释力的。 图 1-9变量进入 |剔除信息表 图 1-10给出了模型整体拟合效果的概述,模型的拟合度系数为,反映了因变量与自变量之间具有高度显著的关系。 图 1-10 模型概 述表 图 1-11给出了方差分析表,我们可以看到模型的设定检验 F 统计量的值为,显著性水平的 P 值几乎为 0,于是我们的模型通过了设定检验,也就是说,因变量与自变量之间的显著性关系明显。 图 1-11 方差分析表 6 / 7 图 1-12给出了回归系数表和变量显著性的 T 值,我们发现,所有变量的 T值都达到显著性 水平。 图 1-12 回归系数表 图 1-13给出了残差分析表,表中显示预测值、残差、标准化预测值、标准化最小值、最大值、均值、标准差及样本容量等。标准化残差的 绝对值最大为,小于 3,说明样本中无奇异值。 图 1-13残差统计表 图 1-14 和 1-15 给出了模型残差的直方图和正态概率 P-P图。 中国计量学院现代科技学院 实 验 报 告 实验课程:应用统计学 实验名称: 回归分析 班 级: 学 号: 姓 名: 实验日期: 实验成绩: 指导教师签名: 一实验目的 一元线性回归简单地说是涉及一个自变量的回归分析,主要功能是处理两个变量之间的线性关 系,建立线性数学模型并进行评价预测。本实验要求掌握一元线性回归的求解和多元线性回归理论与方法。 7 / 7 二实验环境 中国计量学院现代科技
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设备维修的修理类别教学设计-2025-2026学年中职专业课-机械加工技术-机械类-装备制造大类
- 蔬菜产品知识培训心得课件
- 《沟通从心开始 做情绪的主人》教学设计-2023-2024学年心理健康教育四年级下册鲁画版
- 活动三 个人护眼计划教学设计-2025-2026学年小学综合实践活动沪科黔科版四年级下册-沪科黔科版
- 音乐合成与MIDI说课稿-2025-2026学年中职专业课-多媒体技术及应用-计算机类-电子与信息大类
- 第6课 众人拾柴火焰高教学设计-2025-2026学年小学心理健康五年级下册川教版
- 中考模拟往年试卷及答案
- 2025年1月土建施工员模拟练习题(含参考答案)
- 蒸馏法测定水分课件
- 2025年七年级数学秋季开学摸底考(人教版山东专用)含答案
- 材料节约措施管理制度
- 2025纪检监察综合业务知识考试题库及答案
- 国家安全知识题库
- T/CCMA 0095-2020非公路自卸车操作使用规程
- JJF(京) 122-2024 测量仪器与智能传感科技成果概念验证实施规范
- 合资公司经营协议书
- 湘科版 五年级科学上册 全册教案
- 《智能设备故障诊断》课件
- 高中生德育教育主题班会
- 租赁冷库协议书范本
- 一线班组质量奖申报材料
评论
0/150
提交评论