回归、判别分析_第1页
回归、判别分析_第2页
回归、判别分析_第3页
回归、判别分析_第4页
回归、判别分析_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

天津工业大学实验报告大学(系)名称:计算机通信工程学院名字学号职业上课实验项目回归分析和判别分析学科课程名称数据分析和应用软件课程代码0665106实验时间2016年4月6日3,4节,中午实验场所7楼216更正意见成绩教师签名:实验内容:回归分析:1.研究货物总量(万吨)与工业总额(亿元)、农业产值(亿元)、居民非商品支出(亿元)的关系。数据如下表所示编号货物y总计产业生产总值x1农业生产总值x2居民非商品支出x3116070351.0226075402.4321065402.0426574423.0524072381.2622068451.5727578424.0816066362.0927570443.21025065423.0变量x1表示工业生产总值,变量x2表示农业生产总值,变量x3表示居民非商品支出,y表示总货运量。假设变量y和参数x1、x2、x3的线性回归模型如下判别分析:2.为了研究特定地区的人口死亡情况,分为15个已知样本3种,指标和原始数据如下表所示。使用fisher线性判别函数判断其余4个暂记样本属于哪一类。特定地区人口死亡指标和原始数据表组序号X1=0岁组死亡概率X2=1岁组死亡概率X3=10岁组死亡概率X4=55岁组死亡概率X5=80岁组死亡概率X6=平均寿命第一组134.167.441.127.8795.1969.3233.066.341.086.7794.0869.7336.269.241.048.9797.368.8440.1713.451.4313.88101.266.2550.0623.032.8323.74112.5263.3第二组133.246.241.1822.9160.0165.4232.224.221.0620.7124.768.7341.1510.082.3232.84172.0665.85453.0425.744.0634.87152.0363.5538.0311.26.0727.84146.3266.8第三组134.035.410.075.290.169.5232.113.020.093.1485.1570.8344.1215.121.0815.15103.1264.8454.1725.032.1125.15110.1463.7528.072.010.073.0281.2268.3等待样品150.226.661.0822.54170.665.2234.647.331.117.7895.1669.3333.426.221.1222.95160.3168.3444.0215.361.0716.45105.364.2实验结果分析:回归分析:(1)描述统计结果,并显示变量y和x1、x2、x3的平均值、标准差和样例(n)。(2)相关分析结果,货物总量和农业生产总值、货物总量和居民非商品居民居住地的相关系数分别为0.731,0.724,单尾单侧检查分别为P=0.008,P=0.009,相关度较高。(3)模型汇总,相关系数R=0.898,确定系数R Square=0.806,调整确定系数Adjusted R Square=0.708,估计值的标准误差Std。Error of the Estimate=1.391(4)方差分析结果,回归的平均平方Regression Mean Square=4551.790,残差平均平方Residual Mean Square=549.522,F=8.283,P=0.0150(5)部分回归系数结果,常数=-348.280,工业总生产回归系数=3.754,回归系数的标准误差=1.933,回归系数的t检查值=0.385,P=0.100因此,回归方程为y=-348.280 3.754 7.101 12.447(6)残差直方图、正态曲线加载到直方图中,判断标准化残差为正态分布。(7)保存结果,将新变量添加到正在使用的数据文件中。判别分析:(1)将数据导入SPSS,必要时使用系统群集方法在SPSS中进行分析-分类-判别分析选择:(2)将组变量设置为组,以便基于X1到X6之间的所有参数执行判别分析,如下图所示。(3)在统计选项中,选择average、single variable、box s m等。例如,分类选项中的案例,汇总:(4)确保各组的说明统计和各组的平均值相同。表1反映了有效的样本量为15,缺少变量的值为4。表2是对每个组的平均值是否相等的测试,根据p值,可以在0.01的显著性水平上拒绝三个组的平均值中X4和X5相等的假设(变量X4,X5在三个组的平均值中存在显着差异)。(5)典型的判别函数:表3描述了方差的98.8%,二次判别函数描述了方差的1.2%,两个判别函数描述了总体方差。表4是由Wilkins Lambd测试的两个判别函数的显著性测试,在0.05的显著性水平上,根据p值,第一个判别函数值得注意,第二个判别函数不重要。(6)判别函数、判别载荷和各组的重心:表5是标准化的判别函数,表示如下:y1=-17.046 x 114.757 x2-1.306 x3 6.381 x4 1.332 X5 4.315 x 6y2=-7.677 x19.870 x2-0.531 x3-0.666 x4 0.716 X5 1.833 X6表6位结构矩阵,即判别载荷,表4反映了每个组的判别函数重心表7是未规范化的判别函数,显示如下:y1=-78.896-1.950 x1 1.748 x2-0.930 x3 0.825 x4 0.102 X5 1.662 X6y2=-30.330-0.878 x1 1.169 x2-0.365 x3-0.086 x4 0.054 X5 0.706 X6(7)分类统计结果:表8是每个组的分类函数,也称为fisher线性判别函数,这三个组的分类函数表示如下:y1=-5628.382-159.015 x1 168.068 x2-98.413 x3 58.217 x4 11.702 X5 202.770 X6y2=-6584.377-181.479 x1 187.715 x2-109.195 x3-68.296 x4 12.862 X5 221.972 X6y3=-5266.780-149.370 x1 158.749 x2-93.908 x3 54.948 x4 11.185 X5 194.625 x 6根据计算每个观测值的每个群组的分类函数值,可以将观测分类为较大的分类函数值。表9位分类矩阵表,通过判别函数的预测,根据原始数据所属的组关系确定全部三个观测集,将未分组变量中的一个宣告为第一组,一个宣告为第二组,两个宣告为第三组。在交叉验证中,第一组5个样本全部被判定为对,第二组5个样本观测为4对,第三组5个样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论