线性回归与相关性分析_第1页
线性回归与相关性分析_第2页
线性回归与相关性分析_第3页
线性回归与相关性分析_第4页
线性回归与相关性分析_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、YUNNANNORMALUNIVERSITY本科学生实验报告学号:#姓名:学院:生命科学学院专业、班级:学级应用生物教育A班实验课程名称:生物统计学实验教师:孟丽华(教授)开课学期:2021至2021学年下学期填报时间:2021年5月22日云南师范大学教务处编印一.实验设计方案实验序号及名称:实验十:线性回归与相关性分析实验时间2013-05-17实验室睿智楼3幢326(一)、实验目的:1、能够熟练的使用SPSS软件对实验数据进行线性回归分析和相关性分析;2、掌握线性回归与相关性分析的基本思想和具体操作,能够读懂分析结果,并写出回归方程,对回归方程进行各种统计检验;3、进一步熟悉SPSS软件的

2、应用。(二)、实验设备及材料:微机、SPSSforWindowsV统计软件包及相应的要统计的数据(三)、实验原理:1、统计学上采用相关分析(correlationanalysis)研究呈平行关系的相关变量之间的关系。2、对两个变量间的直线关系进行相关分析称为简单相关分析(也叫直线相关分析);对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析;3、相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针

3、对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为,你只需要拿p值和进行比较:如果p值小于,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于;如果大于,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似;4、对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的n对观测值:(xl,yl),(a«2,y2),(ah,>n

4、);为了直观地看出x和y间的变化趋势,可将每一对观测值在平面直角坐标系描点,作出散点图;5、从散点图可以看出:两个变量间有关或无关;若有关,两个变量间关系类型,是直线型还是曲线型;两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切);散点图直观地、定性地表示了两个变量之间的关系。为了探讨它们之间的规律性,还必须根据观测值将其内在关系定量地表达出来;6、利用直线回归方程进行预测或控制时;一般只适用于原来研究的范困,不能随意把范围扩大,因为在研究的范围内两变量是直线关系,这并不能保证在这研究范围之外仍然是直线关系。若需要扩大预测和控制范围,则要有充分的理论依据或进一步的实验

5、依据。利用直线回归方程进行预测或控制,一般只能内插,不要轻易外延;7、进行直线相关分析的基本任务在于根据x、y的实际观测值,计算表示两个相关变量x、y间线性相关程度和性质的统计量一一相关系数r并进行显著性检验;8、根据实际观测值计算得来的相关系数r是样本相关系数,它是双变量正态总体中的总体相关系数P的估计值。样本相关系数r是否来自PW0的总体,还须对样本相关系数r进行显著性检验。此时无效假设、备择假设为:H0:P=O,HA:PWO。与直线回归关系显著性检验一样,可采用2检验法与F检验法对相关系数2-的显著性进行检验;9、直线回归分析将二个相关变量区分为自变量和依变量,侧重于寻求它们之间的联系形

6、式一直线回归方程;直线相关分析不区分自变量和依变量,侧重于揭示它们之间的联系程度和性质一一计算出相关系数。两种分析所进行的显著性检验都是解决y与x间是否存在直线关系。因而二者的检验是等价的。即相关系数显著,回归系数亦显著;相关系数不显著,回归系数也必然不显著;10、应用直线回归与相关的注意事项:直线回归分析与相关分析在生物科学研究领域中已得到了广泛的应用,但在实际工作中却很容易被误用或作出错误的解释。为了正确地应用直线回归分析和相关分析这一工具,必须注意以下几点:1)、变量间是否存在相关;2)、其余变量尽量保持一致;3)、观测值要尽可能的多;4)、外推要谨慎;5)、正确理解回归或相关显著与否的

7、含义;6)、一个显著的回归方程并不一定具有实践上的预测意义;(四)、实验内容:内容:生物统计学(第四版)138页第七章习题和习题实验方法步骤(一)、习题1、启动spss软件:开始f所有程序一SPSSfspssforwindows-*spssforwindows,直接进入SPSS数据编辑窗口进行相关操作;2、定义变量,输入数据。点击“变量视图”定义变量工作表,用“name”命令定义变量“X”(小数点零位),标签:“4月下旬平均气温/”;变量“Y”(小数点零位),标签:“5月上旬50株棉财虫数/头”,点击“变量视图工作表”,一一对应将不同“X”气温与“Y”棉螃虫数的数据依次输入到单元格中;3、设置

8、分析变量。数据输入完后,点菜单栏:“分析(9)”一“回归(R)”一“线性(L)”,将“5月上旬50株棉螃虫数(Y)”移到因变量列表(D)中,将“4月下旬平均气温(X)”移入自变量列表(I)中进行分析;1)、点“统计量(S)”,回归系数:在“估计(E)”、“置信区间水平(%)95”前打钩,“模型拟合性(M)”、“描述性”前打钩,残差:个案诊断(C)前打钩,点“所有个案”,点“继续”;2)、点“绘制(T)”,将“DEPENDNP”移入“丫(Y)”列表中,将“ZPRED”移入“X2(X)”中,标准化残差图:在“直方图(H)”、“正太概率图(R)”前打钩,点“继续”;3)、点“保存(S)”,所有的默认

9、,点“继续”;4)、点“选项(O)”,所有的都默认,点“继续”,然后点击“确定”便出结果;统计量(S)绘制(T)选项(O)(默认)保存(S)(默认)(二二习题1、启动spss软件:开始f所有程序SPSSfspssforwindows->spssforwindows,直接进入SPSS数据编辑窗口进行相关操作;2、定义变量,输入数据。点击“变量视图”定义变量工作表,用“name”命令定义变量“维生素C的含量”(小数点两位);变量“受冻情况”(小数点零位),“未受冻”赋值为“1”,“受冻”赋值为“2”,点击“变量视图工作表”,一一对应将不同“未受冻”与“受冻”的维生素C的含量数据依次输入到单元

10、格中;3、设置分析变量。数据输入完后,点菜单栏:”分析(&)”一“相关(C)”一“双变量(旦)”,将“维生素C含量”、“受冻情况”变量(V)列表中,相关系数:“Pearson”前打钩,显著性检验:双侧检验(T)前打钩,“标记显著性相关(F)前打钩”,点“选项(O)”,统计量:在“均值和标准差(M)”前打钩,缺失值:在“按对排除个案(P)”前打钩,点“继续”,然后点击“确定”便出结果。选项(°)“图形(G)w一“旧对话框(L)”一“散点/点状(S)”散点图/点图双变量相关性二一.|/)-统计量V均值和标准差题叉枳偏差和协方差©缺失值校对排除个案©©

11、按列表排除个案u继续取消帮助简单散点图4、表格绘制出来后,进行检查修改,将其复制到实验报告中,将虚框隐藏等;5、将所求的描述性统计指标数据表格保存,对其所求得的结果进行分析,书写实验报告。(五)、实验结果:回归表1描述性统计量均值标准偏展N5月上旬棉财虫数4月卜.旬平均气温1111表2相关性5月上旬棉蛎虫数4月下旬平均气温Pearson相关性5月上旬棉财虫数4月下旬平均气温.858.858Sig.(单)5月上旬棉财虫数4月下旬平均气温.000.000N5月上旬棉财虫数4月下旬平均气温111111H输入/移去的变量'模型输入的变量移去的变量方法14月下旬平均5曷输入a.已输入所有请求的变

12、量。b.因变量:5月上旬棉蜴虫数模型汇总b模型RR方调整R方标准估计的误差J.858,.737.707a.预测变量:(常量),4月卜旬平均气温。b.因变量:5月上旬棉蜴虫数Anovab模型平方和df均方FSig.1回归1,00残差9总计10a.预测变量:(常量).4月卜.旬平均气温。b.因变量:5月上旬棉筋虫数系数'模型非标准化系数标准系数tSig.B的%苴信区间B标准误差试用版下限上限1(常量)4月下旬平均气温.858,002,001a.因变量:5月上旬棉蜴虫数残差统计量“极小值极大值均值标准偏差N预测值11残差.00011标准预测值.00011标准残差.000.94911a.因变量

13、:5月上旬棉蜴虫数案例诊断”案例数目标准残差5月上旬棉蜴虫数预测值残差1,687862197384295286,0672371281496410.2315011112a.因变量:5月上旬棉蜴虫数图表直方图因变量:5月上旬棉蜥虫数回加标准化残差期望的累积«率回归标准化残差的标准P-P图因变量:5月上旬棉场虫数0.20.40.60.81.0观测的累枳概率散点图因变量:5月上旬棉蜥虫数O-O-O-O-O-20151055月上旬棉财虫数回口标准化预计值相关性表9描述性统计量均值标准差N维生素C含量受冻情况.5083232表10相关性维生素C含量受冻情况维生素c含量Pearson相关性1.19

14、2显著性(双).293N3232受冻情况Pearson相关性.1921显著性(双).293N3232图表45.00-40.00-维生索含量35.00-30.00-80O25.00-2000-i1.0i1.82.0III1.21.41.6受冻情况实验结果分析:习题:由表4得出:拟合优度系数为,接近1,说明拟合好。存在多重线性。由表6得,回归方程的p值说明显著线性。回归系数p值(,说明显著线性。(1)、线性回归方程:丫二十;(2)、sy/x=,F=*;(3)y/x的95%置信区间:,单个y的95%置信区间:(一,;习题:从实验结果可以得出:(1)、相关系数与决定系数分别为:rl二,r2=,(2)、

15、r的95%置信区间:,。0r2=,I-的95%置信区间:(六)、实验总结分析:1、相关性分析是考察两个变量之间线性关系的一种统计分析方法,利用直线回归方程进行预测或控制,一般只能内插,不要轻易外延;2、直线回归相关分析的注意事项:1)、相关分析只是以相关系数来描述两个变量间线性相关的程度和方向,并不阐明事物间存在联系的本质,也不是两事物间存在联系的证据。要阐明两事物间的本质联系,必须凭专业知识从理论上加以论证。因此,把两个毫无关系的事物放在一起作相关分析是毫无意义的。同样,作回归分析也要有实际意义;2)、在进行直线回归前应绘制散点图,有直线趋势时,才适宜作直线回归分析。散点图还能提示资料有无异常点;3)、直线回归方程的适用范围一般以自变量的取值范围为限;4)、对同一组资料作回归和相关分析,其相关系数和回归系数的显著性检验结果完全相同。由于相关系数的显著性检验结果可直接查表,比较方便;而回归系数的显著性检验计算复杂,故在实际应用中常用相关系数的显著性检验结果代替回归系数的显著性检验。5)、在资料要求:相关分析要求两个变量服从双变量正态分布。回归分析要求因变量服从正态分布,自变量可以是精

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论