




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,简单相关与回归,内容提要,相关分析简介简单相关分析偏相关分析Distance过程简单回归分析小结,相关分析简介,在医学科学研究中,常常要分析两个变量之间的关系,例如身高和体重、年龄和血压、体温和脉搏、药物剂量和疗效等问题,因此涉及到研究两个变量的相互关系。这时就涉及到两个变量之间的相关与回归。,积差相关系数,又称Pearson相关系数:定量描述线性相关程度好坏的常用指标,只适用于两变量呈线性相关时。特点:相关系数r是一个无单位的量值,且-10为正相关,r0为负相关;r越接近于1,说明相关性越好;越接近于0,相关性越差。Spearman等级相关系数:当数据不满足条件双变量正态时。,相关分析简介,连续变量的相关指标(最常见),Gamma统计量:描述有序分类变量数据联系强度的指标,以下指标都是基于Gamma统计量衍生出来的。KendallsTau-b:反映两个有序分类变量的一致性。KendallsTau-c:对KendallsTau-b进行了校正。,相关分析简介,有序变量的相关指标,列联系数:基于2值得出PhiandCramersV:也是基于2值得出Lambda系数:用于反映自变量对因变量的预测效果不确定系数,相关分析简介,名义变量的相关指标,EtaKappa值OR、RR等,相关分析简介,其他相关指标,相关分析简介,实际上,在Crosstabs过程的statistics子对话框中提供了非常整齐的相关分析指标体系,如左图。,除了Crosstab过程的statistics子对话框外,SPSS还在statistics菜单的correlation中提供了几个更专业的相关分析过程:,Bivariate过程:最常用Partial过程:专门进行偏相关分析Distances过程:一般不单独使用,而用于因子分析、聚类分析和多维尺度分析的预分析,相关分析简介,例1某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直线相关关系。(数据文件见corr.sav),进食量和体重增量的数据,简单相关分析,首先绘制散点图,结果如下:,简单相关分析,两变量间存在线性相关趋势没有发现明显的异常值,简单相关分析,选入希望进行相关分析的变量,选择相关分析指标,简单相关分析,简单相关分析,结果分析,Pearson相关系数为0.940,且具有统计学意义,表明feed和weight有非常密切的关系,随着feed的增加,weight也随之增加。,简单相关分析,利用上述对话框可以计算秩相关系数,即spearman相关系数,对原始数据分布不作要求,利用两变量的秩次关系作线性相关分析,适用范围更广,但效能也较低。,简单相关分析,结果分析,对上面的例子计算秩相关系数的结果显示,秩相关系数为0.899,P值0.001。,简单相关分析,上述对话框可用于计算kendalls等级相关系数,适用于两变量均为有序分类的情况。,简单相关分析,结果分析,对上面的例子计算等级相关系数,结果显示,等级相关系数为0.750,P值0.003。注意本例并未违反计算积差相关系数的适用条件,这里仅仅是作为演示用。,大家可以发现,对相同的数据,秩相关系数和等级相关系数的绝对值均比积差相关系数小,为什么?,简单相关分析,显然,这是由于在秩变换或数据按有序分类处理时损失信息所导致的。,前面介绍的相关分析是分析两个计量资料间的关系,在计算积差相关系数、Spearman相关系数和Kendalls相关系数的时候,都没有考虑第三方的影响,这就导致可能对事物的解释出现偏差。下面以一个例子对此作进一步的说明。,偏相关分析,例2某地29名13岁男童身高(x1,cm)、体重(x2,kg)及肺活量的实测数据文件为partial.sav。试计算其简单相关系数。当体重固定时,计算身高与肺活量的偏相关系数,并做假设检验。,偏相关分析,偏相关分析,偏相关分析,选择需要在偏相关分析时进行控制的变量。,选择Zero-ordercorrelations复选框,则可以给出包括协变量在内所有变量两两相关的系数阵。,偏相关分析,偏相关分析,结果分析,可见,控制了体重的影响后,身高和肺活量之间的关系无统计学意义。,包括协变量在内所有变量两两相关的系数阵。,Distance过程,简单相关和偏相关有一个共同点,那就是对所分析的数据背景应当有一定程度的了解。但有时会遇到一种情况,在分析之前对数据所代表的专业背景知识了解尚不充分,本身就属于探索性的研究,这时往往就需要先对几个指标或者案例的差异性、相似程度进行考察,以先对数据有一个初步的了解,然后再根据结果考虑如何进行深入的分析。,Distance过程用于计算记录或变量间的距离(或相似程度),根据变量的不同类型可以有许多距离、相似程度测量指标供用户选择。但由于本模块只是一个预分析过程,因此距离分析并不会给出常用的P值,而只给出距离大小,以供用户自行判断相似性。,Distance过程,例3某实验室制作了一张基因芯片,上面一共检测了上万个基因,现在从数据库中提取出7个基因的数据,由于对这7个基因的生物学功能现在一无所知,因此首先想对其进行距离测量,看看哪几个基因“距离”比较接近,然后可以通过临床或实验室进一步验证。(数据见distance.sav。),Distance过程,Distance过程,Distance过程,注意选择该项,Distance过程,结果分析,可见,代号为CDK2AP1,TCEB1和IRF2三个基因比较接近,可以粗略的划为一类,而FPGS,ELF3和GFRA2可以划为另一类,而NFE2可能作为单独一类,这样就可以进一步研究了。,例4仍以数据corr.sav为例,进一步作回归分析,计算进食量与体重增量之间的回归方程。,分析:与相关分析类似,在回归分析之前首先要考虑的问题是两变量是否存在某种趋势,通过前面的散点图已经得到了肯定的结论,因此直接进行回归分析。,简单回归分析,绘制散点图如下:,简单回归分析,两变量间存在线性相关趋势没有发现明显的异常值,简单回归分析,选择应变量,选择自变量,简单回归分析,简单回归分析,结果分析,对各自变量纳入模型情况的汇总,本例只有一个自变量。,简单回归分析,结果分析,对模型的简单汇总,即对回归方程拟合情况的描述。本例决定系数为0.883。,简单回归分析,结果分析,对模型进行方差分析的结果,说明模型具有统计学意义。,最重要,简单回归分析,结果分析,给出了回归方程中的常数项、回归系数的估计值和检验结果,可写出回归方程如下:体重增量-17.3570.222进食量,小结,相关系数r表示两变量间的直线相关程度,r值的范围为-11。r为正表示X与Y之间为正相关,r为负表示负相关。r接近于0表示两变量间关系不密切。但r有抽样误差,故算得相关系数之后,必须检验相应的总体相关系数是否为0。,小结,研究中一般只涉及直线相关关系,但从理论上讲,可以进行变量间的曲线相关分析;如果希望扣除其他变量的影响,可以进行偏相关分析;如果变量不满足线性相关分析的适用条件,则可以进行Spearman秩相关分析。,小结,在意义和应用上,回归反映两变量间的依存关系,相关反映两变量间的相互关系。在资料要求上,相关要求X与Y都是随机变量,而且服从双变量正态分布,这种资料若进行回归分析,一般称为型回归模型。而回归要求应变量Y是随机变量,服从正态分布,自变量是固定的非随机变量,建立的模型称为型回归模型。,相关与回归既有区别又有联系。,相关系数和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025二级建造师考试题库及参考答案
- 江西省新余市2024-2025学年七年级下学期期末语文试题(解析版)
- 舞台技术工试题及答案
- 技术体系面试题及答案
- 2025年工具钳工(中级)考试试题题库
- 2025技术研发合同协议范本
- 2025新会计准则对保险业的影响及保险合同的完善
- 2025药品代加工合同模板
- 摄像机基础知识培训课件
- 搭配课件教学课件
- 脓毒症休克的诊治
- 13.1 磁场 磁感线 课件 高二上学期物理人教版(2019)必修第三册
- GA/T 804-2024机动车号牌专用固封装置
- DBJ50-T-274-2017 重庆市轨道交通客运服务标志标准
- 2022版科学课程标准题库
- 诊断学-12-血管检查课件
- (完整版)韩国商法
- 去骨瓣减压术的护理
- 2024年海盐县交通投资集团有限公司招聘笔试参考题库附带答案详解
- 保健按摩合伙经营协议
- GJB9001C内部审核检查表
评论
0/150
提交评论