09 第9章直线相关与回归(76页)_免费下载.ppt_第1页
09 第9章直线相关与回归(76页)_免费下载.ppt_第2页
09 第9章直线相关与回归(76页)_免费下载.ppt_第3页
09 第9章直线相关与回归(76页)_免费下载.ppt_第4页
09 第9章直线相关与回归(76页)_免费下载.ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第9章直线相关与回归,第1页,医学统计学,主讲程琮,泰山医学院预防医学教研室ccta0509,医学研究生用,第9章直线相关与回归,第2页,theteachingplanformedicalstudents,professorchengcong,dept.ofpreventivemedicinetaishanmedicalcollege,medicalstatistics,第9章直线相关与回归,第3页,医学统计学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。2003年12月晋升教授。现任预防医学教研室副主任。主要从事医学统计学、预防医学,医学人口统计学等课程的教学及科研工作,每年听课学生600-1000人。自2000年起连续10年,为硕士研究生开设医学统计学、spss统计分析教程、卫生经济学等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文50多篇。代表作有“锌对乳癌细胞生长、增殖与基因表达的影响”,“行列相关的测度”等。主编、副主编各类教材及专著10部,代表作有医学统计学、spss统计分析教程。获得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获2004年泰山医学院首届十大教学名师奖。医学统计学为校级和省级精品课程。,程琮教授简介,第9章直线相关与回归,第4页,医学统计学目录,第1章绪论第2章定量资料的统计描述第3章总体均数的区间估计和假设检验第4章方差分析第5章定性资料的统计描述第6章总体率的区间估计和假设检验第7章二项分布与poisson分布第8章秩和检验第9章直线相关与回归第10章实验设计第11章调查设计第12章统计表与统计图,第9章直线相关与回归,第5页,第9章直线相关与回归目录,第五节曲线直线化,第二节直线回归,第三节相关回归分析注意问题,第四节等级相关,第一节直线相关,第9章直线相关与回归,第6页,第9章直线相关与回归学习要求,掌握:直线相关与回归的概念及意义。掌握:直线相关与回归系数的适用条件、计算及检验方法。熟悉:直线相关与回归分析时应注意的问题。熟悉:等级相关的概念、意义、适用条件及计算方法。了解:曲线直线化的概念、意义及计算方法。,第9章直线相关与回归,第7页,第一节直线相关,相关的概念:两事物或现象在数量上的协同变化呈直线趋势时则称为直线相关(linearcorrelation),又称简单相关(simplecorrelation),用于分析双变量正态分布资料。表示两变量相关关系的重要指标就是相关系数。,第9章直线相关与回归,第8页,相关系数(correlationcoefficient)又称为积差相关系数,用符号r表示。它描述两变量间相关关系的密切程度和相关方向。其数值1r1,当r为正值时,表示一变量随另一变量的增加而增加称为正相关;当r为负值时,表示一变量随另一变量的增加而减少,称为负相关。当r愈接近1,表示两变量的相关愈密切;当r愈接近0时,表示两变量相关程度愈低;当r0时,称为零相关,表示两变量无直线相关关系,见示意图9-1。,一、相关系数的意义,第9章直线相关与回归,第9页,一般认为,当样本含量较大的情况下(n100),大致可按下列标准估计两变量相关的程度r0.7高度相关0.7r0.4中度相关0.4r0.2低度相关,相关程度的判断,第9章直线相关与回归,第10页,图9-1相关系数示意,第9章直线相关与回归,第11页,相关系数r的计算公式:,二、相关系数的计算,式中:lxx与lyy分别为变量x与y的离均差平方和,lxy为两变量x、y的离均差积和。,第9章直线相关与回归,第12页,请牢记下列计算公式:,第9章直线相关与回归,第13页,【例9.1】某研究者测量10名20岁男青年身高与前臂长。数据见表9-1。试分析:身高与前臂长有无直线相关关系?计算步骤:(1)由原始数据绘制散点图9-2,本资料呈直线相关趋势。,实例分析,第9章直线相关与回归,第14页,计算步骤:(1)由原始数据绘制散点图9-2,本资料呈直线相关趋势。,绘制散点图,第9章直线相关与回归,第15页,表9-1身高与前臂长数据与计算表,第9章直线相关与回归,第16页,(2)根据表9-1原始数据计算出x,y,x2,y2,xy。本例x1725,y454,x2298525,y220690,xy78541。(3)计算x、y的离均差平方和与离均差积和,第9章直线相关与回归,第17页,(4)求相关系数r,第9章直线相关与回归,第18页,三、相关系数的检验假设检验r是否来自总体相关系数为零的总体。,第9章直线相关与回归,第19页,t检验法t检验的计算公式,第9章直线相关与回归,第20页,【例9.2】对例9.1资料所得r值,检验20岁男青年身高与前臂长是否有直线相关关系。(1)建立检验假设h0:0,两变量间无直线相关关系h1:0,两变量间有直线相关关系0.05(2)计算t值本例n=10,r=0.8227,按公式(9.5)和公式(9.6)计算t值,第9章直线相关与回归,第21页,(3)确定p值,作出推断结论按n-2=8,查t界值表,得0.002p0.005,按0.05水准,拒绝h0,接受h1,故可认为20岁男青年身高与前臂长呈正直线相关关系。2.查表法(用于n50)查附表14,r界值表列出了相关系数r与0差别显著性的判断界值,按自由度n-2查r界值表,当rr,n-2时,则p;反之,rr,n-2时,则p。本例r0.8227,大于r0.05(8)0.738,故pt0.005(8),故pr0.05,10=0.648,故p0.05。(6)推断结论在=0.05水准上,拒绝h0,接受h1。结论:可认为黄曲霉毒素相对含量与肝癌死亡率之间存在正相关关系。,分析步骤(3),第9章直线相关与回归,第49页,第五节曲线直线化,曲线拟合:求曲线回归方程的过程及方法叫曲线拟合。医学上常见的曲线类型有:指数曲线、对数曲线、双曲线、抛物线和“s”型曲线等。曲线直线化:在医学研究中,有时两种变量间呈曲线关系。通过将变量经过一定的变换,使得曲线变为直线,此过程称为曲线直线化。其目的是为了应用及理解上的方便。,一、曲线直线化的概述,第9章直线相关与回归,第50页,修匀由于抽样误差的影响,实测资料存在一定的波动,难于绘出一条能完全符合每一观察点的光滑曲线,但得到的该回归曲线却能比较恰当的显示原资料中两变量间的回归关系。因此经过修匀的曲线比原资料的观察点合理而稳定。估计即由较易测得的自变量x推算较难测得的应变量y的估计值。,(一)曲线直线化的用途,第9章直线相关与回归,第51页,1.确定曲线类型对实测数据选择何种曲线类型,一般要根据以下三个方面:根据专业知识及过去经验或文献资料;根据全部观察点在普通坐标纸上所呈现的总趋势;根据观察点在某种变换值的坐标纸上是不是呈现直线趋势。如半对数纸上点图呈现直线趋势可选用指数曲线或对数曲线;如在双对数纸上呈直线趋势可选用双曲线;如在对数概率单位纸上呈直线趋势时,可选用s型曲线。,(二)曲线拟合步骤,第9章直线相关与回归,第52页,2.直线化对呈曲线关系的变量进行适当变换,使变换后的两个变量之间呈直线关系,称为直线化。直线化既可以验证所确定的曲线型是否恰当,更便于用求直线方程的方法得到曲线方程。除多项式曲线可不必经直线化外,其它几类曲线拟合大多经过直线化。3.求曲线回归方程4.求估计值5.作曲线图6.必要时作拟合优度检验,第9章直线相关与回归,第53页,x与y之间的关系可归纳为下面二点:二者关系始终是正比例或始终是反比例;变化始终是“加速度”的或始终是“减速度”的。具有上述性质的资料一般均可拟和指数曲线或对数曲线。,二、指数与对数曲线的拟合,第9章直线相关与回归,第54页,指数曲线方程的一般形式为(9.15),若10a=a,10b=b,则公式可表示为(9.16),公式(9.15)两边取对数,得(9.17),公式(9.16)两边取对数,得(9.18),第9章直线相关与回归,第55页,令lga=algb=b则公式(9.18)也变成公式(9.17)的形式。公式(9.17)是指数曲线方程的对数形式。如令y=lgy则公式(9.17)就变成了直线回归方程形式,可按最小二乘法求知直线回归方程,得a和b值后,直接可写成(9.15)的形式或经求得a=lg-1a,b=lg-1b后,写成公式(9.16)的形式。指数曲线的形式可概括为四种类型,见图9-3。,第9章直线相关与回归,第56页,图9-3四型指数曲线的模型,四型指数曲线的模型,其主要特点:自变量x在指数位上。,第9章直线相关与回归,第57页,【例9.6】某地大气中离污染源不同距离处氰化物浓度测定结果见表9-3。试拟合曲线。,第9章直线相关与回归,第58页,(1)定曲线型将表9-3第(1)、(2)栏各(x,y)点绘于普通坐标纸上,得到图9-4,对照图9-3各型,接近型指数曲线,即lgy=a-bx.(2)直线化将表9-3第(1)、(2)栏数据在半对数纸上作图,置y于对数轴,x置于真数轴,得观察点连线,见图9-5,其分布近于直线,说明直线化效果较好。故取y=lgy,见表9-3(3)栏。,拟合曲线的步骤(1),第9章直线相关与回归,第59页,(3)求直线方程:计算过程省略。,拟合曲线的步骤(2),第9章直线相关与回归,第60页,图9-4污染源距离与氰化物浓度指数曲线,图9-5曲线直线化,第9章直线相关与回归,第61页,当自变量x取常用对数,而因变量y取原测定值,则对数曲线方程为(9.19)下式。主要特点:自变量x取对数。,(二)对数曲线的拟合,第9章直线相关与回归,第62页,对数曲线(亦有书通称指数曲线)的形状亦可概括为四型见图9-6。注意:与指数曲线相区别。两者形状很相似。,图9-6四型对数曲线模型,第9章直线相关与回归,第63页,对数曲线四型的形状与相应的指数曲线形状类似,只是对数曲线方程是以x变量为对数,故渐近线与y轴平行。在选择曲线方程时应注意这一点。对数曲线的拟合与指数曲线的拟合方法与步骤基本一样,只是将x值置于对数轴上,y值置于真数轴上,进行直线化。如果x与y尚未达到直线化,可取xk作校正,k的数值需经尝试,以使观察点逐步逼近直线趋势。,两种曲线类型的特点,第9章直线相关与回归,第64页,【例9.7】某研究室以不同浓度的免疫球蛋白lga(g%)作火箭电泳,测得泳距的高度(mm)如表9-4。试拟合曲线。,实例分析,第9章直线相关与回归,第65页,(1)确定曲线类型将表9-4第(1)、(3)栏各(x,y)点绘于普通坐标纸上,得图9-7上的观察点。对照图9-6各型,接近型对数曲线,即y=a+blgx(2)直线化将表9-4第(1)(3)栏数据在半对数纸上作图,置x于对数轴,y于真数轴,得观察点见图9-8。其分布近于直线,说明直线化效果较好。故取x=lgx,见表9-4第(2)栏。,拟合曲线的步骤(1),第9章直线相关与回归,第66页,对数曲线拟合计算过程,第9章直线相关与回归,第67页,图9-7iga浓度与火箭高度的对数拟合曲线,图9-8对数曲线直线化,第9章直线相关与回归,第68页,则直线方程为,求对数曲线方程将xlgx代入直线方程得,第9章直线相关与回归,第69页,曲线方程的假设检验(1)拟合的曲线方程有无意义:需要作曲线回归方程的假设检验;(2)拟合的效果如何:可用相关系数的大小说明。,三、曲线方程的假设检验和拟合优度(1),第9章直线相关与回归,第70页,曲线回归方程是否有统计学意义,可以用方差分析来检验。其公式为:,三、曲线方程的假设检验和拟合优度(2),第9章直线相关与回归,第71页,计算出f值后,根据1回归,2剩余,查附表4,f界值表,得出p值,按所选择的检验水准作出结论。在曲线回归方程有统计学意义的前提下,曲线拟合得好坏可以看l剩余的大小。如果l剩余对l总的比例愈小,说明实际观察值与估计愈接近,曲线拟合得愈好;反之愈差。这种拟合度,可以用相关指数(r2)来表示。r2愈接近1,表示拟合得愈好。计算公式为:,第9章直线相关与回归,第72页,【例9.8】以例9.6已经拟合成指数曲线为例,对曲线方程进行假设检验并判断拟合的情况。已经拟合的曲线方程为,按指数曲线方程计算其估计值,见表9-5。,说明指数曲线拟合较好。,第9章直线相关与回归,第73页,课后作业及思考题(1),一、作业教材本上的例题:认真做2-3遍。或练习直到熟练为止。对概念及公式:数人一个小组进行讨论。查阅中华系列杂志:找到5-10个相关与回归分析的科研设计及数据处理方法,仔细分析及讨论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论