chap两变量相关与回归PPT课件_第1页
chap两变量相关与回归PPT课件_第2页
chap两变量相关与回归PPT课件_第3页
chap两变量相关与回归PPT课件_第4页
chap两变量相关与回归PPT课件_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021-12-81Chap6 correlation & regression of Bivariate P88105目的与要求 :6学时. 15 , 69 .掌握:相关与回归、协方差分析的意义、联合用药效应判断、SPSS17.0操作。熟悉:回归的应用、LD50的意义和计算。了解:协变量的条件。 教学内容提要 :重点讲解:相关与回归、协方差分析的思想和意义、SPSS17.0操作。讲解:回归的应用、LD50的意义和计算。介绍:协方差分析与一般方差分析的区别。 重点:相关与回归的意义、协方差分析思想。 难点:协方差分析与一般方差分析的区别。 第1页/共81页2021-12-82第2页/共

2、81页2021-12-83变量间的关系变量间的关系 确定性(函数)关系确定性(函数)关系:xy 对应。对应。随机性关系随机性关系: xy不确定性。不确定性。相关分析的统计指标:相关分析的统计指标:(1)正态分布的双变量计量)正态分布的双变量计量:散点图:散点图直线趋势直线趋势 Pearson相关系数相关系数。皮尔逊。皮尔逊(2)不服从正态分布的双变量计量资料,或等级或相)不服从正态分布的双变量计量资料,或等级或相对数,或总体分布类型不知的资料对数,或总体分布类型不知的资料:散点图:散点图直线趋势直线趋势等级相关系数等级相关系数。(3)两个有关的分类变量)两个有关的分类变量:交叉分类的:交叉分类

3、的RC表表独立独立性性2检验检验和和列联系数列联系数描述其相关性。描述其相关性。 第3页/共81页2021-12-84直线相关直线相关 (linear correlation) P85直线相关or 简单相关(simple correlation):两变量相互呈直线变化趋势的随机性关系。一、散点图、积差相关系数一、散点图、积差相关系数 1.散点图散点图第4页/共81页2021-12-852. 相关系数相关系数 (correlation coefficient):定量描述两变量间直线相关方向和密切程度的统计指标。(1)积差相关系数积差相关系数(Product-moment correlation

4、coefficient)Pearson相关系数,相关系数:参数统计,双变量正态分布。-1r1,符号相关方向,绝对值密切程度。r0 :正相关。r0表示自变量表示自变量应变量应变量 ,直线上升。,直线上升。b越陡越陡 y随随x变化率大。变化率大。y y 第21页/共81页2021-12-822二、直线回归方程的建立与检验二、直线回归方程的建立与检验 建立建立:最小二乘法原则。:最小二乘法原则。 检验:检验:能否使用。能否使用。 使用:使用:在样本数据范围内。在样本数据范围内。 预测:预测: x估估y。 控制控制: y估估x 。 第22页/共81页2021-12-8231建立建立 回归直线回归直线a

5、+bx。剩余误差剩余误差( y-),残差残差:各实测值:各实测值y至回归直线纵向距离。至回归直线纵向距离。剩余平方和(剩余平方和(residual sum of square)或残差平方和)或残差平方和 SS剩余剩余( y-)2 y-(a+bx)2 (6-9)最小二乘法最小二乘法(method of least squares):): SS剩余剩余最小。最小。y y y 第23页/共81页2021-12-8242检验检验 n100,r 假设检验假设检验有统计学意义时有统计学意义时: r0.7,两个变量高度相关;,两个变量高度相关; 0.4r 0.7,中度相关;,中度相关; 0.2r 0.4,

6、低度相关。低度相关。第24页/共81页2021-12-8253. 决定系数决定系数(determining coefficient,相关指数correlation index,R2) R2 = SS回 /SS总 = (SS总SS剩 )/SS总 =1SS剩 / SS总 R2表示y的总变异中被x所决定的占多少。0R2 1, 1,回归效果越好,强度。R2 密切程度(相关强度)。回归强度R2 = SS回 / lyy = (n1)sy2 r2/ lyy = r2 第25页/共81页2021-12-826例:两变量,df=100,r 时,查附表11,P,可认为两变量间存在直线相关。R2 2 ,y的变异只有

7、4%与回归有关,两个变量直线相关的实际意义不大,除 x 外,还有其它因素等待我们去认识。由这样的资料求出的回归方程是无任何预测价值的。区别相关显著(r有统计学意义)与相关强度第26页/共81页2021-12-8274回归系数回归系数的的CI bt/2(n2) sbbt/2 (n2) (s y / sx) 两回归系数比较时可用两回归系数比较时可用CI作假设检验:作假设检验: 无重叠无重叠不同不同 重叠重叠同。同。 ) 2/()1 (2nr第27页/共81页2021-12-828【例例6-3】 例6-1资料3岁儿童体重与体表面积资料,建立直线回归方程并进行检验。 【SPSS】L6-1.sav An

8、alyze Regression Linear Regression,体重为Independent、体表面积为dependentStatistic,选Confidence intervals Continue OK。 第28页/共81页2021-12-829A AN NO OV VA Ab b1.30111.30142.798.000a.2438.0301.5449RegressionResidualTotalModel1Sum of SquaresdfMean SquareFSig.Predictors: (Constant), 体重a. C Co oe ef ff fi ic ci ie

9、en nt ts sa aModel: 12.655.4735.616.0011.5653.745.229.035.9186.542.000.148.309(Constant)体重BStd. ErrorUnstandardized CoefficientsBetaStandardized CoefficientstSig.Lower BoundUpper Bound95% Confidence Interval for BDependent Variable: 体表面积a. M Mo od de el l S Su um mm ma ar ry y.918a.843.823.174336Mod

10、el1RR Square Adjusted R SquareStd. Error of the EstimatePredictors: (Constant), 体重a. 第29页/共81页2021-12-830C Co oe ef ff fi ic ci ie en nt ts sa aModel: 12.655.4735.616 .0011.5653.745.229.035.9186.542 .000.148.309(Constant)体重BStd. ErrorUnstandardized CoefficientsBetaStandardized CoefficientstSig. Lowe

11、r BoundUpper Bound95% Confidence Interval for BDependent Variable: 体表面积a. 第30页/共81页2021-12-831简单回归与相关的区别和联系简单回归与相关的区别和联系 P95一、区别一、区别1.资料要求:资料要求:(1)相关:)相关: X、Y 正态正态(2)回归:)回归: X、Y 正态正态 X 选定,选定, Y 随机随机2. 应用应用 :(1)相关:)相关: X、Y相互关系相互关系 (2)回归)回归 : X推推Y3.计量单位:计量单位:相关系数相关系数r无,回归系数无,回归系数b有单位有单位第31页/共81页2021-1

12、2-832二、联系二、联系(1)方向一致:)方向一致:r与与b的正负号一致。的正负号一致。(2)同一资料假设检验等价:)同一资料假设检验等价:tr=tb(3)r与与b可相互推导获得。可相互推导获得。 (4)用回归解释相关:)用回归解释相关:R2 = r2第32页/共81页2021-12-833回归分析的应用回归分析的应用 P95一、应用一、应用1.描述变量间数量变化关系描述变量间数量变化关系 :量:量-效关系、配伍规律。效关系、配伍规律。 【例例6-4】医宗金鉴医宗金鉴治积聚处方,治积聚处方,x,有统计学意义,有统计学意义,R 2 = 0.9996,拟合度达拟合度达99.96%,用回归方程描述

13、名医治病,用回归方程描述名医治病用药的配伍规律准确有效。用药的配伍规律准确有效。 表6-2 6个治积聚方的川乌与茯苓用量处 方川乌x茯苓y新制阴阳攻积丸3024肥 气 丸3.64.5息 贲 丸3.04.5伏 梁 丸1.53.0痞 气 丸1.53.0奔 豚 丸1.53.0第33页/共81页2021-12-8342. 预测y值容许区间即预测区间(prediction interval PI) x=x0时,y0值的(1)预测区间计算公式为:第34页/共81页2021-12-835第35页/共81页2021-12-8363. 估计的CI:自变量x0,应变量估计值的总体均数 的(1)CI为:0 y第36

14、页/共81页2021-12-837注意事项注意事项1.专业上要有意义:专业上要有意义:专业专业相关相关回归分析。回归分析。2.选择合适的回归模型选择合适的回归模型: 散点图。散点图。 直线趋势直线趋势直线回归分析直线回归分析 曲线趋势曲线趋势曲线方程。曲线方程。3. 不随意外延不随意外延:以自变量的观测范围为限。:以自变量的观测范围为限。第37页/共81页2021-12-838曲线回归曲线回归 (curve linear regression)P97曲线拟合(curve fitting):根据样本资料找出能反映变量间关系的曲线回归方程的过程。散点图曲线类型:对数、指数、幂函数、Logistic

15、等。曲线关系最小二乘法曲线直线化直线回归还原得到曲线方程。统计软件对一组资料常可同时拟合多种模型: R 2接近1、标准估计误差SY较小、变量数最少,结构最简单的模型为首选。 第38页/共81页2021-12-839【例例6-7】 研究板蓝根注射液含量的稳定性,在,温度为78下,测得保温时间与含量破坏百分比的结果如下,作保温时间t与含量破坏百分比p间的曲线拟合。散点图线形模型或对数模型。线形模型:p = t,R2,P。对数模型:T=lnt,p =T,还原t得到p =t,R2,P。两者都有统计学意义,取决定系数大者。第39页/共81页2021-12-840【SPSS操作】以t、P为变量名,建立。A

16、nalyze RegressionCurve Estimation,p入Dependents ,t入Variable,在Modeles框将11个复选项全选OK。第40页/共81页2021-12-841Model Summary and Parameter estimates(模型概述和参数估计),都有意义。S形模型决定系数和F最大, p =exp(b0+b1 / tt)= e t)第41页/共81页2021-12-842第42页/共81页2021-12-843概率单位回归法计算半数致死量概率单位回归法计算半数致死量LD50 P97一、一、 LD50的意义的意义 1.基本概念基本概念(1)质反应

17、:质反应:在群体所引起的(在群体所引起的(+)率表示的效应。)率表示的效应。(2)效量效量(effective dose,E):能引起某种质反应的剂):能引起某种质反应的剂量,说明质反应的大小,如致死量量,说明质反应的大小,如致死量 、致死时间等。、致死时间等。(3)半数致死量半数致死量(50% lethal dose,LD50):使半数试验):使半数试验动物死亡的剂量。动物死亡的剂量。(4)剂量剂量-死亡率曲线死亡率曲线:以剂量为横轴,死亡率为纵轴作:以剂量为横轴,死亡率为纵轴作图。图。不对称的不对称的“S”型曲线型曲线。第43页/共81页2021-12-844剂量D -死亡曲线(非对称的S

18、 S型曲线) 第44页/共81页2021-12-845二二. 概率单位法计算概率单位法计算LD50 【例例6-8】 注射不同剂量厚朴注射液的小白鼠死亡情况如表6-3。求LD50及其95%置信区间。【SPSS】以剂量、鼠数、死亡数建以剂量、鼠数、死亡数建L6-8. savAnalyzeRegressionProbit(概率单位回归),死数入(概率单位回归),死数入Response Frequency,鼠数入,鼠数入Total Observed,剂量入,剂量入Covariates(协变量(协变量)OK 第45页/共81页2021-12-846P Pa ar ra am me et te er r

19、E Es st ti im ma at te es s.480.1353.555.000.215.745-2.772.773 -3.587.000-3.545-1.999Parameter剂量InterceptPROBITaEstimate Std. ErrorZSig. Lower Bound Upper Bound95% Confidence IntervalPROBIT model: PROBIT(p) = Intercept + BXa. 剂量的回归系数剂量的回归系数,z,P,截距截距,P,都有统计学意义;,都有统计学意义;PROBIT(p) = Intercept + BX=2.77

20、2+0.480剂量剂量 第46页/共81页2021-12-8472.意义:意义:剂量DlgD,则(lgD,P)散点图呈现为对称的S形,对称中心在死亡率=50%处。对数剂量-死亡率曲线为一条对称的“S”型曲线,在死亡率50%处斜率最大,药物剂量稍有变动,死亡率有明显差别。LD50衡量毒力大小,稳定,误差较小。第47页/共81页2021-12-848C Ch hi i- -S Sq qu ua ar re e T Te es st ts s.2382.888bPearsonGoodness-of-Fit TestPROBITChi-SquaredfaSig.Statistics based on

21、individual cases differ from statistics based onaggregated cases.a. Since the significance level is greater than .150, no heterogeneityfactor is used in the calculation of confidence limits.b. Pearson拟合优度(Pearson Goodness-of-fit Test):2,P,P 0.15(预设),CI不异质性校正。第48页/共81页2021-12-849Prob = .50对应LD50 点估计g

22、。 第49页/共81页2021-12-850联合用药效应判断联合用药效应判断 P1011协同、叠加与拮抗关系协同、叠加与拮抗关系:剂量剂量-效应效应:曲线关系曲线关系, Dl倍,倍,E不一定不一定1倍。倍。 协同协同: (1+1)2 叠加叠加(独立):独立):1(1+1) 2 拮抗:拮抗:(1+1)1用用等效等效概念表达两药联合应用效应:概念表达两药联合应用效应:第50页/共81页2021-12-851第51页/共81页2021-12-852 2联合用药计量效应的判断联合用药计量效应的判断第52页/共81页2021-12-853【例例6-9】已知已知A与与B对抗体指数均有抑制作用,研究二对抗体

23、指数均有抑制作用,研究二者联合用药的效应。者联合用药的效应。(1)A、B两药各按近似等比级数取两药各按近似等比级数取3个剂量,另加个剂量,另加1空空白,白,试验结果如表试验结果如表6-4。 第53页/共81页2021-12-854第54页/共81页2021-12-855【SPSS操作操作】以以A药、效应药、效应为变量名建立为变量名建立A药剂量药剂量对数变换对数变换 Analyze Regression Linear Regression,ln为为Independent、效应效应为为dependent Statistic,Confidence intervals Continue OK。 同样操

24、作,以同样操作,以B药、效应药、效应为变量名建立数据为变量名建立数据。第55页/共81页2021-12-856第56页/共81页2021-12-857第57页/共81页2021-12-858A药单用药单用时对数剂量时对数剂量-效应回归无统计学意义,不建方程。效应回归无统计学意义,不建方程。为说明操作,为说明操作,求出求出A药单用时药单用时EA=1.18-0.51 logDA第58页/共81页2021-12-859B药单用药单用时对数剂量时对数剂量-效应回归有统计学意义。效应回归有统计学意义。 EB=1.12-0.51 logDB第59页/共81页2021-12-860第60页/共81页2021

25、-12-861第61页/共81页2021-12-862协方差分析协方差分析 (analysis of covariance) P102一一. 基本思想和应用条件基本思想和应用条件 1.概念概念:利用直线回归法消除:利用直线回归法消除混杂因素混杂因素影响后影响后进行的方差分析。进行的方差分析。常用于难以完全控制混杂因素的观察研究。常用于难以完全控制混杂因素的观察研究。2.基本思想基本思想:扣除混杂因素(:扣除混杂因素( covariable协变协变量量)x对对y的影响的影响评价各种处理的效应。评价各种处理的效应。第62页/共81页2021-12-8633.应用条件应用条件:独立独立,正态正态,方

26、差齐性方差齐性;回归系数回归系数b有统计学意义有统计学意义;各组各组b之间差别无统计意义之间差别无统计意义。协变量是协变量是连续变量或等级变量连续变量或等级变量,不能是影响,不能是影响处理的变量。处理的变量。比较的是修正均数,比较的是修正均数,H0为修正后的均数相等。为修正后的均数相等。协变量有多个时,可用多元协方差分析。协变量有多个时,可用多元协方差分析。第63页/共81页2021-12-864二二. 完全随机设计资料的协方差分析完全随机设计资料的协方差分析【例例6-10】 降压宁的临床实验的资料如表降压宁的临床实验的资料如表6-5,比较两组疗效是否相同。比较两组疗效是否相同。 第64页/共

27、81页2021-12-865【SPSS】以以组别、用药前、组别、用药前、用药后为变量用药后为变量名,建立名,建立3列列28行的数据文件行的数据文件。分分3步步来进行来进行协方差分析。协方差分析。第65页/共81页2021-12-866第一步:第一步:散点图散点图直线趋势。(无直线趋势则不直线趋势。(无直线趋势则不宜作协方差分析)。宜作协方差分析)。Graphslegacy dialogs Scatter Define ,Simple Scatterplot,用药后用药后入Y Axis框,用药前用药前入X AxisOK。两组均有直线趋势两组均有直线趋势协方差分析。协方差分析。第66页/共81页2

28、021-12-867第67页/共81页2021-12-868第二步:第二步:交互项交互项两总体两总体是否相等:是否相等:AnalyzeGeneral Linear ModelsUnivariate 用药后入用药后入Dependent variable,组别入,组别入Fixed Factors,用药前入,用药前入CovariateModel, Custom,先先组别组别、再、再用药前用药前入入Model,又将,又将组别、用药前组别、用药前同时送入同时送入Model,选,选Type(型方差分析模型)型方差分析模型)Continue OK。第68页/共81页2021-12-869交互作用F ,P,两

29、组的斜率相同,故进一步分析。若交互作用有统计学意义,则不宜作协方差分析。 第69页/共81页2021-12-870第三步:第三步:比较修正均数,操作同第二步。比较修正均数,操作同第二步。不分析交互,把不分析交互,把组别组别*用药前用药前从从Model移除;移除;对两组进行比较,采用对两组进行比较,采用LSD法。法。AnalyzeGeneral Linear ModelsUnivariate Model, Custom,将组别,将组别*用药前送出用药前送出Model,Type III(III型方差分析模型)型方差分析模型)Continue Options,将组别入,将组别入Display Mea

30、ns for,Compare main effects Continue OK。第70页/共81页2021-12-871第71页/共81页2021-12-872第72页/共81页2021-12-873第73页/共81页2021-12-874三三.配伍组(随机区组)设计资料协方差分析配伍组(随机区组)设计资料协方差分析 【例例6-11】将每窝将每窝3只出生只出生3周体重周体重3438g的的12窝大鼠,窝大鼠,随机分到随机分到3组:组:A组喂缺乏核黄素饲料,组喂缺乏核黄素饲料,B组喂核黄素饲组喂核黄素饲料、限制食量与料、限制食量与A组相近,组相近,C组喂核黄素饲料、不限食量。组喂核黄素饲料、不限食量。1周后,体重增加量周后,体重增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论