版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学第五章线性回归例测某地10名三岁儿童的体重X(kg)与体表面积Y(10-1m2),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411判断X和Y是否是线性相关的。2021/4/2725.1相关分析原理1.直线相关:(1)两个变量均服从正态分布
总体相关系数:样本相关系数:r绝对值愈接近1,两个变量间的线性相关越密切r绝对值越接近0,两个变量间的线性相关越不密切性质:Pearson简单相关分析2021/4/273相关系数的检验原假设则:()×(2)如果不服从正态分布,则应考虑变量变换,或采用等级相关来分析。
Spearman等级相关
Kendall等级相关注:列联表可用“Crosstabs过程”中的“ContingencyCoefficient”计算Pearson列联相关系数2021/4/2742.曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的曲线趋势。一般都先将变量变换,再将趋势变换为直线来分析,或者采用曲线回归方法来分析。5.2Bivariate过程例某医生在不同保存时间(天)的条件下,测得白蛋白与白球蛋白的比值,判断保存时间与白球蛋白比值是否相关?目的:检验问题:两变量数据是否服从正态分布?(需提前进行)是Pearson相关分析否数据转换或进行等级相关分析2021/4/275实现步骤:1.将数据录入SPSS并整理加工定义变量输入数据保存保存为:“时间与比值.sav”2021/4/2762.正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)可以认为保存时间、白球蛋白比值服从正态分布。2021/4/277【Variables框】用于选入需要进行相关分析的变量,至少需要选入两个。将“保存时间”、“白球蛋白比值”点入“Variables”框。【CorrelationCoefficients复选框组】用于选择需要计算的相关分析指标。【Flagsignificantcorrelations】用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P<0.05的系数值旁会标记一个星号,P<0.01的则标记两个星号。点击“Options”按钮。
3.相关分析过程菜单“Analyze”|“Correlate
”|“Bivariate”命令2021/4/278【Options钮】弹出Options对话框,选择需要计算的描述统计量和统计分析选择“Meansandstandarddeviations”,点击“Continue”返回上一层对话框。点击“OK”按钮2021/4/279结果输出和讨论:分析:左图给出了均值、标准差和样本数目。分析:Pearson相关系数r为0.995,P=0.000<0.001,所以保存时间与白球蛋白比值存在密切的直线相关关系。2021/4/2710
英国遗传学家F·Galton和他的学生K·Pearson测量了1078个父亲及其成年儿子的身高.x表示父亲的身高,y表示儿子的身高(单位为英寸).孩子的遗传一部分来自父母,一部分来自祖先。无论好的方面还是坏的方面的遗传都会打相同的折扣。回归效应2021/4/27112021/4/2712(反映了观测值总的分散程度)(回归平方和)反映了回归值的分散程度(由于线性影响引起的离散性)(剩余平方和)反映了观测值偏离回归直线的程度(由于随机误差引起的离散性)5.3回归分析原理2021/4/2713F检验:
H0:β=0()当时:或2021/4/2714决定系数R2=SS回/SS总=1-SS剩/SS总
0≤R2≤1,越接近于1,回归效果越好。临床:R2≥0.7就认为回归效果不错高精度医药实验研究:R2>0.9R2=r2一元线性回归方程中:越接近于1,回归效果越好。校正决定系数1-MS剩/MS总2021/4/2715例测某地10名三岁儿童的体重X(kg)与体表面积Y(10-1m2),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411做体表关于体重的回归方程。做散点图建立回归方程并检验实现步骤:保存为:“体重与体表.sav”体重;体表;1.将数据录入SPSS并整理加工定义变量输入数据保存2021/4/27162021/4/27172.利用Scatter/Dot命令做散点图菜单“Graphs”|“LegacyDialogs”|“Scatter/Dot”点击“simple
scatter”命令,点击“Define”按钮。2021/4/2718将“体重”变量选入“XAxis”框,将“体表”选入“YAxis”框中,点击“OK”按钮输出结果。2021/4/27192021/4/2720(2)正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)2021/4/27213.Regression过程菜单“Analyze”|“Regression
”|“linear”命令将“体表[y]”选入【Dependent框】;将“体重[x]”选入【Independent(s)框】中,点击“Statistics”按钮2021/4/2722【Modelfit】输出复相关系数R,其平方,校正决定系数和标准差,以及方差分析表。选择“Estimates”、“Modelfit”、“Descriptives”,点击“continue”返回。点击“OK”按钮输出结果。【Estimates】输出有关回归系数和相关测量【Confidenceinterval】输出回归系数95%的置信区间【Descriptives】描述性统计量2021/4/2723分析:给出了体表和体重的均数和标准差情况。分析:此表给出了体重和体表的相关系数阵和P值。结果输出和讨论:2021/4/2724分析:R=0.918(即相关系数r),决定系数校正的决定系数为0.823,估计值的标准误差为0.174342021/4/2725分析:可见回归平方和为1.301,剩余平方和为0.243,F=42.798,P=0.000<0.001,拒绝原假设,认为回归方程有统计学意义。2021/4/2726分析:非标准化系数,t统计量分别为5.616和6.542,其P值分别为0.001和0.000,均小于0.05,有显著性意义。其回归方程为2021/4/2727
多元线性回归分析
研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,在计算上更为复杂,一般需借助计算机来完成。是偏回归系数2021/4/2728编号载脂蛋白AI(mg/dl)载脂蛋白B(mg/dl)载脂蛋白E(mg/dl)载脂蛋白C(mg/dl)胆固醇含量(mg/dl)11731067.014.76221391326.417.84331981126.916.78141181387.115.7395139948.613.651617516012.120.365713115411.221.54081581419.729.642有研究认为血清中高密度脂蛋白降低是引起动脉硬化的一个重要原因,现测量了30名被怀疑患有动脉硬化的就诊患者的载脂蛋白AⅠ、载脂蛋白B、载脂蛋白E、载脂蛋白C和高密度脂蛋白中的胆固醇含量,资料见表,分析四种载脂蛋白对高密度脂蛋白中胆固醇含量的影响。2021/4/272991581377.418.256101321517.517.237111621106.015.9701214411310.142.841131621377.220.756141691298.516.758151291386.310.1471616614811.533.449171851186.017.569181551216.120.457191751114.127.274201361109.426.039211531338.516.965221101499.524.74023160865.310.857241121238.016.6342021/4/2730251471108.518.454262041226.121.072271311026.613.451281701278.424.762291731238.719.0853013213113.829.238实现步骤:x1:载脂蛋白AI;X2:载脂蛋白B;X3:载脂蛋白EX4:载脂蛋白C;y:胆固醇含量。1.将数据录入SPSS并整理加工定义变量输入数据保存2021/4/27312021/4/27322.正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)2021/4/27332021/4/27343.Regression过程菜单“Analyze”|“Regression
”|“linear”命令将“y”选入【Dependent框】;将“x1、x2、x3、x4选入【Independent(s)框】中在methods中选择“stepwise”。点击“Statistics”按钮Enter强迫进入Stepwise逐步回归Remove只出不进Backward向后剔除,只出不进Forward向前选择,只进不出2021/4/2735选择“Estimates”、“Modelfit”、“Descriptives”,点击“continue”返回。2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省富顺县2026届初三下学期第一次统考语文试题含解析
- 农地流转联合责任书(8篇)
- 扬州树人学校2025-2026学年初三第三次适英语试题含解析
- 营销策略制定与执行效率分析工具
- 家庭医疗紧急支援承诺书(8篇)
- 健身教练私教课会员管理标准化流程指导书
- 会议策划执行方案与效果评估模板
- 跨境电商平台订单处理标准流程指南
- 企业员工沟通反馈平台搭建
- 互联网产业稳定增长承诺书(3篇)
- 设计成果管理办法
- 血液净化护理教学查房
- 中山网约车考试题目含答案
- 盾构施工安全培训课件
- 公共符号设计过程
- 旅行社线路产品设计
- 车间级油脂管理制度
- 2025年高考数学全国二卷试题真题及答案详解(精校打印)
- JG/T 5072.2-1996电梯T型导轨检验规则
- 2025至2030年中国护眼眼罩行业发展研究报告
- 2025浙江旅游职业学院辅导员考试试题及答案
评论
0/150
提交评论