




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,线性回归与相关,第一节 线性回归,一、线性回归的概念 线性回归方程(linear regression equation ):,用于描述两个变量间依存变化的数量关系。也称简单回归(simple regression)。,Francis Galton,X-自变量(independent variable); Y-应变量(dependent variable); - 给定X 时Y 的估计值; a - 截距(intercept)或常数项(constant term); b - 回归系数(regression coefficient)。,simple regression,表示X与Y 的离均差积和;
2、 表示X的离均差平方和; 和 分别为两个变量的均值。,simple regression,例1 研究饮水氟含量与成人骨X线改变指数间的关系,得到了表11-1中所示的资料,试进行回归分析。,二、回归方程的估计,表1 饮水氟含量(mg/L)与骨X线改变指数,(1)绘制散点图: 由散点图可见,饮水氟含量与骨X线改变指数之间存在着直线趋势,可以考虑建立二者之间的线性回归方程。,simple regression,(2)计算回归系数与常数项,本例:,simple regression,代入公式得:,则回归方程为:,simple regression,按上述回归方程,在 X 实测值的范围内,任取两个相距较
3、远的点 和 ,连接A、B两点即得到回归直线。本例可取 ,计算出 ; 计算出 ;两点的连线即为所求的回归直线。,(3)作回归直线,simple regression,三、线性回归的假设检验 (一) 方差分析 回归方程检验的基本思想: 如果 X 与Y 之间无线性回归关系,则 与 都只包含随机因素对Y 的影响,因此其均方应近似相等,如果两者差别较大,并超出能够用随机波动解释的程度,则认为回归方程具有统计学意义。,Hypothesis test,对例11-1数据建立的回归方程进行假设检验: (1)建立假设检验,Hypothesis test,(2)计算统计量,Hypothesis test,(3)确定
4、P 值,得出统计结论 查 F 界值表 , ,拒绝 ,可以认为饮水氟含量与成人骨X线改变指数之间存在线性回归关系。,Hypothesis test,上面结果可以归纳成表2方差分析表的形式。,表2 方差分析表,Hypothesis test,(二) t 检验,为样本回归系数的标准误,反映样本回归系数的抽样误差; 为剩余标准差,表示应变量Y 值对于回归直线的离散程度。,Hypothesis test,例1数据建立回归方程后,进行t 检验,过程如下: (1)建立假设检验,(2)计算统计量,Hypothesis test,(3)确定P 值,作结论 查 t 界值表, , 拒绝 ,结论与方差分析相同。可以看
5、出,统计量 与 之间存在确定的数量关系,即有 ,本例 。,Hypothesis test,第二节 线性相关,一、线性相关的概念 两个变量之间存在的线性相关关系称为线性相关或简单相关。 用于分析双变量正态分布资料。,Karl Pearson,图11-2 11名男青年身高与前臂长散点图,linear correlation,图11-3 线性相关性质示意图,二、相关系数及其计算 相关系数(correlation coefficient):又称Pearson积差相关系数(coefficient of product moment correlation),是说明具有线性相关关系的两个数值变量间相关的密
6、切程度与相关方向的统计量。,相关系数r没有度量衡单位,其数值为 。 表示正相关; 表示负相关; 表示无相关,即无直线关系。当 时称为完全相关。 相关系数的绝对值愈接近1,表示相关愈密切;相关系数愈接近0,表示相关愈不密切。,linear correlation,相关系数的计算公式:,linear correlation,例2 从男青年总体中随机抽取11名男青年组成样本,分别测量每个男青年的身高和前臂长,测量结果如表11-3所示,试计算身高与前臂长之间的相关系数。,表3 11名男青年身高与前臂长的测量结果(cm),本例:,结论: 前臂长与身高呈正相关关系, 而且相关程度较高。,linear co
7、rrelation,三、相关系数的假设检验,1. t 检验法: 根据 r 作总体相关系数 是否为零的假设检验。,2. 根据计算出的 r 值,直接查 r 界值表得到P 值,若 ,则可以认为两变量之间存在线性相关关系。,对例2计算得到的 r 值进行假设检验: (1)建立检验假设 ,即身高与前臂长之间不存在线性相关系 ,即身高与前臂长之间存在线性相关关系 (2)计算统计量,linear correlation,(3)确定 P 值,作出结论,查 t 界值表,得 , ,拒绝 ,接受 ,可以认为男青年身高与前臂长之间存在正相关关系。或查 r 界值表 , , 结论相同。,linear correlation
8、,一、线性回归分析的应用,1. 线性回归方程可应用于以下三个方面:, 分析两个变量之间是否存在线性依存关系; 利用回归方程由自变量 X 对应变量Y 进行估计,必要时可以作区间估计;,第三节 线性回归与相关应用的注意事项, 利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制自变量 X 取值来限定应变量Y在一定范围内波动。 2. 作回归分析时,如果两个有内在联系的变量之间存在因果关系,那么应该以原因变量为X ,以结果变量为Y ;如果变量之间因果关系难以确定,则应以易于测定或变异较小者为X 。,3. 在回归分析中,自变量X 既可以是随机变量(称为型回归模型,两个变量都服从正态分布),也可以
9、是给定的量(称为 I 型回归模型,在 X 取值固定时Y 服从正态分布)。如果Y不服从正态分布,在进行回归分析前,应先进行变量的变换以使应变量符合回归分析的要求。,4. 使用回归方程估计Y 值时,尽量不要把估计的范围扩大到建立方程时的自变量的取值范围之外,由于超出样本取值范围,其线性关系是否成立难以判断,外推要慎重。如例1中,X 的取值范围为0.2410.81,计算估计值时X 的取值最好在0.2410.81之间。,二、线性相关分析的应用,1. 相关分析理论上适用于两个变量都服从正态分布的情形,如果资料不服从正态分布,应先通过变量变换,使之近似正态化后计算相关系数。如果不能正态化,或针对有序数据则
10、可以计算Spearman或Kendall相关系数进行分析(参考SPSS软件说明)。,2. 相关系数 r 值究竟多大有实际意义,需 要根据具体问题而定。实际经验而言, 时,表示相关性较差; 时,表示中度相关; 时,表示有较高度的相关性; 时,表示有很高的相关性。,3. 相关系数可以描述两个变量间相互关系的密切程度和方向。然而,不能因为两变量间的相关系数有统计学意义,就认为两者之间存在着因果关系,要证明两事物间确实存在因果关系,必须凭借专业知识加以阐明。医学中很多变量的数量变化可能由于相同的因子调控引起。,三、线性回归与相关的区别,1. 相关系数的计算只适用于两个数值变量都服从正态分布的情形,而在
11、回归分析中,应变量是随机变量,自变量既可以是随机变量(型回归模型),也可以是给定的量(I 型回归模型)。 2. 线性相关表示两个变量之间的相互关系是双向的,线性回归则反映两个变量之间单向的依存关系,更适合分析因果关系的数量变化。,四、线性回归与相关的联系,1. 相关系数 r 与回归方程中的 b 正负号相同,r 和 b 为正,说明 X 与 Y 的数量变化的方向是一致的,X 增大,Y 也增大;符号为负,变化方向相反。 2. 对同一样本可以得出 r 与 b 互相转化的公式,两种假设检验完全等价。,3. 相关与回归可以互相解释。r 的平方称为决定系数 (coefficient of determination),可表示为:,表示回归平方和在总平方和中所占的比重, 即 其值越接近1, 回归效果越好。决定系数和相关系数有确定的关系, 例如 r = 0.5, 有 =0.25, 说明一个变量的变异有25%可以由另一变量所解释。,1.线性回归方程常用于分析两个变量之间是否存在线性依存关系。 2.相关系数可以描述两个变量间相互关系的密切程度和方向。 3.相关系数的计算适用于两个数值变量都服从正态分布的情形,在回归分析中,应变量是随机变量,自
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新闻媒体传染病及突发公共卫生事件报告和处理工作计划
- 六年级下册语文冲刺复习计划
- 部编语文一年级下学期作文教学计划
- 房地产行业违纪违法案例心得体会
- 自动化生产线设计-第1篇-洞察及研究
- 酒店服务行业劳务派遣流程规范与工作流程
- 牛津英语八年级下册课题研究教学计划
- 小学一年级下册语文教学计划
- 2025届山东省青州市物理高二下期末联考模拟试题含解析
- 幼儿园营养配餐工作计划
- 2025年城建技师考试题库及答案
- 2025年中国LTCC技术行业市场现状、前景分析研究报告(智研咨询发布)
- 租赁住房培训课件下载
- 房管员试题资料
- 2025至2030中国扭蛋机行业市场发展现状及商业模式与投融资战略报告
- 2024年苏州昆山国创投资集团有限公司招聘笔试真题
- 商场吸烟区管理制度
- DL∕T 5161.5-2018 电气装置安装工程质量检验及评定规程 第5部分:电缆线路施工质量检验
- 湖北武汉洪山区招考聘用社区干事235人模拟检测试卷【共1000题含答案解析】
- 常用乐高零件清单
- 蛋糕制作工艺课件(PPT81张)
评论
0/150
提交评论