




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章简单相关与回归,卫生统计学教研室,2019/11/19,2019/11/19,直线相关:又称简单相关(simplecorrelation),用于描述两个变量之间的线性相关程度。经典相关分析要求X与Y都是随机变量,而且服从双变量正态分布。相关关系的统计量使人们对变量间的相关关系是否成立、相关的性质和强弱等有了量化依据。,一、线性相关(linearcorrelation),相关系数(correlationcoefficient),又称积差相关系数或Pearson相关系数(软件中常用此名称)以及spearman相关系数;定量描述线性相关程度的一个常用指标,说明相关的密切程度和方向。,2019/11/19,线性相关(linearcorrelation),计算公式,相关系数的特点:相关系数r是表示两个随机变量之间直线相关强度和方向的统计量,是一个无量纲的数值,取值范围-1r1;r的正负值表示两变量之间直线相关的方向,即r0为正相关,r0为负相关,r=0为零相关;r与回归系数b的符号相同;r的绝对值大小表示两变量之间直线相关的密切程度,r越接近于1,说明密切程度越高,r越接近于0,说明密切程度越低。,2019/11/19,线性相关(linearcorrelation),相关系数的假设检验:,r0原因:由于抽样误差引起,=0存在相关关系,0检验方法:直接查表法(r界值表),t检验;,2019/11/19,公式,Sr-相关系数的标准误,线性相关(linearcorrelation),二、线性回归(linearregression),定义用直线方程表达X(自变量,independentvariable)和Y(应变量,dependentvariables)之间的数量关系。是Y(实测值)的预测值(predictivevalue),b是直线的斜率,即X每变化一单位,Y相应的变化b个单位。a为截距,即X为0时Y值的大小。,2019/11/19,二、线性回归(linearregression),直线回归的前提假设(LINE)线性Linearity反应变量均数与X间呈线性关系:Y|X=+X独立Independence每一观察值之间彼此独立正态Normality对于任何给定的X:Y均服从正态分布等方差Equalvariance对于任何X值,随机变量Y的标准差Y|X相等,2019/11/19,线性回归(linearregression),回归直线的建立主要是基于最小二乘法(least-squares,LS),即各实测点与拟合直线之间纵向距离的平方和最小。线性回归的主要运用:统计预测与统计控制统计预测:给定X值,估计Y;统计控制(逆估计):要求Y在一定范围内波动,可通过X的取值来实现。,2019/11/19,二、线性回归(linearregression),注意:做直线回归之前,先做散点图,是确定两变量之间是否有关系的最简单的好方法。回归系数(b)的假设检验判断直线回归方程是否成立,需要检验总体回归系数是否为0。方法一:t检验两种方法等价,方法二:F检验只有当0,才能认为直线回归方程成立(具有统计学意义)。,2019/11/19,2019/11/19,1.资料:,相关X、Y均为随机变量,且服从双变量正态分布,回归Y为正态随机变量,X为固定的非随机变量,2.意义与应用:,回归反映两变量间的依存关系,相关反映两变量间的相互关系,3.回归系数与原度量单位有关,而相关系数无关,区别,三、相关与回归的区别和联系,2019/11/19,联系,相关与回归的区别和联系,1.根据分析目的选择变量及统计方法,2019/11/19,直线相关用于说明两变量之间直线关系的方向和密切程度,X与Y没有主次之分直线回归则进一步用于定量刻画应变量Y对自变量X在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y例如用身高估计体表面积两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归或相关分析,四、相关与回归应用的注意事项,2.进行相关、回归分析前应绘制散点图第一步,2019/11/19,散点图可考察两变量是否有直线趋势可发现异常点(outlier),散点图对异常点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据并检查其产生过程认定是过失误差,或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。,相关与回归应用的注意事项,3.资料的要求,2019/11/19,直线相关分析要求X与Y服从双变量正态分布直线回归要求至少对于每个X相应的Y要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量对于双变量正态分布资料,根据研究目的可选择由X估计Y或者由Y估计X,一般情况下两个回归方程不相同,相关与回归应用的注意事项,4.结果解释及正确应用,2019/11/19,反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数或相关系数的绝对值,而不是假设检验的P值P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”不能任意“外延”;直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围,相关与回归应用的注意事项,例题(相关与回归),例题7.1在某克山病区测量12名健康儿童头发中的硒含量与血液中的硒含量,其结果如表1所示。问儿童头发中的硒含量与血液中的硒含量是否相关,是否能求出以血液中的硒含量为因变量的回归方程。,2019/11/19,相关SPSS操作步骤,2019/11/19,一、绘制散点图,二、对X/Y变量做正态性检验,三、相关spss步骤,有线性趋势,X/Y变量均成正态分布,1.相关SPSS操作步骤,散点图结果有线性趋势,2019/11/19,正态性检验结果发硒值(X)、血硒值(Y)的P0.05,均成正态分布。,1.相关SPSS操作步骤,相关过程步AnalyzeCorrelateBivariateCorrelations,2019/11/19,等级相关系数非参数方法,积矩相关系数参数方法,Kendalls相关系数:用于反映分类变量一致性的指标,只能在两个变量均为有序分类时使用。,1.相关SPSS结果,2019/11/19,结果解释:相关系数r=0.880,双侧Pearson检验p0.001,有统计学意义,可认为血硒值与发硒值呈正相关关系。,问题:是否能求出以血液中的硒含量为因变量的回归方程?,2019/11/19,2、回归SPSS操作,回归过程步正态性、散点图AnalyzeRegressionLinear,2019/11/19,2、回归SPSS操作,2019/11/19,检验残差序列是否存在相关关系,2、回归SPSS结果,结果解释相关系数R=0.880,R2=0.774,表示血硒值(因变量)的变异中77.4%可由发硒值(自变量)来解释,说明血硒值的变化能较好的运用发硒值的变化来解释。,2019/11/19,2、回归SPSS结果,结果解释经F检验,F=34.156,P0.001,差异有统计学意义
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年山东省淄博第十中学物理高三第一学期期末学业水平测试试题
- 防爆枪枪支管理办法
- 鹿邑静态化管理办法
- 《缉毒特情管理办法》
- 新质生产力发展突破路径
- 出血性中风课件
- 农业保险监管政策-洞察及研究
- 出口口罩的税务要点
- 2025四川省旅游标准合同
- 企业安全培训简报模板课件
- GRE强化填空36套精练与精析
- 物流管理就业能力展示
- 宿管老师培训课件
- 四年级英语 4AM3U2 Around my home同课异构
- 超限货物运输安全
- 2024年江苏省对口单招英语试卷及答案
- 循环经济的环保意义
- 国家临床版3.0手术操作编码(ICD-9-CM3)
- 小学一年级上册体育全册教案
- 2024年高考法语核心词汇全突破
- 病原生物与免疫学知识点
评论
0/150
提交评论