常用多变量统计分析方法简介_第1页
常用多变量统计分析方法简介_第2页
常用多变量统计分析方法简介_第3页
常用多变量统计分析方法简介_第4页
常用多变量统计分析方法简介_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常用多变量统计分析方法简介1多变量统计方法是运用数理统计的方法来研究多变量问题的理论和方法 ,它是单变量统计统计方法的推广,是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学分支学科。近年来,多变量统计方法已广泛应用到医学研究的各个领域。医学现象涉及到的变量不止一个 ,而是多个变量 ,且这些变量间又存在一定的联系 ,需要处理多个变量的观测数据。多变量统计分析方法概述2对于多变量医学问题, 如果用单变量统计方法就要对多方面分别进行分析 ,而一次分析一个方面 ,同时忽视了各方面之间存在的相关性 ,这样会丢失很多信息 ,分析的结果不能客观全面地反映情况。多变量统计方法不仅能够研究多个变量之间的相互关系以及揭示这些变量之间内在的变化规律,而且能够使复杂的指标简单化 ,并对研究对象进行分类和简化。 多变量统计分析方法概述3回归分析的分类多个因变量(y1,y2, yk)路径分析结构方程模型分析一个因变量 y连续型因变量 (y) - 线性回归分析分类型因变量 (y) -Logistic 回归分析时间序列因变量 (t) -时间序列分析生存时间因变量 (t) -生存风险回归分析4一、多重线性回归二、 Logistic回归 三、 Cox比例风险回归四、其他常用多变量统计方法多变量统计分析方法概述5Multivariate linear regression概念:多重线性回归分析 也称 复线性回归分析 ( multiple linear regression analysis) ,它研究一组自变量如何直接影响一个因变量。自变量( independent variable) 是指独立自由的变量,用向量 X表示; 因变量( dependent variable)是指非独立的、受其它变量影响的变量,用向量 Y表示;由于模型仅涉及一个因变量,所以多元线性回归分析也称单变量线性回归分析( univariate linear regression analysis)6人的 体重 与 身高、胸围血压值 与 年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史糖尿病人的 血糖 与 胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂射频治疗仪定向治疗脑肿瘤过程中,脑皮质的 毁损半径 与 辐射的温度、照射的时间一个变量的变化直接与另一组变量的变化有关:如:7假定因变量 Y与 自变量 间存在如下关系:式中, 是常数项, 称为 偏回归系数( partial regression coefficient) 。 的含义为在其它自变量保持不变的条件下,自变量 改变一个单位时因变量 Y 的平均改变量。 为随机误差,又称残差( residual),它表示 的变化中不能由自变量 解释的部分。一、多元线性回归方程模型8只有一个自变量时 ,回归的结果为二维平面上的一条直线 ;而有两个自变量时 ,回归的结果为三维空间的一个平面;有更多自变量时 ,回归的结果则是在三维以上空间的 “超平面 ”,无法用直观图形表达。 9应用条件:注意: 虽然模型要求因变量是连续数值变量,但对自变量的类型不限。若自变量是分类变量,特别是无序分类变量,要转化为亚变量才能分析。对于自变量是分类变量的情形,可以应用 广义线性回归模型分析。10二、多元线性回归分析的步骤(一) 估计各项参数,建立多元线性回归方程模型(二)对整个模型 进行假设检验,模型有意义的前提下,再分别对各偏回归系数进行假设检验。(三)计算相应指标,对模型的拟合效果进行评价。11(一)模型的参数估计1227名糖尿病患者的血清总胆固醇( x1)、甘油三酯( x2)、空腹胰岛素( x3)、糖化血红蛋白( x4)、空腹血糖( y)的测量值列于表中,试建立血糖与其它几项指标关系的多元线性回归方程。 例 16.113各变量的离均差矩阵14线性回归方程模型为:151、对模型的假设检验 F检验2、对偏回归系数的假设检验 F检验 和 t 检验3、标准化偏回归系数(二)对模型及偏回归系数的假设检验161、对模型的假设检验 F检验17SS回归 =b1l1y+ b2l2y + b3l3y + b4l4y =0.142467.6962+0.351589.8025+0.2706142.4347+0.638284.5570 =133.7107;回归 =m=4 各变量的离均差矩阵18SS总 =lyy=222.5519; 总 =n-1=26SS剩余 = SS总 - SS回归 =222.5519-133.7107=88.8412剩余 =n-m-1=22 MS回归 = SS回归 /回归; MS剩余 = SS剩余 /剩余;F= MS回归 / MS剩余1、对模型的假设检验 F检验191、对模型的假设检验 F检验202、对偏回归系数的假设检验 F检验 和 t 检验回归方程成立只能认为总的来说自变量与因变量间存在线性关系,但是否每一个自变量都与因变量间存在线性关系,须对其偏回归系数进行假设检验。 方差分析法 t 检验法21 偏回归系数的假设检验 -方差分析法22 偏回归系数的假设检验 -方差分析法23 偏回归系数的假设检验 t 检验系数矩阵 A24指定 REG过程进行多元线性回归分析,拟合 y与四个自变量间的多元线性回归方程 25整个方程有统计学意义各自变量的参数估计 对偏回归系数的假设检验 26注意27变 量 回 归 系数 bj 标 准化偏回 归 系数 bjX1 0.14245 0.07758X2 0.35147 0.30931X3 -0.27059 -0.33948X4 0.6382 0.397743

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论