已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学 3 多元统计分析方法 TheMethodsofMultivariateStatisticalAnalysis 参考书 医用多元统计分析方法 陈峰主编 第2版 医用多元统计方法 张家放主编 医学统计学与电脑实验 方积乾主编 应用多变量统计分析 孙尚拱主编 第一章绪论 多元统计学简介 什么是多元统计学多元统计学与基本统计学的区别多元统计学在医学研究中的地位多元统计学的主要应用如何学习多元统计分析方法课程要求 一 什么是多元统计学 统计学 统计学 结论conclusions 总体population 样本sample 利用样本推断总体特性的一门科学 统计学的主要任务 结论conclusions 总体population 样本sample Sampling Estimation Evaluation SEE 统计学的主要用途 比较参数 H0 72vsH1 72 分析关联性 H0 0vsH1 0 分析依存性 H0 0vsH1 0 2 什么是多元统计学 统计学 基本统计学的主要内容 t 检验 方差分析卡方检验简单相关分析简单回归分析 1 2变量 1维 多元统计学的主要内容 多变量方差分析多变量相关分析多变量回归分析 多个变量 多维 多元统计分析 讨论多维随机向量的理论和统计方法的总称 英国著名统计学家 肯德尔 M G Kendall 在 多元分析 一书中把多元分析所研究的内容和方法概括为以下几个方面 1 简化数据结构 降维问题 例如通过变量变换等方法使相互依赖的变量变成互不相关的 或把高维空间的数据投影到低维空间 使问题得到简化而损失的信息又不太多 主成分分析 因子分析 对应分析等多元统计方法就是这样的一类方法 分类与判别 归类问题 对所考查的对象 样品点或变量 按相似程度进行分类 或归类 聚类分析和判别分析等方法是解决这类问题的统计方法 3 变量间的相互联系 1 相互依赖关系 分析一个或几个变量的变化是否依赖于另一些变量的变化 如果是 建立变量间的定量关系式 并用于预测或控制 回归分析 2 变量间的相互关系 分析两组变量间的相互关系 典型相关分析等 3 两组变量间的相互依赖关系 偏最小二乘回归分析 5 多元统计分析的理论基础包括多维随机向量及多维正态随机向量 及由此定义的各种多元统计量 推导它们的分布并研究其性质 研究它们的抽样分布理论 这些不仅是统计估计和假设检验的基础 也是多元统计分析的理论基础 多元数据的统计推断参数估计和假设检验问题 特别是多元正态分布的均值向量和协差阵的估计和假设检验等问题 各种设计资料的方差分析 完全随机设计资料的单因素方差分析随机区组设计资料的两因素方差分析析因设计资料的多因素的方差分析拉丁方设计资料的三因素方差分析嵌套设计资料的多因素方差分析裂区设计资料的多因素方差分析单因素重复测量资料的方差分析双因素重复测量资料的方差分析交叉设计资料的多因素方差分析 简单相关分析 x y 偏相关分析 x y z 复相关分析 y x1 x2 xk 典型相关分析 x1 x2 xk y1 y2 yp 各种类型的相关分析 单变量回归分析 线性和非线性回归分析 Logistic回归分析 生存时间回归分析 时间序列回归分析 对数线性模型分析多变量回归分析 路径分析 结构方程模型分析 各种类型的回归分析 聚类分析 因子分析 主成分分析 对应分析 各种类型的分类分析 二 多元统计与基本统计的区别 较少变量 较多变量 实用性较差 实用性较强 较简单 较复杂 不够准确 更准确 MSA BSA 例如 用四种不同方法治疗8名患者 其血浆凝固时间的资料列在下表中 试分析治疗方法对血浆凝固时间的影响 治疗方法与浆凝固时间的资料 SourceDFSumofSquaresMeanSquareFValuePr FA313 016250004 338750001 310 2909Error2892 762500003 31294643CorrectedTotal31105 77875000 不考虑个体差异 单因素方差分析结果 SourceDFAnovaSSMeanSquareFValuePr FA313 016250004 338750006 620 0025B778 9887500011 2841071417 200 0001Error2113 773750000 65589286CorrectedTotal31105 77875000 考虑个体差异 双因素方差分析结果 四种治疗方法对血浆的凝固时间有显著性差异 四种治疗方法对血浆的凝固时间无显著性差异 例如 为了研究两种药物对癫疯病菌的治疗效果 将30名病人随机分成3组 一组使用抗生素A 一组使用抗生素D 另一组作为对照组使用安慰剂 治疗前和治疗后分别对病人身体的癫疯病菌数量进行了检测 病菌的数量是由每一个病人身体上六个部位病菌感染的程度而定的 数据列在下表3中 试对该试验研究进行统计分析 SourceDFTypeISSMeanSquareFValuePr FDRUG2293 60000000146 800000009 150 0010 SourceDFTypeIIISSMeanSquareFValuePr FDRUG268 5537106034 276855302 140 1384X1577 89740304577 8974030436 010 0001 未校正用药前的病菌数量 校正了用药前的病菌数量 三种药物的治疗效果有显著性差异 三种药物的治疗效果无显著性差异 doctor patients data evaluatetreatment statisticalanalysis improvedknowledge feedback 三 多元统计学在医学研究中的地位 Exampleofcomplexityinmedicalstudy physicalactivity eating drinking smoking socialeconomicstatus enduredglucose bloodpressure weight cholesterol diabetes coronaryheartdisease environment lifestyle endogeneousfactors diseases 它扩展了统计分析的应用范围 提高了统计分析结果的准确性 它不仅是医学科学研究中不可缺少的一个重要工具 而且它是促进医学科学发展的一门重要相关学科 多元统计学在医学研究中的价值 MSA是高级医科研究人员应当掌握的现代知识 Advanced Elementary MSA BSA 四 多元统计分析有哪些应用 比较关系预测分类评价 4 1比较 比较比较不同地区儿童生长发育情况不同种族正常人头发中微量元素的含量不同组别的IgG IgM IgA IgE不同组别的CD2 CD3 CD4 CD8 CD4 CD8文献1 比较不同性别的各部位脂肪含量 文献2 比较试验组和对照组健康老人的空间记忆能力 语言能力等文献3 比较不同人群左 右脑垂体灰 白质 4 2关系 探索病因校正混杂因素调整基线文献4 探讨巯基丁氨酸 homocysteine 与血压 冠心病的关系 需调整年龄 性别 种族 已知的与冠心病有关的其他因素 探索与预后有关的因素影响黑色素瘤患者的生存时间的因素 年龄 性别 病灶部位 浸润深度 4 3预测 疾病预后的预测是否会患某病的预测哪些人更容易患糖尿病 年龄 家族史 工作性质 BMI 腰臀比等 乳腺癌患者手术后的生存时间 年龄 家族史 并发症 复发 化疗等 法医鉴定中死亡时间的推算 根据尸体的直肠温度 环境温度 停尸物的质地等 4 4分类 计算机辅助诊断系统临床诊断病毒鉴别胸痛患者如何快速诊断 是否急性心肌缺血 对体形进行分类 制作服装对口腔牙列进行分类 预制牙列 4 5评价 综合评价医院效益评价卫生投入产出评价健康状况评价 各种应用对应的多元统计分析方法 比较 多元方差分析关系 回归模型预测 回归模型分类 聚类分析与判别分析 回归模型评价 主成分分析与因子分析多元回归 logisitic回归 Cox回归 Poisson回归 各种设计资料的方差分析 完全随机设计资料的单因素方差分析随机区组设计资料的两因素方差分析析因设计资料的多因素的方差分析拉丁方设计资料的三因素方差分析嵌套设计资料的多因素方差分析裂区设计资料的多因素方差分析单因素重复测量资料的方差分析双因素重复测量资料的方差分析交叉设计资料的多因素方差分析 完全随机设计资料的应用实例 19只小猪被随机地分到四个试验组分别给与四种不同的饲料喂养 两个月后测量其体重 kg 数据列在下面表中 试分析用这四种饲料喂养的效果是否有显著性区别 feed1feed2feed3feed460 868 7102 687 957 067 7102 184 265 074 0100 283 158 666 396 585 761 769 890 3 析因设计资料的应用实例 在研究某防霉剂的毒性作用时 对有关影响皮肤吸收的因素进行试验 在皮肤干式和湿式状况下 分别用密闭和敞开的方法处理4组小白鼠 经3小时后杀死 测定肝中Sn含量 数据见下表 拉丁方设计资料的应用实例 因子A 喂养时间 水平记为1 2 3 因子B 地区温度 水平记为1 2 3 因子C 食品配方 水平记为a b c 经过一段时间喂养后 体重的增加量y记录在下表中 嵌套设计资料的应用实例 在某项化合物转化率的实验研究中 涉及到催化剂的种类 因素A 和温度 因素B 根据专业知识 催化剂对该化合物转化率的影响作用大于温度 而且在不同催化剂条件下所用的温度不完全相同 实验批次为2 转化率观测结果列在下表中 试分析催化剂和温度对该化合物转化率的作用 不同催化剂在不同温度下对某化合物转化率的观测结果 裂区设计资料的应用实例 为研究不同瘤株的生瘤效果和不同浓度蛇毒的抑瘤作用 先将48只小鼠按条件分成3个区组 再将每个区组的16只小鼠随机地分成4组 分别接受4种不同的瘤株 因子A 一天后再对接受同一种瘤株的4只小鼠分别腹腔注射4种不同浓度的蛇毒 0 00 0 03 0 05 0 075 连续用蛇毒抑瘤10天 停药1天后解剖测瘤重 结果列于下表 重复测量设计资料的应用实例 20个病人分别接受了两种不同的治疗处理 A 1 2 治疗后以30分钟的时间间隔测量病人的前额体温 T 1 2 3 4 测量结果列在下表中 试分析 1 两组病人的体温有无显著性差异 2 T2时刻测得较高的体温 问其它各时间点的体温与T2时刻有无显著性差异 各种类型的回归分析 连续型因变量 y 多重线性回归分析 多个因变量 y1 y2 yk 分类型因变量 y 多重Logistic回归分析 时间序列因变量 t 时间序列分析 生存时间因变量 t 生存风险回归分析 路径分析结构方程模型分析 一个因变量y 简单线性回归分析模型Y X 例如 舒张压和血清胆固醇的依存关系 编号舒张压胆固醇 id y x 18030727525939034147023757525461054167702678853209883741078316 y 26 622 0 179x 多重线性回归分析模型Y 1X1 2X2 3X3 例如 校正性别和年龄后舒张压和血清胆固醇的依存关系Y 25 867 3 312SEX 0 207AGE 0 153X 编号性别年龄舒张压胆固醇11478030721557525931799034141567023751657525462891054167245702678267853209277883741025978316 三个自变量的线性回归模型 Y 25 867 3 312SEX 0 207AGE 0 153X 一个自变量的线性回归模型 Y 26 622 0 179X 多元线性回归分析模型Y1 1 11X1 12X2 13X3 1Y2 2 21X1 22X2 23X3 2 例如 大学与高中学习成绩的关系研究 y1是学生必修课的平均成绩 y2是选修课的平均成绩 x1是高中一般知识测试得分 x2是智商IQ得分 x3是学习动机平均得分 y1是学生必修课的平均成绩 y2是选修课的平均成绩 x1是高中一般知识测试得分 x2是智商IQ得分 x3是学习动机平均得分 二元线性回归分析模型 多变量路径回归分析模型Y1 1 11X1 12X2 1Y2 2 21X3 22X4 2Y3 3 1Y1 2Y2 3 例如 高血压和冠心病是两种严重影响人类身体健康的疾病 目前遗传流行病学研究中倾向于认为遗传和环境因素对这两种疾病的发病起着重要的影响作用 为了证实这一点 某研究生收集了相关的一些资料 父母以及子女的生活环境和舒张压的相关系数矩阵 n 94 X1 父亲的生活环境 X2 母亲的生活环境 Y1 父亲的舒张压 Y2 母亲的舒张压 Y3 子女的生活环境 Y4 子女的舒张压 Y1 0 3200 X1 R2 0 10 Y2 0 4580 X2 R2 0 21 Y3 0 3336 X1 0 1997 X2 R2 0 14 Y4 0 2247 Y1 0 0879 Y2 0 4266 Y3 R2 0 27 各种回归分析的比较 例如 研究者调查了3094个学生的四个指标 x1是母亲的学历等级 1 6 x2是父亲的学历等级 1 6 x3是父母亲的工资总收入等级 1 10 x4是学生的大学学分等级 1 4 x5是学生毕业5年后的工资等级 1 10 其相关系数列在下表 模型的标准估计 X1 0 8418F1 0 5398E1X2 0 6994 F1 0 7147E2X3 0 6491 F1 0 7607E3X4 0 8448F2 0 5351
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产科虚拟分娩模拟与产科质量提升
- 初中数学九年级上册期末复习易错单选题专项练习附答案及解析2
- 2025年江苏省南通市中考生物真题卷(含答案与解析)
- 亚洲儿童糖尿病代谢特点与管理差异
- 冷库火灾发生原因及预防措施分析
- 略论孔子的战争观
- 2025年中国蛋鸡产业发展研究报告
- 临床试验药物供应的应急响应流程
- “信息检索与利用”检索报告(数据库检索)
- 临床试验药物供应追溯系统的构建
- 玩转计算机网络-计算机网络原理知到智慧树章节测试课后答案2024年秋青岛大学
- 物流发货管理
- 医用高压氧舱项目可行性实施报告
- 控制区人员通行证件考试1附有答案
- 医院培训课件:《静脉血栓栓塞症(VTE)专题培训》
- 第27节 中华人民共和国的思想文化、卫生、科技、军事和文化传承与保护+知识清单 高三统编版(2019)历史一轮复习(选必融合)
- MOOC 医事法学-西南医科大学 中国大学慕课答案
- 重庆大学材料科学与工程学院《833土木工程材料》历年考研真题汇编
- 2024年上海春考语文试题及参考答案作文范文(搜集整理版)
- 《农业保险承保理赔电子化作业规范》
- 高中语文(统编版)选择性必修中册9《 屈原列传》公开课一等奖创新教案
评论
0/150
提交评论