




已阅读5页,还剩86页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二军医大学临床流行病学与循证医学中心 张罗漫 临床研究资料常用统计分析方法 1 统计数据分析是一门综合技术,统计数据分析是一门综合技术, 也是一门高超的艺术!也是一门高超的艺术! n医学专业知识 n医学统计学理论知识 n计算机统计软件技术 2 q学习了统计学理论知识,并不代表已经有 能力进行统计数据分析。要不断进行实践。 q实际科研工作中的“原型”资料与教科书上 的 “标准型”例子有一定差距。 q应用统计软件进行计算分析一定要有正确的 综合的统计理论方法的后台背景指导。 q不但要注重对统计方法的选择,而且要注重 对分析结果的解释。 3 一、概述一、概述 二、原始数据的录入 三、数据处理的几个基本问题 四、统计方法选择的基本思路 五、统计分析结果的表述 4 医学统医学统 计计 学学 研究 设计 数据 处理 观察性研究 实验性研究 统计描述 统计推断 假设检验 参数估计 (调查) 5 调查设计调查设计 系统 分层随机 整群 调查方法 调查对象 调查指标 研究目的 按范围 按时间 抽样 普查 横向(现况调查) 非概率 概 率 简单随机 纵向 病例对照研究 队列研究 调查工具 调查员 nested case control study 6 实验设计实验设计 实验分类实验分类 动物实验 临床试验 社区干预试验 基本要素基本要素 处理因素 受试对象 实验效应 诊断试验 疾病防治 病因 疾病预后 7 实验设计实验设计 基本原则基本原则随机化、盲法 对 照 重 复 (样本含量) 形式 原则:专设、同步、均衡 1- 、 自身处理前后 平行:无治疗无治疗 安慰剂安慰剂 阳性治疗阳性治疗 不同剂量不同剂量 8 统计描述统计描述 资料资料 类型类型 数学 连续型(计量) 离散型:计数 计量:脉搏次数/分 统计 等级等级(有序分类) 计量计量 计数计数(无序分类) 定比(0表示无,如体重kg) 定距(0不表示无,如温度0C) 9 统计描述统计描述 统计表统计表 制表原则 制表要求 简单明了 主辞在左、宾辞在右 一张表表达一个中心内容 备注 数字 线条 标目 标题 10 统计描述统计描述 统计图统计图 制图原则 制图要求 连续型资料(计量) 离散型资料(计数、计量) 图例 刻度 纵轴、横轴 标目 标题 条图、圆图、百分比条图 线图、直方图、散点图 11 统计描述统计描述 统计统计 指标指标 计量资料 (单变量) 中心 位置 正态: 非正态: 对数正态: 离散 程度 个体值 样本均数: 正态 非正态: 量纲相同: 量纲不同: 计量资料 (双变量) 偏度:g1 峰度:g2 12 统计描述统计描述 统计统计 指标指标 计量资料 (单变量) 计量资料 (双变量) 离散程度: r、b 13 统计描述统计描述 中心位置:均数向量 离散程度:离均差平方 和矩阵 协方差矩阵 相互关系:相关矩阵 计量资料 (多变量) 统计统计 指标指标 14 统计描述统计描述 等级 资料 统计统计 指标指标 计数资料 率、构成比、相对比 RR(OR) 离散程度:标准误 离散程度: 秩号、秩和 秩和的标准误 单变量 双变量:rs 15 统计描述统计描述 参参 考考 值值 范围估计范围估计 正态 偏态 或 双侧: 单侧: 双侧: 单侧: 或 16 统计推断统计推断 区间 估计 参数参数 估计估计 点估计 双侧: 单侧:或 双侧: 单侧: 或 RR(OR): 17 统计推断统计推断 假设假设 检验检验 步骤步骤 1.进行检验假设 假设样本来自某一特定总体 2.确定检验水准 确定最大允许误差 3.选定检验方法计算检验统计量 计算样本与总体的偏离程度 4.根据某一特定分布计算与检验统 计量对应的P值 5.作出结论 根据小概率反证法思想作出推断 18 统计推断统计推断 比较差别:2、t、F、q、log-rank 、 秩和检验等 联系:相关、回归分析 分类:回归分析、判别分析 推测:回归分析 筛选影响因素:回归分析 综合变量信息:主成分分析 寻找潜在支配因素:因子分析 假设假设 检验检验 方法方法 19 统计分析软件统计分析软件 qq SPSSSPSS (有人称“鼠标软件”) q SASSAS (Statistical Analysis System) q StataStata q R R (方法新、提供源程序、免费) 20 qqSPSSSPSS软件软件 Statistical Package for Social Science (社会科学统计软件包) 后改名为: Statistical Product and Service Solutions (统计产品与服务解决方案) qq现现改名为改名为PASWPASW Predictive Analytics Software 预测分析软件 21 一、概述 二、原始数据的录入二、原始数据的录入 三、数据处理的几个基本问题 四、统计方法选择的基本思路 五、统计分析结果的表述 22 原始数据的记录形式 行:观察单位行:观察单位 列:变量列:变量 23 标识变量标识变量分析变量分析变量 24 标识变量标识变量分析变量分析变量 自变量(解释变量)反应变量反应变量 25 原始数据的录入 文件类型:文件类型: 数据库文件:EpiData Excel文件: Excel 统计软件数据文件:SPSS(PASW)、SAS、Stata 变量名及标签:变量名及标签: 变量值及标签:变量值及标签: 名义变量值的量化:名义变量值的量化:有序、无序分类资料 26 27 数据编辑窗口数据窗 标题栏 菜单栏 工具按钮栏 数据单元格显示 数据文件建立原则 一个观测占一行 一个变量占一列 2728 变 量 度 量 类 型 变 量 名 变 量 类 型 变 量 宽 度 保 留 小 数 位 数 变 量 名 标 签 变 量 值 标 签 缺 失 值 显 示 数 据 列 宽 数 据 对 齐 方 式 数据编辑窗口变量窗 28 29 定量变量 Scale 等级变量 Ordinal 名义变量 Nominal 2930 标准数值型 科学记数法 圆点数值型 逗号数值型 日 期 型 带美元符号数值型 自 定 义 字 符 型 30 31 名义变量的哑变量化 原资料 姓名性别 X1 年龄 X2 疗法 X3 张三150中西医 李四120西医 王五018中医 刘六070中医 赵七135中西医 孙八029西医 哑变量化 姓名X1X2X31X32 张三15001 李四12010 王五01800 刘六07000 赵七13501 孙八02910 32 一、概述 二、原始数据的录入 三、数据处理的几个基本问题三、数据处理的几个基本问题 四、统计方法选择的基本思路 五、统计分析结果的表述 33 数据的净化数据的净化 逻辑检查 计算检查 离群数据的处理离群数据的处理 离群值离群值(outliner)(outliner) 与P25或P75的距离为“ 四分位数间距”的1.53.0倍。 极端值极端值(extreme value)(extreme value) 与P25或P75的距离 为“四分位数间距”的3.0倍以上。 剔除离群或极端值要予以合理解释。 34 数据质量有问题,数据质量有问题, 使用的统计方法越高级,使用的统计方法越高级, 欺骗性越大欺骗性越大! ! 35 一、概述 二、原始数据的录入 三、数据处理的几个基本问题 四、统计方法选择的基本思路四、统计方法选择的基本思路 五、统计分析结果的表述 36 设计类型:设计类型:完全随机、随机区组、拉丁方、 交叉、析因、正交、嵌套、裂区设计 处理因素:处理因素:单因素、双因素、多因素 水平:水平:单水平、两水平、多水平 处理效应:处理效应:单变量、双变量、多变量 资料类型:资料类型:计量、无序分类、有序分类 数据情况:数据情况:完全数据、不完全数据、 重复测量数据、层次结构数据 假设检验方法前提条件:假设检验方法前提条件: 独立、方差齐性、正态分布 重要 37 二个处理因素,观测指标为单变量。二个处理因素,观测指标为单变量。 38 一个处理因素,观测指标为三个变量。一个处理因素,观测指标为三个变量。 39 ( (一一) )单变量计量资料单变量计量资料 1. 1.样本均数与总体均数比较样本均数与总体均数比较 单因素 服从正态分布 单样本单样本t t检验检验 可信区间法可信区间法 不服从正态分布 单个样本中位数与总体中位数比较单个样本中位数与总体中位数比较 40 2. 2.两个相关样本均数的比较两个相关样本均数的比较 单因素 配对设计或自身前后对照设计 差值服从正态分布 成对成对t t检验检验 可信区间法可信区间法 差值不服从正态分布 WilcoxonWilcoxon符号秩检验符号秩检验 ( (一一) )单变量计量资料单变量计量资料 (1-)可信区间不 包括 d=0, P T 1 Pearson Pearson 2 2 检验检验 (Yates (Yates 校正公式校正公式) ) N40 或 T 1 Fisher Fisher 确切概率法确切概率法 (2)(2)配对设计配对设计 McNemarMcNemar 2 2 检验检验 Logistic回归分析 55 Y(疗效) = 1 有效 0 无效 X1(疗法) = 1 新疗法 0 传统疗法 组别 疗效 频数 1 1 99 1 0 5 0 1 75 0 0 21 数据输 入格式 56 3. 3.病例对照研究成组资料分层分析病例对照研究成组资料分层分析 ( (二二) )计数资料计数资料 57 (1)检验病例组与对照组有暴露史 (饮酒)的比例 是否有差异: 分层分层Pearson Pearson 2 2 检验检验 (2)剔除混杂因素(吸烟)影响后分析饮酒与食管 癌关联: Mantel-Mantel-HaenszelHaenszel 2 2 检验检验 (3)计算暴露与疾病的关联强度 分层OR值计算; 分层OR值一致性检验; 如一致,计算Mantel-Haenszel公共OR值。 58 4.R4.R C C列联表列联表 相关、相差相关、相差 (1)(1)双向有序双向有序 备择假设:行变量与列变量为非零相关 Cochran-Mantel-Cochran-Mantel-HaenszelHaenszel 2 2 检验检验 有序分组资料的线性趋势检验有序分组资料的线性趋势检验 2 2 回归回归 ( (二二) )计数资料计数资料 59 双向有序双向有序的的RCRC表资料表资料 60 4.R4.R C C列联表列联表 相关、相差相关、相差 (2)(2)单向单向( (反应变量反应变量) )有序有序 备择假设:行平均得分不同 Cochran-Mantel-Cochran-Mantel-HaenszelHaenszel 2 2 检验检验 WilcoxonWilcoxon 秩和检验秩和检验 ( (二二) )计数资料计数资料 分组变量无序 61 单向有序单向有序( (仅指反应变量仅指反应变量) )的的RCRC表资料表资料 62 4.R4.R C C列联表列联表 相关、相差相关、相差 (3)(3)双向无序双向无序 备择假设:行变量与列变量有一般关联 Cochran-Mantel-Cochran-Mantel-HaenszelHaenszel 2 2 检验检验 Pearson Pearson 2 2 检验检验 ( (二二) )计数资料计数资料 63 双向无序的双向无序的RCRC表资料表资料 64 1. 1.配对设计配对设计 WilcoxonWilcoxon符号秩检验符号秩检验 2. 2.两组独立样本两组独立样本 WilcoxonWilcoxon两两样本秩和检验样本秩和检验 3. 3.完全随机设计多个样本比较完全随机设计多个样本比较 KruskalKruskal-Wallis H -Wallis H 检验检验 4. 4.随机区组设计多个样本比较随机区组设计多个样本比较 Friedman M Friedman M 检验检验 ( (三三) )等级资料等级资料 65 1. 1.相关分析相关分析 X1与X2服从二元正态分布 PearsonPearson积差相关分析积差相关分析 X1与X2不服从二元正态分布 SpearmanSpearman秩相关分析秩相关分析 2. 2.回归分析回归分析 Y与X服从二元正态分布 或 Y服从正态分布而X为控制变量 Y与X间呈直线趋势 直线回归分析直线回归分析 ( (四四) )双变量计量资料双变量计量资料 66 3. 3.曲线回归分析(曲线回归分析(SPSSSPSS) 67 3. 3.曲线回归分析(曲线回归分析(SPSSSPSS) 68 4. 4. 协方差分析协方差分析 比较带有协变量(Xj)的各组均数( )间的差别 协变量Xj对Yj有影响 分为完全随机设计与随机区组设计 69 1. 1.有应变量的多元分析有应变量的多元分析 ( (五五) )多变量资料多变量资料 70 1. 1.有应变量的多元分析有应变量的多元分析 Y为计量资料且服从正态分布 自变量服从多元正态分布 多元线性回归或多元逐步回归分析多元线性回归或多元逐步回归分析 ( (五五) )多变量资料多变量资料 qj的意义为在其它自变量保持不变时,Xj 增加或减少一个单位时Y的平均变化量。 qq可排除混杂因素影响。可排除混杂因素影响。 71 1. 1.有应变量的多元分析有应变量的多元分析 Y为二分类或多分类变量 以分析影响Y的危险因素为主要目的 LogisticLogistic回归分析回归分析 ( (五五) )多变量资料多变量资料 72 1. 1.有应变量的多元分析有应变量的多元分析 Y为生存时间且含有截尾数据 以分析影响Y的危险因素为主要目的 CoxCox比例风险回归分析比例风险回归分析 ( (五五) )多变量资料多变量资料 73 开始观察时间开始观察时间:1992.01.01 :1992.01.01 终止随访时间终止随访时间:2001.12.31:2001.12.31 74 1. 1.有应变量的多元分析有应变量的多元分析 Y为二分类或多分类变量 根据判别对象若干个指标的观测值判定其 应属于哪一类为主要目的 BayesBayes判别分析判别分析 ( (五五) )多变量资料多变量资料 75 2. 2.无应变量的多元分析无应变量的多元分析 ( (五五) )多变量资料多变量资料 76 2. 2.无应变量的多元分析无应变量的多元分析 n n主成分分析主成分分析 将所有变量化为少数几个互不相关的综合 变量 n n因子分析因子分析 从所有变量中找出有限个不可观测的潜在 因素 n n典型相关分析典型相关分析 分析两组集团变量之间的相关关系 ( (五五) )多变量资料多变量资料 77 一、概述 二、原始数据的录入 三、数据处理的几个基本问题 四、统计方法选择的基本思路四、统计方法选择的基本思路 五、统计分析结果的表述 78 1.统计分析结果的正确表述统计分析结果的正确表述 q在报告结论时,最好列出检验统计量的 值,尽量写出具体P值,而不简单写成 P 0.05,以便读者与同类研究进行比较 或进行循证医学时采用Meta分析。 q经常遇到PASW软件计算结果中P=0.000的 情况,这是由于P值小于0.0005或更小,因 保留3位小数四舍五入所致,在论文中可 写为P0.0005。 ( (一一) )统计分析结果的表述与理解统计分析结果的表述与理解 79 1.统计分析结果的正确表述统计分析结果的正确表述 qq统计结论统计结论 P,按检验水准,拒绝H0,接受H1 差别有统计学意义 the difference was statistically significant. We could draw the conclusion that qq专业结论专业结论 可以认为不同,高于(低于)。 结论较肯定,因知犯第一类错误概率范围。 ( (一一) )统计分析结果的表述与理解统计分析结果的表述与理解 80 qq统计结论统计结论 P,按检验水准,不拒绝H0 差别无统计学意义 the difference was not statistically significant . qq专业结论专业结论 还不能认为两总体均数或率不同。 结论不肯定,因不知犯第二类错误概率范 围。不拒绝H0不意味能证实H0是正确的(两 总体均数或率相同)。 ( (一一) )统计分析结果的表述与理解统计分析结果的表述与理解 81 2. 2.统计学结论与医学专业结论有分岐时统计学结论与医学专业结论有分岐时 q统计结论“有意义”,专业结论“无意义”, 最终结论为无临床意义。 q统计结论“无意义”,专业结论“有意义”, 可能原因:样本含量较小;可能原因:样本含量较小; 试验误差较大;试验误差较大; 误用统计分析方法。误用统计分析方法。 ( (一一) )统计分析结果的表述与理解统计分析结果的表述与理解 82 体重 均数 标准差 最小值 最大值 对照组 疗前 68.91 8.7942 52 99 (111例) 疗后 68.95 8.7992 51 99 差值 0.0450 0.9666 -2 3 前后比较 t=0.4905 P=0.6248 试验组 疗前 68.97 7.7875 55 92 (114例) 疗后 68.72 7.8679 53 95 差值 -0.1930 0.9855 -3 4 前后比较前后比较 t=2.0921 P=0.0387t=2.0921 P=0.0387 两组差值比较 t=1.1372 P=0.2567 rr统计学上有意义,但无临床意义实例统计学上有意义,但无临床意义实例 83 n研究某药物对脑梗塞患者的作用,采用欧洲 脑卒中评分(ESS),试验组与对照组各50例。 试验组疗后比疗前ESS增加37.9029.75; 对照组疗后比疗前ESS增加28.37 27.91。 n n两组差异无统计学意义两组差异无统计学意义(t=1.652(t=1.652,P=0.102)P=0.102)。 试验组试验组ESSESS增加比对照组多增加比对照组多9.359.35分,有临床分,有临床 意义。意义。 n但目前的检验效能只有37.9,要达到90的 检验效能,估计各组需193例。 rr统计学上无意义,但有临床意义实例统计学上无意义,但有临床意义实例 84 以随机对照临床试验为例以随机对照临床试验为例 r要定性描述研究的类型(探索性、验证性 研究;前瞻性、回顾性、横断面研究)。 r清楚陈述研究目的及研究假设(优效、非 劣效或等效性检验)。 r描述目标人群情况如人口、地理、医院性 质、是否转诊、诊断等。 r明确诊断标准、入选标准与排除标准。 rr确定样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北省邢台市第三中学2026届化学高三第一学期期中考试模拟试题含解析
- 广西桂林市2024-2025学年高二下学期期期末考试英语
- 8上Unit2HomeSweetHome单元词汇短语深度默写1默写版
- 化妆师入行基本知识培训课件
- 县妇联面试题目及答案
- 启东中学七下数学试卷
- 太仓幼师面试题目及答案
- 机械传动基础知识培训课件
- 事业人才面试题目及答案
- 社区中学面试题目及答案
- 幕墙密封胶相容性检测
- T/CMES 37005-2023滑道运营管理规范
- 催收机构运营管理制度
- 药品生产企业药品安全信用评价指标及评分标准
- T-SCSTA001-2025《四川省好住房评价标准》
- 台州市水处理发展有限公司化工废水处理工程项目环评报告
- 【亿欧】2025年全球AI Coding市场洞察研究报告
- 建行银行面签合同协议
- 第五单元:含长方形和正方形的不规则或组合图形的面积专项练习-2023-2024学年三年级数学下册典型例题系列(解析版)人教版
- 2025年湖南吉利汽车职业技术学院单招职业技能考试题库附答案
- 毕节地区金沙县2025年小升初易错点数学检测卷含解析
评论
0/150
提交评论