医学统计学课件数据处理的一般原则与方法(第29章)_第1页
医学统计学课件数据处理的一般原则与方法(第29章)_第2页
医学统计学课件数据处理的一般原则与方法(第29章)_第3页
医学统计学课件数据处理的一般原则与方法(第29章)_第4页
医学统计学课件数据处理的一般原则与方法(第29章)_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据处理的一般原则与方法第29章 第二军医大学卫生统计学教研室 张罗漫 医学统计学讲课内容: 第一节 医学统计学概述 (重点 ) 第二节 原始数据的录入 第三节 数据处理的几个基本问题 第四节 统计方法选择的基本思路 (重点 ) 医学统计学 第一节 医学统计学概述 医学统计学 医学统 计学 研究 设计 数据 处理 观察性研究 实验性研究 统计描述 统计推论 假设检验 参数估计 (调查) 医学统计学 调查设计 调查方法 调查对象 调查指标 研究目的 按范围 按时间 抽样 普查 横向(现况调查) 非概率 概率 简单随机 系统 分层随机 整群纵向 病例对照研究 队列研究 调查工具 调查员 医学统计学

2、 实验设计 实验分类 动物实验 临床试验 社区干预试验 基本要素 处理因素 受试对象 实验效应 医学统计学 实验设计 随机化 基本原则 对照 重复 (样本含量) 设置 原则:均衡可比 类型:配对、组间?1-? ?、?、? ?空白 实验 安慰剂 标准 相互 医学统计学 统计描述 统计表 制表原则 制表要求 简单明了 主语在左、宾语在右 一张表表达一个中心内容 备注 数字线条 标目相互关系:相关矩阵中心位置:离散程度:均数向量 离均差矩阵标题 医学统计学 统计描述 统计图 制图原则 制图要求连续性资料: 间断性资料: 图例 刻度纵轴、横轴 标目标题 条图、圆图、百分比条图 线图、直方图、散点图 医

3、学统计学 统计描述 统计 指标 计量资料 (单变量) 中心 位置正态: 非正态: 对数正态:离散 程度 个体值 样本均数: 正态 非正态: 量纲相同: 量纲不同: 计量资料 (双变量) 离散程度: r、b 医学统计学 统计描述协方差矩阵计量资料(多变量) 统计指标 医学统计学 统计描述 等级 资料 统计 指标 计数资料 绝对数、率、构成比、相对比 、RR(OR) 离散程度: 标准误 离散程度: 秩号、秩和 秩和的标准误 单变量 双变量: rs 医学统计学 统计描述参 考 值 范围估计 正态 偏态 或 双侧: 单侧: 双侧: 单侧: 或 医学统计学 统计推论 参数 估计 区间 估计 点估计 双侧

4、: 单侧: 或 双侧: 单侧: 或 RR(OR): 医学统计学 统计推论 假设联系 分类 鉴别 推测 筛选影响因素:回归分析检验步骤1.进行检验假设 假设样本来自某一特定总体2.确定检验水准 确定最大允许误差3.选定检验方法计算检验统计量 计算样本与总体的偏离程度4.根据一特定分布计算与检验统计量对应的P值5.作出结论 根据小概率反证法思想作出推断医学统计学统计推论比较差别: ?2、t、u、F、q、 log-rank 、 秩和检验等 相关、回归分析 聚类、回归分析 判别分析 回归分析 综合变量信息:主成分分析 寻找潜在支配因素:因子分析 假设 检验 方法 医学统计学 第二节 原始数据的录入 医

5、学统计学一、原始数据的记录形式行:观察单位列:变量医学统计学标识变量 分析变量 医学统计学 标识变量 分析变量 解释变量 反应变量 医学统计学二、原始数据的录入 文件类型: 数据库文件: EpitaDadBASE、FoxBASE、FoxprowOracleSPSS、SAS、STATA交叉、析因、正交、 处理因素:单因素、双因素、 反应变量:单变量、双变量、 资料类型:计量、无序分类、Excel 文件:Excel 文本文件: Word 统计软件数据文件: 变量名的定义: 变量值的量化: 医学统计学 第三节 数据处理 的几个基本问题 医学统计学、数据的净化 逻辑检查 计算检查、离群数据的处理离群值

6、(outliner)与P25或P75的距离为 四分位数间距”的1.53.0咅。极端值(extreme value)与P25或P75的距离为四分位数间距”的3.0倍以上。 剔除离群或极端值要予以合理解释。医学统计学三、统计方法前提条件的检验多样本比较的方差分析: 独立 正态分布 方差齐性多重线性回归分析: 变量间无多重共线 残差分布正态医学统计学 第四节统计方法选择 的基本思路 医学统计学 根据: 医学专业知识 医学统计学知识 计算机统计软件技术 医学统计学 设计类型:完全随机、随机区组、拉丁方、 嵌套、裂区设计 多因素 多变量 有序分类样本数目:单样本、两样本、多样本 数据提供信息:完全数据、

7、不完全数据、重复测量数据 假设检验方法前提条件: 独立、方差齐性、正态分布 重要 医学统计学 一、单变量计量资料1.样本均数与总体均数比较单因素服从正态分布 单样本t检验 可信区间法不服从正态分布 单个样本中位数与总体中位数比较 医学统计学2.两个相关样本均数的比较单因素配对设计或自身前后对照设计 差值服从正态分布 成对t检验 可信区间法 差值不服从正态分布 Wilcoxon 符号秩检验一、单变量计量资料1-a可信区间不包括卩d=0,P&It; a 医学统计学3.两个独立样本的比较 单因素、完全随机设计 服从正态分布且方差齐性 两样本均数比较t检验 两样本均数的差数可信区间法不服从正态分布或方

8、差不齐性 两独立样本 WiIcoxon 秩和检验 反应变量为生存时间且含有截尾数据 log-ra nk 检验 一、单变量计量资料 医学统计学4.多个样本均数的比较(1)一个处理因素完全随机设计 服从正态分布、方差齐性 完全随机设计方差分析 两两比较:SNK-q、Dunnett-t检验 不服从正态分布或方差不齐性N<40 或 T <1多个独立样本比较 Kruskal-Wallis H 检验 两两比较: Nemenyi 检验 一、单变量计量资料 医学统计学 4.多个样本均数的比较(2)一个处理因素、一个控制因素随机区组设计 服从正态分布、方差齐性 随机区组设计方差分析 两两比较:SNK

9、-q、Dunnett-t检验 不服从正态分布或方差不齐性 多个相关样本比较 Friedman M 检验 两两比较: q 检验一、单变量计量资料 当处理因素为重复测量因素且不满足 “球对称”假设,应用重复测量设计方差分析 医学统计学4.多个样本均数的比较(3)一个处理因素、二个控制因素 (行、列)拉丁方设计 服从正态分布、方差齐性 拉丁方设计方差分析两两比较: SNK-q、Dunnett-t 检验 一、单变量计量资料医学统计学4.多个样本均数的比较(4)一个处理因素、二个控制因素 (阶段、受试者 )二阶段交叉设计 服从正态分布、方差齐性 前一阶段处理效应不持续作用到下一阶段 二阶段交叉设计方差分

10、析一、单变量计量资料 医学统计学 4.多个样本均数的比较处理因素2每个因素的水平数 2 完全随机分组析因设计服从正态分布 分析各因素主效应与交互作用 完全随机分组析因设计方差分析 一、单变量计量资料 医学统计学4.多个样本均数的比较(6)处理因素2 每个因素的水平数 2 正交设计服从正态分布 分析各因素主效应与主要因素一阶交互作用正交设计直接分析、方差分析 一、单变量计量资料 医学统计学4.多个样本均数的比较(7)处理因素2每个因素的水平数 2 处理因素中有一个为重复测量因素 不满足 “球对称 ”假设 分析各因素主效应与交互作用 重复测量设计的方差分析 一、单变量计量资料 医学统计学 二、计数

11、资料1.一个样本率与总体率比较 基于二项分布的直接概率法 正态近似法u检验 医学统计学2.两样本率比较二、计数资料 (1)两组完全随机设计N ? 40 且 T ? 5 Pearson ?2检验 N ? 40 但 5 > T ? 1Pearson ?2检验(Yates 校正公式 ) Fisher 确切概率法(2)配对设计Logistic回归分析 医学统计学Y(疗效)=1 有效0 无效McNemar ?2 检验(1)双向有序 备择假设:行变量与列变量为非零相关 Cochran-Mantel-Haenszel ?2检验 有序分组资料的线性趋势检验 ?2 回归(2)单向 (反应变量 )有序 备择

12、假设:行平均得分不同 Cochran-Mantel-Haenszel ?2检验 Wilcoxon 秩和检验 二、计数资料 医学统计学3.R?C列联表相关、相差(3)双向无序 备择假设:行变量与列变量有一般关联 Cochran-Mantel-Haenszel ?2检验 Pearson ?2检验 二、计数资料 医学统计学1.配对设计Wilcoxon 符号秩检验2.两组独立样本Wilcoxon 两样本秩和检验3.完全随机设计多个样本比较Kruskal-Wallis H 检验4.随机区组设计多个样本比较Friedman M 检验三、等级资料 医学统计学1.相关分析X1与X2服从二元正态分布P ears

13、on积差相关分析X1与X2不服从二元正态分布Sp earma秩 相关分析2.回归分析丫与X服从二元正态分布 或丫服从正态分布而X为控制变量丫与X间呈直线趋势 直线回归分析四、双变量资料 医学统计学3.曲线回归分析( SPSS) 医学统计学3.曲线回归分析( SPSS) 医学统计学4.协方差分析比较带有协变量(Xj)的各组均数()间的差别 X1(试验因素)=1 有0 无 组别 疗效 频数119912521752221数据输入格式医学统计学3.R?C列联表相关、相差协变量Xj对Yj有影响 分为完全随机设计与随机区组设计 医学统计学1.有应变量的多元分析五、多变量资料 医学统计学1.有应变量的多元分

14、析丫为计量资料且服从正态分布自变量服从多元正态分布 多元线性回归或多元逐步回归分析 五、多变量资料 医学统计学1.有应变量的多元分析丫为判别分类变量 自变量服从多元正态分布 判别分析或逐步判别分析 五、多变量资料 医学统计学 1.有应变量的多元分析丫为二分类或多分类变量 以分析危险因素为主要目的 条件或非条件 Logistic 回归分析 五、多变量资料 医学统计学1.有应变量的多元分析丫为生存时间且含有截尾数据 Cox比例风险回归分析 五、多变量资料 医学统计学2.无应变量的多元分析 五、多变量资料 医学统计学2.无应变量的多元分析将n个观察单位聚为k类(n ? k) Q型聚类将m个变量聚为k类(m ? k)R型聚类 五、多变量资料 医学统计学2.无应变量的多元分析 将所有变量化为少数几

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论