医学科研的统计设计与数据处理PPT课件.pptx_第1页
医学科研的统计设计与数据处理PPT课件.pptx_第2页
医学科研的统计设计与数据处理PPT课件.pptx_第3页
医学科研的统计设计与数据处理PPT课件.pptx_第4页
医学科研的统计设计与数据处理PPT课件.pptx_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学科研的统计设计与数据处理 1 医学科学研究的基本程序 完整的医学研究课题设计 必须包括如下内容 拟探索和解决的医学问题以及明确而具体的目标 科学假说及其依据 设计方案和技术路线 必要的信息及条件保障 从统计学角度来讲 研究设计的基本内容包括 确定设计类型 确定研究总体及样本 拟定观察指标及测量方法 资料的可靠性及质量控制 数据的管理及统计分析计划等 2 基本程序 3 统计学在医学科研中的应用 专业设计阶段 观察指标 影响因素统计设计阶段 分组因素 控制因素搜集数据阶段 统一采集标准 质量控制数据分析阶段 实验设计资料 观察性资料提出观点 结论和撰写论文阶段 p值的大小 p值的可靠性 统计结论与专业结论 4 Asciencedealingwiththecollection analysis inter pretation andpresentationofmassesofnumericaldata Webster sInternationalDictionaryThescienceandartofdealingwithvariationindatathroughcollection classificationandanalysisinsuchawayastoobtainreliableresults LastJM Dictionaryofepidemiology 5 不明于计数而欲举大事 犹无舟楫而欲经于水 险也 举事必成 不知计数不可 管仲学者不能离开统计而研学 政治家不能离开统计而施政 事业家不能离开统计而执业 马寅初StatisticsaretheonlytoolsbywhichanopeningmaybecutthroughtheformidablethicketofdifficultiesthatbarsthepathofthosewhopursuetheScienceofMan F Galton 6 Tocallinthestatisticianaftertheexperimentisdonemaybenomorethanaskinghimtoperformapostmortemexamination hemaybeabletosaywhattheexperimentdiedof R A Fisher 非常痛心地看到 因为数据分析的缺陷和错误 那么多好的生物研究工作面临着被葬送的危险 F Yates M J R Healy 7 研究类型常用医学统计方法统计方法的选择统计方法综合运用实例常见错误案例讨论 医学科研的统计设计与数据处理 常用医学统计方法 8 一 研究类型 不同的分类标准有不同的类型 研究的目的 验证性研究 探索性研究 研究的形式 观察性研究 实验性研究 研究的指标 单因素研究 多因素研究 研究的时限 前瞻性研究 回顾性研究 横断面研究 研究的对象 社区研究临床研究 实验研究 9 Table1 Classificationofstudydesigns 10 Table2Aclassificationofbiomedicalresearchreports 11 医学研究的研究类型分类示意图 12 分类 是否施加干预 处理 否 是 观察性研究 实验性研究 13 14 15 一 实验性研究 根据资料性质 分析目的 实验设计类型可找到对应的统计方法 16 1 实验设计基本原理 空白对照时分析处理因素效应T S1E e1O S2O e2TE 17 处理因素单因素实验多因素实验非处理因素可控制未知或不可控制实验单位固定非固定实验效应 实验设计三要素 实验设计三原则 实验类型 根据处理因素 控制因素和实验单位特征 数据结构 实验单位 case观察指标 dependent分组因素 factor控制因素 covariate 18 例1研究三种抗癌药物对小白鼠肉瘤抑瘤效果 将15只小白鼠按完全随机分组方法等分到A B C三组 分别接受甲 乙 丙三种抗癌药物 19 例2研究3种抗癌药物对小白鼠肉瘤抑瘤效果 将小白鼠体重作为分层 区组 因素 将15只小白鼠按区组随机化分组方法分到A B C三组 分别接受甲 乙 丙三种抗癌药物 20 2 多因素实验 析因设计 处理为全面组合正交设计 处理为部分组合裂区设计 实验单位分级嵌套设计 处理因素分组 21 例3比较甲 乙 丙 丁四种饲料对小白鼠体重的影响 实验对象为8窝小白鼠 每窝4只 应采用何种实验设计方法 如果四种饲料是由脂肪含量和蛋白含量两个因素复合组成 研究目的是要分别分析脂肪含量高低 蛋白含量高低对小鼠体重的影响 应采用何种实验设计方法 22 第一种情况 单处理因素实验设计 为控制非处理因素小白鼠窝别影响 应采用随机区组设计 配伍组设计 其方差分析表的部分内容如下 23 第二种情况 为多处理因素实验设计 根据研究目的 应采用随机区组析因设计 其方差分析表的部分内容如下 24 例4某眼科实验 以家兔作为一级实验单位 分别注射三种全身药物a1 a2 a3 以每只兔的双眼作为二级实验单位 分别复制轻重不同的两种损伤b1 b2 观察指标为兔眼房水中环核甘酸含量 试进行实验设计 25 26 例6试验甲 乙 丙三种催化剂在不同温度下对某化合物的转化作用 由于各催化剂所要求的温度范围不同 应如何设计 两因素嵌套设计 I 3 J 3 r 2 27 3 常用实验设计模型 完全随机设计 随机区组设计 拉丁方设计 析因设计 嵌套设计 28 二 观察性研究 相应观察研究的统计分析方法拟合较为复杂的统计模型 描述性研究 横断面研究分析性研究 病例对照研究 队列研究 29 1 横断面研究 30 2 病例对照研究 31 3 队列研究 32 三 临床试验研究 研究性质 实验性研究特点 患者的依从性 失访 伦理学问题 赫尔辛基宣言 尊重人 有利 公正 三条基本伦理原则 伦理委员会的批准或准许 知情同意 33 二 常用统计分析方法 34 常用统计分析方法 35 统计描述 指标 图 表 单变量资料计量资料 统计图表 平均水平指标 离散程度指标计数资料与等级资料 统计图表 相对数 比 比例 率 双变量资料 散点图 相关系数 回归系数多变量资料 相关系数矩阵 均数向量 方差协方差矩阵 距离 例如 Mahalanobis 轮廓图 聚类图 36 随访资料 将事件发生的结果和随访时间两个因素结合在一起的资料 生存曲线图 寿命表 K年生存率角度资料或圆形分布资料 平均角 角离差 散布图 37 38 参数估计 点估计 pointestimation 总体均数的点估计总体率的点估计OR RR的点估计区间估计 intervalestimation 总体均数的区间估计总体率的区间估计OR RR的区间估计 39 假设检验 目的差别等效关系 互依关系 依存关系 基本步骤建立检验假设与备择假设 确定检验水准计算检验统计量确定P值 统计推断 专业推断 40 三 统计方法的选择 反应变量为单变量 双变量 多变量反应变量类型 定量变量 定性变量 等级变量处理因素多少 单因素试验 多因素试验设计类型 完全随机 随机区组 拉丁方等处理的组别 单样本 两样本或多样本检验方法的前提条件 41 单变量计量资料的分析思路示意图 42 单变量计数资料的分析思路示意图 43 单变量等级资料的分析 单变量等级资料的分析思路示意图 44 双 多 变量资料的分析思路示意图 45 1 若应变量Y为数值型随机变量 且服从正态分布 自变量满足多元正态分布 可选多元回归分析或多元逐步回归分析 回归方程形如Y 0 1X1 2X2 iXi mXm2 若因变量Y为分类变量 二分类或多分类 且以判别分类为主要目的 自变量满足多元正态分布 可选判别分析或逐步判别分析 判别函数形如 46 Y1 10 11X1 12X2 1iXi 1mXmY2 20 21X1 22X2 2iXi 2mXm Yn 10 n1X1 n2X2 niXi nmXm3 若因变量Y为生存时间 并含有截尾数据 可选Cox模型做生存分析 风险函数形如ln h t h0 t 1X1 2X2 iXi mXm4 若因变量Y为二分类变量或多分类变量 且以分析危险因素为主要目的 如果为配比设计 选条件Logistic回归 如果无配比设计 选非条件Logistic回归 回归模型形如ln P 1 P 0 1X1 2X2 iXi mXm 47 1 聚类分析 将变量或观察单位划分为性质相近的k类2 主成分分析 寻找综合指标3 因子分析 寻找潜变量4 典型相关分析 两组变量之间的相关 48 影响假设检验方法选用的因素 研究目的 找差异 找关系 其它 研究因素的多少 单因素 两因素 多因素 研究的组数 水平数 的多少 两组 多组 效应变量的多少 单变量 双变量 多变量 实验设计类型成组 配对 配伍组 析因设计 资料特征与分布 检验统计量 样本含量大小 49 50 51 52 53 54 四 统计方法综合运用实例 例1根据2001年进行的大规模调查 已知某地健康青年男子身高均数为168 34cm 体重均数为57 20kg 同年在该地应征男性青年中随机抽取120名男子 测得其身高 体重资料见表1 试对该资料进行统计分析 55 56 1 本例的身高 体重频数分布情况及Q Q图 身高近似服从正态分布 体重呈偏态分布 57 2 计算基本统计量 3 统计分析身高 服从正态分布 描述分布 均数及标准差 参考值范围估计 正态分布法 参数估计 总体均数的可信区间统计推断 单样本t检验 单样本u检验 58 体重 不服从正态分布 描述分布 中位数及四分位数间距 参考值范围估计 百分位数法 参数估计 总体均数的可信区间统计推断 单样本t检验 单样本u检验 Wilcoxon符号秩检验身高和体重两变量间相关分析 Spearman等级相关分析 59 例2某研究所为研究某药物的抑癌作用 使一批小白鼠致癌后 将一批致癌小白鼠40只按完全随机设计的方法分为四组 A B C三个试验组和一个对照组 分别接受不同的处理 A B C三个试验组 分别注射0 5m1 1 0m1和1 5m130 的注射液 对照组不用药 经一定时间以后 测定四组小白鼠的肿瘤重量 g 测量结果见表2 试进行统计分析 60 表2某药物对小白鼠抑癌作用 肿瘤重量 g 的试验结果 1 单因素方差分析2 Dunnett t检验 61 例3为研究三种饲料对增加大白鼠体重的影响 有人按随机区组设计将初始体重相近的36只大白鼠分成12个区组 再将每个区组的3只大白鼠随机分入A B C三种饲料组 但在实验设计时未对大白鼠的进食量加以限制 三组大白鼠的进食量 X 和所增体重 Y 的原始资料见表 问扣除进食量因素的影响后 三种饲料对增加大白鼠体重有无差别 62 统计分析方法 随机区组设计单变量协方差分析 63 64 65 66 67 UNIANOVAyBYblocktreatWITHx METHOD SSTYPE 3 INTERCEPT INCLUDE EMMEANS TABLES treat WITH x MEAN COMPAREADJ LSD CRITERIA ALPHA 05 DESIGN blocktreatx 68 69 70 例4某研究者收集103例冠心病患者和100例正常对照者的多项指标 部分资料见下表 其中G为组别 X1为性别 X2为年龄 X3为患高血压史 X4为吸烟史 X5为胆固醇含量 X6为甘油三酯含量 X7为低密度脂蛋白含量 x8为高密度脂蛋白含量 x9为脂蛋白含量 X10为载脂蛋白含量 X11为载脂蛋白含量 X12为基因EcoR 型 71 冠心病患者和正常对照者多项指标的部分观测结果 研究目的和拟采用的统计分析方法 72 常见错误 实验设计中的常见错误 设计类型 随机 违背随机原则对照 对照不全重复 均衡 73 运用相对数时 计算相对数的分母太小率 或构成比 不具有可比性率 或构成比 不具有可比性分析时构成比与率混淆 或滥用率统计表绘制和表达中常见的错误统计图绘制和表达中常见的错误 常见错误 统计描述中的常见错误 74 缺少统计学分析或未说明应用的统计学方法 统计方法选择不当 忽视配对资料特性 忽视重复测量特性 误用t检验代替方差分析 常见错误 统计推断中的常见错误 75 案例讨论 例1某医师对口腔门诊不同年龄龋齿患病情况 表1 进行了分析 得出40 49岁组患病率高 0 9岁组和70岁及以上组患病率低的错误结论 7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论