选择正确的统计方法ppt课件_第1页
选择正确的统计方法ppt课件_第2页
选择正确的统计方法ppt课件_第3页
选择正确的统计方法ppt课件_第4页
选择正确的统计方法ppt课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

选择正确的统计方法,1,一、概述,什么时候开始考虑选择统计方法:应在研究设计的时候考虑,而不应是一切结束之后的结果“修饰”常见的现象:无科学设计、数据量不够、统计结果与专业结论自相矛盾、无法得出期望的统计结果此刻,才考虑用什么统计方法得到想要的结果,统计成了“数字游戏”,2,正确运用统计方法的前提:良好完善的研究设计如果没有科学的设计、良好的数据质量那么无论用什么方法和软件都无法获得真实的结果,甚至得出错误的结论。例:20世纪30-40年代,金的化合物普遍用于治疗结核病,视作特效药,为此发表过数以百计的文章,并作为定论写入教科书。40年代末,随机对照临床试验,否定了这种结论。并用几个月的时间肯定了链霉素、对氨柳酸、异烟肼的疗效。,3,二、科研中的资料类型,4,某疫苗皮下注射免疫结果,计量资料,有序多分类,二分类,5,数据类型的相互转换如年龄(岁),为何类资料?转换为“未成年、成人”,是何类资料?再转换为“婴幼儿、青年、中年、老年”则又是何类资料?如治疗效果分类“无效、好转、显效、痊愈”为何类资料?分别给予编码0,1,2,3后又为何类资料?,年龄(岁)为计量资料,转换为“未成年、成人”,就是二分类的计数资料,再转换为“婴幼儿、青年、中年、老年”则为多分类有序的计数资料(等级资料),如治疗效果分类“无效、好转、显效、痊愈”为多分类有序的计数资料,分别给予编码0,1,2,3后即便为计量资料了,6,三、统计方法选用,各种情形下最常用的统计方法索引(张文彤整理)应变量:连续单个自变量:二分类T检验多分类单因素方差分析连续相关分析,回归分析多个自变量:分类变量为主方差分析模型连续变量为主线性回归模型,7,应变量:有序分类单个自变量:二分类秩和检验多分类秩和检验连续Logistic回归分析多个自变量:分类变量为主Logistic回归分析连续变量为主判别分析、Logistic回归分析,8,应变量:无序分类(含二分类)单个自变量:二分类卡方检验多分类卡方检验连续Logistic回归分析多个自变量:分类变量为主:Logistic回归分析、最优尺度分析连续变量为主判别分析、Logistic回归分析,9,希望将变量/纪录分成若干个类别,但类别数不清楚,或各类别的特征不明:聚类分析希望建立判别方程,对以后新进入的案例进行所属类别的预测:判别分析需要探索多个变量间的内在联系或内在结构:因子分析、对应分析生存时间和生存结局都是需要关心的因素,同时数据中存在大量的失访:生存分析得到的是时间序列数据,需要对以后的情形加以预测:时间序列模型考察的特征需要有多个应变量来表示,同时研究多个自变量对他们的影响:多元方差分析模型,10,多变量统计方法选用指导,11,12,统计应用错误的实例分析,13,实例1,某研究小组对围手术期老年人头孢唑啉钠的合理用法进行研究,得结果如下表,14,存在的问题,老年组变异较小,60岁以下组变异较大:可能60岁以下年龄变动较大而变异加大个别超常值的存在也可能存在年龄增大个体差异减小T检验要求:个体独立、正态性、方差相等。后两个条件得不到满足,15,正态性经验判断:所有观测值为正值时,如为正态分布,S不会大于均值,更不会是均值的若干倍,60岁以下组k10的s为均数的若干倍,不符合正态性要求方差齐显然指标、k10的两组间方差不齐。,16,解决的办法,变量变换:对数变换、开方变换非参数检验:秩和检验、符号检验等,17,实例二,某医院为了解昏迷时血清甲状腺素的变化分别测定了昏迷病人和普通病人的血清T3、T4、rT3.,18,研究者采用t检验对每两组的均值进行比较,分别比较昏迷病人与对照组、浅昏迷与中昏迷、中昏迷与深昏迷比,19,分析,这是一个单因素(昏迷)、四水平(无、浅、中、高)设计误用t检验代替单因素方差分析如果要同时比较三项指标,应当采用多元方差分析,20,实例三,研究大豆黄酮对sp2/0肿瘤细胞DNA合成的影响,在大豆黄酮组中加入3HTdr后0.5h,1h,2h,4h分别测量Cpm值。每次试验均设空白对照,每个大豆黄酮剂量均设一式3份,取平均值。,21,用t检验,差异显著,大豆黄酮作用于肿瘤细胞后,其3HTdr掺入量随时间的延长而增加,但抑制率下降。,22,分析,随时间变化,肿瘤细胞数目的变化有较强的自相关性,而且同时涉及两个因素,资料与设计类型不满足t检验的要求。统计结果不可信。此资料是重复测量的两因素设计资料重复测量资料的方差分析常采用轮廓分析方法。轮廓分析通常进行组间轮廓相似性或平行性、组间平均水平差异显著性和组内条件变异显著性三方面的假设检验进行分析。,23,实例四定性资料的分析,双向无序RC资料2检验或Fisher检验,24,单向有序RC资料,25,不适合使用2检验因为2检验与“疗效”的有序性间没有任何联系应该采用与“有序性”有联系的秩和检验或Ridit分析,26,双向有序且属性不同的资料,27,也不适合采用2检验2检验与两变量的有序性没有任何联系应采用等级相关分析典则相关分析线性趋势检验,28,双向有序且属性相同的资料,29,研究目的是考察两种测定方法的测定结果间是否有一致性不适合使用2检验应当采用一致性检验或Kappa检验,30,实例五综合分析(一),某研究者将直肠癌根治术后会阴伤口感染42例,按随机法分为喷氧组(A组)21例,常规换药组(B组)21例,经治疗后观察伤口愈合的时间:A组:2例5天,5例7天,6例9天,4例11天,4例14天B组:7天、9天各1例,3例11天,7例14天,9例28-103天。,31,T检验结果:A组伤口愈合时间平均9.48天B组伤口愈合时间平均22.57天P1时当分析水平为2,影响因素为1时,T2检验影响因素个数=2或虽影响因素=1但其水平数=3,多元方差分析,39,目的二、对冠心病人而言,“性别、吸烟史、高血压史、基因型”等因素对血脂指标有无影响?,性别、吸烟史、高血压史、基因型等因素都是“影响因素”。需采用四因素析因设计的方差分析或多元方差分析,40,目的三、对冠心病人而言,同时分析“性别、吸烟史、高血压史、用药情况”等因素的影响的前提下,分析某种基因型取不同水平时7项血脂指标均之间的差别有无显著意义?,所谓设法排除相关因素的影响,就是要将前述诸因素的作用化为相等,以便比较评价不同基因型对血脂指标的影响。影响因素中既有定性、又有定量,故采用多元协方差分析,41,目的四、对冠心病人而言,试对7项血脂指标的内部从属性做客观评价?,要研究一组冠心病人“7项血脂指标的内部从属性”,显然不涉及任何分组变量,此时可采用主成分分析、因子分析。,42,目的五、对冠心病人而言,试对7项血脂指标的亲疏关系做客观评价?,指标间的亲疏关系,应当采用变量聚类分析,43,目的六、假定病情的轻重可以通过7项血脂指标很好的反映出来,试根据7项血脂指标的数据,将他们划分为3组,以便作为关于病情“轻、中、重”评判,可有的放矢的采取不同方案进行治疗,根据7项血脂指标的数量大小对病人进行分类,当然采用样本聚类的方法。,44,目的七:利用正常人与冠心病人的7项血脂指标,建立一种方法,用来对一个怀疑患有冠心病的就诊者进行辅助诊断。,欲实现对就诊者进行辅助诊断,就必须有能区分冠心病患者与正常人的判别函数,故应选用判别分析,45,目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论