统计方法选择与常见的误用课件_第1页
统计方法选择与常见的误用课件_第2页
统计方法选择与常见的误用课件_第3页
统计方法选择与常见的误用课件_第4页
统计方法选择与常见的误用课件_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计描述统计推断统计分析的两大方面根据数据类型选择统计方法(摘自:娄 冬 华.从变量的类型看统计方法. 数理医药学杂志,2003,16(3):282-283)(计量资料的比较)(1)方法:分析这两类变量之间的关系采用的统计方法用t检验;若分类变量的分类数多于两类时方差分析。(2)条件:当然t检验或方差分析要求数据来自于正态分布,且方差齐。(3)备用方法:当条件不满足时,可以采用与分布形式无关的非参数分析方法(秩和检验)。要点和注意事项(计数资料的比较)(X2检验或Fisher确切概率法)要点和注意事项(1)方法:(2)注意:校正条件。1)n40,T5:不用校正2)n40, 但1T5:需校正3)

2、n 40,或T1:Fisher 确切概率法3 X是无序分类变量,Y是有序分类变量例3 试分析针刺不同穴位的镇痛效果有无差别?等级资料比较(单向有序资料)要点和注意事项(1)方法:(2)注意:比较大小时用平均秩和。但是,大好或小好要根据具体的赋值。(同一观察对象同时测两个不同的(计量)指标。)(双变量资料)要点和注意事项(1)方法:有无关系:相关分析; 能否推算:回归分析(2)注意: 1)x,y呈直线趋势:直线回归,否则曲线拟合 2)x,y均呈正态分布:线性相关,否则等级相关(双向有序资料)要点和注意事项(1)方法:等级相关分析 (2)注意:PEMS选择计数资料相关分析; SPSS相关分析:Sp

3、earman相关分析要点和注意事项(1)方法:一致性分析(X2检验) (2)注意:也可用PEMS选择计数资料相关分析(参照P62,例6.6)7 1个Y,多个X的资料多因素分析模型多元回归分析Logistic回归分析Cox模型聚类分析判别分析科研论文中常见的统计学误用某大学学报(医学版)论文中统计推断应用缺陷分析(目前的情况)% 16.84 27.37 9.47 24.21 12.63 9.47 100.00、(方法误用):占68.42%(注意事项):9.47%(没介绍方法):12.63(低级错误):9.47%一、未对资料进行统计分析就下结论 一些文章仅计算均数、率等指标,没有进行必要的统计分析

4、,就进行比较,下结论。 组别例数均数标准差甲组202.130.98乙组202.331.04(t=0.3259, p=0.5351)结论:乙组高于甲组。(最低级的错误) 甲组(n=180) 乙组(n=120) P值 XS XS甲指标 3.481.65 4.762.52 0.10乙指标 5.231.12 6.381.21 0.01两均数相差1.28两均数相差1.15差值大小抽样误差大小变异度例数多少是否拒绝H0,取决于: 1、被研究的事物有无本质的差异; 2、抽样误差大小: (1)个体差异大小(S) (2)样本例数多少(n) 3、检验水准的高低 二、描述结果错误计量资料的结果全部用 表示。资料:来

5、自广西医科大学学报,2006,23(6):883集中趋势指标 资料 抗体滴度 G、S 否 偏态、开口 M、Q 否 X、S是是选择判断的步骤:离散趋势指标单位不同均数相差悬殊CV二、描述结果的错误计量资料的结果全部用 表示。资料:来自广西医科大学学报,2006,23(6):883应该用MQ三、没说明所用的统计方法(不规范)现象一:没有写清所用统计方法的具体名称或根本不写论文中所用的统计方法。如果交待不清或根本不予交待,则审稿者或读者对论文结论的正确与否将无法判断。 实例:资料:来自广西医科大学学报,2006,23(6):940现象二:“简略法” :计量资料比较采用t检验;计数资料比较采用X2检验

6、。配对设计与成组设计数据的统计方法就不同,如果只说用了t检验,则很难判断其正确性。现象三:有的文章中只提一句“经统计学处理”后,就写出结论;有的甚至干脆不提“统计”二字,直接用P值说明问题了事。小贴士:应写出具体的统计方法。四、假设检验结果表达错误错误实例一:“P值越小,差别越大 ” P0.05, “两者有显著差别” P0.01,“两者有极显著差别”改正: P0.05, “两者差异有统计学意义” P0.01,“两者差异有统计学意义”最低级的错误!五、统计学意义与实际意义(拉虎皮作大旗)有统计学意义,不一定有实际意义!药物治疗高血压后,血压下降了5mmHg,经统计学检验,差异有显著意义。但降低5

7、mmHg对改善临床症状无意义。(该结论:经统计学检验,t=3.12, P=0.0023, 差异有统计学意义,该药有效。)没有统计学是万万不能的,但是统计学不是万能的。某种意义上说,经统计学分析有差别,只是说:在H0假设下,由抽样误差造成两样本的差别的概率很小,即认为不是抽样误差造成的(推算两总体不同)。六、X2检验的错误错误一:四格表资料X2检验该校正未校正小贴士: T5,且n40:不用校正 1T5,且n40:必须校正 T1,或 n 40:不能用X2检验, 改用Fisher确切概率法错误二:RC表资料,该处理而未处理。小贴士: 有理论数T1的格,或1 T5的格数超过总格数的1/5,应采用适当的

8、处理方法,否则,会导致分析的偏性。错误三:多组率的两两比较采用一般四格表X2检验。小贴士: 应采用 分割法。七、单向有序资料(等级资料)仍用X2检验小贴士: 单向有序资料比较应用秩和检验等级资料秩和检验:P=0.042;X2检验:P=0.051构成比有无差别疗效有无差别如改为下表:X2=5.677,P=0.017建议还是采用秩和检验(从科学的态度)(为了更有机会得出有差别的结论)八、多样本均数比较,采用多个t检验比较小贴士: 多样本均数比较应用方差分析及其两两比较(当不满足方差分析条件时:改用秩和检验)后果:犯一类错误的概率增大。九、相对数误用错误一:以比代率如某论文叙述“某病男41例,女43

9、例,年龄3-62岁,3-40岁68例,占81%,反映本病青壮年、少年发病率高。”显然是错误的。又如某文章作者根据表1资料认为沙眼在20一岁组的患病率最高,以后随着年龄增大而减少,显然,也是非常错误的。错误二:混淆某病病死率与某病死亡率二者相同:分子。因某病死亡的人数二者区别:分母。某病病死亡率:患某病的总人数; 某病死亡率:平均人口数 意义。病死率:反映疾病严重程度 死亡率:反映疾病危害程度错误三:混淆患病率与发病率二者相同:反映疾病的严重程度二者区别:分子 发病率:新发病例数 患病率:现患病例数分母 发病率:平均人口数 患病率:受检人数应用 发病率:用于急性疾病 患病率:用于慢性疾病错误四:

10、计算率的分母太小后果:结果不稳定;或给人以错误的印象。 例:治疗2例,2例治愈,治愈率100%。小贴士:直接报告绝对数。 例如:治疗5人,3人治愈十、把“随便”当“随机” 实例:从动物室买回20只动物后,先抓10作为第一组(实验组),剩下为第二组(对照组)。小贴士:何为随机分组?在没有分组之前,谁都有同等的机会被分到实验组或对照组。随机:某事件可能发生也可能不发生。实验设计的随机化分组方法半随机化:按就诊(入院)顺序、生日、住院号等;简单随机化:投硬币、抽签、随机数字随机区组分层随机由上往下,效果越好!适宜转律后药疗的慢性房颤者风湿性非风湿性0.50.50.50.5 6月 6月 6月 6月 6

11、月 6月 6月 6月随机分入实验组和对照组对象病因心胸比病程调查设计的随机抽样方法基本抽样方法 单纯随机抽样 系统抽样 整群抽样 分层抽样 (一)单纯随机抽样1、单纯随机抽样含义 先将调查总体的全部观察单位编号,再用随机数字表或抽签等方法随机抽取部分观察单位组成样本。总体:1 2 3 4 5 6 7 8 9 10 (统一编号)样本: 3 5 9 (被抽到的号)(二)系统抽样(等距抽样、机械抽样)1、系统抽样的含义 先将总体的观察单位按某一顺序号分成几个部分,再从第一部分随机抽第K号观察单位,依次用相等间隔,机械地从每一部分各抽一个观察单位组成样本。从20人中随机抽取5人。(假如,第1部分的3号

12、被抽到)编号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20部分: 1 2 3 4 5 样本的编号:3、7、11、15、19 (从3号开始,每间隔4抽1个)2、系统抽样优缺点优点: 1)易于理解、执行 2)易得到一个按比例分配的样本 3)抽样误差小于单纯随机抽样缺点:1)当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,系统抽样将产生明显偏性。 2)各个观察单位不是彼此独立的,无可靠的方法估计抽样误差。(三)整群抽样1、整群抽样含义 直接由K个“群”组成的总体中随 机取k个“群”,再对被抽取的每个群的全部观察单位加以调查。某幼儿园大班中

13、班小班大2中5小1被抽到的班的学生全部调查2、整群抽样优缺点 优点:便于组织,节省人力、财力;容 易控制调查质量。缺点:当样本例数一定时,其抽样误差 一般大于单纯随机抽样的误差。 (四)分层抽样 1、分层抽样含义 先按某种特征将总体分为若干组别,类型或区域(层),再从每一层内进行随机抽样,组成样本。 将影响观察值变异较大的某种特征分层,各层中观察单位数n的分配: 1)按比例分配 (按人数比例抽样) 2)最优分配 (按误差大小抽样)某中学(1000人)一年级(300人)二年级(400人)三年级(300人)计划抽100人抽30人抽40人抽30人分层按比例抽样分层按比例抽的人数抽样比: 10%2、分层抽样优缺点:优点: 1)减少抽样误差,提高效率 2)便于对不同的层采用不同的抽样方法 3)可对不同层独立进行分析缺点: 如果是按比例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论