医学写作中基本统计处理_第1页
医学写作中基本统计处理_第2页
医学写作中基本统计处理_第3页
医学写作中基本统计处理_第4页
医学写作中基本统计处理_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

公共卫生学院黄河浪,目录,一医学统计学的几个概念二统计学的基本步骤三计数资料的统计描述和统计推断四计量资料的统计描述和统计推断,一医学统计学的几个概念,医学统计学运用概率论和数理统计的方法,研究医学数据收集、整理、分析、推断等的一门学科总体根据研究目的确定的研究对象的全体样本在总体中抽取的有代表性部分变异研究数据的变化和波动,包括生物误差、测量误差、随机误差、系统误差,参数描述总体特征的数值,通常是未知的,一般用希腊字母表示、统计量描述样本特征的值,是已知的,用英文字母表示S、P检验水准()小概率事件具体化,实践中常取0.05或0.01概率某事件发生可能性的变量。事物在一定条件下必然发生的概率等于1,不可能发生的事件概率等于0,随机事件的概率在01之间。自由度()是解析几何上的一个名词,指不受限制的运动的空间量度。数学上把x1,x2,xn作为N度空间里的点,如果不加任何条件限制,这些点就有N个自由度。但若加上一个条件,即x1+x2+xn=x,那么自由度就减少了一个,即=N-1。这就是统计学中自由度的基本含义,计数资料先将观察单位按性质或类别进行分组,然后清点各组观察单位的个数所得的资料计量资料对每个观察单位用定量方法测定某项指标的数值大小所得的资料等级资料又称为半定量资料,将观察单位按观察单位按某项指标的等级顺序分组,再清点各组观察单位的个数所得的资料变量(X)信息的数量化,(1)收集资料:根据调查目的,进行调查或实验设计,然后按设计要求,收集准确与完整的原始资料。这是统计工作的前提与基础(2)整理资料:把收集到的原始资料,有目的、有计划的进行科学加工,使资料系统化、条理化(3)分析资料:是在整理的基础上进一步计算相应的指标,结合专业知识,应用统计方法进行分析比较,阐明事物的规律,二统计学的基本步骤,(一)常用相对数应用及注意事项1率,三计数资料的统计描述和统计推断,基数:可取百分率(100)、千分率(1000)、万分率(1/万)、十万分率(1/10万)等使计算结果保留12位整数平均率不能由各组率相加后求平均,应为分子合计除以分母合计,例11999年某幼儿园有36名儿童患了腮腺炎,该幼儿园有200名儿童(其中25名儿童以前患过腮腺炎),该幼儿园儿童1999年腮腺炎发病率是多少?,例2汉族不同年龄组孕妇携带HBsAg情况,不可直接相加:(11.1+6.1+5.2+2.3+2.3)/5=5.4%(此为错),2相对比(relativeratio)概念:是两个有关的指标之比,说明两者的对比水平,以倍数或百分数表示。计算公式:,例3某年某医院出生婴儿中,男性婴儿为370人,女性婴儿为358人,则出生婴儿性别比例:女:男=1:370/358=1:1.03例42008年某国卫生部颁布的综合性医院床工比(床位数与工作人员之比):1:1.3(300张床位)1:1.41.5(300450张床位)1:1.61.7(450张床位),(1)率与构成比要区分开。(2)分母要选择适当,要够大。(3)构成比可相加,和为100%;平均率不能由各组率相加后求平均。(4)样本率或构成比的取得应遵循随机化原则,内部构成不同要用标准化法处理。(5)构成比或率比较时,不能凭表面数值大小下结论,要考虑抽样误差,需作假设检验。,3应用相对数注意事项,4动态数列及其分析指标概念:动态数列(dynamicseries)是一系列按时间顺序排列起来的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。常用指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。,平均发展速度和平均增长速度,1.平均发展速度(各环比发展速度几何平均),(二)计数资料的统计推断,两组资料四格表检验常用以检验两个或两个以上样本率或构成比之间差别的显著性,用以说明两类属性现象之间是否存在一定的关系。其基本思想:以理论数与实际数有无差别来判断事物,例6某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见下表。问两组降低颅内压的总体有效率有无差别?,附表两组降低颅内压有效率的比较,(1)建立检验假设,确定检验水平H0:1=2即试验组与对照组降低颅内压的总体有效率相等H1:12即试验组与对照组降低颅内压的总体有效率不相等=0.05。,假设检验步骤,式中:A为实际频数(actualfrequency)T为理论频数(theoreticalfrequency),基本思想:可通过检验的基本公式来理解。,式中:TRC为第R行C列的理论频数nR为相应的行合计nC为相应的列合计,理论频数由下式求得:,(2)求统计量值,(3)结果判断,四格表资料检验的专用公式,四格表资料检验的校正公式,1、1T5,且n40时,需要计算校正卡方,或改用方法直接概率法计算2、T1或n40时需改用直接概率法计算,2行列表资料的检验,行列表资料多个样本率比较时,有R行2列,称为R2表;两个样本的构成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为RC表。,检验统计量的公式,例7某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?附表三种疗法有效率的比较,(1)检验步骤:,四计量资料的统计描述和统计推断,集中趋势和离散趋势(计量资料的统计描述),主要内容:(一)频数表(二)集中趋势(三)离散趋势(四)正态分布(五)正常值范围估计,例8原始资料,频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。,(一)频数表,100名18岁女大学生身高均数的计算,1.求全距(R):R=最大值最小值=173.6154.7=18.9(cm)2.确定组数:通常815组计算组距(i)i=R/组数i=18.9/10=1.89cm取整数2cm所以,i=2cm3.确定组段:第一组段包括最小值,如本例为154最后组段包括最大值,如本例1721744.列表划记,频数表的编制,1998年100名18岁健康女大学生身高的频数分布,100名18岁女大学生身高均数的计算,频数分布的两个特征:集中趋势与离散趋势频数分布的类型:对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态)频数表的主要用途:1.揭示分布类型2.发现特大值和特小值3.计算集中趋势指标与离散趋势指标,常用几种平均值:1.算术均数2.几何均数3.中位数,平均值是一组数据典型或有代表性的。由于这样典型的值趋向于落在根据数据大小排列的数据的中心,因此可以用于度量集中位置,(二)集中位置的描述,意义:一组性质相同的观察值在数量上的平均水平。表示(总体)、(样本)计算:直接法、间接法、计算机特征:(X-)=0估计误差之和为0应用:正态分布或近似正态分布注意:合理分组,才能求均数,否则没有意义,1.算术均数(均数),例8100人的平均身高计算,意义:N个数值的乘积开N次方即为这N个数的几何均数。表示:几何平均数(G)计算:应用:原始数据分布不对称,经对数转换后呈对称分布的资料。如抗体滴度例9某地10人接种某种疫苗后,测定抗体滴度为:1:2,1:2,1:4,1:4,1:4,1:4,1:8,1:8,1:16,1:32。求抗体平均滴度。,2.几何均数,(小样本用),(大样本用),解:,10人疫苗的抗体平均滴度为:1:5.7,中位数(median,M):将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。公式l:中位数所在组的下限i:组距fm:中位数所在组的频数c:小于l的累计频数百分位数(percentile,PX):将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是50%位的数值,其为百分位数的特殊形式。应用:偏态资料,开口资料(不封顶或不归定底线),3.中位数、百份位数,例10204名轧钢工人血中大单核细胞百分数的中位数计算,解:,204名工人的大单核细胞的平均数是5.38%以上的平均数求解都是点值估计,生物医学中许多指标都是波动的,需要区间估计,因此必须考虑它的离散度,描述一组数据参差不齐的程度全距四分位数间距方差标准差变异系数,(三)离散程度的描述,R=最大值一最小值。,1、全距,2、四分位数间距,Q=Qu一Ql=P75一P25四分位数间距:为上四分位数(P75)Qu与下四分位数Ql(P25)之差,其包含了全部观察值的一半。,46,(1)相关概念:离均差、离均差平方和、方差(2S2)标准差的符号:S(2)标准差的意义:全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好)(3)标准差计算公式:(小样本)(大样本)(3)标准差的应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围,3、标准差,例8:计算标准差(s),100名女大学生身高的平均数为163.84公分,标准差为3.794公分,即163.843.79495%CI(变量值范围)=163.841.963.794163.841.963.794=156.404171.276,意义:标准差与均数之比用百分数表示。计算公式:(无单位)应用:单位不同的多组数据比较或均数相差悬殊的多组资料,4、变异系数(CV),例8100名女大学身高的变异系数,假设检验,(四)假设检验(统计推断),可信区间估计(95%,99%的可信区间)显著性检验(t检验,u-检验);,1参数估计(可信区间):运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。以例8为说明:求标准误(SE或):说明样本均数间或样本均数与总体均数间的离散度(2)95%CI=,(3)有95%把握说女生身高的总体均数就在163.09至164.58的范围内,2t检验,(1)t检验条件计量资料;资料分布正态或近似于正态;两组资料的比较;方差齐性(1)样本均数与已知总体均数比较的t检验(一组样本资料的t检验),目的:比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。计算公式:指总体均数,未知时以0代替自由度:n1举例,例11:已知一般婴儿平均出生体重为3.20kg,某医生调查了25个难产婴儿出生体重,并计算其平均出生体重为3.42kg,标准差为0.42kg,试分析难产儿出生体重与一般婴儿出生体重有否差异?已知:难产婴儿出生体重一个总体均数():3.20kg;一个样本均数():3.42kg;可计算出样本标准误():0.42/5=0.084n=25t0.05(24),p0.055做出推论:p0.05,小概率事件发生了,原假设不成立;拒绝H0,接受H1,可认为:难产儿平均出生体重与一般婴儿平均出生体重不同;难产儿平均出生体重比一般婴儿平均出生体重大;难产儿平均出生体重与一般婴儿平均出生体重差别显著。,(2)配对资料的t检验什么是配对资料?治疗前后;不同检验方法;进行配对;一对观察对象之间除了处理因素/研究因素之外,其它因素基本齐同目的:判断不同的处理是否有差别计算公式:,例12某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。试问用药前后IgG有无变化?,用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量,检验假设H0:d=0H1:d0=0.05计算统计量t值确定P值查t临界值表,t0.05,11=2.201,19.5522.201,P0.05在=0.05的水准上拒绝H0所以可以认为用药后小儿IgG增高,目的由两个样本均数的差别推断两样本所代表的总体均数间有无差别适用条件已知/可计算两个样本均数及它们的标准差;两个样本之一的例数少于100;样本来自正态或近似正态总体;方差齐计算公式,(3)两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论