卫生统计学重点笔记_第1页
卫生统计学重点笔记_第2页
卫生统计学重点笔记_第3页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医师资格考试蓝宝书一预防医学医学统计学方法第一节基本概念和基本步骤(非常莹要)一、统计工作的基本步腺设计(最关犍、决定成败)、搜集资料、整理资料、分析资料。总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位 某一变量值的集合.总体的指标为参数。实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断 总体特征。样本的指标为统计量.由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种 由抽样引是的差异称为抽样误差。抽样误差愈小,用样本推斷总体的精蜩度愈高;反之,其 粘确度愈低.某事件发生的可能性大小称为概率,用P表示,在01

2、之间,0和1为肯定不发生和肯 定发生,介于之间为偶然事件,0.05或0.01为小概率事件。二、变量的分类变量:观察单位的特征,分数值变量和分类变量。第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趁势的指标有1。均数均数是算术均数的简称,适用于正态或近似正态分布。2。几何均数 适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始 数据呈偏态分布,经对数变换后(用原始数据的对数值IgX代替X)服从正态分布,观察值不 能为0,同时有正和负。3。中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布, 特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定

3、数据资料的中心位置。不 能求均数和几何均数,但可求中位数。百分位数是个界值,將全部观察值分为两部分,有X% 比小,剩下的比大,可用于计算正常值范围。二、描述计量许料的离散趨势的指标1。全距和四分位数间距.2。方差和标准差 最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差), 又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小, 观察值的变异度越小.3。变异系数 多组间单位不同电均数相差较大的情况.变异系数计算公式为:CV=s/X X100%,公式中s为样本标准差,元为样本均数.三、标准差的应用表示观察值的变异程度(或离散程度)。在两组(或几组)资料均数相

4、近、度量单位相同的条件下,标准差大,表示观察值的变 异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多集中在均数周 围,均数的代表性较好。(常考!)四、医学参考值的计算方法,单双侧问题,医学为95%医学参考值是指正常人体或动物体的各种生理常数,由于存在变异,各种数据不仅因人 而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范国,即正 常值范国.医学参考值的计算公式:正态分布资料95%医学参考值:X ±1.96s (双侧);X+1o 645s或X 1.645s (单侧),s为标准差。百分位数法Pz 5和P”. 5(双侧);P5或比(单侧)。第三节

5、数值变量数据的统计推斷(莹要考点)一、标准误,标准误与标准差和样本含董的关系标准差和标准误的区别。样本标准误等于样本标准差除以根号下样本含量。标准误与标准差成正比;与样本含董 的平方根成反比。因此。为减少抽样误差,应尽可能保证足够大的样本含童。样本标准差与样本标准误是既有联系又有区别的两个统计董,二者的联系是公式:二者 的区别在于:样本标准差是反映样本中各观测值Xi,X2,,X"变异程度大小的一个指标, 它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数1, 2,的标准差,它 是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。(掌握!)二、t分布和标准正态U

6、分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布低,两端翘。(v 逐渐增大,t分布逐渐逼近u分布)。正态分布的特点:以均数为中心左右两侧完全对称分布;两个参数,均数U (位置 参数)和s (变异参数):对称均数的两侧面积相等.三、总体均数的估计样本统计童推算总体均数有两个重要方面:区间估计和假设检验样本均数估计总体均 数称点估计.总体均数区间估计(可信区间)的槪念:按一定的可信度估计未知总体均数所在范围. 其统计上习惯用95% (或99%)可信区间表示总体均数u有95% (或99%)的可能在某一 范国。可信区间的两个要素,一为准确度,反映在可信度1a的大小.即区间包含总体

7、均 数的概率大小,当然愈接近1愈好;二是精度,反映在区间的长度,当然长度愈小愈好。在 样本例数确定的情况下,二者是矛盾的,需要兼顾。总体均数可信区间的计算方法:1当n小按t分布的原理用式计算可信区间为:X ±ta/2, kSX2当n足够大 因n足够大时八分布逼近u分布,按正态分布原理。用式估计可信区间为:X ± u Q/2S-可信区间与医学参考值范围的区别:二者的意狡和算法不同.四、假设检验的步骤1o建立假设:H。(无效,两样本代表的总体均数相同),HM备择,两样本来自不同总体), 当拒绝Ho就接受Hi,不拒绝就不接受Hio2o确定显著性水平:区分大概率和小概率事件的标准,

8、通常取a=0. 0503. 计算统计量:根据资料类型和分析目的选择适当的公式计算.4。确定槪率P值:将计算得到的t值或u值査界值表得到P值和a值比较.5o做出推断结论。It I值、P值与统计结论a丨t丨值P值统计结论0. 05<10. 05 (v)>0. 05不拒绝H:,差别无统计学意义0.05左t0。05 (v)W0 05拒绝H。,接哽差别有统计学意戈0.01>t0.01 (v)W0° 01拒绝H。,接t H,差别有商度统计学意义五、两均数的假设检脸(常考!)1 样本均数与总体均数比较 u检验和t检验用于样本均数与总体均数的比较。理论上 要求样本来自正态分布总体实

9、际中,只要样本例数n较大,或n小但总体标准差a已知,就选 用u检脸。n较小且o未知时,用于t检验两样本均数比较时还要求两总体方差等。dSx以算得的统计量匕按表所示关系作判断.2。配对资料的比较 在医学研究中,常用配对设计.配对设计主要有四种情况:同一 受试对象处理前后的数据;同一受试对象两个部位的数据;同一样品用两种方法(仪器 等)检脸的结果;配对的两个受试对象分别接受两种处理后的数据情况的目的是推断其 处理有无作用;情况、的目的是推斷两种处理(方法等)的结果有无差别。d-0 d尸对子数一1:如处理前后或两法无差别,則其差数d的总体均数应为0,可看作样本均 数2和总休均数0的比较。7为差数的均

10、数:S/为差数均数的标准误,Sd为差数的标准差; n为对子数。因计算的统计童是t,按表所示关系作判断。3. 完全随机设计的两样本均数的比较 亦称成纽比较。目的是推斷两样本各自代表的总 体均数U 1与U 2是否相等根据样本含量n的大小,分u检验与t检验。t检验用于两样本含量m、巾较小吋,且要求两总体方差相等,即方差齐。若被检验的 两样本方差相差显著则需用廿检脸。u检验:两样本量足够大,n50。S:(n -1) + S;(n】1)I” +n2 2(rnT ) + (门2-1)二m+ri22式中5,为两样本均数之差的标准误,Sc,为合并估计方差(combined estimate variance)

11、 算得的统计量为t,按表所示关系做出判斷。4. I型错误和II型错误 弃真,拒绝正确的H。为I型错误a表示,若显箸性水平a定为 0. 05,则犯I型緒误的槪率0。05;接受错误的H。为II型错误,概率用0表示,0值的大小 很难确切估计。当样本含量一定时,两者反比,增大n,当a定时,可减少0 o 1-0称为 检验效能或把握度,其统计意义是若两总体确有差别,按a水准能检出其差别的能力。客观实际拒绝H。不拒绝H。Ho成立I型错误(a )推斷正确1-a&不成立推断正确(10)II型错误(0)5o假设检脸注意事项 保证纽间可比性:根据研究目的、资料类型和设计类型选用适 当的检脸方法,熟悉各种检验

12、方法的应用条件;“显著与否”是统计学术语,为“有无统计学 意不能理解为“差别是不是大”;结论不能绝对化。第四节分类变量资料的统计描述(一般考点)相对数是两个有关联事物数据之比。常用的相对数指标有构成比、率、相对比等.一、构成比表示事物内部各个组成部分所占的比重,通常以100为例基数,故又称为百分比。其公式 如下:构成比=事物内部某-构成部分的个体数"昭事物内部各构成部分的个体数总和该式可用符号表达如下:A构成比=X100%A + B + C +构成比有两个特点:(1)各构成部分的相对数之和为100%.(2)菜一部分所占比重增大,其他部分会相应地减少.二、率用以说明某种现象发生的频率或

13、賤厦,故又称频率指标,以100, 1000, 10000或100000 为比例基数(K)均可,原则上以结果至少保留一位整数为宜,其计算公式为:率和构成比不同之处:率的大小仅取决于某种现象的发生数和可能发生该现象的总数, 不受其他指标的影响,并且各率之和一般不为1。率_某现象实际发生例数v可能发生某现象的总数该式亦可用符号表达如下阳性率=鼻XK (若算阴性率則分子为 2)A G)+ A(-)式中A 为阳性人数.A 一为阴性人数。三、相对比表示有关事物指标之对比,常以百分数和倍数表示.其公式为:相对比:甲指标/乙指标(或X100%)或用符号表示为:A/BXK四、注意爭项构成比和率的不同,不能以比代

14、率:计算相对数时,观察例数不宜过小;率的比较 注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消除:观察单位 不同的几个率的平均率不等于几个率的算术均数;样本率或构成比的比较应做假设检验.第五节分类变量资料的统计推断(非常重要)一、率的抽样误差用抽样方法进行研究时,必然存在抽样误差.率的抽样误差大小可用率的标准误来表示, 计算公式如下:式中:5为率的标准误,n为总体阳性率,n为样本含量因为实际工作中很难知道总 体阳性率口,故一般釆用样本率P来代替,而上式就变为二、总体率的可信区间由于样本率与总体率之间存在着抽样误差,所以也需根据样本率来推算总体率所在的范 国,根据样本含量n和样

15、本率P的大小不同,分别釆用下列两种方法:(-)正态近似法(常考!)当样本含董n足够大,且样本率P和(1P)均不太小,如nP或n(1P)均M5时,样 本率的分布近似正态分布。则总体率的可信区间可由下列公式估计:总体率(TT)的95%可信区间:p±1. 96sp总体率(TT)的99%可信区间:P±2.58sp(二)查表法 当样本含量n较小,如nW50.特别是P接近0或1吋,則按二项分布 原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n和阳性数x参照专用统计 学介绍的二项分布中95%可信限表。三、U检脸(非常重要!)当样本含童n足够大,且样本率P和(1P)均不太小,如n

16、P或n(1-P)均M5吋,样本 率的分布近似正态分布。样本率和总体率之间、两个样本率之间差异的判斷可用U检验.1o样本率和总体率的比较公式U二I Pn |/0p二IPn | / 丁兀(1一兀)加;2. 两样本率比较公式 u=|P-P2 I /SpP2= I PlP2|/Ja(1 ")(1/+I/“2)也可用X?检验两者相等.四、X?检验(非常重要!)可用于两个及两个以上率或构成比的比较:两分类变量相关关系分析。其数据构成,一 定是相互对立的两组数据.四格表资料自由慶#永远=1。四格表X,检验各种公式适用条件,0> 40且每个格子T5,可用基本公式或专用公式, 不用校正。基本公式

17、:X2=Z (AT) 2/T专用公式:X (ad-bc) 2n/ (a+b) (c+d) (a+c) (b+d)只要有一个格子T在15之间,需校正。校正公式:基本公式:X-Z( I AT | 一0。5) 7T专用公式:X 2=( I ad c I n/2) 2n/ (a+b) (c+d) (a+c) (b+d)n <40或TC.用确切概率法.五、行X列表x彳检验当行数或列数超过2时,称为行X列表。行X列表x'检验是对多个样本率(或构成比) 的检验.适用条件:一般认为行X列表中不宜有1/5以上格子的理论数小于5,或有小于1的理 论数。1.当理论数太小可釆取下列方法处理 增加样本含量

18、以增大理论数;删去上述理论 数太小的行和列;将太小理论数所在组与性质相近的纽合并,使重新计算的理论数增大。 由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推斷结论,故 不宜作常规方法.另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资 料合并。20如检脸结果拒绝检验假设,只能认为乞总体率或总体构成比之间总的来说有差别, 但不能说明它们彼此之间都有差别,或菜两者间有差别。3. 关于单向有序行列表的统计处理 在比较各处理组的效应有无差别时,宜用秩和检验 法,如作X?检验只说明各处理组的效应在构成比上有无差异.六、配对计数许料的X 2检验同一样品用两种方法处理,

19、观察阳性和阴性个数。判断两种处理方法是否相同.当b+c 40 时.x2= (bc) 7b+c: b+c<40 时,校正公式:x-( I bc I T) 7b+c第六节直线相关和回归(一般考点)一、直线相关分析的用途、相关系数及其意艾相关分析是研究事物或现象之间有无关系、关系的方向和密切程度。相关系数:是定量表示两个变董(X, Y)之间线性关系的方向和密切程度的指标,用r 表示,Ixy/lxxlxy,其值在T至+1间.r没有单位。r呈正值,两变量间呈正相关,即 两者的变化趋势是同向的,r=1时为完全正相关:如r呈负值,两变莹呈负相关,即两者的 变化趋步是反向的,r=-1时为完全负相关。r的

20、绝对值越接近1,两变董间线性相关越密切; 越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。二、直线回归分析的作用、回归系数及其意艾直线回归分析的任务在于找出两个变量有依存关系的直线方程,以确定一条最接近于各 实测点的直线,使各实测点与该线的纵向距离的平方和为置小.这个方程称为直线回归方程, 据此方程描绘的直线就是回归直线。直线同归方程式的一般表达式Y二a+bX式中a为回归直线在Y轴上的截距,即a>0表示直线与Y轴的交点在原点上方.0在 原点下方,a=0过原点。b为样本回归系数,即回归直线的斜率,表示当X变动一个单位吋,Y平均变动b个单 位。b>0:表示Y随X增大而增大b<0:表示Y随X增大而减少b二0:表示Y不随X变化而变化第七节统计表和统计图(重要考点)一、统计表原则:结构简单、层次分明.内容安排合理、重点究出、数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论