




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品文档卫生统计学第一章 绪论1、 卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫 生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及 其相关领域研究中不可缺少的分析问题。2、 卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、 卫生统计学的几个基本概念(P4):同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。变异:同质个体的某项特征或属性的观察值或测量值之间的差异。总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。样本:从总体中随机抽取的具有代表性的部分观察单位的集
2、合。样本中包含的观察单位个数成为样本含量。参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数以、总体率九等。统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数一x 、样本率叫。变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。可细分为:计数资料;等级资料第二章调查研究设计 1、调查研究的特点(P7):不能人为施加干预措施;不能随机分组;很难控制干扰因素;
3、一般不能下因果结论2、常用抽样方法(名称、原理):单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取 n (样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n (样本大小)个部分,每一部分内含 m个观察单位;然 后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔 m机 械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样 本。分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,
4、层间变异较大,然后分别从每一 层内随机抽取一定数量的观察单位结合起来组成样本。整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。第三章实验设计 1、实验设计的特点(注意与调查研究的特点的区别):研究者可人为设置处理因素;受试对象接受何种处理因素或处理因素的何种水平是随机的。 2、实验设计的三要素、四原则:基本要素:处理因素受试对象 实验效应基本原则:对照原则随机原则重复原则均衡原则4、实验设计的基本步骤: 明确实验目的;确定研究对象;确定可比的实验组和对照组;确定把受试对象分配到各处理组中的原则;确定样本含量;确定方法和指标;偏
5、倚及其控制5、常用的实验设计方案:主要掌握完全随机设计和配对设计。第四章 定量资料的统计描述 1、频数表的编制:求极差确定组数和组距(一般815组)确定组段(上限=下限+组距)归组计数,整理成表 2、频数表的用途:揭示资料的频数分布特征和频数分布类型频数分布的特征:集中趋势和离散趋势 ;频数分布的类型: 对称分布和偏态分布(高峰位置偏向数值小的一侧正/右偏态分布;高峰位置偏向数值大的一侧 负 /左偏态分布)便于发现某些特大或特小的可疑值便于进一步计算指标和统计处理3、连续型的定量资料,其频数图中各长方形是相连的,又称直方图;离散型的 定量资料,其频数图是非连续的,其频数图中各长方形是又间隔的,
6、称直条 图。4、定量资料集中趋势的描述,常用平均数一一表达一组同质定量数据的平均水 平或集中位置。(结合书本的例题加深理解)算术均数:适用于对称分布特别是正态分布资料; 几何均数:适用于对数正态分布 等比级数资料;观察值中不能有 0 中位数:是一种位置平均数,适用于偏态分布资料、一端或两端无确切值、总体分布不明的资料;百分位数:一组数据某一百分位置的水平;确定非正态分布资料的医学 参考值范围0平均数意义应用场合O平均数量水平对称分布,尤其正态分布几何均数平均增减倍数等比、对数正态分布中位数位次居中的观察值水平偏态、分布不明确、分布末端无确定值5、离散趋势是频数分布的另一特征,反映了观察值之间的
7、变异情况。离散趋势指标意义应用.四分位数间距方差和标准差反映一组数据的变异范围反映全部观察值居中一半的范围反映全部观察值之间的变异程度资料不限资料不限适用于对称分布,尤正态 6、正态分布的特征: 正态曲线在横轴上方均数处最高;并以均数为中心,左右对称;两端与 横轴永不相交,呈钟形的曲线。正态分布有两个参数,即位置参数 N和形状参数CT ;(T固定不变时,11越大,曲线沿横轴越向右移动;N固定不变时,越大,曲线越平阔。正态曲线下面积的分布有一定的规律:正态曲线与横轴之间的面积包等于 1或100%对称分布,对称轴两侧的面积各为 50%;在(* 口)区间的面积为68.27 %;在(以-1.96,+1
8、.96(t)区间的面积为 95.00 %;在(以-2.58,+2.58(t)区间的面积为 99.00 %7、医学参考值范围:正态分布法:适用于正态或近似正态分布的资料双侧界值:一x -单侧界值:一xz /2S z Sx - z S常用z值表%单侧800.8421.282901.2821.645 95 1.645 1.960992.3262.576百分位数法:偏态分布资料以及资料中一端或两端无确切数值双侧界值:P2.5P97.5单侧界值:上界为:P95下界为:P5第五章 定性资料的统计描述1、常用相对数:率是指某现象实际发生数与可能发生某现象总数之比,用以说明某现象 发生的频率或强度。常以百分率
9、,千分率,万分率,十万分率等表示。构成比是事物内部某一观察单位数 与事物内部各组成部分 观察单位的总 数之比,说明事物内部各部分所占的比重。常以百分数表示。相对比是两个有关的指标之比,用以描述两者的对比水平。两个指标可 以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。 2、应用相对数注意的事项:计算相对数分母不宜过小; 不能以构成比代替率。率反映事物发生的频率,构成比表示事物内部各 组分所占的比重,二者性质不同。各个组成部分的构成比之和应为 100%事物内部各组成部分之间呈此消彼长的关系;计算合计率时,不能简单地相加求平均; 率的比较时应注意可比性。3、标准化法是在一个指定的标准构成
10、条件下进行率的对比的方法。意义:用统 一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响。标准化法的基本思想:确定一个标准的人口年龄构成,男、女人口都按该标 准的人口年龄构成,计算年龄别发病情况,最后计算出男、女的合计发病 率。4、应用标准化法应注意的问题:标准化率便于比较,但不能反映实际水平; 比较几个标准化率时,应在采用同一标准标化的情况下进行;若各组间的率出现明显交叉时,不宜采用标准化法比较,可直接比较各组的 率;两样本标化率的比较应作假设检验。第六章总体均数和总体率的估计1、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可 避免、可以控制。表现:样本统计量
11、与总体参数之间的差异样本统计量之间 的差异。产生原因:个体变异+抽样。2、标准误:样本统计量的标准差称为标准误;样本均数的标准差称为均数的标 准误。均数的标准误表示样本均数的变异度 :a一 、, 一,、,, X =总体标准差未知时,用样本标准差代替:.nSSX 二 3、标准差与标准误的区别:n标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明 抽样误差的大小。标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标 准误用于总体均数的区间估计和假设检验。4、t分布的特征:以0为中心,左右对称;自由度v越小,t值越分散,曲线越平阔,尾部越高;当V趋于8时,t分布逼近标准正态分布;t
12、分布曲线下面积为1.5、从界值表可看出:(1)自由度v相同时,t界值越大其对应的P值越小(2)概率P (或尾部面积)相等时,v越大,t界值越小(3) t值相等时,双侧概率为单侧概率的两倍(4) v = 8时,t界值即为z界值6、总体均数可信区间的计算:z分布法:当b已知, x-服从标湎帧黄布总体均数的双弁_二- n _'可信区间为:乂一乙2,x, x zj。未知但n足够大(n>50)t分布法:当(T未知n较小x - z: 2SX , xZ2SXx 北 2,§, x t: 2S7、常用单双侧u值a单侧0.101.2821.6450.051.6451.9600.022.05
13、42.3260.012.3262.5788、可信区间的涵义:从总体中作随机抽样,每个样本可以算得一个可信区间。如95%T信区间意味着做100次抽样,算得100个可信区间,平均有95个 估计正确。可信区间的两个要素:一是准确度:反映在可信度的大小二是精密度:反映在区间的长度第七章假设检验 1、假设检验的基本思想:应用反证法和小概率原理,先对总体的参数或分 布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此 假设应当拒绝或不拒绝。 2、假设检验的基本步骤:建立检验假设,确定检验水准选定检验方法和计算检验统计量确定P值,作出推断结论 3、I型错误与II型错误:I型错误:拒绝了实际上成立的
14、,犯“弃真”的错误。其概率大小用。表示,豆可取单侧亦可取双侧。R型错误:不拒绝了实际上不成立的 H0,犯“存伪”的错误。其概率大 小用B表示。P只取单侧,其大小一般未知,只有在已知两总 体差A二及n时,才能估算出来。实际情况-拒绝H0不拒绝H0成立第一类错误(a )结论正确(1- a )不成立结论正确(1- B )第二类错误(B )推断结论与两类错误注:当样本含量固定时,a增大,B减小;反之亦然。若欲同时减小a与B ,则只有增加样本含量。若重点减小I型错误,a可取小一些,如a =0.01 ;若重点减小II型错误,a可取大一些,如a =0.1或a =0.2 4、检验效能:若两总体确有差别,按照
15、a水准能够发现这种差别的能力。它的大小用(1- B )表示。检验效能的影响因素:容许误差6、总体标准差 6、I型错误a、样本含量n 5、假设检验应注意的事项:应有严密的研究设计:总体中的每个研究个体应具有同质性、样本的获 取必须遵循随机化原则、比较的组间应具有可比性。 正确理解a水准和P值的意义:a是人为预先设定的一个概率值,可有 多个;P是彳BH成立,得到实际观测数据的可能性的大小,一个样本按某一方法必能得出一个。正确理解结论的统计学意义 。假设检验的结论不能绝对化。第八章 t检验 1、t检验的适用条件:(T未知;n较小(n<60);样本来自正态总体;两样本所来自的总体方差齐,即埠=J
16、2、配对设计主要情况:(看书本例题)配对的两个受试对象分别接受两种处理同一样品用两种不同方法测量同一指标,或接受不同处理同一受试对象处理前后的结果进比较同一对象的两个部位给予不同的处理步骤:建立检验假设,确定检验水准(差值的总体均数)H。0$ 匕,0 = 0.05计算检验统计量确定P值,作出统计推断v =中女-0 飞/ n3、两样本均数的比较:(看书本例题)步骤:建立检验假设,确定检验水准H 0 : % =匕 H:i 以 1 -匕计算检验统计量t =Xi - X2=0.05v= n1 + n2 - 2§,:,:)确定P值,作出统计推断两独立样本资料的t检验,又称成组t检验,适用于完全
17、随机设计的两 样本均数的比较。第九章方差分析1、方差分析的基本思想:根据资料的设计类型(即变异的不同来源),将全部 观察值之间的变异(总变异)分解为两个或多个部分,除随机误差外其余每 个部分的变异都可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,以了解某因素对观察指标是否有影响或某因 素是否有效应。 2、方差分析的应用条件:各样本须是相互独立的随机样本(独立性)各样本来自正态分布总体(正态性)各总体方差相等(方差齐性)3、完全随机设计:又称成组设计。在实验研究中,按 随机化原则将受试对象随 机分配到某一研究因素的多个水平中去,然后观察实验效应;在调查研究 中,按
18、一个研究因素的不同水平分组,比较各组的效应。目的都是推断不同 水平下各组均数之间的差别是否有统计学意义。注:方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与t检验等价,即F = t 2。4、随机区组设计:又称配伍组设计,是配对设计的扩展。其设计方法是将全部 受试对象按某种或某些特征分为若干个区组,使每个区组内研究对象的特征尽可能接近,然后分别使每个区组内的观察对象随机地接受研究因素某一水 平的处理。随机区组设计的方差分析:总变异 =处理组问变异+区组间变异+误差;和完全随机设计的方差分析相比,误差减小了,检验效率提高了。5、多个样本均数的两两比较:SNKq检验,适
19、用于探索性研究,对任意两个样本均数都进行检验。LSD-t检验,最小显著性差异检验,适用于某一对或某几对在专业上有 特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理 组间的比较,一般在设计阶段确定哪些均数需进行多重比较。第十章 片检验 1、片检验主要用途:推断两个或两个以上总体率(或构成比)之间有无差别两变量间有无相关关系(有无关联)检验频数分布的拟合优度2、2X2表的卡方检验(会列表)完全随机设计力检验的注意事项:当n>40且所有T之5时:2基本公式为K (AT),一Tc专用公为为:(ad -bc) n兄 =n之40但有1分<5时:(a b)(c d)(a c)(b
20、 d)校正的基本公式为2(|A-T| -0.5)2一T2校正的基本公式为:_(| ad - bc | - n/ 2) n当n<40或T<1时,采用四格表确切概率(a+ b)(C * d)(a * C)(b + d)配对四格表资料?2检验的计算公式:当 b+c> 40 时:方计算公式为2 _(b-c)2 b c当 b+c<40 :校正2 2计算公式为炉=(| b-c| T)23、行x列(RX C)表资料的好检验:注意事项:允许有不超过1/5的基本格子理论频数大于1小于5,但 不能有理论频数小于1;如果有1/5以上格子的理论频数大于1小于5,或有1个格子的理论 频数小于1,
21、可采用以下处理方法:增加样本含量,可以增大理论频数;将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并;删去理论频数太小的格子所对应的行或列。第十一章非参数检验 1、参数检验与非参数检验的区别:参数检验:已知总体分布类型,对未知参数(小,冗)进行统计推断;依 赖于特定分布类型,比较的是参数。非参数检验:不依赖总体分布类型,不针对总体参数;不受总体参数影响,比较分布或分布位置 。2、非参数检验的检验效率没有参数检验高,犯第二类错误的概率B较大。3、非参数检验应用范围:总体分布形式未知或分布类型不明;偏态分布的资料;等级资料:不能精确测定,只能以严重程度优劣等级、次序先后等表示不满足参数
22、检验条件资料:各组方差明显不齐;数据的一端或两端是不确定数值,如“ >50mgj o4、Wilcoxon符号秩和检验:编秩:按照差值的绝对值从小到大编秩差值为0者不参加编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相反时取平均秩次5、两样本比较的秩和检验:编秩原则:将两组数据混合起来从小到大统一编秩数值相等且组别相同时顺次编秩数值相等但组别不同时取平均秩次第十二章双变量关联性分析 1、直线相关,又称简单相关,是用来描述具有直线关系的两变量X、y的相互关系的统计方法。要求两变量均来自于双变量正态总体的随机变量。相关系数r没有单位,取值介于-1与1之间。r>0,表示正相关;r<
23、;0,表示负 相关;r=0 ,表小零相关。I r I >0.7时,两变量有高度相关关系;0.4 < I r I <0.7时,两变量有中度相关关系;I r I <0.4时,两变量有低度相关关系;I r I =1表示完全相关;I r I =0表示无直线相关,但不一定没有关联性。 2、等级相关应用范围:(1)不服从双变量正态分布的资料(2)总体分布类型未知的资料(3)等级资料第十三章直线回归分析 1、直线回归(注意与直线相关的区别):又称简单回归,用于研究一个变 量随另一个变量变化而变化的依存关系(回归关系),从而预测或控制未知变 量的一种统计分析方法,通过拟合线性方程来描述
24、两变量间的回归关系。应用条件:要求因变量 Y呈正态分布;自变量X是可以精确测量和控制的变 量。 2、直线回归方程式:Y?=0+bX b为样本回归系数(直线的斜率)其统计学意义是X每增加/减小1个单 位,Y平均改变b个单位。b=0, x与y之间没有直线关系。 3、最小二乘法原理:各实测点至回归直线的纵向距离的平方和最小。4、Sy.x为剩余标准差,表示应变量y在扣除自变量x的线性影响后的离散程 度,反映实际观察值在回归直线周围的分散状况。5、对同一资料,相关系数t检验与回归系数t检验结果相同,t r=t b;同一资料,有t= . F 6、直线回归与相关区别与联系:区别资料要求不同:回归要求因变量y
25、服从正态分布;x是可以精确测量和严格控制的变 量;相关要求x和y均呈正态分布。变量地位不同:回归的变量y称为因变量,处在被解释的地位,x称为自变量,用于预测 因变量的变化;相关中变量x变量y处于平等的地位,彼此相关关系 。用途不同:说明两变量间依存变化的数量关系用回归;说明变量间的相关关系用相关 。联系:r与b的方向一致;r与b的假设检验等价;r与b可相互换算;用回归解释相关。第十四章 生存分析 1、生存资料的特点:蕴涵有结局和时间两个方面的信息:结局为两分类互斥事件;一般是通过随访收集得到、随访观察往往是从某统一时间点开始,观察到某规定时间点截止;常因失迹等原因造成某些研究对象的生存时间数据
26、不完整,分布类型复 杂,不能简单地套用前面介绍过的统计方法,如 t检验、方差分析、检验、四 格表资料确切概率法或秩和检验进行分析。 2、生存分析中的几个基本概念:死亡事件又称失效事件,不单是指通常意义下的生物体死亡,而是泛指标志 某种处理措施失败或失效的特征事件。生存时间:指观察到的存活时间,不单是指通常意义下生物体的存活时间, 而是泛指研究者所关心的某现象的持续时间。(广义概念)生存时间根据其特点,可分为以下两种类型:完全数据:指从观察起点到发生死亡事件所经历的时间;截尾数据:从起点至截尾点所经历的时间,观察过程的截止不是由于死亡事 件,而是由于其他原因引起的,称为截尾(censored),
27、常用t +表示。截尾原因:失访、退出(死于其它原因)、终止(观察结束时病人尚存活)死亡概率:指在某单位时段开始时存活的个体在该时段内死亡的可能性大 小,记为q。生存概率:表示在某单位时段开始时存活的个体到该时段结束时仍存活的可 能性大小,记为p。 生存率:记为§(tQ,指观察对象活过tk时刻的概率。第十六章 Meta分析1、Meta分析的概念:Meta分析是对具有共同研究目的的多个研究进行综合分 析的一系列过程。2、Meta分析的目的:提高检验效能、解决若干单个研究结论不一致问题、改善效应量的估计、提出新的研究问题和研究方向3、Meta分析的基本方法:固定效应模型,统计方法有Mentel-Haenszel法、Peto法和General Variance-based 法;随机效应模型,方法有 Dersi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电箱火灾应急预案(3篇)
- 煤磨夜间火灾爆炸应急预案(3篇)
- 中心实验室火灾应急预案(3篇)
- 麦田火灾应急预案方案(3篇)
- 生物安定协议书
- 餐厅火灾事件应急预案(3篇)
- 希腊签署移民协议书
- 瓦工结算协议书
- 工厂超市合作协议书
- 小学违纪学生协议书
- 2025展览馆装饰工程合同范本
- 《科普技巧常识》课件
- 2025年中国全电脑横机市场现状分析及前景预测报告
- 2019-2025年房地产经纪协理之房地产经纪操作实务过关检测试卷B卷附答案
- 2025年全国保密教育线上培训考试试题库及答案(夺冠)带答案详解
- MOOC 跨文化交际通识通论-扬州大学 中国大学慕课答案
- 国际金融(南开大学)智慧树知到答案章节测试2023年
- 询价小组签到表
- 电气设备调试定额
- 储能技术-储能材料-新能源材料-锂电池储能(PPT100页)
- 商品销售明细单(样本)
评论
0/150
提交评论