医学统计学复习资料_第1页
医学统计学复习资料_第2页
医学统计学复习资料_第3页
医学统计学复习资料_第4页
医学统计学复习资料_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理 和分析的应用科学。个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单 位。总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。分为 有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间 和空间范围的限制)。反映总体特征的指标为参数,常用小写希腊字母表示。样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。(抽样,随机化 原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。抽样研究:从总体中随机抽取样本,根据样本信

2、息推断总体特征的方法。抽样误差 是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标 之间的差异。其根源在于总体中的个体存在变异性。只要是抽样研究,就一定存在抽样 误差,不能用样本的指标直接下结论。统计分析主要是针对抽样误差而言。变量(一个个体的任意“特征”);资料(变量值的集合),资料类型|:计量资料/ 定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离 散型两类;计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容 的属性或类别,一般无度量衡单位,可分为二分类和多分类;等级资料/半定量资料/ 有序分类变量资料:表现为等级大小或

3、属性程度。各类资料间可相互转化。可选分析 方法有:t检验、方差分析、相关回归分析等;可选分析方法有:X2检验、z检验等; 可选分析方法有:秩和检验、Ridit分析等。误差:实测值与真实值之差。可分为随机误差(随机测量误差+抽样误差)与非随机 误差(系统误差与非系统误差)。随机误差:是一类不恒定、随机变化的误差,由多 种尚无法控制的因素引起,它是不可避免的;系统误差:是实验过程中产生的误差, 它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的, 它是可以消除或控制的;非系统误差:又称过失误差,是指在实验过程中由于研究者 偶然失误而造成的误差,可以消除。概率(P):描述随机

4、事件发生可能性大小的值,其取值为0WPW1。其中,P=1为必 然事件,P=0为不可能事件,0P60:X土u /2 。乂或Xu /2 。*总体均数的区间估计,也可间接进行假设检验含义计算公 式用途样本量 作用样本量越大,可信区间越小参考值范围“正常人”的解剖、生理、 生化某项指标的波动范 围个体值的波动范围 正态分布:X土气 vS* 偏态分布:PP100 X绝大多数(如95%)观察 对象某项指标的分布范 围样本量越大,参考值范围 越稳定8.间接判断要解决的问题(H1)是否成立,然后在H。成立的条件下计算检验统计量,最后 获得P值来判断。|基本思想:小概率思想:小概率事件在一次试验中认为基本上不发

5、 生,其概率是相对的,在进行统计分析时要事先规定,即检验水准。反证法思想: 首先提出一个假设,用适当的统计方法确定当假设成立时,获得现在样本的概率大小, 如果是小概率事件,则推断假设是假的,拒绝它;如果不是小概率事件,则不能认为假 设是假的,不能拒绝它。假设检验的基本步骤:1)建立检验假设,确定检验水准:u = u :即检验假设, 常称无效假设或零/原假设,用H表示;u尹u :即备择假设,常称对立假设,用H 表示;a:即检验水准,也称显著性水准,属于I型错误的范畴,是预先规定的概率 值,确定了小概率事件的标准。2)计算检验统计量:根据变量或资料类型、设计方案、 统计推断的目的、方法的适用条件等

6、选择检验统计量,所有检验统计量都是在H成立的 前提条件下计算出来的。3)确定P值,做出推断结论:P的:是指从H规定的总体随机 抽样,抽得等于及大于或(和)等于及小于现有样本获得的检验统计量值(如t、u等) 的概率。(当样本含量n较大时,t值近似和u值相等,有人将其称为u检验或Z检验, 实际是t检验的特例。)对于检验假设须注意|:检验假设是针对总体而言,而不是针 对样本;H和H是相互联系、对立的假设;H为无效假设,其假定通常是:某两个 总体参数相等,或某两个总体参数之差等于0,或无效,或某一资料服从某一特定分 布;H的内容直接反映了检验的单双侧。t检1验(方差相等):单样本t检验:即已知样本均数

7、与已知总体均数的比较,要求样本取自正态总体(样本均数与已知总体均数不等,原因有二: 出非同一总体即 u尹u ; b.虽为同一总体即u = u,但有抽样误差)。配对样本t检验:简称配对t 检验,也称成对t检验,适用于配对设计的计量资料,要求差值服从正态分布。(配对 设计是将受试对象按照某些重要特征配成对子,每对中的两个受试对象随机分配到两处 理组。主要有以下情形:a.两同质受试对象配成对子分别接受两种不同的处理;b.同一 受试对象分别接受两种不同处理;c.同一受试对象接受一种处理前后。)两样本t检 验:又称成组t检验,适用于完全随机设计两样本均数的比较,要求样本来自正态总体, 且两总体方差齐性。

8、当两样本含量较小,且均来自正态总体时,要根据两总体方差是否 不同而采用不同检验方法。t检验(方差不等):Cochran&Cox近似t检验一一对临 界值校正;Satterthwaite近似t检验对自由度校正;Welch近似t检验对自由度校正。I型错误:拒绝了实际上成立的H,即“弃真”,其概率大小用a表示,检验水准 就是预先规定的允许犯I型错误概率的最大值,a可取单尾也可取双尾。II型错误:“接 受” 了实际上不成立的H,即“取伪”,其概率用B表示,B只取单尾。把握度:又称 检验效能,是指1 -B。其意义是当两总体确有差异,按规定检验水准a所能发现该差 异的能力。假设检验应注意的问题:1)要有严密

9、的研究设计一一假设检验前提。2)不同类型 的资料应选用不同检验方法。3)正确理解“显著性”一词的含义,一般假设检验结果 并不指差异的大小,只能反映两者是否有差异,采用“有无统计学意义”表达。4)因 结论具有概率性质,故结论不能绝对化,报告结论时最好列出检验统计量的值,尽量写 出具体的P值或P值的确切范围。5)统计“显著性”与医学/临床/生物学“显著性”: 若统计结论和专业结论一致,则最终结论就和这两者一致;若统计结论和专业结论不一 致,则最终结论需根据实际情况。当统计结论有意义,而专业结论无意义时,可能是由 于样本含量过大或设计存在问题,那么结论最终无意义。当统计结论无意义,而专业结 论有意义

10、,则应当检查设计是否合理、样本含量是否足够。6)可信区间与假设检验的 区别和联系:可信区间用于说明量的大小即判断总体均数的范围,而假设检验用于推 断质的不同即判断两总体均数是否不等;可信区间可回答假设检验的问题,算得的可 信区间若包含了 H,则按a水准不拒绝H;若不包含H,则按a水准拒绝H接受H。 可信区间不但成回答差别是否具有统计学意义,而且能比假设检验提供更多0的信息1, 即提示差别有无实际的专业意义。可信区间只能在预先规定的概率一一检验水准a 的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。验证一个假设时, 可选择假设检验,而只是对总体参数做一个估计时,可选用区间估计,两者结

11、合可对问 题进行更全面的说明。正态性检验:图示法:概率图(P-P图)和分位数图(Q-Q图);计算法:a.对 峰度和偏度各用一个指标来评定,以矩法效率最高。网旨分布不对称的程度和方向, 样本偏度系数g1,总体偏度系数r1。(r1=0对称,r10正偏态,r10尖峭峰,r0平阔峰)b.仅用一个指标来综合评定。两样本方差比较的F1检验:即方差齐性检验,目的是判断两样本所代表的两总体方 差是否不等,资料要求服从正态分布。若方差齐,采用一般的t检验;若方差不齐,则 米用近似t检验。变量变换:是将原始数据作某种函数转换,如转换为对数值等。它可使各组方差齐 同、稳定,亦可使偏态资料正态化,以满足t检验或其它统

12、计分析方法对资料的要求。 方法:对数变换:适用于a.对数正态分布资料,即原始数据的效应是相乘时;b.各样 本标准差与均数成比例或变异系数是常数或接近某一常数的资料。平方根变换:即将 原始数据开算术平方根。平方根反正弦变换。倒数变换。第4章 多个样本均数比较的方差分析方差分析:由fisher首创,又称F检验。(F分布有两个参数:两个自由度)基本思 想:根据试验设计的类型,将全部观测值总的离均差平方和及其自由度分解为两个或多 个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交 互作用)加以解释,如组间变异SS、可由处理因素的作用加以解释。方差分析是综合 的F检验。实验数据

13、有三个不同的变异:总变异:全部观测值大小不同,这种变异称 为总变异,其大小可以用离均差平方和表示SS疽组间变异:各处理组由于接受处理 的水平不同,各组的样本均数也大小不等,这种变异称为组间变异,记为SS.;组 内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但观测值仍各不相同, 这程度异称为组平变和和误差度有记为各嚣分离均差平组方和除以相应的自矗E:组其比值 称为均方差,简称均方(MS)。应用条件:各样本是相互独立的随机样本;均来自 正态分布总体;相互比较的各样本的总体方差相等,即具有方差齐性。完全随机设计资料的方差分析:完全随机设计是采用完全随机化的分组方法,将全 部试验对象分配到g

14、个处理组(水平组),各组分别接受不同的处理,实验结束后比较 各组均数间的差别有无统计学意义,推论处理因素的效应。变异分解:SS =SS +SS,V =V +V 。分析步骤:略。总 组间 组随机区组设计资料的方差分析:随机区组设计又称配伍组设计,是配对设计的扩展, 先按影响试验结果的非处理因素将受试对象配成区组,再分别将各区组的受试对象随机 分配到各处理组或对照组。随机分配的次数要重复多次,每次随机分配都对同一个区组 内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。区组内各试验对象 具有较大的差异为好,利用区组控制非处理因素的影响,并在方差分析时将区组间的变 异从组内变异中分解出来。

15、误差比完全随机设计小,试验效率高。变异分解:SS广SS处时方设计资料的方差理分析:组拉丁误方设计是在随机区组设计的基础上发展的,实验 涉及一个处理因素和两个控制因素,将两个控制因素分别安排在拉丁方设计的行和列 上,每个因素的类别数或水平数相等,增加了均衡性,减少了误差,提高了效率。变异 分解:SS广SS卜+SSJSS +SS,V广V卜+v +v +v。分析步骤:略。两阶段交叉替计资料的方差分析:二阶段麦叉设行计是列A、B误两种处理先后以同等的机 会出现在两个试验阶段中,不仅平衡了处理顺序的影响,而且能把处理方法间的差别、 时间先后之间的差别和受试者间的差别分开来分析。但是前一个试验阶段的处理效

16、应不 能持续作用到下一个试验阶段,故在两阶段之间设计洗脱阶段以消除残留效应。多用于 止痛、镇静、降压等药物或治疗方法间疗效的比较。分析方法:SS广SS处理间+SS阶段间+SS 受.者多个样本均数间的多重比较:当方差分析的结果为拒绝H,接受H时,只说明g个 总体均数不全相等。样本均数间的多重比较不能用两样本均数比较的t检验,否则会加 大犯I型错误的概率,即假阳性。LSD-t检验,即最小显著差异检验,适用于一对或 几对在专业上有特殊意义的样本均数之间的比较;Dunnett-t检验,适用于g1个实 验组与一个对照组均数差别的多重比较;SNK-q检验,亦称q检验,适用于多个样本 均数两两之间的全面比较

17、,最常用。多样本方差比较的Bartlett检验和Levene检验:Levene检验法在用于对多总体方 差进行齐性检验时,所分析的资料可不具有正态性。第5章 计数资料的统计描述计数资料的常见数据形式是绝对数,但绝对数不具有可比性,所以需计算相对数, 常用的相对数指标包括比,比例,率。根据研究目的不同,比例又分为强度相对数(率) 和结构相对数(即构成比)。率:说明某现象发生的频率或强度,常用百分率,千分率,万分率等表示。某一分 率改变不影响其他分率变化。构成比:表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来 说明各构成部分在总体中所占的比重或分布。某一部分构成比的改变将影响其他构

18、成比 的变化。相对比:简称比,是两个有关指标之比,说明两指标之间的比例关系。两个指标可 以是绝对数、相对数或平均数。应用相对数的注意事项:结构相对数不能代替强度相对数:构成比用以说明事物 内部某种构成所占比重或分布,并不说明某现象发生的频率或强度计算相对数应有足 够数量,否则会使相对数波动较大正确计算合计率:对分组资料计算合计率或称平均 律时,不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算注 意资料的可比性:a.观察对象是否同质,研究方法是否相同,观察时间是否相等,以及 地区、周围环境、风俗习惯和经济条件是否一致或相近等;b.观察对象内部结构是否相 同;对比不同时期资料应客

19、观条件是否相同;样本率(或构成比)的抽样误差:不 能仅凭数字表面相差大小下结论,而应进行样本率(或构成比)差别的假设检验。率的标准化法:采用某影响因素的统一标准构成以消除构成不同对合计率的影响, 使通过标准化后的标准化合计率具有可比性。标准化法只适用于某因素两组内部构成不 同,并有可能影响总率比较的情况(两个率不具有可比性)。标准化率只表示相互比较 的资料间的相对水平,不再反映实际水平;此外标准化率表示样本值,存在抽样误差。 第6章 几种离散型变量的分布及其应用(u分布,t分布和F分布均为连续型分布)率的标准误:即样本率的标准差,可以用来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就

20、越小。二项分布:是指在只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重 复试验中,当每次试验的“阳性”概率n保持不变时,出现“阳性”次数X=0,1,2,n 的一种概率分布。适确件:每个观察单位仅有两个相互对立的结果,如阳性/阴性;每次试验的条件不变,即n固定不变;n个观察单位的结果相互独立。图形:二 项分布为离散型分布;当n=0.5,二项分布图形是对称的,当n尹0.5,图形是偏态的, 随着n增大,图形趋于对称。当n8时,只要n不太靠近0或1,二项分布近似正态 分布。Poisson分布:是二项分布的一种极限情况,可用来分析医学上如人群中癌症等发病 率低的非传染性疾病的发病或患病人数的分布

21、,也可用来研究单位时间内某罕见事件发 生次数的分布。应用条件:每个观察单位仅有两个相互对立的结果,如阳性/阴性; 每次试验的条件不变;n个观察单位的结果相互独立;发生率n很小,n很大(此 时入二nn = O2,为常数)。(适用条件:普通性独立增量性平稳性。)|性质|:总 体均数入与总体方差。2相等;当n很大时,n很小,入二nn为常数;当入一8 (入N20),Poisson分布近似正态分布;可加性。图形:由入决定。入越小,分 布越偏态;入越大,分布趋向正态。u检验:率的比较t检验(样本含量大时适用)。第7章 X2检验X2检验:以X2分布为基础,以X2值为检验统计量的计数资料的假设检验X2分布 为

22、连续型分布,只有一个参数vvW2时曲线呈L型;随着v的增加,曲线趋于对 称;当V 8时,X2分布趋近正态分布。此外X2分布具有可加性。基本思想|:X2值 反映实际频数A与理论频数T的吻合程度。四格表X2检验应用条件:nN40,TN5,用四格表X2检验的基本式或或专用式计 算;nN40且1 WT5,用四格表X2检验的校正公式;n40或T1,用四格表Fisher 确切概率法(不属于X2检验范畴)。行X列表资料的X2检验:多个样本率的比较:RX2表;多个样本构成比的比较: CX2表;双向无序分类资料的关联性检验:RXC表。注意事项:行X列表资料中 各格的理论频数不应小于1,并且1 WT5的格子数不宜

23、超过格子总数的1/5:多样本 率的比较,若统计结果是拒绝H。,接受H1,仅说明个总体率之间总的来说有差别,不能 说明任两个总体之间有差别;对有序的RXC资料不能用X2检验。第8章 秩转化的非参数检验参数检验:总体分布为已知的数学形式,对其总体参数作假设检验的统计推断方法。 非参数检验:又称任意分布检验,是指对总体分布不作严格规定,即在应用中可以不考 虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计 方法。秩转化的非参数检验是先将数值变量资料从小到大,或等级资料从弱到强转换成 秩后,再计算检验统计量,其特点是假设检验的结果对总体分布的形状差别不敏感,只 对总体分布的位

24、置差别敏感。非参数检验的优点:不受总体分布的限制,适用范围广;缺点:适宜用参数检验方 法的资料,如果用非参数检验方法,由于没有充分利用资料提供的信息,就会降低检验 效能,即第II类错误的概率B增大。秩转化的非参数检验适用范围:未经精确测量的资料(包括等级资料);偏态分 布且无法转化为正态分布的资料;分布不清的资料。配对样本比较的Wilcoxon符号秩检验:亦称符号秩和检验,用于配对样本差值的中 位数和0比较;还可用于单个样本中位数和总体中位数的比较。|基本思想:在H。成立的 前提下,配对差值的总体分布是对称的,总体中位数应为0, T与T_应接近n(n+1)/4, 若正、负秩和相差悬殊,则H成立

25、的可能性很小。基本步骤:建立检验假设,确定检0验水准;计算统计量T值:a.求差值d,b.编秩,c.求秩和并确定统计量T值;确 定P值并做出统计推断:可用查表法(小样本)和正态近似法(大样本)求u值,确定 P值(若T值在上、下界值范围内,其P值大于相应概率水平;若丁值恰好等于界值, 其P值等于或近似等于相应概率水平;若丁值在上、下界值范围外,其P值小于相应概 率水平)。|适用资料|:不满足t检验条件的配对设计或单样本的计量资料、等级资料和 其他不能精确测量的资料。两个独立样本比较的Wilcoxon秩和检验:用于推断计量资料或等级资料的两个独立 样本所来自的两个总体分布是否有差别。|基本思想:如果

26、H成立,则两样本来自分布相0同的总体,两样本的平均秩次T/n与T/n应相等或接近,含量n的样本的秩和T应在 ni(N+1)/2的左右变化。若T值偏离此值太远,H。成立的可能性就很小。若偏离出给定 值所确定的范围时,则P0表示Y随X增大而增大,b0表示Y随X增大而减小, b=0表示Y与X无线性依存关系。回归系数是有单位的,不能根据b的大小判断回归关 系的密切程度。回归方程的假设检验:回归方程需要进行假设检验,以推断两个变量间的线性关系 是否存在。方法有:方差分析和t检验,两者是等价的,检验结论相同。回归方程的应用:描述两个变量间的依存关系:经回归系数的假设检验,认为两变量间线性依存关系存在时,可

27、用直线回归方程来描述两变量间依存变化的数量关系。 利用回归方程进行预测:将自变量X的值代入回归方程式,则可得到应变量Y的估计 值Y,即预测值。其意义为当X=X时,应变量Y的样本均数,也是相应总体均数U 的一个点估计。其总体均数U 的 1-a的可信区间为:Y 土tS,S是样本珂数Y的标准误,计算公式为SYlX0,当同时考虑所有X 的可能取值时,可信形成一条中间窄、两端宽的带子,称为回归直线的可信带。其意义为在满足线性回归的条 件下,总体回归直线落在可信带内的概率为(1-a)。而预测值Y的波动范围又称为个 体Y值的容许区间(预测区间),Y 土tS,标准差S =,同样,当同时考虑所有X的可能取值时,

28、容许区间也会形成一条中间窄、两端宽的带子,称为 个体值的预测带,叫回归直线的可信带宽。利用回归方程进行控制:统计控制是利用 回归方程进行逆估计。如要求应变量Y在一定范围内波动,可以通过控制自变量X的取 值来实现。直线相关:又称简单相关,是分析服从正态分布的两个随机变量X和Y有无线性相关关系的一种统计分析方法。直线相关的性质可由散点图直观的说明。相关分析的前提 条件:两个随机变量;散点图呈线性关系;服从双变量正态分布。相关系数:又称Pearson积差相关系数,是用来说明具有直线关系的两变量间相关 的密切程度与相关方向的统计指标。以符号r表示样本相关系数,符号P表示其总体 相关系数。相关系数没有单

29、位,其值为OWrWl, r为正表示正相关,r为1表示完全正 相关;r为负表示负相关,r为-1表示完全负相关;r=0表示零相关,即两变量间没有 直线相关关系。R的绝对值越接近于1,表示两个变量间相关关系的密切程度越高;越 接近于0,则相关关系越不密切。相关系数的假设检验:目的是推断两变量间有无直线相关关系。即使存在直线关系, 仅凭样本计算出的相关系数并不能说明两变量间就有相关关系。从P=0的总体中随机 抽样,由于抽样误差的影响,所得r值也常不等于0。对同一资料,相关系数t检验与 回归系数t检验结果相同,有t=t = F。决定系数:回归平方和与总平方和之比,即R2=SS /SS,R2取值在0到1之

30、间且无 单位,其数值大小反映了回归贡献的相对程度,也就是在丫总的总变异中回归所能解释的 百分比。R2越接近于1,回归效果越好。秩相关:又称等级相关,是用双变量等级数据作直线相关分析,对原变量分布不作 要求,属于非参数统计方法。适用资料:不服从双变量正态分布而不宜作极差相关分 析;总体分布型未知;原始数据时用等级表示。Spearman等级相关系数r是说明 两个变量间直线相关关系的密切程度与相关方向的统计指标,其取值和意义同r。根据 样本资料计算得到的r,也需对其进行假设检验。相关与回归的区别:相关表示相关关系(共变关系),无依存关系,无自变量与 应变量之分,而回归表示依存关系,应变量随自变量的变

31、化而变化;r没有单位,b 有单位:所以相关系数与单位无关,回归系数与单位有关;相关表明两变量间关系 的方向和密切程度,回归则用函数方程表达应变量随自变量变化的数量关系;对资料 的要求不同,相关分析要求两变量均为随机变量,并服从双变量正态分布。回归分析只 要求应变量Y服从正态分布,而自变量X可以是正态分布的随机变量,也可以是人为控 制大小的变量。相关与回归的联系:均表示线性关系;对能计算相关分析的同一组 数据计算出的r和b的符号相同:共变方向一致;同一资料r和b的假设检验等价。直线回归与相关应用的注意事项:根据分析目的选择变量及统计方法,做直线回 归与相关分析要有实际意义,不能把毫无关联的两个事

32、物或现象做相关与回归分析; 进行相关、回归分析前应绘制散点图;用残差图考察数据是否符合模型假设条件; 进行相关与回归分析都必须进行假设检验,以推断两变量间的线性关系是否存在;结 果的解释及正确应用:反映两变量关系密切程度或数量上影响大小的统计量应该是相关 系数或回归系数的绝对值,而不是假设检验的P值,此外回归方程一般只适用于自变量 X的取值范围内,可以内插,不宜外延。曲线拟合:当散点图中应变量与自变量间表现出非线性趋势时,可以曲线拟合方法 来刻画两变量间数量上的依存关系。一般步骤:依据分析目的确定自变量X与应变量Y之后,根据两变量散点图呈现的趋势,结合专业知识及既往经验选择合适的曲线; 选用适

33、当的估计方法求得回归方程;实际工作有时可结合散点图适配几种不同形式的曲线方程并计算其R2, 一般来说R2较大时拟合效果较好。用途:定量刻画Y与X的曲 线关系;用相关指数反映两变量曲线关系的密切程度。第10章统计表与统计图统计表:将研究指标或统计指标及其取值以特定表格的形式列出,以简洁明了、条 理清晰的方式表达数据,便于阅读、比较和计算。意义:展示资料的数据结构、分布特 征和规律,便于在进一步分析中选择和计算统计量。制表原则:重点突出,简单明了; 统计表有主语和宾语,通常主语放在表的左边,作为横标目,宾语放在右边,作为纵 标目。基本要求:标题:概括表的主要内容,包括研究的时间、地点和研究内容,放

34、 在表的上方;标目:分横标目与纵标目,注意标明指标的单位;线条:至少用三条 线(三线表),即顶线、底线和纵标目下与数字的分隔线,部分表格可再用横线将合计 分隔开,其他竖线和斜线一概省去;数字:用阿拉伯数字表示,按小数位对齐,无数 字用“一”表示,确实数字用“”表示,数值为0者记为0,不要留空项;表中数 字区不要插入文字,必须说明者标“*”号,表下方备注说明。种类:简单表:主语 只有一个层次;组合表:主语有两个以上层次;频数分布表;列联表等。注意事 项:一张表一般只包括一个中心内容,不要把过多的内容放在一个庞大的表格里。统计图:用“点、线、面、体”等各种几何图形来形象化地表达和对比数据。意义:

35、将统计数据形象化,易于做分析比较。缺点:一般只能提供概略情况,而不能获得确切 数值,不能完全代替统计表,常需要同时列出统计表作为统计图的数值依据。种类:直 条图、圆图和百分比条图、线图、直方图、散点图和统计地图等,以及箱式图、茎叶图、 误差条图等特殊分析图。制表原则|:根据资料性质和分析目的正确选用适当的统计图;用标题简要说明资料的主要内容、时间和地点。标题位于图下方;分别用横标目和 纵标目说明横轴和纵轴代表的指标和单位,一般将两轴的相交点即原点处定为0,纵、 横轴的比例一般以5:7或7:5为宜;统计图用不同线条和颜色表达不同事物和对象的 统计量,需要附图例加以说明,图例可放在图的右上角空隙处

36、或下方中间位置。直条图:用相同宽度的直条长短表示相互独立的某统计指标值的大小。可分为卧式 条图和立式条图或者是单式条图(横轴只有一个分组变量)和复式条图(横轴有两个或 多个分组变量)。直条图的直条尺度必须从0开始,各直条的宽度相等,间隔一般与直 条等宽或为其一半。主要适用于分析、比较各自独立的或离散型变量的多个组或多个类 别的统计指标。指标可以是绝对数,也可以是相对数或平均数。圆图和百分比条图适合描述分类变量资料的各类别所占的构成比。圆图:以圆形总 面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。主要用于 单个构成比的分析。百分比条图:以矩形总长度作为100%,将其分割

37、成不同长度的段表 示各构成的比例。主要用于多个构成比的分析。线图:用线段的升降来表示数值的变化,适合于描述某统计量随另一连续性数值变 量变化而变化的趋势。通常横轴是时间或其它连续性变量,纵轴是统计指标。普通线图 (横轴和纵轴都是算术尺度,纵轴需从0开始)用于描述绝对变化趋势(变化幅度);半对数线图(纵轴是对数尺度)用于描述相对变化趋势,特别适宜作不同指标变化速度 的比较。直方图:以各直方面积描述各组频数的多少,面积的总和相当于各组频数之和,适 合表示连续型数值变量资料的频数分布或频率分布,特别是了解一群数据的集中趋势、 离散趋势和分布规律,为选用正确的统计描述和统计推断方法奠定基础。统计地图:

38、用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研 究指标的地理分布。注意颜色或花纹的选择最好与统计量数值增减的趋势一致。箱式图:适用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、 偏度、变异范围和离群值。箱子两端分别是上四分位数和下四分位数,中间横线是中位 数,两端连线分别是除离群值外的最小值和最大值,另外标记可能的离群值。特别适合 于多组数据分布的比较。茎叶图:将数据分离成两部分,即整数部分和尾数部分,整数部分形成图的茎,尾 数部分形成图的叶。可非常直观地显示数据的分布范围和形态。误差条图:通过样本信息来描述总体,估计抽样误差的大小。特别适合比较多个样 本间的差异

39、情况。可显示三种不同的区间:可信区间、X土S、X土sx。第12章重复测量设计资料的方差分析重复测量资料的数据特征巢式数据;数据个体内相关而个体间独立(球形检 验/球对称检验);同一个体重复测量(相关个体)。独立结构:即无相关关系,相关 矩阵主对角线上的元素为1,非主对角线上的元素为0 (相关系数为0),它表示不同时 间点上的测量值之间彼此独立,无相关关系。前后测量设计与配对设计t检验的区别:配对设计中同一对子的两个实验单位可 以随机分配处理,两个实验单位同期观察实验结果,可以比较处理组间差别;前后测量 设计不能同期观察实验结果,在本质上比较的是前后差别,推论处理是否有效是由条件 的,即假定测量

40、时间对观测结果没有影响。配t检验要求同一对子的两个实验单位的 观测结果分别与差值相互独立,差值服从正态分布;前后测量设计前后两次观测结果通 常是与差值不独立,大多数情况第一次观测结果与差值存在负相关的关系。配对设计 用平均差值推论处理的作用,前后测量设计除了分析平均差之外,还可进行相关回归分 析。重复测量设计与随机区组设计的区别:重复测量设计中处理是在区组(受试者) 间随机分配,区组内的各时间点是固定的,不能随机分配;随机区组设计则要求每个区 组内实验单位彼此独立,处理只能在区组内随机分配,每个实验单位接受的处理是不相 同的。重测设计区组内实验单位彼此不独立,更确切的说重测数据用随机区组方差分

41、 析比较处理组间差异的前期是满足“球对称”假设,若重测数据不满足“球对称”假设, 采用随机区组设计方差分析会增大I型错误的概率。重测设计的优点是可以减少样本 含量和控制个体变异(个体差异),可看作是随机区组设计的一种极端形式。重测数据的统计分析方法:单变量方差分析(ANOVA)和多变量方差分析(MANOVA)。 单变量方差分析要求满足要求方差结构为球形或复合型对称;不满足,则采用多变量方 差分析或一般方差分析进行校正。注意事项:只有在满足球对称假设的情况下,单组重 测数据的方差分析才与随机区组方差分析等价。第25章 医学科学研究设计医学研究:首要任务是创新。根据医学研究过程的不同发展阶段分为基

42、础研究应 用研究和发展研究。特点:伦理性和复杂性(个体变异大和主观干扰大)。分类:按研究目的分为验证性研 究和探索性研究;按研究形式分观察性研究和实验性研究;按研究指标分单因素研究和 多因素研究;按研究的时限分前瞻性研究、回顾性研究和横断面研究;按研究对象分社 区研究、临床试验和实验研究。观察性研究设计实验性研究设计;临床试验研究 设计。步骤:选题;制定研究方案:收集资料;数据整理与分析;撰写研究 报告。研究方法:比较与分类、分析与综合、归纳与演绎、类比推理。目的:探讨疾病 发生发展的机制;研究可能与疾病发生相关的因素;探索防止疾病的有效方法;促进人 群的健康水平。第27章 实验研究设计实验设

43、计的基本要素:实验单位:处理因素作用的客体,是接受处理因素的基本 单位,亦称实验对象或受试对象。要求对处理因素敏感且反映必须稳定。处理因素: 研究者根据研究目的施加于实验单位,在实验中需要观察并阐明其效应的因素。非处理 因素:与处理因素同时存在,能使实验单位产生效应的其他因素。确定处理因素时应注 意:A.明确处理因素和非处理因素;(a.一次实验中处理因素不宜太多也不宜过少;b. 根据专业知识和实验条件,找出重要的非处理因素,以便进行控制)B.处理因素要标准 化。实验效应:处理因素作用于受试对象的反应,是研究结果的最终体现,也是实验 研究的核心内容,一般通过观测指标来表达。观测指标的基本要求:客

44、观性、特异性和 灵敏性、精确性。实验设计的基本原则:对照原则:控制已知非处理因素产生的系统误差的有效措 施,设立对照时应遵循均衡性原则。常用对照形式有:空白对照、实验对照、标准对照、 相互对照和潜在对照。随机化原则:控制未知非处理因素产生的系统误差的有效方法。 包括抽样随机,分组随机和实验顺序随机。其作用是避免主观因素的参与;打破原实验 对象排列的系统性,控制系统误差;对实验中意想不到的因素起平衡作用;随机化也是 统计推断的基础。重复原则:降低随机误差和增加精密度,其应用就是样本含量的估 计。影响样本含量的条件:假设检验的I型错误概率a大小;假设检验的II型错 误概率B或检验效能(1-B )的

45、大小;容许误差5的大小;总体的相关信息。完全随机设计:又称简单随机分组设计,是采用完全随机化分组方法将同质的实验 单位分配到各处理组,各组分别接受不同的处理。优点:设计简单,易于实施,出现数 据缺失时任可进行统计分析。缺点:样本小时,可能均衡性较差,抽样误差较大。与随 机区组设计相比,效率较低。配对设计:将实验单位按一定条件配成对子,再将每对中的两个实验单位随机分配 到不同处理组。配对的因素为可能影响实验结果的主要非处理因素。包括异体配对和同 体配对。与完全随机设计相比其优点|:抽样误差较小,实验效率高,所需样本含量也小。缺点:当配对条件未能严格控制造成配对失败或配对欠佳,反而会降低效率。随机

46、区组设计:又称配伍组设计,先将实验单位按性质相同或相近者组成区组,再 分别将各区组内的实验单位随机分配到各处理或对照组。设计时应遵循单位组间差别越 大越好,单位组内差别越小越好。优点:每个区组内的实验单位有较好的同质性,比完 全随机设计减少了误差,提高了实验效率。缺点:要求区组内实验单位数与处理数相等, 实验结果中若有数据丢失,统计分析较麻烦。拉丁方设计:是在随机区组设计的基础上发展的,实验涉及一个处理因素和两个控 制因素,将两个控制因素分别安排在拉丁方设计的行和列上,每个因素的类别数或水平 数相等,即用g个拉丁字母排成g行g列的方阵,使每行、每列中每个字母都只出现一 次,这样的方阵称为g阶拉

47、丁方或gXg拉丁方。优点:大大减少了实验次数,尤其适 合动物实验和实验室研究。|缺点|:要求处理数必须等于拉丁方的行(列)数,一般的实 验不满足此条件,且数据丢失会增加统计分析的难度。交叉设计:按事先设计好的试验次序,在各个时期内对研究对象先后实施各种处理, 以比较各处理组间的差异。优点:节约样本含量;控制个体差异和时间对处理因素的影 响,即效率高;临床试验中均等地考虑了每个患者的利益。缺点:(样本量降低)每个 处理时间不能太长,受试对象可能中断试验;受试对象发生根本变化如死亡,后一阶段 的处理将无法进行;受试对象一旦在某一阶段推出实验,就会造成数据丢失,增加统计 分析的困难。注意事项|:各种

48、处理间不能相互影响一一洗脱阶段;应采用盲法进行观察, 以提高受试对象的依存性;不宜用具有自愈倾向或病程较短的疾病研究。10析因设计:又称完全交叉分组试验设计,安排析因试验(多因素试验)的设计,是 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行试验。优点:全面 性和高效性,可分析交互效应。缺点:当因素个数多于3个时,所需处理组数、实验单 位数、实验次数和计算量剧增。正交设计:按正交表安排部分实验,即各因素各水平的组合方式要查正交表才能决 定。优点:可以成倍地减少试验次数,空高。缺点:为非全面试验,要求有较充分的 理由认为因素间交互作用不显著。裂区设计:类似于析因设计,该设计的处理也

49、是析因处理,只是每个因素作用于不 同级别的实验单位。特点是实验单位按其自然隶属特征划分级别,高级的实验单位包含 低级的实验单位;A因素只作用于一级实验单位,B因素只作用于二级实验单位。裂区 设计与析因设计的差别I:析因设计的g个处理全部作用于同一级别的实验单位,如完全 随机设计全部作用于一级实验单位,随机区组设计全部作用于同一级别的实验单位;但 裂区设计A因素I个水平只作用于一级实验单位,只有B因素J个水平作用于二级实验 单位。医学研究中,裂区设计多用于研究全身药物与局部处理的观测指标的综合效应。第28章 临床试验研究设计临床试验:是以人为观察对象、评价各种治疗方法或预防措施效果、有对照的前瞻

50、 性研究。目的:证实或揭示治疗方法或预防措施的疗效和安全性,综合评价治疗方法或 预防措施的效果和价值。受试对象:病人。“失访”医学伦理学、知情同意)药物的临床试验设计:将一种新药首次用于人体时,需在严格试验条件下,将试验 药物用于一小部分健康自愿者,评价试验药物的安全性和耐受性,并确定一个安全的药 物剂量范围。主要目的:为下一阶段的临床试验方法进行设计,以便根据积累的结果对 试验进行适当的修改,为后续研究提出进一步的假设。临床试验设计的基本要素:处理因素(药物):一个临床试验至少要验证一种新的 干预方法(处理因素)的有效性。临床试验按照试验目的定义为:治疗性试验、预防性 试验和诊断性试验。新药

51、的临床试验主要是评价药物的安全性和有效性。非处理因素一 一会影响临床试验结果,产生混杂效应。设计时应明确这些非处理因素,通过严格执行 随机化方案来控制其干扰和影响。受试对象(病人):根据临床试验目的确定研究总 体。受试对象的选择标准:总体代表性、临床试验的伦理学要求和病人参加试验的安全 性考虑。;排除标准:病人的依从性、试验过程中可能影响有效性和安全性评估的合并 疾病情况。受试对象的选择在很大程度上受到一种主观愿望的影响(受试对象是病人总 体中很局限的,最容易显示疗效的一小部分)。由于地理位置、研究时间以及特定的研 究者在医疗单位的医疗实践等因素影响,临床试验常采用多个不同地区的医疗单位同时

52、选择受试对象,尽可能使受试对象能代表研究的总体人群,这种临床试验常称为中心试 验。试验效应(服药后反应):指处理因素作用于受试对象而产生的各种效应。试验 中受试者有无不良事件是药物临床试验观察的重点。观察指标可分为定量指标(可测量 的指标)和定性指标(受试者有无发生不良事件)。一个临床试验只有一个研究目的, 一个主要指标,该指标是用于临床试验的样本含量估计的一个重要参数。(如果在研究 方案中定义多个主要指标,可能出现多重性问题,在统计分析时考虑对I类错误进行调 整。主要指标应根据试验目的选择易于量化、客观性强、重复性高,并在相关研究领域 已有公认标准的指标;辅助性指标作为次要指标;复合指标;综

53、合评价指撇痊愈、显 效、好转、无效,综合评价指标中的客观指标一般应同时单独作为主要指标进行分析; 替代指标间接反映其临床效果,所提供的用于临床效果评价的证据的强度取决于:a. 替代指标与试验目的在生物学上相关性的大小;b.替代指标对临床结果预后判断价值的 流行病学证据;c.从临床试验中获得的有关处理因素对替代指标的影响程度与处理因素 对临床试验结果的影响程度相一致的证据。)测量指标转换为分类指标通常会丧失部分 信息,容易导致检验效能的降低偏倚:又称系统误差,是指人为的有系统倾向性的非随机误差,它不是由于抽样引 起的,而是某种恒定的使试验效应偏向某一方面的因素所造成的误差,从而使对治疗作 用的估

54、计偏离它的真实值。偏倚的大小取决于研究的方法和具体条件。临床试验常见偏倚的产生与控制:选择性偏度:是在临床试验中,由于选择的试 验对象或观察指标不恰当而引起的偏倚。包括。.入选偏倚(根据临床试验的目的,可考 虑病型、病期、病情程度等因素具体制定入选标准);b.排除偏倚(在临床试验中,有 时需要根据试验目的,考虑年龄、合并症、妇女特殊生理期、病情程度、病程、过敏史、 治疗史、鉴别诊断等方面因素具体制定统一的排除标准,以排除不合格的受试者);c. 分组不均衡性偏倚(在临床试验中,如果不应用随机方法分配受试对象,有些可能影响 疾病转归与预后的因素在组间常无法得到均衡;或采用简单随机分配方法进行分组,

55、在 受试例数较少时两组的有关基线特征就不一定均衡,从而可能带来分组不均衡性偏倚。 增加受试例数,或采用分层区组随机化方法);d.非同期对照偏倚(注意比较资料 之间是否具有可比性,由于不同时期的资料中被研究的对象的条件、环境等都很难保持 一致,可比性差,会带来非同期对照偏倚)。消除或防止选择性偏倚产生的有效方法: 在临床试验设计阶段对产生选择性偏倚的原因采取相应的措施,防止偏倚的产生。关键 是预见或估计到本临床试验可能出现哪些偏倚。观察性偏倚:由于在临床信息收集、 整理过程中各种原因的影响而出现的误差,可能来自临床试验的观察全过程。分为:a. 调查偏倚(是在调查试验组与对照组时,由于两组的调查环

56、境与条件不相同、也可能是 调查人员的质量不高或调查人员的询问态度、方式不一,从而造成对资料的收集和记录 的误差);b.回忆偏倚(是指受试者的记忆不完整,使其准确性与真实情况之间存在着 误差);c.无应答偏倚(在临床试验需要随访时采用信访或电话询问时有时会出现无应 答现象,而且无应答者与应答者往往在临床经过等方面存在着系统差异,这种偏倚称 之);d 试验条件偏倚(由于临床试验时没有制定和/或执行标准操作规程,临床试验的 场所、条件、测定仪器、测定方法、试剂的不同,或研究者的操作和判断水平不统一对 实验结果产生影响,造成的误差称之);上述为测量偏倚。e.临床资料遗漏偏倚(由于 临床资料中有的经过检

57、查结果正常或阴性,研究者未作记录,或者是未经检查没有做记 录,导致临床资料遗漏和不完整,影响研究结论的正确推导,这种误差称之);f.不接 受测量偏倚(由于临床试验中采用的检查测量法方法易造成损伤、疼痛等结果时,被检 查者拒绝和逃避检查,造成两组被测量检查的数量不相同从而产生偏倚,这种偏倚称 之);g.失访偏倚(受试者失去联系而造成的偏倚);h.期望性偏倚(主要来源于研究者, 未采用双盲法。也可能来自受试者。)。控制观察性偏倚的产生:主要是在收集信息阶段, 针对产生观察性偏倚的原因采取相应措施。混杂偏倚:指当研究某一处理因素与疾病 的疗效关系时,另一种伴随的非处理因素产生的效应,干扰着处理因素所

58、产生的效应, 这一伴随因素称为混杂因素。发生在资料分析阶段,常由于影响试验结果的非处理因素 在各对比组中分配不均匀但未采取校正所引起的偏倚。一一首先可按可预期的重要混杂 因素进行分层随机设计,试验过程中严格执行随机化方案,使潜在的混杂因素在各组分 布均衡。临床试验中避免偏倚的技巧:盲法:是为了避免研究者和受试者的主观因素对试 验结果的干扰的重要措施。分双盲和单盲,双盲临床试验是指研究者和受试者在整个试 验过程中不知道受试者接收的是何种处理;单盲临床试验是指仅受试者处于盲态。受主 观因素影响较大的变量、客观指标一一双盲试验。双盲临床试验中,盲态应贯穿整个试 验,从产生随机数、编制试验盲底、试验处

59、理的随机分配、病人入组后的治疗、研究者 记录试验结果并作出疗效评价、试验过程的监察、数据管理直至统计分析都必须保持盲 态。相反:开放试验,即不设盲的试验:研究者和受试者都知道具体治疗方案。研究者 和参与试验效应评价的研究人员最好不是同一个人。随机化:是指临床试验中的受试 者有同等的机会被分配到试验组或对照组中个,而不受研究者和/或受试者主观意愿的 影响,可以使各处理组的各种影响因素(包括已知和未知的因素)分布趋于相似。包括 分组随机和试验顺序随机,与盲法合用有助于避免因处理分配的可预测性而产生的分组 不均衡性偏倚。在多中心临床试验中,应按参加试验的中心组织随机化过程,即按中心 分层,分层随机化

60、有助于保持层内的均衡性,还可按照基线资料中的重要预后因素进行 分层。意向性分析原则:根据意向性分析的基本原则,主要指标的分析应包括所有随 机化的受试者,无论其是否完成试验。全分析集(FAS)是指尽可能接近符合意向性分 析原则的理想的受试者集,该数据集是从所有随机化的受试者中,以最少的和合理的方 法剔除受试者后得出的。协变量及交互作用分析:把对主要指标有重要影响的因素作 为协变量临床试验的对照组选择:遵循专设、同步、均衡的网对照组的专设是指在临床 试验设计中,将合格的受试者分出部分受试者作为对照,即不接受所研究的处理因素, 在试验结束时比较两组的处理效应才能达到对照组所引起的“比较鉴别”的作用。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论