




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章第七章 两分类资料的统计描述与推断两分类资料的统计描述与推断 第一节第一节 二项分布和二项分布和poisson分布分布 二项分布二项分布(binomial distribution)是一种重要的离散是一种重要的离散型分布。其应用条件:型分布。其应用条件: 每次试验结果只能是相互对每次试验结果只能是相互对立的两种情况中的一种,例如,某药的疗效为有效或立的两种情况中的一种,例如,某药的疗效为有效或无效;动物毒性试验的结果为存活或死亡;化验结果无效;动物毒性试验的结果为存活或死亡;化验结果为阳性或阴性;等等,二者中必居其一,且仅居其一;为阳性或阴性;等等,二者中必居其一,且仅居其一; 已知发生
2、某一结果已知发生某一结果(如阳性如阳性)的概率为常数的概率为常数,则另一,则另一结果结果(阴性阴性)发生的概率为发生的概率为(1); 在在n次重复试验中,次重复试验中,各次试验相互独立,即每次试验的结果不会影响其他各次试验相互独立,即每次试验的结果不会影响其他试验的结果。在医药学中二项分布常用于分类资料的试验的结果。在医药学中二项分布常用于分类资料的抽样研究,如总体率的估计、两率的比较等。抽样研究,如总体率的估计、两率的比较等。 1定义定义 若随机变量若随机变量 x 的概率函数为的概率函数为 pn(x) = cnxx(1)nx ,(x =1,2,n) (9.1)则称则称x服从参数为服从参数为n
3、和和的二项分布。式中的二项分布。式中pn(x)为为pn(x=x)的简写;的简写; n 为试验次数;为试验次数;cnx为从为从 n 个不同元个不同元素中,每次取出素中,每次取出 x 个元素的不同组合的种数;个元素的不同组合的种数;是二项是二项分布一个的参数,而不是圆周率。分布一个的参数,而不是圆周率。 在医药统计中应用二项分布时,在医药统计中应用二项分布时,表示总体阳性率,表示总体阳性率,一般用大样本率一般用大样本率p来估计来估计;pn(x)表示表示n次试验中,发次试验中,发生阳性次数为生阳性次数为x的概率,二项分布的概率函数为的概率,二项分布的概率函数为 pn(x)=cnxpx(1p)nx,(
4、x =1,2,n ) (9.2)二项分布的图形如图二项分布的图形如图9-1所示。所示。 cnxx (1-)nx = + (1-)n =1, cnxpx(1-p)nx = p +(1- p)n =1。 由于二项分布变量取值的概率函数值由于二项分布变量取值的概率函数值cnxx (1-)nx 或或cnxpx(1-p)nx正好是二项式正好是二项式+(1-)n或或p +(1- p)n的展开式中,按的展开式中,按 或或p的升幂排列的各项,故名二项分的升幂排列的各项,故名二项分布。布。 所以,在所以,在 n 次独立重复试验中,一个二项分布变量次独立重复试验中,一个二项分布变量各取值的概率之和为各取值的概率之
5、和为1。 2二项分布的分布函数二项分布的分布函数 二项分布的分布函数为:二项分布的分布函数为: f (x) =p ( x x) = pn(0)+pn (1)+.+pn(x) (9.3) 例例9.1 某疗法治痹症的治愈率某疗法治痹症的治愈率=60%,用该疗法治疗,用该疗法治疗痹症三例痹症三例(n=3),治愈例数,治愈例数x(x=0,1,2,3)的情况如的情况如表表9-1 。 表表9-1 三例患者中治愈三例患者中治愈 x 例的情况例的情况 (治愈率治愈率p=0.60;治;治愈例数愈例数x = 0,1,2,3)治愈治愈例数例数 x 三例患者可能的情况三例患者可能的情况 一患者一患者 二患者二患者 三
6、患者三患者 治愈治愈x例的概率例的概率* p3(x)=c3x0.6 x 0.4 3x p(xx)* p(xx) 0 未愈未愈 未愈未愈 未愈未愈c300.6 00.4 3=0.064 0.064 1 1 愈愈 未愈未愈 未愈未愈 未愈未愈 愈愈 未愈未愈 未愈未愈 未愈未愈 愈愈 c310.6 10.4 2=0.288 0.352 0.936 2 愈愈 愈愈 未愈未愈 愈愈 未愈未愈 愈愈 未愈未愈 愈愈 愈愈 c320.6 20.4 1=0.432 0.784 0.648 3 愈愈 愈愈 愈愈c330.6 30.4 0=0.216 1.000 0.216 注:注:*三例患者中治愈三例患者中治
7、愈x例的概率函数为例的概率函数为p3(x);*p(xx)为分布函数为分布函数 3二项分布的均数和标准差二项分布的均数和标准差 记二项分布的总体阳记二项分布的总体阳性率为性率为,未知时,用大样本率未知时,用大样本率 p 来估计来估计。由式由式(9.1)推导出二项分布变量推导出二项分布变量x的均数用绝对数表示的均数用绝对数表示时的计算公式为:总体均数时的计算公式为:总体均数= e (x) =n相应的样本均数相应的样本均数=n p (9.5)改用相对数改用相对数(率率)表示为:表示为: 总体率总体率 =,相应的样本率,相应的样本率p (9.6)二项分布变量二项分布变量 x 的标准差用绝对数表示时的计
8、算公式的标准差用绝对数表示时的计算公式为:为: )1( n)1(pnps (9.7) 二项分布变量的标准差用相对数二项分布变量的标准差用相对数(率率)表示时,称为表示时,称为率的标准误,总体率的标准误记为率的标准误,总体率的标准误记为p,样本率的标准,样本率的标准误记为误记为sp,计算公式为:,计算公式为: np)1( nppsp/ )1( (9.8) 二、二、 poisson分布分布 poisson分布分布(poisson distribution)是一种重要的离散是一种重要的离散型分布。适用条件:型分布。适用条件: 两分类的资料;两分类的资料; 所考察的事所考察的事件发生率件发生率(一般用
9、大样本率一般用大样本率p来估计来估计)很小,很小,n很大,很大,n(或或np)为一不大的常数;为一不大的常数; 事件的发生是独立的,事件的发生是独立的,如各病人的患病与否与他人无关。如人群中,对某种如各病人的患病与否与他人无关。如人群中,对某种物质中过敏的人数,遗传缺陷、癌症等非传染性疾病物质中过敏的人数,遗传缺陷、癌症等非传染性疾病的发病例数;又如大量产品中不合格品出现的次数;的发病例数;又如大量产品中不合格品出现的次数;用显微镜观察片子上每一格子内的细菌数;细胞发生用显微镜观察片子上每一格子内的细菌数;细胞发生某种变化或细菌死亡的数目等等,都服从或近似服从某种变化或细菌死亡的数目等等,都服
10、从或近似服从poisson分布。分布。poisson分布可视为二项分布的特例。分布可视为二项分布的特例。poisson分布常用于研究单位容积分布常用于研究单位容积(或面积、时间或面积、时间)内稀内稀有事件发生数的规律。有事件发生数的规律。 1定义定义 若随机变量若随机变量 x 的概率函数为的概率函数为 exxpx!)(x=0,1,2,) (9.9)参数参数系系poisson分布的总体均数分布的总体均数(即数学期望即数学期望),=。 2poisson分布的均数、方差分布的均数、方差 poisson分布的总体均数分布的总体均数= n,相应的样本均数,相应的样本均数= n p , 式中式中为稀有事件
11、发生的概率为稀有事件发生的概率(很小很小),未知时未知时,用大样本率,用大样本率 p 来估计来估计。 式式(9.10)的意思是:稀有事件在的意思是:稀有事件在n(n很大很大)次试验中平次试验中平均发生均发生n次次(未知时,用大样本率未知时,用大样本率 p 来估计来估计)。 poisson分布的方差分布的方差 = 均数均数3poisson分布的分布函数为分布的分布函数为 xkkekxxp0!)( (9.10) 4poisson分布具有可加性分布具有可加性 如果相互独立的如果相互独立的 k 个随机个随机变量都服从变量都服从poisson分布,则它们之和仍服从分布,则它们之和仍服从poisson分布
12、,且均数为分布,且均数为 k 个随机变量的均数之和。如果以较个随机变量的均数之和。如果以较小的度量单位观察某一现象的发生数呈小的度量单位观察某一现象的发生数呈poisson分布时,分布时,把若干个小单位合并为一个大单位后,总计数亦呈把若干个小单位合并为一个大单位后,总计数亦呈poisson分布,其均数等于以较小的度量单位时的均数分布,其均数等于以较小的度量单位时的均数之和。例如已知某放射性物质每之和。例如已知某放射性物质每10分钟放射脉冲数呈分钟放射脉冲数呈poisson分布,分布,5次测量的结果分别为次测量的结果分别为35,34,36,38,34次,那么次,那么50分钟的脉冲数分钟的脉冲数x
13、 = 35 + 34 + 36 + 38 + 34 =177次,亦呈次,亦呈poisson分布。分布。poisson分布资料常利分布资料常利用可加性原理使均数用可加性原理使均数20,以便用正态近似法处,以便用正态近似法处理。理。 5三种分布的渐近关系三种分布的渐近关系 二项分布、二项分布、poisson分布和正分布和正态分布,是三种基本的也是最重要的概率分布,它们态分布,是三种基本的也是最重要的概率分布,它们之间有着密切的渐近关系,若所考察的事件发生率为之间有着密切的渐近关系,若所考察的事件发生率为p,试验次数为试验次数为n,则如图,则如图9-3。 (1) 二项分布资料,当二项分布资料,当0.
14、1 p 50时,可用正态分布法近似计算;当时,可用正态分布法近似计算;当p0.9,n50,均数,均数np10时,可用时,可用poisson分布法近似计分布法近似计算;算; (2) poisson分布资料,当均数分布资料,当均数20时,可用正态分时,可用正态分布法近似计算。布法近似计算。 第一节第一节 分类资料的统计描述分类资料的统计描述 分类资料的统计描述除用频数表示外,更多是用分类资料的统计描述除用频数表示外,更多是用相对数相对数(relative number)。如表。如表7-1的的栏,表栏,表7-1第第、列,都是将分类资料的观察结果,按照分析列,都是将分类资料的观察结果,按照分析的要求,
15、分类汇总统计观察单位数的要求,分类汇总统计观察单位数(频数频数),列出的分类,列出的分类资料频数分布表。表资料频数分布表。表7-1中第中第、两栏及表两栏及表7-1第第列列的数据都是绝对数。绝对数说明实际发生的绝对水平的数据都是绝对数。绝对数说明实际发生的绝对水平,是统计分析的基础。但仅使用绝对数,不能进行比,是统计分析的基础。但仅使用绝对数,不能进行比较分析研究,故常计算两个有联系的指标之比,统称较分析研究,故常计算两个有联系的指标之比,统称为相对数。常用相对数有比、构成比和率。为相对数。常用相对数有比、构成比和率。相对数相对数表表7-1 某年某医院外科病区院内感染发生数及其相对数某年某医院外
16、科病区院内感染发生数及其相对数 病区病区调查调查人数人数院内感染院内感染发生数发生数各病区与普外病区各病区与普外病区院内感染发生数之比院内感染发生数之比各病区院内感染各病区院内感染发生数构成发生数构成(%)(%)各病区院内各病区院内感染率感染率(%)(%)普外普外808808717131.331.38.798.79胸外胸外52852869690.970.9730.430.413.0713.07骨外骨外49949934340.480.4815.015.06.816.81神外神外29129153530.750.7523.323.318.2118.21合计合计21262126227227100.01
17、00.010.710.7 表表 7-17-1的的栏,表栏,表9-39-3第第、列,都是将分类资料的观察结果,按照列,都是将分类资料的观察结果,按照分析的要求,分类汇总统计观察单位数分析的要求,分类汇总统计观察单位数( (频数频数) ),列出的分类资料频数分布表,列出的分类资料频数分布表。表。表9-29-2中第中第、两栏及表两栏及表9-39-3第第列的数据都是绝对数。绝对数说明实际列的数据都是绝对数。绝对数说明实际发生的绝对水平,是统计分析的基础。但仅使用绝对数,不能进行比较分析发生的绝对水平,是统计分析的基础。但仅使用绝对数,不能进行比较分析研究研究 肝脾血虚、肝郁化热肝脾血虚、肝郁化热 20
18、 26.67心虚肝郁、神不守舍心虚肝郁、神不守舍 7 9.33肝肾阴虚、肝阳偏元肝肾阴虚、肝阳偏元 35 46.67表表9-3 75例更年期综合症辨证分型观察例更年期综合症辨证分型观察 证证 型型例数例数构成比构成比(%)脾肾阳虚、水湿不化脾肾阳虚、水湿不化13 17.33 合合 计计75 100.001,常用相对数常用相对数1 1比比(ratio) (ratio) 亦称相对比亦称相对比(relative ratio)(relative ratio),是两,是两个有关指标之比,是说明两对比水平的指标。对比的个有关指标之比,是说明两对比水平的指标。对比的数量可以是绝对数、相对数或平均数,可以是性
19、质相数量可以是绝对数、相对数或平均数,可以是性质相同,也可以是性质不相同。例如,变异系数同,也可以是性质不相同。例如,变异系数cvcv= = ( (标标准差准差 / / 均数均数) )100%100%,就是一个相对比。,就是一个相对比。 习惯上,若甲指标大于乙指标,相对比的结果用习惯上,若甲指标大于乙指标,相对比的结果用倍数表示;若甲指标小于乙指标,相对比的结果用倍数表示;若甲指标小于乙指标,相对比的结果用百分数表示。如表百分数表示。如表9-29-2第第栏中,各病区与普外病区栏中,各病区与普外病区院内感染发生数之比分别为院内感染发生数之比分别为69/7169/71,34/7134/71,53/
20、7153/71,即即0.970.97,0.480.48,0.750.75。说明各病区院内感染发生数。说明各病区院内感染发生数分别为普外病区的分别为普外病区的97%97%,48%48%,75% 75% 。又如,我国最。又如,我国最早的古典医籍早的古典医籍五十二病方五十二病方载药载药240240种,种,发展到明代李时珍集古代医药之大成的科学巨著发展到明代李时珍集古代医药之大成的科学巨著本本草纲目草纲目,载药已达,载药已达18921892种,相对比种,相对比1892 / 1892 / 240=7.88240=7.88,说明,说明本草纲目本草纲目载药为载药为五十二病方五十二病方载药的载药的7.887.
21、88倍倍 。 2构成比构成比(constituent ratio) 又称构成指标。说明某又称构成指标。说明某事物内部各组成部分在该事物整体中所占的比重或分事物内部各组成部分在该事物整体中所占的比重或分布,如说明药物的成份构成,或疾病的死因构成、年布,如说明药物的成份构成,或疾病的死因构成、年龄别构成、性别构成、职业构成等,常以百分数表示龄别构成、性别构成、职业构成等,常以百分数表示,计算公式为:,计算公式为: %100 察察单单位位总总数数同同一一事事物物各各组组成成部部分分观观位位数数某某一一组组成成部部分分的的观观察察单单构构成成比比 3率率(rate) 又称频率指标,它指一定条件下某现象
22、又称频率指标,它指一定条件下某现象发生的频率或强度。如说明治疗的有效率、疾病的病发生的频率或强度。如说明治疗的有效率、疾病的病死率等。常用符号死率等。常用符号表示总体率,而用符号表示总体率,而用符号p表示样本表示样本率。率的计算公式为:率。率的计算公式为:1000%(100或或数数可可能能发发生生该该现现象象的的总总例例某某现现象象实实际际发发生生的的例例数数率率 式中的式中的100%或或1000为比例基数。选择依据:为比例基数。选择依据:习惯,如有效率、感染率、治愈率、病死率习惯习惯,如有效率、感染率、治愈率、病死率习惯用百分率表示;出生率、死亡率习惯用千分率表示用百分率表示;出生率、死亡率
23、习惯用千分率表示。使算得的率至少保留一、二位整数,如恶性肿使算得的率至少保留一、二位整数,如恶性肿瘤的死亡率多采用十万分率表示。瘤的死亡率多采用十万分率表示。 4率的标准误率的标准误 类似于均数的抽样误差,在抽样研究类似于均数的抽样误差,在抽样研究中所获得的样本率与总体率也存着率的抽样误差。表中所获得的样本率与总体率也存着率的抽样误差。表示率抽样误差大小的统计指标称为示率抽样误差大小的统计指标称为率的标准误率的标准误(standard of rate)。由于总体率和总体率的标准误一。由于总体率和总体率的标准误一般未知,常用样本率般未知,常用样本率p来估计总体率来估计总体率,用样本率的标,用样本
24、率的标准误准误sp来估计总体率的标准误:来估计总体率的标准误:nppsp)1( 一般说来,用样本率一般说来,用样本率 p 来估计总体率来估计总体率时,至少时,至少 n 应大于应大于30。 率的标准误是衡量样本率稳定性和可靠性的统计指率的标准误是衡量样本率稳定性和可靠性的统计指标,它反应率的抽样误差大小,率的标准误越小,表示标,它反应率的抽样误差大小,率的标准误越小,表示率的抽样误差越小,用以估计总体率的可靠性就越大。率的抽样误差越小,用以估计总体率的可靠性就越大。反之,如果率的标准误越大,则由样本率估计总体率的反之,如果率的标准误越大,则由样本率估计总体率的可靠性越小。可靠性越小。 5.应用相
25、对数时应注意的问题应用相对数时应注意的问题 (1) 计算相对数的计算相对数的分母不宜过小分母不宜过小。观察单位数够多时,。观察单位数够多时,计算出的相对数较稳定计算出的相对数较稳定, 可以正确反映实际情况。但观可以正确反映实际情况。但观察单位过少即分母过小时,计算出来的相对数不稳定察单位过少即分母过小时,计算出来的相对数不稳定, 这时最好直接用绝对数表示这时最好直接用绝对数表示 ;必须用相对数时,应同时必须用相对数时,应同时列出其可信区间。但动物实验可例外列出其可信区间。但动物实验可例外, 因动物实验可以因动物实验可以周密设计周密设计 , 精选对象精选对象 , 严格控制实验条件严格控制实验条件
26、 , 例如有的毒例如有的毒理实验理实验 , 每组用每组用10只小白鼠也可以观察反应率或死亡率。只小白鼠也可以观察反应率或死亡率。(2) 进行率的对比分析时,应注意进行率的对比分析时,应注意资料有可比性资料有可比性。除。除了被研究的因素之外,其余可能影响指标的重要因素了被研究的因素之外,其余可能影响指标的重要因素应控制在应控制在“齐同对比齐同对比”的条件下。若两组分类资料的的条件下。若两组分类资料的诊断标准或疗效判断标准不一致,则组间缺乏可比性诊断标准或疗效判断标准不一致,则组间缺乏可比性;若两组资料内部构成;若两组资料内部构成(如病人的性别、年龄、病程如病人的性别、年龄、病程及病情等及病情等)
27、缺乏齐同性,则两个总率也不能直接进行缺乏齐同性,则两个总率也不能直接进行比较。如果需要直接比较总率,为了消除某一混杂因比较。如果需要直接比较总率,为了消除某一混杂因素素(如年龄,职业,病性等如年龄,职业,病性等)对观察结果的影响,可作对观察结果的影响,可作率的标准化处理。率的标准化处理。3) 3) 避免避免“以比代率以比代率”,“比比”、“率率”误用。例如误用。例如临床研究报告中,常用病人的资料来分析疾病与年龄临床研究报告中,常用病人的资料来分析疾病与年龄、性别、职业等因素的关系,所计算的相对数一般都、性别、职业等因素的关系,所计算的相对数一般都是构成比,不能作为率来分析。是构成比,不能作为率
28、来分析。(4) (4) 样本率样本率( (或构成比或构成比) )的比较,不能仅凭表面数值大的比较,不能仅凭表面数值大小下结论,应进行假设检验。小下结论,应进行假设检验。 2,2,临床诊断试验评价方法的相对数临床诊断试验评价方法的相对数 一项新的临床诊断试验的评价,应该是将该试一项新的临床诊断试验的评价,应该是将该试验与一种较为理想的、公认的标准诊断方法进行对验与一种较为理想的、公认的标准诊断方法进行对比分析而得出的结论。标准诊断亦称比分析而得出的结论。标准诊断亦称金标准金标准(gold (gold standard)standard)指能较为准确地区分阳性与阴性的诊断方指能较为准确地区分阳性与
29、阴性的诊断方法。临床上常以活体组织检查、手术、尸体解剖、法。临床上常以活体组织检查、手术、尸体解剖、长期追踪观察或其他可靠的方法作为标准诊断。新长期追踪观察或其他可靠的方法作为标准诊断。新的诊断方法与金标准对比,一定要有某方面的优点的诊断方法与金标准对比,一定要有某方面的优点,才能进行推广,否则予以摒弃。,才能进行推广,否则予以摒弃。 1诊断试验评价中四格表资料的相对数诊断试验评价中四格表资料的相对数 下面用表下面用表9-4的模式,作为诊断试验收集整理的模式,作为诊断试验收集整理出的四格表出的四格表(four-fold table)资料,介绍诊断试验评资料,介绍诊断试验评价中四格表资料的相对数
30、及其计算公式。价中四格表资料的相对数及其计算公式。 诊 断 试诊 断 试验验金金 标标 准准 合合 计计阳阳 性性阴阴 性性阳阳 性性真阳性数真阳性数(tp=a)假阳性数假阳性数(fp=b) a+b=tp+fp阴阴 性性假阴性数假阴性数(fn=c)真阴性数真阴性数(tn=d) c+d=fn+tn合合 计计a+c=tp+fnb+d=fp+tna+b+c+d 敏感度敏感度(sesitivity,se):敏感度即:敏感度即真阳性率真阳性率(true positive rate ,tpr),是指实为阳性时该试验诊断为阳,是指实为阳性时该试验诊断为阳性的比例,表示该试验具有正确地识别阳性的能力。性的比例
31、,表示该试验具有正确地识别阳性的能力。按照金标准确定阳性的病例数为按照金标准确定阳性的病例数为(a+c),用诊断性试,用诊断性试验确定的阳性病例数为验确定的阳性病例数为a,敏感度,敏感度se为为 %100 caase (%)tpr = (9.4) 特异度特异度(specificity,sp):特异度即:特异度即真阴性率真阴性率(true positive rate ,tnr),是指实为阴性时该试验诊断阴性,是指实为阴性时该试验诊断阴性的比例,表示该试验具有正确地识别阴性的能力。按的比例,表示该试验具有正确地识别阴性的能力。按照金标准排除的病例数为照金标准排除的病例数为(b+d),用诊断试验所排
32、除的,用诊断试验所排除的病例数为病例数为d,特异度,特异度sp为为sp (%)tnr = %100 dbd (9.6) 诊断效率诊断效率(diagnostic efficiency,de):诊断效率即:诊断效率即该试验诊断的准确率,是指真阳性数、真阴性数占总该试验诊断的准确率,是指真阳性数、真阴性数占总例数的比例:例数的比例: %100 dcbada 诊断效率诊断效率de应大于应大于50%,且波动在,且波动在50100%范围范围内。内。de值愈大,临床应用价值愈好,值愈大,临床应用价值愈好,de小于等于小于等于50%的试验应予废弃的试验应予废弃 敏感度敏感度se和特异度和特异度sp从正面说明诊
33、断实验的效从正面说明诊断实验的效能,诊断效率能,诊断效率de则综合说明诊断实验的效能。则综合说明诊断实验的效能。 预断值预断值(predictive value):预断值是指试验结果提示:预断值是指试验结果提示本病存在或不存在的可能性。分为阳性预断值与阴性预本病存在或不存在的可能性。分为阳性预断值与阴性预断值。断值。阳性预断值阳性预断值ppv(%)=a / (a+b)100% (9.9) 阴性预断值阴性预断值npv(%)= d / (c+d)100% (9.10) 患病率患病率(prevalence):患病率为被检人群中,确诊病:患病率为被检人群中,确诊病例的比值。例的比值。 患病率患病率=(
34、a+c) / (a+b+c+d) (9.11) 诊断指数诊断指数(diagnostic index,di):诊断指数是敏感:诊断指数是敏感性与特异性的总和,反应诊断试验的有效程度,故性与特异性的总和,反应诊断试验的有效程度,故 诊断指数诊断指数 di(%) = se +sp (9.12) 诊断指数诊断指数di值越大,诊断试验的应用价值也越大,值越大,诊断试验的应用价值也越大,当当di100%,这种试验应淘汰。,这种试验应淘汰。 漏诊率漏诊率(false negative rate,fnr):漏诊率:漏诊率fnr即即假阴性率假阴性率。 漏诊率漏诊率fnr =c / (a+c)100% =1se
35、(9.13) c / (a+c) +a / (a+c) = (a+c) / (a+c) = 1,可知漏诊率,可知漏诊率与敏感度互补。在统计学上,将假阴性的概率以与敏感度互补。在统计学上,将假阴性的概率以表表示,示,1=把握度,从诊断性试验来看,可认为把握度,从诊断性试验来看,可认为 把握度把握度=1= 敏感性。敏感性。 误诊率误诊率(false positive rate,fpr):误诊率:误诊率fpr即假阳性率。即假阳性率。 误诊率误诊率fpr=b / (b+d)100%=1sp (9.14) b / (b+d) + d / (b+d) = 1,可知,可知 假阳性率和真阴性率假阳性率和真阴性
36、率互补。在统计学上,将假阳性的概率以互补。在统计学上,将假阳性的概率以表示,从诊断表示,从诊断性试验来看,可认为性试验来看,可认为 误诊率误诊率fpr=1sp = (9.15) 由式由式(9.14)可知:置信水平可知:置信水平(1)= 特异度特异度sp 。漏诊率和误诊率是从不足的一面来说明诊断实验的效漏诊率和误诊率是从不足的一面来说明诊断实验的效能能。(9)可用度可用度(diagnostic availablity,da)可用度可用度da = 1)spse(222 (9.16) 任何一个诊断性试验的可用度范围波动应在任何一个诊断性试验的可用度范围波动应在01之间之间,一般认为,只有,一般认为,
37、只有da0.5的实验才有利用价值。的实验才有利用价值。 例例9.2 湖南中医学院研究的血吸虫病肝纤维化气虚湖南中医学院研究的血吸虫病肝纤维化气虚血瘀证判别模型回代检验结果见表血瘀证判别模型回代检验结果见表9-5,试评价该判,试评价该判别模型的诊断效果。别模型的诊断效果。 判别分析诊断判别分析诊断 标准诊断标准诊断 合合 计计气虚血瘀气虚血瘀 非气虚血瘀非气虚血瘀气虚血瘀气虚血瘀 36( 36(a) 5(b)a) 5(b) 41( 41(a+b)a+b)非气虚血瘀非气虚血瘀 3( 3(c) 40(d)c) 40(d) 43( 43(c+d) c+d) 合合 计计 39( 39(a+c) 45(b
38、+d)a+c) 45(b+d) 84( 84(a+b+c+d)a+b+c+d) 敏感度敏感度se=a/(a+c)100%= (36/39)100% = 92.31%; 特异度特异度sp=d/(b+d)100%= (40/45)100% =88.89%; 诊断效率诊断效率(准确率准确率)de=(a+d) / (a+b+c+d)100% = 90.48% 可用度可用度da= %100)spse(222 %23.81%100)8889. 09231. 0(222 youden指数指数a=sesp100%=81.20%;阳性预断值阳性预断值ppv=a / (a+b)100%=87.80%;阴性预断值阴
39、性预断值npv=d / (c+d)100%=93.02%;漏诊率漏诊率fnr=c / (a+c)100%=1se7.69%; 误诊率误诊率fpr=b / (b+d )100%=1sp=11.11%。可见所建立的数学判别模型对气虚血瘀的诊断辨别具可见所建立的数学判别模型对气虚血瘀的诊断辨别具有良好的判别效果,在敏感度、特异度、诊断效率及可有良好的判别效果,在敏感度、特异度、诊断效率及可用度等都达到了满意的效果。用度等都达到了满意的效果。youden指数指数(记为记为y):youden指数指数y反映该试验在反映该试验在诊断中的正确率。诊断中的正确率。youden指数又称正确指数:指数又称正确指数:
40、 youden指数指数y =1或或y = se +sp1 (9.17) youden指数的取值范围在(指数的取值范围在(-1,+1)之间,越接近于)之间,越接近于+1,诊断中的正确性越好。,诊断中的正确性越好。youden指数的意义与诊断指数的意义与诊断指数指数di基本相同。视基本相同。视se与与sp同等重要时,有同等重要时,有改良改良youden指数指数y=se+sp+4sesp/(se+sp)22 (9.19) 似然比似然比:似然比是患本病与未患本病的概率比值,:似然比是患本病与未患本病的概率比值,分阳性似然比与阴性似然比。分阳性似然比与阴性似然比。阳性似然比阳性似然比(记为记为+lr)是
41、指该项诊断试验诊断为阳性时,其正确是指该项诊断试验诊断为阳性时,其正确诊断真正有病的可能性与误诊率之比的多少倍:诊断真正有病的可能性与误诊率之比的多少倍:阳性似然比阳性似然比+lr = 真阳性率真阳性率 / 假阴性率假阴性率= se / (1sp) = se / fpr (9.20) 阳性似然比阳性似然比+lr反映了诊断试验判断正确的可能程度,取值范反映了诊断试验判断正确的可能程度,取值范围在(围在(0,+)之间,其值越大,该项检测方法证实阳性的能力)之间,其值越大,该项检测方法证实阳性的能力越强越强 阴性似然比阴性似然比(记为记为-lr)是指该项诊断试验获得阴性结果时,其是指该项诊断试验获得
42、阴性结果时,其漏诊者为真正无病人数的多漏诊者为真正无病人数的多阴性似然比阴性似然比-lr = 假阴性率假阴性率 / 真阴性率真阴性率= (1se) / sp (9.21) 阴性似然比阴性似然比-lr反映诊断试验判断错误的可能程度,取值范围反映诊断试验判断错误的可能程度,取值范围在(在(0,+)之间,其值越小,检测方法排除阳性的能力越好。)之间,其值越小,检测方法排除阳性的能力越好。3 3. .不同类型疾病的评价指标的选择不同类型疾病的评价指标的选择 1 1常用的判断预后指标的计算公式常用的判断预后指标的计算公式 该病患者总数该病患者总数因某病死亡的人数因某病死亡的人数病死率(病死率(%)= 1
43、00% (9.34) (2)治愈率治愈率(cure rate) 主要用于病程短且死亡率低主要用于病程短且死亡率低的疾病,是预后程度与医疗水平的标志,它的生物的疾病,是预后程度与医疗水平的标志,它的生物学意义恰与病死率相反。计算公式为:学意义恰与病死率相反。计算公式为: 同同期期接接受受该该病病患患者者总总数数某某病病治治愈愈人人数数治愈率治愈率(%)= 100% (9.35) (1 1)病死率病死率(case-fatality) 主要用于病程短但死亡率主要用于病程短但死亡率较高的疾病。它既可说明疾病预后的严重程度,又是较高的疾病。它既可说明疾病预后的严重程度,又是诊断与医疗水平的重要标志。计算
44、公式为:诊断与医疗水平的重要标志。计算公式为:(3)存活率存活率(survival rate) 常用于反映恶性肿瘤或常用于反映恶性肿瘤或其它死亡率较高疾病在一定时间内的存活频率。计其它死亡率较高疾病在一定时间内的存活频率。计算公式为:算公式为:观察期内该病患者总数观察期内该病患者总数人数人数患某病活过一定时间的患某病活过一定时间的存活率存活率= = 100% (9.36) (4)缓解率缓解率(remission rate)与与复发率复发率 (recurrence rate) 主要用于病程长、慢性疾病。主要用于病程长、慢性疾病。 患患者者总总数数同同期期内内接接受受治治疗疗的的该该病病某某病病治
45、治后后缓缓解解人人数数缓解率缓解率(%)= 100% (9.37) 某病经治后缓解总人数某病经治后缓解总人数某病缓解后复发人数某病缓解后复发人数复发率(复发率(%)= 100% (9.38) 2不同类型疾病的评价指标的选择不同类型疾病的评价指标的选择 见表见表9-7。 疾病类疾病类型型结局结局评价指标评价指标突发性突发性疾病疾病它是在某种条件下,病态突然出现而又很它是在某种条件下,病态突然出现而又很快消失,如麻醉后的呕吐。快消失,如麻醉后的呕吐。出现率,平均持续时间。出现率,平均持续时间。急性疾急性疾病病传染病的结局一般大多恢复,少数死亡;传染病的结局一般大多恢复,少数死亡;非传染病,如急性肺
46、炎等所引起的发热、非传染病,如急性肺炎等所引起的发热、咳嗽、罗音、胸片出现的阴影等均可在短咳嗽、罗音、胸片出现的阴影等均可在短期内消失。期内消失。治愈率或消失率。治愈率或消失率。慢性病慢性病及慢性及慢性病急性病急性发作发作多数慢性疾病可出现治愈、缓解、复发、多数慢性疾病可出现治愈、缓解、复发、迁延、恶化、死亡等多种结局,但很少能迁延、恶化、死亡等多种结局,但很少能彻底治愈。如高血压病人的血压慢性迁延彻底治愈。如高血压病人的血压慢性迁延肝炎病人的肝功能、冠心病病人的心电图肝炎病人的肝功能、冠心病病人的心电图改变等。改变等。缓解率、有效率、复发率、缓解率、有效率、复发率、病死率或研究某一指标恢病死
47、率或研究某一指标恢复正常的程度及时间。复正常的程度及时间。特殊的特殊的严重的严重的疾病疾病恶性肿瘤的结局大多死亡;神经系统疾病恶性肿瘤的结局大多死亡;神经系统疾病的结局严重者可有残废、功能丧失;某些的结局严重者可有残废、功能丧失;某些药物慢性中毒可致畸变;脑外伤的结局容药物慢性中毒可致畸变;脑外伤的结局容易出现后遗症等。易出现后遗症等。生存率、致畸率、后遗症生存率、致畸率、后遗症发生率、致残率等远期疗发生率、致残率等远期疗效观察指标。效观察指标。其他其他如高血钙是甲状旁腺机能亢进症的重要结如高血钙是甲状旁腺机能亢进症的重要结局。局。研究某一指标恢复正常的研究某一指标恢复正常的时间。时间。3选择
48、评价指标时的注意事项选择评价指标时的注意事项(1)对所选指标最基本的要求对所选指标最基本的要求客观性客观性:指标有客观的记录指标有客观的记录,如心电图等如心电图等特异性特异性:如脱落细胞检查诊断胃癌等如脱落细胞检查诊断胃癌等灵敏性灵敏性:能测定出反应的微小变化的能测定出反应的微小变化的“阈值阈值”,如脑血流图等,如脑血流图等精确性精确性:系指准确度和精确度而言。理想的指标是既准确又精密系指准确度和精确度而言。理想的指标是既准确又精密 重现性重现性:在相同的条件下,不管谁作重复试验都能得出相同的评价在相同的条件下,不管谁作重复试验都能得出相同的评价结果。结果。从统计学角度考虑,一般认为从统计学角
49、度考虑,一般认为客观指标比主观指标敏感,计量指客观指标比主观指标敏感,计量指标比记数指标敏感。标比记数指标敏感。(2)以病死率或存活率、治愈率、缓解率等反映预后,虽然简)以病死率或存活率、治愈率、缓解率等反映预后,虽然简明,但只是提供了一个时点的预后信息,并未反映预后的全貌。单明,但只是提供了一个时点的预后信息,并未反映预后的全貌。单纯比较两组存活率或死亡率纯比较两组存活率或死亡率)等以说明疗效和预后的差异,仅适等以说明疗效和预后的差异,仅适于急性疾病。对于大多数疾病,特别是慢性疾病,单个时点存亡比于急性疾病。对于大多数疾病,特别是慢性疾病,单个时点存亡比较是相对片面的,正确的作法是进行较是相
50、对片面的,正确的作法是进行生存率分析生存率分析第六节第六节 总体率的可信区间总体率的可信区间 样本率样本率 p是总体率是总体率 的点估计的点估计(无偏估计无偏估计) , 与总体与总体均数的估计一样均数的估计一样 , 由于样本率由于样本率 p 与总体率与总体率之间存在着之间存在着抽样误差抽样误差 , 除了点估计以外除了点估计以外 , 常需根据样本率常需根据样本率 p 推算总推算总体率体率以一定的概率所在的范围以一定的概率所在的范围 , 即总体率即总体率的可信区的可信区间间 . 下面介绍查表法和正态近似法求总体率下面介绍查表法和正态近似法求总体率的可信区的可信区间。间。 1查表法查表法 (1) 二
51、项分布资料:总体阳性发生率为二项分布资料:总体阳性发生率为时,在时,在 n 次次独立重复试验中,阳性的发生次数独立重复试验中,阳性的发生次数 x 是一个服从二项是一个服从二项分布的随机变量,阳性的发生次数分布的随机变量,阳性的发生次数 x 取某一确定值取某一确定值 x 的概率为:的概率为: pn(x) = cnxx (1)n x (9.46) 最多有最多有 x 例为阳性的累计概率为:例为阳性的累计概率为: p (xx) = pn (0)+ pn (1)+ +pn(x) (9.47) 最少有最少有 x 例为阳性的累计概率为:例为阳性的累计概率为: p (x x) = pn (x)+ pn (x+
52、1)+ + pn (n) (9.48 求阳性总体率求阳性总体率的的1可信区间实际上是求满足可信区间实际上是求满足p (1n/2 时,应时,应以以(nx)值查表,然后用值查表,然后用100减去查得的数值,即为减去查得的数值,即为所求可信区间。所求可信区间。 例例9.4 用某中医疗法矫治用某中医疗法矫治15名学生的近视眼,其中名学生的近视眼,其中10名名有效,求其总体有效率的有效,求其总体有效率的95%可信区间。可信区间。 本例本例n=15,x=10,附表,附表5中未列出,先以中未列出,先以x=1510=5查附表查附表5,在,在n=15的横行和的横行和x=5的纵列交叉处的纵列交叉处95%可信区间的
53、数值可信区间的数值1262,再,再10012=88,10062=38,所以该中医疗法矫治近视眼总体有效率的,所以该中医疗法矫治近视眼总体有效率的95%可信可信区间为区间为3888% 。 本例本例95%可信区间的下限为可信区间的下限为0.38,表明总体有效率,表明总体有效率=38%时,治疗时,治疗15例的有效例数虽可达到例的有效例数虽可达到10例乃至例乃至10例以上,但概率只有例以上,但概率只有0.025!可用二项分布变量的概率!可用二项分布变量的概率分布规律验证,当分布规律验证,当=0.38时:时: p (x 10)0.3810(10.38)5 +0.3811(10.38)4 +.+0.381
54、5 0.025 类似地,总体有效率类似地,总体有效率的的95%可信区间上限为可信区间上限为0.88表明,即使总体有效率表明,即使总体有效率=88%,治疗,治疗15例的有效例数例的有效例数可能会低于可能会低于10例,但可能性不大,其概率只有例,但可能性不大,其概率只有0.025,可用二项分布变量的概率分布规律验证,当可用二项分布变量的概率分布规律验证,当=0.88时:时: p (x10)(10.88)15 +0.88(10.88)14 +.+0.8810(10.88)5 0.025 2正态近似法正态近似法 (1) 二项分布资料:当每次抽取的样本含量二项分布资料:当每次抽取的样本含量n不是太小不是
55、太小时,样本率的分布亦近似正态分布,因此,可用正态时,样本率的分布亦近似正态分布,因此,可用正态近似法按正态分布的规律求总体率近似法按正态分布的规律求总体率的的(1)可信区间可信区间,公式为:,公式为: ( pu sp,p + u sp ),缩写为,缩写为pusp 式中式中 p 为样本率为样本率, sp为率的标准误为率的标准误, u为标准正态分为标准正态分布布水准下的界值水准下的界值(为常量为常量), 例如求例如求95%可信区间时可信区间时,=0.05, 双侧双侧u0.051.96, 单侧单侧u0.051.64; 求求99%可信区可信区间时间时, =0.01, 双侧双侧u0.02.58, 单侧单侧u0.012.33 。 总体率总体率的的95%可信区间:可信区间: 双侧时,缩写公式为双侧时,缩写公式为 p1.96sp 单侧时,公式为单侧时,公式为 p1.64sp 或或
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 60034-15:2025 EN-FR Rotating electrical machines - Part 15: Impulse voltage withstand levels of form-wound stator coils for rotating a.c. machines
- 2025至2030中国男式高腰皮鞋行业市场发展分析及竞争格局与投资前景报告
- 2025至2030中国狗肉行业深度研究及发展前景投资评估分析
- 教育心理学在课外活动中的应用分析
- 矿山教育培训课件图片
- 教育技术助力幼儿语言发展研究
- 商业培训中的混合式游戏化教学模式研究
- 智能辅导系统在商业培训中的创新实践与思考
- 教育技术发展对教师角色的影响及伦理思考
- 抖音商户数据分析师用户行为建模制度
- 2025年广东省中考英语试题卷(含答案解析)
- 2025年吉林省中考物理试卷真题及答案详解(精校打印版)
- 标准的编写讲课件
- 新编阿拉伯语第三册第二课课文及单词
- 急性上消化道出血Blatchford评分
- DB12-T368-2008卤虫池塘养殖技术规范
- TSG11-2020 锅炉安全技术规程
- 航图zbyn太原武宿-机场细则
- 浙江省城市体检工作技术导则(试行)
- DVD在线租赁-2005年全国大学生数学建模大赛B题全国一等奖论文
- 防火封堵施工方案(新版)
评论
0/150
提交评论