研究生统计学讲义第10讲中医临床实验设计与统计分析.ppt_第1页
研究生统计学讲义第10讲中医临床实验设计与统计分析.ppt_第2页
研究生统计学讲义第10讲中医临床实验设计与统计分析.ppt_第3页
研究生统计学讲义第10讲中医临床实验设计与统计分析.ppt_第4页
研究生统计学讲义第10讲中医临床实验设计与统计分析.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中医临床研究设计及统计分析,第一章 制定中医证候宏观辩证量表 : 统一辩证标准,第一节 现时中医证候宏观标准产生的背景,1.古代医家论述、医案记载;,2.现代教材描述;,3.学术机构的制定;,4.政府有关部门组织专家制定;,5. 来源于一定范围的临床流行病学研究;,就第2、3、4 项与第 5 项结合, 阐述其制定方法 .,第二节 中医证候宏观辩证量表制定方法,1.利用现有四诊项目组合法+临床流行病学调查证候加权积分法:, 国际或行标规定的主要症状都具备(如果无主要症状,则要求任意三项症状)+舌苔+脉象. 合计至少5项阳性才能辩为某证候 . 根据此项规定可以计算出每个证候 诊断的最低加权积分临界值 . 优点:宏观辩证统一化、规范化、量化。, 现场调查证候 加权积分步骤:, 每项症状按严重程度或频次制定0、2、4、6分的得分量表 . 分别对应无 、轻、中、重症状;使用文字进行描述得分具体内容. 是症状和体征(四诊)的定量方法., 舌和脉象如果不容易打分 , 也可按照无=0分,有=1分., 证候加权积分(计量资料)=每项四诊得分*每项四诊对证候的权重.(=同一证候中每项四诊中出现频率的百分构成比 , 可根据文献或现场调查计算), 证候加权积分作为证候疗效评价的定量依据., 若再将证候加权积分转化为证候分级值, 则可以把证候分级为0、1、2、3级, 分别代表某证候的无、轻、中、重 .,2. 利用古今传统文献统计法:因为四诊资料和证候在原始文献 (医案) 中没有定量值 , 只能查到有或无的记载 . 因此可以统计各种证候的每项四诊资料发生的频数, 换算成为频率(条件概率) , 再用对数转换为诊断概率指数,从而制定出计量诊断与鉴别诊断表来 .,3. 只按照现代流行病学调查和统计分析,特点:不受现有证候诊断(宏观辩证)标准的限制, 完全按照无偏的自然人群样本调查收集到的四诊资料进行团结分析.,优点:不仅可以筛选出某证主要四诊资料(指标) ,而且可以得到每个指标对证候的权重 .例如主成分及因子分析和指标聚类分析 .,问题: 对证候的重新分类可能与现有辩证体系不全吻合,上述第 1 种方法可做暂行“金”标准, 其最大优点是:,1. 辩证统一;,2. 辩证结果可以重复 , 即重测信度(retest reliability)好 .,3. 症状和证候可定量 , 均可作为症状和证候疗效评价的依据.,第三节 制定方法举例,以中医内科学(张伯臾)对胃痛的辩证分型和四诊资料项目作为基础 . 再按照四诊资料的严重程度或发生频次评定得分 , 拟定四诊资料表 , 称为四诊资料得分,证候加权积分=各项四诊资料得分*各项四诊项目权重的积和(代数和) .,加权方法: 某一证候中 , 每一项四诊资料出现频率的百分构成比(根据临床流行病学调查数据计算) .,上述四诊资料得分为等级资料 , 证候加权积分是计量资料 .,表1 胃痛各证候的宏观辩证量表(金标准),参考文献: 中医内科学张伯臾主编,第1版 上海科技出版社 ,1986年,临床流行病学王家良主编 ,第2版 ,上海科技出版社 , 2001 , 437页 临床流行病学在中医药研究中的应用:赖世隆,第二章 中医证候宏观辩证量表 的表面效度评价,第一节 Kappa检验的原理,在诊断检验中, 对水平数3的配伍设计问题. 通常进行一致性(intraobserver aggrement)检验,可使用McNemar检验和Kappa检验.,1.Kappa检验的意义 Kappa检验(Kappa test)或称一致性(intraobserver agreement) 检验,包括 同一医药工作者对同一受试对象进行两次以上观察作出判断的一致性。例如:同一临床医师对同一患者的两次胃镜检查的结论、两次阅读同一X光片的诊断结论,病理学医师两次阅读同一张切片的诊断结论,同一医药工作者两次测定同一药材某特征物含量的结论,都可能产生不一致的情况。 两个及两个以上的医药工作者对同一对象进行观察作出判断的一致性。,例如:两个或更多的医药工作者检查同一患者、阅读同一X光片、同一病理切片也可能发生判断的不一致。因此在临床实际工作中,特别是临床试验研究中,有必要对判断的一致性作出估计。例如,在利用胃镜检查结果作慢性胃炎的诊断之前,研究者很有必要了解重复检查的一致程度,若一致性较差,说明诊断结果的可靠性受到重复检查结果判断不一致的影响;若一致性较好,说明重复检查结果是可信的。由于实际工作中重复观察造成的判断不一致很难避免,只能尽量采取措施控制在最低限度,同时,选用适当的统计方法评价其判断的一致性。,2Kappa检验的统计量 为Kappa值,简记为K,计算公式为:,式中PA为实际观察到的一致率;Pe为期望一致率,简称期望率,即两次检查结果由于偶然机会所造成的一致率。PA和Pe的计算公式分别为:,可见,K值实际为两个差值之比,分母为(1期望率),即非偶然机会造成的一致率;分子称为校正后的一致率,它是实际观察到的一致率和可能由于偶然机会造成的期望率之差值,差值越大,说明实际观察到的一致率远比由于机会造成的期望一致率高。K值为经校正后一致率与非机会造成一致率的比值。 配对四格表资料的期望率Pe 、实际观察一致率PA分别为:,Pe =(a+b) (a+c)/n+ (b+d) (c+d)/ n / n = (a+b) (a+c)+ (b+d) (c+d) / n2 ( 10.15),PA = (a+d)/n ( 10.14),配对四格表资料的Kappa值可简化为式(10.16): K = 2(adbc) / (a+b) (a+c) +(b+d) (c+d) (10.16,Kappa的取值范围在-1至+1之间,K值愈接近+1,表明一致程度愈好,K值+1,说明两次判断的结果完全一致;K值1,表示二者完全相反,说明两次判断的结果完全不一致;若K值0,表示一致率完全由机会引起,说明两次检查结果很不一致。在实际运用中,只有K值在0到+1区间时,对判断一致性才有意义。K值越大说明二者的一致性越好。一般认为,若K值0.75,可说明已经达到相当满意的一致程度;若小于0.4,则可说明一致程度不够理想。Landis和Koch对四格表资料提出判断一致性程度的Kappa量判断表,见表10-15。,表10-15 一致性程度的Kappa量判断表*,* Kappa值0.60时,须按式(10.17)计算Kappa修正值:,3Kappa值的标准误 根据实际资料计算的Kappa值是一个样本的统计量,同样存在着抽样误差,估计其抽样误差大小的统计量为Kappa值的标准误,用符号sK表示,计算公式为:,式中Pe为期望一致率,N为观察例数,Ri代表第i行(甲检查结果第i分级)合计数,Cj代表第j列(乙检查结果第j分级)合计数,i =1,2,., R;j=1,2,.,C 。可见其计算很不容易。,4Kappa值的假设检验 根据实际资料计算的Kappa值是一个样本的统计量,同样存在着抽样误差,故需检验样本K值是否来自Kappa值为零的总体(即观察的一致性是由于偶然机会造成的),H0:总体Kappa=0。通常采用u检验,根据是:当观察例数较多时,比如N 100,K值近似正态分布,由正态分布的特性可知,u = ( KK )/sK近似标准正态分布,若样本K值来自Kappa值为零的总体,则u = ( KK ) /sK = ( K0 ) /sK = K / sK ,所以,当观察例数较多时,可用u检验,检验统计量为:,u = ( KK ) /sK = ( K0 ) /sK = K / sK (10.19),一致性与吻合性呈正比关系,在很多情况下,一致性与吻合性是同义词。方表资料的一致性与吻合性检验常用McNemar检验和Kappa检验。,第二节 定量观察(多分类变量)的一致性评价方法,例1 甲研究者使用中医证候宏观辩证量表独立进行辩证 , 乙为专家经验辩证. 资料如下:,H0:两者吻合,一致性好; H1:两者不吻合,一致性不好。=0.05。 这是是双向有序且属性相同的33方表资料. 可用McNemar检验与Kappa检验。使用SPSS11.5统计软件,建立数据文件E1.sav以后,分析如下:,Kappa检验统计量Kappa值=0.5290.4,Kappa值的标准误=0.049,近似概率P=0.000。说明样本Kappa值来自总体Kappa值为0的概率近似0.000,故可认为两者辩证结果的一致性较好。,第三节 定性观察(二分类变量)的一致性评价方法,如果将证候分度简化为二分类变量 , 则资料整理成表,例10.14 湖南中医学院研究的血吸虫病肝纤维化气虚血瘀证判别模型回代检验结果见表10-17,用Kappa值评价该判别模型诊断的吻合性与一致性。,H0:两者吻合。H1:两者不吻合。,2 ( xji-xij)2/( xji + xij)= (5-3)2/ (5+3) =0.5,,自由度df=k (k -1)/2=2 (2-1)/21 , 查2界值表得P0.05 K = 2(adbc) / (a+b) (a+c) +(b+d) (c+d) 2(3640-53)/(4145+3943)=0.81,按表10-15的一致性程度的Kappa量判断表,可认为该判别模型诊断的吻合性极强。,第三章 中医证候宏观辩证量表的重测信度评价,(R值法)及反应度评价,信度又称为可靠性(reliability): 指在相同条件下, 对同一客观事件重复测量若干次 , 测量结果相互符合的程度 ; 说明数据的可靠性 .,常用信度评价的方法有四种:,1. 客观信度(objectivity reliability),2. 精确程度(precision reliability),3. 和谐程度(congruence reliablity),4. 重测信度(re-test reliability) :用同样测量方法对同一批对象在不同时间段进行重复测量, 目的是考核测量工具的可靠性 .,下面介绍使用组内相关可靠性系数( intra-class correlation coeficient of reliability, R值) 对中医证候宏观辩证量表进行重测信度评价的方法和反应度评价的方法.,第一节 R 的设计计算和统计分析,一、例1 某研究者使用中医证候宏观辩证量表对同一批受测者(10例)在上, 下午两次盲法观测证候的直接积分,(四诊资料总得分) , 资料见下表:,二、计算组内相关可靠性系数: 可使用SPSS统计分析,0.7R 0.4 , 可靠性较好, R0.7 可靠性甚佳 . 这里 R=0.92 可靠性好 .,第二节 量表反应度的评价,量表不但要评价其真实性 (效度) 和可靠度, 还要评价反应度 .,一、反应度的概念,反应度(responsibility to change):反应内外环境和受试者有一定变化 (例如中医四诊资料的严重度或频度有所变化)的情况下该量表的应变能力.,二、 反应度指标,1. 实施干预措施后 , 量表两次得分的差别有无统计学意义的假设检验:既可以按照计量资料进行假设检验 ,如 t 检验(正态性 , 方差齐性) 或 t 检验(方差不齐) .也可以进行非参数检验 .,2. 效应尺度统计量(effect size statistics):除开假设检验外 , 还可以把实施干预措施前后 , 量表两次得分转换为 “效应尺度” 统计量来评价量表的反应度.,效应尺度=(干预得分-干预后得分)/干预前得分的标准差,一般认为 , 效应尺度小于0.2 , 则反应度甚差 ;0.20.50之间反应度较小 ; 0.510.80为反应度较大 . 如果量表在干预前后两次得分的假设检验有统计学意义的差别,而效应尺度却小于0.20 , 则显示该量表的反应度甚差 .,第四章病证结合的观察性描述研究:横断面调查分析,观察性描述性研究主要包括横断面调查、诊断试验评价与筛查、生态学研究、临床医疗调查报告、病例总结分析,专家述评等,属于观察性描述性研究。其科学价值可参考加拿大MCMaster大学的四级分类方法,属于第三级(较低一级)研究设计方案,论证强度较弱。,第一节横断面调查的概念和特点,横断面调查又称现况调查(cross-sectional survey)或患病率(现患病,prevalence rate)调查。是在某个时点或较短时段内(看成一个时点,一般在一个月内完成调查),调查一个特定人群样本中医证候的分布频率以及与某些因素的相关关系,可以得到证候的现患率(prevalence rate)和一些可疑的影响因素。,现况调查可以将证候按人群各种特征间、时间、地区间(合称“三间”)的横断面分布频率显示出来,而且可以获得影响证候“三间”分布频率的相关因素信息。,由于证候与相关因素是在同一次调查中得到的,即果与因同时存在,无法判断发生时间的先后顺序,除非一些持续不变的因素如家族史、性别、血型、基因型外,不能推断证候与相关因素之间存在因果联系,即不能确定病因或危险因子。,尽管不能进行病因推断,但却是病因研究必须的第一步,能为病或证候的病因(或危险因子)研究提供工作假设的线索,为第二步观察性分析性研究(包括回顾性病例对照研究和前瞻性的队列研究)以及第三步的干预研究(包括治疗性临床试验、预防性临床试验、以群体为单位的社区试验)提供基础。,第二节 横断面调查的目的和用途,1. 证候按人群各种特征的分布频率:年龄、性别、种族、基因型、经济收入、职业、婚姻、家庭状况等一切可能影响证候的分布频率。,一、了解证候人群人中的现况和描述证候按“三间”的分布频率,3. 证候按地区的分布频率:不同地理区域可能影响证候的分布频率。,二、了解影响证候“三间”分布频率的相关因素,2. 证候按时间的分布频率:人群抽样调查时间的不同(例如季节和年份)可能影响证候的分布频率。,1. 证候按人群各种特征的分布频率:年龄、性别、种族、基因型、经济收入、职业、婚姻、家庭状况等一切可能影响证候的分布频率。,2. 证候按时间的分布频率:人群抽样调查时间的不同(例如季节和年份)可能影响证候的分布频率。,3. 证候按地区的分布频率:不同地理区域可能影响证候的分布频率。,三、了解影响证候“三间”分布频率的相关因素,如果是病证结合研究,影响病的患病率的相关因素,也可能是证候影响因素。例如:软水质使冠心病高发,硬水质使龋齿高发,黄曲霉素B在食品中的浓度与肝癌患病率呈正相关,吸烟与支气管肺癌,某些地区的民族某种病低发和高发,即使移民到某国几代人后仍与该国居民的患病率(或发病率)水平有显著差别。所有这些相关因素都可能影响证候的分布频率,因为证候与病都是反映疾病和健康状况的概念。,四、了解证候分布频率的动态变化,如果能像全球疾病监测那样,在监测点同样可以做到证候的监测,在同监测的相同人群样本中2次以上的调查,就可以提供时间动态变化。,第三节 人群抽样调查设计及随机抽样的SAS程序,一、目标明确 1、主要了解某病的证候分布频率:使用医院确诊为某病的连续病例,直到满足样本含量为止。医院病例的缺点:不能计算病或证候的患病率(时点患病率某时点新老病例数之和/该时点平均人口数),只能计算某病的某证候分布 频率。因为医院的病例不能包含各年龄组、各职业、各病期、种种病情(轻、中、重、并发症)的全部病例,所以医院病例是该病的有偏样本。理想的人群样本来自自然人群(人群各种特征的比例符合所在的市或县最近一次人口普查的特征比例)。,2、了解某病及证候的患病率及其影响因子(相关因素):来自自然人群的样本。城镇的居民委员会或农村的行政村均为自然人群。,二、统一诊断标准,1、病的诊断标准:国际标准或国家标准。 2、证候的辩证标准:笔者建议制定“统一的辩证用四诊量表”作为目前阶段统一的辩证标准,即暂行“金”标准。制定方法可参阅本书第一章。,三、调查表 应包含一般项目和研究项目。 一般项目:姓名;性别;年龄组(按世界卫生组织提供的“标准人口构成”构成年龄分组方法,成年人5岁一个年龄组,75岁以上只一个年龄组,例如20 25 3075);职业。,研究项目:凡是可疑的病或证的一切相关因素,而且打算统计分析的,都不应遗漏; 不打算统计分析的,一项也不要列入。 各种项目都要写明计算机编码:三分类名义变量如男和女,编码为1和2;多类无序名义变量(如某病的证1、证2、证3)以及多类有序变量(等级变量),编码为1、2、3K;连续型变量(计算资料)填写实际观测值。 研究项目应尽量选择客观的测量指标,即硬数据(hard data),尽量减少主观的重复性差的不能准确度量的指标,即软数据(softdata)。必不可少的软数据(如症状、心理学指标等)收集,为了统一,宜做成量表(scale),要做效度(真实性、准确度,即validity)和信度(可靠性、可重复性、精确度,即reliability)检验,可参阅本书有关章节。,四、抽样方法及SAS 统计程序 无论采用何种抽样方法,必须遵守随机抽样的原则。因为只有随机样本才能代表总体(自然人群中所有的某病某证候者的总体)的各种特征。而且要计算抽样误差(sampling error),以便对总体参数作出估计,并对抽样调查结果的真实性(与总体真值的距离,即准确度或效度)和可靠性(可重复性,即精确度或信度)进行评价。,1、单纯随机抽样(Simple random Sampling) 是简单又基本的抽样方法,从N个人的总体中随机抽出 n 个构成一个含量为 n 人的样本。这里,基本抽样单位是“人”。笔者建议使用SAS程序进行随机抽样,单纯随机抽样SAS程序举例:,设计例题1 现有有限总体2000人,欲从中随机抽出50人的样本 ,怎样改写SAS 程序?,data ebm3.samp;,do i=1 to 50;,x=ranuni(20020808);,y=int(x*2000);,output;,end;,run;,运行结果如下:,OBS I X Y,1 1 0.09759 195,答: 欲抽出50人,第3行do i1 to 50;如欲抽出80人,则把 50 改为80;从2000人的有限总体中抽样,所以第5行y = int(x*2000);即随机数先乘2,000 再取整。如有限总体为20000人,则把2000改为20000即可。第4行括号内是种子数,相当于抽样起始点,本例取日期,读者也可取其它任意正整数。当然首先给有限总体的每个抽样单位编号。,上面运行结果的第4列(Y列)就是在2 000人的有限总体内随机抽中的50人随机样本号,它是通过x*2000得到的,x也是随机数。,50 50 0.53951 1079,49 49 0.16101 322,2、抽样误差的计算公式: (1)无限总体抽样误差: 当(n/N)5%时,N 可看作无限总体。例如本例,n/N=50/200=2.5%,看作无限总体。均数的标准误:,率的标准误:,式中S=样本标准差,样本均数的标准误,p=样本率,n=样本含量。,如果n/N5%,N 看作有限总体。上述2个公式分别乘上校正数(1n/N)的平方根。,(2)有限总体的抽样误差:,均数的标准误:,率的标准误:,3、整群抽样(Cluster Sampling) 基本抽样单位不是以“人”为单位,而是以“群组”为单位,例如城镇的居委会,农村的行政村、学校的班、部队的班、工人的车间等。,设计例题2 欲调查北京市2000年8月城区常驻户口居民II型糖尿病患病率及II型糖尿病气阴两虚证的现患率。 问:怎样进行整群抽样? 答:基本抽样单位是居委会。按照市公安局户口处的资料,先把各城区各街道办事处各居委会的名称、人口列表,并且按某种人为的顺序对居委会编号,假定1到2000号。再计算样本量,得出平均需要多少个居委会作为样本,(样本量计算方法见本章第五节), 假定需要抽出50个居委会。最后仍用SAS程序(数据集名:ebm3.samp)随机抽出50个居委会。被抽中的居委会全体居民都是调查对象。 整群抽样的抽样误差大于单纯随机抽样,需要增加样本量,一般增加50左右即可。,4、分层抽样(Stratified sampling) 先按总体人口学特征(年龄组、性别、种族、职业、经济收水平等)或疾病的病情(轻、中、重、并发症等)分成若干层次,并在每层内作单纯随机抽样。一般说,当样本会计师足够大时,调查患病率和相关因素,只要单纯随机抽样即可,不一定需要事先分层。但是调查结束后处理资料时,分层统计分析是必要的,这是为了控制混杂偏倚(confounding bias)。,第四节 横断面调查需要的样本含量估计方法,一、调查总体均数时样本含量计算公式(当总体标准差和均数未知时,都用样本统计量代替):,式中,n= 样本含量;=0.05时,s=样本标准差;d=允许误差,即样本均数与总体均数的容许差值,既可用所求总体均数95可信区间间距之半(1.96倍标准误);又可根据专业知识提出一个容许差d,通常用后者。,设计例题3 某单位拟抽样调查了解该地区20岁男性身高。据预调查计算的样本均数为170cm,样本标准差为30cm,设计者要求容许差值d=总体均数(用样本均数代替)的1/100=170cm/100=1.7cm.,问:需要多大样本含量?,答:设定=0.05,s=30cm,d=1.7cm,t0.05 =1.96 。将数据代入公式4-5得:n=(1.96*30/1.7)2=1196.3 。即决定至少需要抽样调查1197名20岁男性。 如果想减少样本量必然要增大容许误差d,例如令d= 总体均数(用样本均数代替)的2/100=170cm*0.02=3.4cm. 将数据代入公式4-5,得 : n=(1.96*30/3.4)2=299.1 即至少需要抽样调查300名20男性。,设计例题4 某中医科拟抽样调查了解空腹糖200mg/dL的II 型糖尿病气阴两虚证的证候加权积分均值(指总体均值,这里的总体是研究结果推论的范围,即全国的该证型患者)。/15=0.2。,据预调查样本计算,样本证候加权分均数为3分,标准差约为1分,要求容许误差d=总体均数(用样本均数代替)的1/15=3分/15=0.2。,问:所需要调查多少人数? 答: 设定0.05,s=1分,d=0.2分,将数据代入公式45,得:n=(1.96*1/0.2)2=96.04 即至少需调查97位空腹血糖200mg/dL的II型糖尿病患者,才能了解气阴两虚证的加权均数,其误差在0.2分范围内。,二、调查总体阳性率时样本含量计算 当阳性率 p 在0.20.8时:,式中n为所需样本含量;当时0.05时, p为总体阳性率的估计值;d为容许误差,一般可取总体率的1/10。,设计例题5 江南某地区欲用抽样调查了解该地区居民血吸虫感染率。总体感染率不知。要求样本感染率与总体感染率之差不超过总体感染率的1/10,问需调查多少人?,答:因为总体感染率一无所知,但估计在0.20.8之间,所以可以假定p0.5;容许误差要求不超过总体感染率的1/10,即d=0.1,p=0.10.5=0.05;设定0.05,代入公式4- 6 得:,即需要调查至少385人。,设计例题6 某市欲抽样调查乙肝感染率。总体感染率用前些年文献中报告的样本率近似代替,约15;容许误差要求不超过总体感染率的1/10;问样本含量。 答:p=0.15 ,d=0.1 ,p=0.10.15=0.015,设定=0.05 代入公式4-7:,即至少需要调查2177人。,设计例题7 现欲抽样调查了解命门火衰证在男性40岁以上阳痿病人中的比例(即总体率)。据笔者预调查经验,约为80;要求了解总体率的真值。要求样本得出的现患率与总体现患率真值之间的差距不超过总体率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论