PRO量表研制和应用_第1页
PRO量表研制和应用_第2页
PRO量表研制和应用_第3页
PRO量表研制和应用_第4页
PRO量表研制和应用_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、量表的研制与应用第一章 前言QOL和 PRO1970年代,国外开始关注健康相关生存质量(health related quality of life,HRQOL)和健康状况 (health status)2000年以来,国内外医学专家在临床实践中越来越多地重视患者报告的结局指标 (patient reported outcome, PRO)国内外研制了许多测评量表作为评价工具。 有的国家还成立了专门的量表专家科学咨询委员会,专门评估量表的质量和应用价值。2002年,欧洲癌症研究与治疗组织制定了欧洲癌症生存质量量表模块的研究和在临床试验中的应用规范;2006年, 美国食品与药品管理局 (Food

2、 and Drug Administration, FDA) 颁布了PRO量表研制的规范草案。中国, “十五” 科技攻关课题中医临床疗效评价研究的一部分,由方积乾、刘凤斌、郝元涛、刘保延、谢雁鸣等起草和制定医药领域量表研制与应用指南(草案)。慢性阻塞性肺病量表Patient Reported Outcomes Measurement Information System (PROMIS) funded by the NIH, is a system of highly reliable, precise measures of patientreported health status for

3、 physical, mental, and social wellbeing. PROMIS tools measure what patients are able to do and how they feel by asking questions. PROMIS measures can be used as primary or secondary endpoints in clinical studies of the effectiveness of treatment. TwitterpromisNIH1.1 量表的概念与分类量表是测量“软指标”的工具 Questionnai

4、re Scale Instrument 测量某个概念:不可直接测量 - 潜变量(latent variable),用可观测变量来表征潜变量 - 量表的条目(item), 或称项目。测量过程第一步,明确概念的定义,必须用尽量简洁和准确的语言定义所研究的概念; 第二步,根据概念的定义确定相关的领域 (domain) 和方面 (facet) 及其操作性定义 - 分别对应于一个潜变量;第三步,针对各个领域和方面产生相应的可观测变量:问题条目 (item); 第四步,构建测量模型 (model):潜变量和可观测变量之间的关系。医药领域常用的量表(1)普适性量表:适用于所有疾病人群和健康人群,用于了解一般

5、的情况。例如, 世界卫生组织生存质量测定量表 WHOQOL-100 和 WHOQOL-BREF 健康状况调查量表 SF-36(2)特异性量表:针对特定疾病的量表。例如, 艾滋病人生存质量量表 肺结核病人生存质量量表 儿童生存质量量表 老年人生存质量量表 残疾人生存质量量表1.2 量表在医学领域的应用与现状一般人群健康状况测评 健康影响因素与防治重点 -有助于卫生资源配置、计划和决策的制定临床疾病的评估 - 通过PRO量表比较治疗前后的患者的主观感受,从而判断治疗方案对疾病的干预效果和不良反应; 比较不同治疗方案,帮助选择更为优越的个体化治疗方案。康复医学评估 - 较之通常的客观测定更能真实地评

6、价康复对象的功能障碍状况和康复效果。 中医药研究 传统中医的疗效评价以软指标为主? - 描述不确定、判断笼统性,严重阻碍了中医药的现代化发展。 用西医实验室指标评价中医疗效? - 中医治疗对象不是西医实验室指标,被动,不公平! PRO ? - 符合中医传统,普遍认可,已广泛应用!量表研制的现状测评量表琳琅满目,却并不完善 量表研制的规范达成共识 - 出现了若干由专门的委员会或机构制定的量表研制规范或指南。国际范围资源共享 - 国际机构纷纷建立网上资源信息库,信息共享,推动交流与应用。国内如火如荼,唯缺量表 第二章 量表的研制假设概念框架列出概念确定人群综述概念框架将PRO与主要终点挂钩问卷研制

7、计划PRO问卷研制v.修改问卷改变条目词句、人群、反应模式、回想时间段或操作方式 向其他语言翻译和文化调适评估适宜性撰写修改文件 ii.调整概念框架和问卷初稿生成新条目产生问卷 选择操作方式、回想时间段、反应模式问卷格式认知报告初稿预试验撰写内容效度文件iii.确定概念框架和评价其他测量性质以计分规则确定概念框架评价计分的信度、效度和区分度完成问卷内容、格式、计分方法和培训材料撰写关于测量的文件iv.收集、分析和解释数据准备研究计划书和统计分析计划收集和分析数据 利用累积分布和反应者定义评价疗效撰写与说明书有关的解释治疗益处的文件PRO的测量工具的制定步骤2.1 基本原理与步骤 确定研究目的

8、被测概念的确立及操作性定义 文献回顾 条目的形成和筛选 量表的考评及修订2.1.1 根据研究目的确定量表性质量表的性质决定于研究目的。 研究一般人群的生存质量或健康状况? -普适性量表(如WHOQOL100)研究老年人群的生存质量或健康状况? -特异性量表(如WHOQOLOLD)比较多种疾病治疗的成本-效果? - 普适性量表(如SF36)比较治疗肺癌的两种方法? - 特异性量表(如FACT-L)评价?既需要普适性量表,又需要特异性量表比较?特异性量表2.1.2 测定概念的定义及分解文献检索,形成概念的结构模型: 概念的操作性定义、 几个领域 (domain) ? 每个领域含哪几个方面 (fac

9、et)?中华生存质量量表:形神统一领域、七情领域、社会领域、自然领域概念与领域的因果模式: 领域是所测概念的体现或反映(图1) 所测概念是领域测定值的综合(图2)图1 领域是所测概念的体现图2 概念是领域的综合2.1.3 建立条目池条目的产生1)核心小组(focus group) 成员:广泛,由能代表目标人群的人员组成,除专家、医生、护士,必须有被调查者; 互相不认识; 36个核心小组, 每组6-8人 核心小组的讨论: 研究者主持说明座谈的目的和作用 没有正确或错误不同的观点对研究都很重要记录、录音,但资料保密2) 访谈选择3050位相关患者,主诉既往和现在的症状;核心小组综合归纳,提出条目;

10、根据条目的频率、重要性决定取舍 - 来自患者,切合实际3) 推导法在预想概念结构模型的基础上,根据专业知识和经验写出与上述概念有关的条目- 层次分明、内容完善4)文献法阅读文献及相关的量表,摘录相关的条目初步确定条目整理,使每个条目只表达一个含义;提请课题组以外的专家,征求意见根据语义,条目可分为:评价性条目(evaluation),如 好 差强度性条目(intensity), 如 重 极重频度性条目(frequency), 如 很少 经常能力性条目(capacity), 如 能 完全能 根据条目的内涵, 可分为:感知的客观性条目(perceived objective item)自己报告的主

11、观性条目(self-reported subjective item) 确定条目的反应尺度(response scale)线性尺度 在具有刻度(如0-10)的线段上划记等距等级尺度 (Likert 法) 在一些等距离的、反映程度的词语间选择答案。如 很差 差 中等 好 很好 Likert (1932) 创立,3点法、5点法和7点法,5点法最为常用。不等距等级尺度 备选词语的程度间不完全等距。2.1.4 量表的初稿量表的格式 卷首语 调查的目的、对患者带来的益处、该量表的设计。 填表说明 填表方法、举例说明。 条目的排列 相类似的条目排在一起?知情同意书 应说明: 伦理问题、隐私问题、是否会对被

12、调查者造成不便 应留有空间,供被调查者填写需补充的内容; 被调查者签名和填写日期预调查从目标人群、一般人群中分别选择4050名个体,进行现场测试;困难度:条目的通过率,如某个条目很多人都未回答,则说明条目不适宜或难以理解。反应度:被测者如何回答? 集中于特定的选择项? - 天花板效应、地板效应 某个选择项完全没有人问津?条目涵义:相关较大的条目,择其主要者分析、比较、讨论和修改,整理成量表初稿。2.1.5 现场调查目标人群 根据研究目的确立目标人群,如 健康人、患者?样本量和构成 性别、年龄、文化层次、地域等的分配比例? 样本量多大? 抽样方法 在目标人群中做抽样调查; 样本具有代表性,方法不

13、限样本样本构成某些重要混杂因素(如文化程度、地区、城乡、年龄等)的构成比例与总体接近;资料收集完毕后,如果发现样本与总体的构成出入较大,可以进行校正(如标准化)样本量多领域、多条目,多终点,可借鉴多变量分析中样本含量的估算经验和方法。Kendall认为作为一个粗糙的工作准则,样本含量可取变量数的10倍。例如,20个条目,至少应测定200例。2.1.6 结果分析和条目筛选综合多种方法结果, 兼顾专家意见, 形成最终量表。常用方法:专家重要性评分法 从重要性角度筛选条目。 邀请若干名医药专业人员分别、独立对各条目的重要程度评分;求平均值离散趋势法 (变异系数法) 从敏感性角度筛选条目。 指标的变异

14、小,区别能力就差 - 选变异较大的指标 。 偏离正态分布, 则变量变换,使接近正态。回归分析法 从与综合评分关系密切的角度筛选条目。 要求被调查者对其生存质量或健康状况给出一个综合评分; 以此综合评分为因变量Y,各条目的得分为自变量,进行多重回归 - 筛选出对综合评分影响较大的条目。 克朗巴赫系数法 从内部一致性角度筛选条目。Cronbach 系数,反映“领域”或“方面”内部条目间一致性。 - 如果某条目去掉后,Cronbach 系数较大上升, 则剔除该条目。因子分析法 从代表性角度筛选条目。 根据设想的量表结构作因子分析 - 挑选因子负荷较大者聚类分析法 从代表性角度筛选条目。 将相似的条目

15、归并在同一类,类内条目差别小,类间差别大 - 从同一类指标中挑选代表性条目。判别分析法 从区分性的角度筛选条目。 选择能区分 病人 vs. 健康人或 特殊人群 vs. 一般人群或 A疗法 vs. B疗法 2.2 量表的考核量表的效度(validity) 量表能否测得所需测量的东西? 量表的信度(reliability) 测量结果的可靠性如何?2.2.1 效度及其考核方法量表是否真正能测量所要测量的概念? 例如, 智商测验是否真正测量了智力的高低? 生存质量量表是否真正测量人们的生存质量? 抑郁量表是否真正测量病人抑郁的程度?四类效度: 内容效度、 标准效度、 结构效度、 区分效度内容效度(co

16、ntent validity)专家评价: 概念的定义 vs. 最终的量表 内容效度的局限: 对概念定义的依赖性。 许多概念的定义缺乏一致的认同, 例如, - 许多测量 “亚健康”的量表,彼此差别较大统计方法: 若条目与所属“领域”得分的相关强,与其它“领域”的相关弱; 若条目与所属“方面”得分的相关强,与其它“方面”的相关弱 -具有较好的内容效度。标准效度(criteria validity)又称效标效度:测量与“标准”测量之间接近的程度 - 常采用相关系数来衡量。效标:选定一个与之比较的“标准”。 有时不存在公认的“标准”量表: 相关系数大?不好! 相关系数小?不好!结构效度(constru

17、ct validity)因子分析: 提取一系列公共因子(潜变量); 高度关联的“条目”分成几群,每群共享一个公共因子; “条目-公共因子” 、“公共因子-公共因子” :反映量表的基本结构。探索性因子分析 (expolratory factor analysis, EFA) 证实性因子分析 (confirmatory factor analysis, CFA)借助因子分析考察结构效度步骤 设计量表时假设理论结构; 实际测量数据; 验证数据是否符合假设的结构?证实性因子分析 更适合评价量表的结构效度。区分效度 (discriminant validity)步骤: 选择两类不同人群(例如,“健康人”

18、和“病人”); 从两类不同人群分别抽样; 测量两组样本(各领域得分和总得分); 这两组样本得分的差别有统计学意义吗? - 量表区分不同人群的能力。2.2.2 信度及其考核方法测量的一致性 答案的波动越大,信度越低; 回答的一致性越好,信度越高常用三种方法: 重复测量法 分半信度法 Cronbachs 信度系数重复测量法(test-retest method)假定:在这段时间内被调查者的情况没有发生变化。- 两次测定各项得分间的相关与差异分析信度系数,一般要求达到0.7以上。困难: 被调查者可能随时间发生变化; 记忆,第二次测定结果未必反映真实情况。间隔时间:不宜太长,也不宜太短,2-4周为宜分

19、半信度法(split-half method)将调查的条目分成两半 计算两半得分的相关系数r; 进一步计算分半信度系数(斯皮尔曼-布朗公式) 假定:两半部分中,条目分数的方差相等优点:只在一个时间点上进行; 不受记忆效应的影响; 经济和简便。缺点:如何分为两半?如果两半条目的方差不相等,分半信度系数往往低估信度。克朗巴哈 信度系数 (Cronbach coefficient) 评分者的信度多位评分者评分的一致性由主观性测题构成的测验(如作文题),必须考虑评分者信度一、两位评分者: 相关系数若有两位评分者,每份测验均有两个分数,则两个分数间的相关系数即为评分者信度。分数是连续变量,采用Pearson相关系数;若是有序变量,采用Spearmen相关系数二、多位评分者: 系数第 i 评分者所评分数的方差多个评分之和在人群中的方差例 3 位评分者 (K=3),7名学生评分者方差分别为 9.1, 6.9 和 5;评分之和的方差为 34; 评分者信度=0.58 三、肯德尔(Kandall)和谐系数学生 (n=5)评分者(K=4) R1234112126231217353341544545185245314合计 秩和 R 的离均差平方和最大离均差平方和 例2.2.3 反应度 (responsibility to change)反应度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论