项目反应理论在医学量表条目筛选中的应用_第1页
项目反应理论在医学量表条目筛选中的应用_第2页
项目反应理论在医学量表条目筛选中的应用_第3页
项目反应理论在医学量表条目筛选中的应用_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、工程反响理论在医学量表条目挑选中的应用工程反响理论在医学量表条目挑选中的应用条目挑选是量表编制及简化工作中不可缺少的部分,选择好的挑选方法、恰当的评价指标及挑选好的条目是保证最终量表具有较好的信度和效度的重要过程。目前条目挑选的方法主要包括经典测量方法TT和工程反响理论iterespnsethery,IRT方法。TT,比方相关系数法、因子分析法、克朗巴赫系数法、重测信度法等1-2,因其理论较成熟,数学模型简单,在国内得到广泛的应用。然而它在理论假设和实际应用方面也存在许多缺乏,如潜变量与观测变量之间通常不是线性关系,工程参数严重依赖于被试样本,只提供平均测量信度等。IRT的开展抑制了上述缺陷3

2、。与TT相比,IRT具有以下优点:被试者的才能估计不依赖于量表条目;工程参数区分度和难度估计不依赖于被试样本;用信息函数的概念代替了TT的信度理论,可以提供条目信息量及不同才能程度对应的测量信度。IRT是20世纪50年代开展起来的一种心理与教育测量理论,主要用于试题、量表条目的挑选和评价,在西方国家开展很快,但在国内用于医学研究本文由论文联盟搜集整理的很少,因此,本文介绍IRT的根本特征及其在医学量表的工程分析中的应用。1IRT的根本介绍IRT是一系列心理统计学模型的总称。美国心理测量学家Lrd于1952年提出著名的累积正态模型nralgivedel标志着IRT的正式诞生。IRT对所测量的工程

3、可以找到一条工程特征曲线I,通过被试者对工程的反响与其潜在特质之间的关系用一单调递增的工程反响函数来估计被试者的才能程度。I是IRT的根底,两个常用的参数区分度和难度决定了它的形状,常为一条S型曲线,见图1。难度参数b,也称阈值参数是指被试者按给定方向选择某个选项的概率为50%所对应的潜在才能点;难度参数越大,被试者选择这个选项需要的才能就越大。区分度参数a是指难度参数对应的I曲线拐点的斜率。区分度参数越大,表示条目对不同潜在特质程度的人群有越高的区分才能。三参数模型还可以估计伪机遇参数,在考试中,的估计可以进步才能估计的精度,但在安康研究中,估计的意义不大,反而增加了参数估计的复杂性。对于多

4、级记分模型,不同模型的难度参数概念略有不同,它们的原理都是将k个选项的条目分成k-1个二分类条目,故有k-1个阈值参数。在I的根底上,IRT还可以产生类别反响曲线Rs,它表示每个反响选项在特定才能程度下被选择的概率,因此,每个选项都有一条相应的类别反响曲线,如图2为一个5分类条目的Rs,假设条目基于分部评分模型,那么相邻两个类别反响曲线的交点可作为这个条目的阈值参数。图1工程反响曲线IRT的另一个重要特征就是信息函数,它是潜在才能的一个连续函数。对具有同一才能的一组被试,其才能估计值的标准误差越小,估计值对真实值提供的信息量就越大,当用极大似然法估计时,估计量随样本量的增大而渐近正态分布,那么

5、测验信息函数可以定义为才能估计值的方差的倒数,即I=1/var或者SE=1/。测验信息与测量误差是一一对应的,信息量越大,测量精度越高,信息量最大值所对应的才能程度代表该条目所能最准确测量到的才能参数估计值。假设记工程信息函数为Ii,n个条目的信息累加,那么可产生测验信息函数,其数学表达式为I=Ii。可见,每个条目可以单独对量表总信息作奉献,奉献量大小不受量表其它条目的影响,因此可以为增加或者删除条目提供根据。2IRT在条目挑选中的应用2.1IRT模型的选择IRT模型是建立在强假设的根底上,假设假设不成立,那么可能导致得到的结果不能很好地解释数据信息。因此,选择适当的模型是很重要的。IRT有单

6、维、多维的参数模型及非参数模型等多种模型,由于后两种模型较复杂且应用少,本文主要介绍单维的参数模型3-4。选择模型时,需要考虑条目的选项个数、模型参数及参数是否受到限制等问题,表1总结了8种模型的主要特征。目前IRT的参数估计方法很多,大多数方法是以极大似然估计法和Bayes估计法为根底,其中极大似然估计法的应用最广泛。目前对于P、GP、GR等模型的选择没有明确的标准,主要根据个人的偏好或者对软件的熟悉程度选择其中一个模型。比方Ru、Parsale、insteps等软件可用于P的估计,而ultilg软件多用于GR的估计。2.2评价IRT模型的拟合情况2.3条目挑选和评价指标根据Edelen等1

7、2和eads等13的研究,目前基于IRT的条目挑选指标主要有:区分度参数a,a太小说明条目对被试者的才能估计提供的信息量太少;根据类别反响曲线Rs和难度参数判断条目是否存在逆反阈值reversedthreshlds、条目选项的有效性及条目的难度范围是否适宜;个体-条目图,将条目难度和个体潜在特性反响在同一尺度上,用于考察条目测量被试者才能的范围及条目是否足够或者出现冗余等情况;条目对模型的拟合情况;条目信息量及信息曲线,选择信息量大和覆盖才能范围广的条目,通过信息曲线可以判断条目冗余的情况;条目在不同群体上的功能差异分析。不同的模型提供不同的指标,因此不是所有模型都提供上述6种指标,比方分部评

8、分模型不提供区分度参数,等级反响模型不提供个体条目图等。对于量表的编制或者修订,应该根据选定的模型选择相应的挑选指标,删除某些不符合要求的条目后,再对剩余条目进展重新评价,直至所有条目都满足要求为止。对于较成熟的量表,除考虑上述指标外,还可以用其他方法考察量表简化的情况。Bjrner等14根据简明量表的条目构建评分算法预测原始量表的总分,评价预测分与原始分的关系。3样本量大多数应用IRT的文献都没有对样本量有明确的说明,样本量的多少是否会影响IRT模型的应用呢?根据国外文献,模型越复杂,需要的样本量越大。Linare15认为,要保证Rash模型参数估计的稳定性,至少需要100名被试者。对于拥有

9、两个及以上参数的模型,如等级反响模型至少需要250人,但为了更准确的估计参数,样本量为500人较为适宜3。样本量越大,条目参数估计对应的标准误越小,测量也越准确。假设IRT是用于条目池的工程分析,那么需要的样本量较大,而假设是用于成熟量表条目特性的评价,那么需要的样本量较小12。此外,数据满足IRT模型假设的程度越好,需要的样本量越小9。4展望随着生存质量和患者报告结局的不断开展,人群安康评价、患者生存质量监测、患者挑选如抑郁患者等研究需要越来越多的量表,IRT的引入为这些量表的开展及简化提供了有力的工具。然而IRT的引入并不意味着要摒弃经典测量理论。经典测量理论主要从宏观的角度评价量表,而IRT那么从微观的角度分析每个条目,两种理论相辅相成,互相补充,将两者有机交融能使最终量表具有更好的信度和效度。随着IRT在生存质量量表研究中的应用的不断增多,其自身的某些缺陷也逐渐突现,如IRT是建立在比较复杂的数学模型上,理解比较困难,依赖较强的假设。在安康结局测量研究中,多数量表由多个方面组成,很少只测量单一的才能,因此IRT的单维性假设在安康研究中很难实现。假设分维度来分析多维度量表,单维性的问题解决了,但在每个维度包含的条目数很少的情况下会增大测量误差,且没有考虑多维度之间的相关性,致使测量结果准确性下降。为解决这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论