(概率论与数理统计专业论文)birnbaum信息在教育和心理测量中的应用.pdf_第1页
(概率论与数理统计专业论文)birnbaum信息在教育和心理测量中的应用.pdf_第2页
(概率论与数理统计专业论文)birnbaum信息在教育和心理测量中的应用.pdf_第3页
(概率论与数理统计专业论文)birnbaum信息在教育和心理测量中的应用.pdf_第4页
(概率论与数理统计专业论文)birnbaum信息在教育和心理测量中的应用.pdf_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东大学硕士学位论文 b i r n b a u m 信息在教育和心理测量中的应用 刘谦 ( 山东大学数学与系统科学院,济南,山东2 5 0 1 0 0 ) 中文摘要 本篇论文主要分析了b i r n b a u m 信息函数在教育与心理测量中的模型及 其各种变化下的应用论文认为一个被测特质的合理估计可以利用b i r n b a u m 信息函数的相关理论,在对该特质或其相关因素进行多次测量之后,对多个测 验分数赋以合理权重( 最佳组合权) 以求取最佳组合分数的方式获得论文的 主要结论是在假定测量分数值服从指数型联合分布时得到的文中主要考虑的 重要模型包括参数模型与非参数模型假定函数形式h 是已知的,z 是未知的, 则本篇论文考虑的参数模型可以表示为真分数模型x = tte 的一般的参数 变化x = h ( t ) + e ,参数变化形式中的线性模型x = z z + e 以及广义线性 模型x = 九( p ) + e 本篇论文考虑的非参数模型有x = l ( t ) + e ,以及单指 标模型x = z ( z 7 卢) + e 本篇论文从心理测量学、教育测量学的历史及其发展谈起,简单介绍了测 量学历史上经典测验理论( c t t ) 和项目反应理论( i r t ) 中比较重要的分数模 型及评价测验评分方法的相关标准,从而引出了b i r n b a u m 信息函数的概念 之后本篇论文较为详细的介绍了b i r n b a u m 信息函数表达式的由来及其 合理性并对相关概念如测验的信息函数及其性质进行了简要介绍本篇文章 所涉及到的其他知识包括利用b i r n b a u m 信息在真分数模型x = t + e 下给 出的最佳组合权的相关结果也以预备知识的形式作了简要介绍 本篇论文的重要结果是参数模型下的若干定理与结论,其中包括定理证明 过程以及对应的参数估计论文在真分数模型的几种重要的参数形式变化下, 利用b i r n b a u m 信息函数给出了不同模型对应的最优组合权本篇论文之后 山东大学硕士学位论文 还给出了参数模型最优组合权的估计方法对于非参数函数情形下的最优组 合权,本篇论文也给出了对应的估计方法 本篇论文所使用的最佳组合法能够获得需估计特征的最大信息,能够突破 经典测验理论( c t t ) 和项目反应理论( i r t ) 的局限,具有一定的合理性,并具 有一定的实际应用价值 关键词:真分数模型;b i r n b a u m 信息函数;指数型分布;最佳组合法 山东大学硕士学位论文 a p p l i c a t i o no fb i r n b a u m i n f o r m a t i o n i ne d u c a t i o n a la n dm e n t a lm e a s u r e m e n t l i uq i a n ( s c h o o lo fm a t h e m a t i c sm a ds y s t e ms c i e n c e s ,s h a n d o n gu n i v e r s i t y , j i n a n ,s h a n d o n g2 5 0 1 0 0 ,p r c h i n a ) a b s t r a c t t h i st h e s i sm a i n l ya n a l y z e st h ea p p l i c a t i o no fb i r n b a u mi n f o r m a t i o no i lt h e e d u c a t i o n a lo rm e n t a lm e a s u r e m e n tm o d e l s t h em e t h o do ft h i st h e s i sw i l lb eb a s e d o nm a n yt e s ts c o r e so ft h e8 a j n ec h a r a c t e r i s t i c s a p p l y i n gb i r n b a u mi n f o r m a t i o n , r e a s o n a b l ew e i g h t sw i l lb er e a s o n e do u tt om a k et h eb e s tc o m b i n a t i o no ft h e8 c o r e s b ea ne s t i m a t i o no ft h ep e o p l e sq u a n t i t yo rc h a r a c t e r i s t i c s t h ec o m b i n a t i o nw i l lb e ag o o de s t i m a t i o nw h i c ho b t a i n st h eg r e a t e s ti n f o r m a t i o no ft h eq u a n t i t y t h em a i n r e s u l t so nt h ep a r a m e t r i cm o d e l so ft h i st h e s i sa r eg o tw i t ht h et e s ts c o r e ss a t i s f y i n g e x p o n e n t i a ld i s t r i b u t i o nf a m i l y t h ei m p o r t a n tm o d e l sw ec o n s i d e r e di nt h i st h e s i s i n c l u d ep a r a m e t r i cm o d e l sa n dn o n p a r a m e t f i cm o d e l s s u p p o s i n gt h ef o r mo ft h e f u n c t i o nhi sk n o w nb u tzi su n k n o w n b i r 住h a u mi n f o r m a t i o nw i nb eu s e di nd 勖 i n gw i t hs o m em a t h e m a t i c a lm o d e l s t h ep a r a m e t r i cm o d e l sw ec o n s i d e r e di nt h i s t h e s i si n c l u d ex = h ( t ) + ew h i c hi sag e n e r a lp a r a m e t r i cc h a n g eo ft h et r u e8 c o r e f u n c t i o n l i n e a rm o d e lx = 刀p + ea n dg e n e r a l i z e dl i n e a rm o d e lx = ( 卢) + e a r ea l s oc o n s i d e r e di nt h i st h e s i s t h en o n p a r a r n e t f i cm o d e l sw ec o n s i d e r e di nt h i s t h e s i si n c l u d es i m p l ex = l ( t ) + ea n dt h es i n g l e - i n d e x e dm o d e lx = z ( 国+ e t h i st h e s i sb e g i n sf r o mt h ei n t r o d u c t i o no ft h eh i s t o r ya n dt h ed e v e l o p m e n to f m e n t a im e a s u r e m e n to re d u c a t i o n a lm e a s u r e m e n t a n dt h e nw ei n t r o d u c es o m ei r a - p o r t a n tm o d e l si nc l a s s i c a lt e s tt h e o r y ( c t t ) o ri t e mr e s p o n s et h e o r y ( m t ) a n dw e d i s c u s st h ec o r r e s p o n d i n gc r i t e r i o ni ne v a l u a t i n gt h eg o o d n e s so fe s t i m a t i o n sw h i c h i n v o l v e sb i r n b a u mi n f o r m a t i o nf u n c t i o n a f t e rt h a t ,t h ep r e p a r a t i o no fk n o w l e d g ei nt h i st h e s i si sd i s c u s s e dw h i c hi n - e l u d e st h es o u r o 罄o fb i r n b a u mi n f o r m a t i o nf u n c t i o n t h en o t a t i o no ft h et e s ti n - f o r m a t i o na n di t sp r o p e r t i e sa n da p p l i c a t i o n sa r ea l s oi n t r o d u c e di nt h i st h e s i s t h e i i i 山东大学硕士学位论文 c o r r e s p o n d i n gc o n c l u s i o ne v e rg o ta b o u tb e s tc o m b i n a t i o no nt h em o d e lx = t + e i sa l s om e n t i o n e di nt h et h e s i s t h ei m p o r t a n tr e s u l t si nt h i st h e s i sa r es o m et h e o r i e sa n dc o n c l u s i o n so fp a r a - m e t r i cm o d e l s ,i n c l u d i n gt h e i rp r o o fa n dc o r r e s p o n d i n ge s t i m a t i o no fp a r a m e t e r s 鹏o b t a i nt h eb e s tc o m b i n a t i o no fd i f f e r e n tm o d e l sb ya p p l y i n gb i r n s a u mi n f o r - m a t i o nf u n c t i o nu n d e ri m p o r t a n tp a r a m e t r i cc h a n g e so ft h et r u es c o r em o d e l t h e e s t i m a t i o nm e t h o d so ng e n e r a ln o n p a r a m e t r i cm o d e la n dt h es i n g l e - i n d e x e dm o d e l a r ea l s op r o p o s e d t h em e t h o du s e di nt h i st h e s i sw h i c hi sn a m e dt h eb e s tc o m b i n a t i o nc a no b t a i n t h eg r e a t e s ti n f o r m a t i o n a n dt h i sm e t h o dw i l lb ew i d e l yu s e db e c a u s ei 乞b r e a k st h e l i m i t a t i o no ft h et h e o r yi nc t ta n di r t k e y w o r d s :m o d e lo ft r u es c o r e ;b i r n b a u mi n f o r m a t i o n ;e x p o n e n t i a lf a m i l y o fd i s t r i b u t i o n s ;b e s tc o m b i n a t i o n i v 原创性声明 本人郑重声明t 所呈交的学位论文,是本人在导师指导下,独 立进行研究所取得的成果除文中已经注明引用的内容外,本论文 不包含任何其他个人或集体已经发表或撰写过的科研成果对本论 文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明 本声明的法律责任由本人承担 论文作者签名,皇卫! 鍪 日 论文作者签名,翌! 】! 鍪 日 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅;本人授权山东大学可以将本学位论文全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制 手段保存论文和汇编本学位论文 ( 保密的论文在解密后应遵守此规定) 敝储貅逊圣导师繇薄谬日期:一c 。 山东大学硕士学位论文 第一章引言 1 1 心理测量学的发展 1 9 世纪中后期e 日w e b e r 和g h f e c h n e r 以及形w u n d t 的心理实验 室对心理测量学做出了重大贡献他们当时的研究表明了人的心理特性是能够 像长度等物理量一样进行测量的,然而当时他们试图寻求心理量与物理量确切 的函数,寻求人类普遍的心理量规律,而作为误差忽略掉了受测者的个人差异 实际上,个体差异客观存在是不容忽略的2 0 世纪初,a b i n e t 开始制定智力 量表来求取常模,常模是一个包含概率统计思想的概念,是指测验所应该测察 的被试群体在所测特性上的一般水平或水平分布状态常模及其相应的其他 概念在心理测量技术上具有着划时代的贡献 2 0 世纪2 0 年代以来,心理学发展十分迅速,逐步产生了以真分数为旗帜 的经典测验理论( o t t ) ,该理论属于随机抽样理论,于2 0 世纪5 0 年代臻于成 熟之后又产生了从理论上发展的强分数理论1 9 7 2 年,c r o n b a c h 提出了与 方差分析相关的概化理论如今现代测量理论的重点是项目反应理论( i r t ) 项目反应理论以其度量值不依赖于样本的变化而变化,所应用的l o g i s i t i c 回 归理论以及各种优秀理论工具,吸引了研究者们的注意,他们又为此提供的大 量可实现的计算机程序,这都使得该理论在现代考试学中有很大的应用2 0 世 纪9 0 年代,测量学开始不再停留在参数层面,开始向非参数理论发展其中, 早在1 9 9 1 年,核平滑方法( k e r n e ls m o o t h i n g ) 已经开始使用在测验理论中非 参数理论应运而生,发展十分迅速在2 0 0 1 年,j u n k e r 和跚t s m 口还提出三 条非参数项目反应理论的使用理由非参数项目反应模型为参数项目反应模型 提供一种更深的理解,相比参数模型适应的局限性非参模型提出了更适应更有 弹性的框架,并且非参模型给短测验和小样本提供了比大样本量表测验更容易 使用的方法非参数模型在心理与教育测量中具有很大的发展前景 经典测验理论中的真分数模型为 x = t + e 这里x 是测验的观测分数,t 是测验所对应能力或特质的真实分数,e 是误差, 并且满足数学期望e ( e ) = 0 对被测验全体来说,x 与t 是随机变量,e 与t 1 山东大学硕士学位论文 不相关而强真分数理论的核心就是对真分的分布与测验观察分之间作出一定 的假设,在此基础上如果通过观察分对真分做出估计比较重要的项目反应理 论( “日) 有单参数l o g i s i t i c 模型又有r a r s c h 模型,19 6 9 年又有了对应它的 参数估计计算机程序其数学形式如下: 只( p ) = 再面o i 一万b i 雨 1 9 5 7 年b i r n b a u m 提出了几个重要的l o g i s i t i c 模型,其中三参数模型形式如 下: ,只p ) = c + 丁干毛曷页= x 历- - _ c 瓦i 币而。 其中a i ,6 t ,仅分别表示测验项目的区分度、项目难度以及猜测成功的比例d 是个常数,一般取d = 1 7 除此之外 有称名反应模型以及其他各种项目反 应理论模型也陆续被提出来然而对于非参数模型,我们没有具体的模型表达 式,不过非参数理论的不断发展允许我们可以给出非参模型的估计式本篇论 文对参数模型及非参模型都有涉及 各种模型为能力测验等提供了好的理论基础,丰富和规范了测验形式然 而在实际应用中,经典测验理论仍然有着其独有的优点,在现在心理与考试测 量中继续发挥着独有的作用 1 2 测验评分方法优劣的评价标准 一个测验的评分方法可以是多种多样的,如何评价各种评分方法的优劣则 需要一个客观的标准经典测验理论( c t t ) 试图用测验信度来作为这种标准 在项目反应理论( i r t ) 中,信息函数很好地起到了评价标准的作用,是非常有 用的一个概念 事实上,在教育测量或者心理测量的经典测量理论中,我们可以通过多次 测验并利用多次测验分数的组合来体现被试者的能力利用将独立测验的测 验分数的组合提高预测效度是值得应用的好方法为测量某种综合能力或特 质,现实中往往独立实施几个测验: 2 五= 正+ e i = 1 ,2 ,m 山东大学硕士学位论文 这里假定t = 9 ( 噩,t 2 ,瓦) ,并常常用x = :,五作为这种综合能力或特 质的估计,但这样的简单组合缺乏一定的科学根据,所得的估计性质般 由a b i r n b a u m 和f m l o r d 定义的测验分y = l 纰五的信息为 j :( 掣) 。y 口r ( y ) 我们称之为b i r n b a u m 信息函数与f i s h e r 信息一样,b i r n b a u m 信息刻划了 y 估计t 时的精确度,然而b i r n b a u m 信息还描述了y 对r 变化时的敏感程 度并将其研究范围也扩充到了有偏估计本篇论文主要就是应用b i r n b a u m 信息函数对几种测验理论模型进行分析,求解各自合理权重的过程 本篇论文的第二章将介绍b i r n b a u m 信息函数的由来,以及对应用信息 函数及其最佳得分权的以往结论及相关结果进行了简单介绍,这些内容都是本 论文的预备知识 第三章将给出b i r n b a u m 信息函数在参数模型下的应用,这也是本篇论 文的主要的结果,共有三个重要的定理以及由此所得到的t 的新估计y = 竺。纰五中权重蚍的估计方法 第四章将给出b i r n b a u m 信息函数在非参数模型下的应用,涉及到了简 单的非参数模型以及单指标模型,第四章也具体的给出了两种非参模型的估计 方法,但并未给出性质的相关证明 第五章将给出第三章所述的主要定理,即文章的参数部分的相关定理给出 了具体的证明过程 3 山东大学硕士学位论文 第二章预备知识 本章主要介绍b i r n b a u m 信息函数的由来,以及以往研究所得到的有关 信息函数以及相应最佳得分权的相关结果等预备知识下面我们首先给出 b i r n b a u m 信息函数的定义 定义2 1 1 【1 ,定义】如果我们利用y 估计t ,则对应估计值y 的 b i r n b a u m 信息函数可以记为 ,生e f 酗、2 ,矿) = ! v a 型r ( y i t ) 2 1 信息函数的提出 信息函数的概念是a b i r n b a u m 于1 9 6 8 年提出来的p m l o r d 从另外 一种途径提出了测验分数信息函数的定义,得到了与a b i r n b a u m 相同的结 论f 6 】 a b i r n b a u m 认为:测验的作用就是通过测验分数对被试的相应能力或 者特质水平作出有效估计而这种估计的精确度则反映了测验分数以及这个测 验的有效性估计精确度与置信区间联系密切,因而b i r n b a u m 认为,这种有 效性是可以用测验所测量的那种能力或者特质水平的估计量的置信区间来表 示的 。 假设一个测验由n 个项目所构成,然后可以将被试答对测验项目的数量 z 看作是一种测验分数,其取值范围是0 到竹,同样z = x n 也是一种测验分 数,其取值范围为0 到1 如果我们令地留= e ( z i t ) 表示t 关于z 的回归, v a r ( z l t ) 表示回归的均方误差,九留表示样本的标准差因而假如个被试的 测验分数为z o ,那么磊( 所得到的能力参数的估计值) 的置信度9 5 的置 信区间为r p = a b 对9 5 的置信区间而言: x b = 3 9 2 旒- 3 9 2 蒜a ( 1 ) 艺口,l c l口l “z i tj 因而x b 的长度大小显然反映了这种测验分数代表相应能力水平的有效性上 式中3 9 2 这个常数,随置信度改变,对于有效性无实质影响,可以忽略不计由 4 山东大学硕士学位论文 此,a b i r n b a u m 的一种信息函数i ( t ,矽) 定义为: 配) 2 罱一壶 ,生墨刨丑、21 与此同时,p m l o r d 认为,对于一种表示测验的分数矽: 乒陬一 m - _ _ _ - _ - _ 一_ 口- p 是一种测验有效性的合理指标其中心i n 表示能力水平为五的被试所对应 的测验分数的分布f ( y l 墨) 的均值,而q m 则表示分布f ( y l 噩) 的标准差,取 ( 7 i t = ( 陬十m ) 则a u l t 越大,表示通过测验分对能力参数t 作出的 估计的误差也越大,这个指标的值也就越小# v l t , 一脚m 越大,说明测验分 对能力参数t 越是敏感,同时这个指标的值也越大对上式除以死一噩,得到 另外一个指标: 丝! 互= 生i 丑 :! 竖 正一正 这就是上述指标的标准化形式令已_ 噩,则第二个指标就变为: 于是,f m l o r d 把测验分数的信息函数定义为: 配炉警三墼v a r ( y l t ) 所得到的结果与a b i r n b a u m 所得到的式( 2 ) 正好吻合,从而反映了对测验分 数可所定义的信息函数是合理的 由a b i r n b a u m 和f m l o r d 定义的测验分y = 竺l 咄五的信息为 配y ) :( 掣) 2 y 口r ( y ) 我们称之为b i r n b a u m 信息函数与f i s h e r 信息一样,b i r n b a u m 信息刻划 了y 估计t 时的精确度,然而b i r n b a u m 信息还描述了y 对t 变化时的敏 感程度并将其研究范围也扩充到了有偏估计这个概念具有着十分重大的意 义,不同的评分方法可能会具有相同的信息函数信息函数的应用也十分广泛 5 塑卯 山东大学硕士学位论文 2 2 信息函数的性质与测验的信息函数 在测验所对应的能力或者特质时,t 的极大似然估计值于也可认为是一种 测验分数,因而也有其相应的信息函数i ( t ,于) 根据统计学原理我们知道:参 数t 的大似然估计值于服从渐进正态分布,其均值为t ,方差为鄙蕊职1 可啊 我们知道于是个一致的估计量令l 为似然函数,由此可以推出: e ( 于l t ) = z 丁d e ( t i t ) = 1 ; l = a ( t ) q 岱( t ) 1 一; i n l = u i l n p i ( t ) - t - ( 1 一崛) z 蚴( 刃 一z 一、 7 一1i - - - - 1 将上述结果带入信息函数表达式得: 配于) = 面蒜= 刀【( d 倒l n l 1 2 i 卅 :壹壹= 娶要= e 【( 讹一鼽) ( 锄一p j ) l 卅 鲁鲁蚴岱留1 r 1 ”“。7 川“1 根据i r t 关于项目局部独立的假设当i j 时 e 【( 饥一鼽) ( 一聊) = 0 因而我们得到: 配惦砉罴 可以证明i ( t ,于) 简记为,( t ) 可以证明该信息函数是其他任何评分方法所 获得的信息函数的上界,我们称之为测验的信息函数也可以说明对能力或者 特质的t 的极大似然估计于是测验的一种最佳评分法然而,于作为被试的 测验分数也有不便之处:首先该估计比较麻烦,其次它与测验分数的差别较大 利用加权评分是克服这些弱点又能够使得信息函数达到较大的比较理想的方 法 6 山东大学硕士学位论文 2 3 最佳得分权的相关定理 在b i r n b a u m 的结论以及一些重要的文章里,我们有各种l o g i s t i c 模型 对应的最佳得分权比如三参数l o g i s t i c 模型的最佳得分权的形式为: 蛾= d 吼黑 鼽k 1 一( :j 有关多个测验分数的最佳组合法的研究中,林路教授在( ( b i r n b a u m 信息与多 个测验分数的最佳组合法中讨论了用墨,恐,弱的加权和y = :1 岫五 作为孔个测验分数的综合分的问题,并解决了x = t + e 模型中如何确定权 重u 1 ,u 2 ,使y 为最合理估计的问题下面屉上述文章中主要应用的定 理以及所得结果 y 作为t 的估计有可能屉t 的有偏估计,对于有偏估计,先引入个与 无偏估计的g r a m e r r a o 不等式相似的不等式: 引理2 3 1 【1 ,引理1 】 设五,恐,k 的联合密度函数是,( 0 1 ,x 2 ,;丑,t 2 ,咒) ,并设j f 满足g 一兄正则条件,且 嘉j y f d x l d x 2 d x = jy 蔷a x l 似2 a x 。嗡 则 啦佻e ( 等) 2 下面一个引理在本论文中具有很大的重要性,3 香- y e 于指数型分布族性质的 一个引理 引理2 3 2 【1 ,引理2 】 设x 服从指数型分布族,即假设其密度函数的形式为 m 以加唧 锗嘶斛 ( 5 ) 其中b ( 口) 存在三阶导数,y ( o ) 是p 的严格单调递增函数,更! l 有e ( z ) = 矽( 口) , 并有v a r ( x ) = 矿p ) 口( 妒) 7 山东大学硕士学位论文 文章认为,选择的u l ,u 2 ,能够使得i ( t ,y ) = e ( 簪) 2 成立这样 的组合分数y 即是最佳组合分文章给出了下列定理作为主要结果: 引理2 3 3 【1 ,定瑚 设魁,恐,k 相互独立,五的密度函数 ( 勘,仇,忱) 为指数型分布族, 雨 瓶酬= e 印 毪铲+ c ( 姚 其中b c o , ) 存在三阶导数,( 巩) 是仇的严格单调递增函数,则当 咄= 矗葫筹= 上v a r ( x ;) 坚d t ( 2 ,咄2 而丽丽而2 一p 刮铀n 时,( zy ) 取得最大值赢( 署) 2 此外文章还设法利用样本值对姚= 1 亟d t ( i = l ,2 ,佗) 在x 与五 具有线性关系时给出了权重的估计,觑= 霹写蕊万m - - 两1 嘲 = 1 ,2 ,n ) 具 有较好的实际应用价值和意义 8 山东大学硕士学位论文 第三章参数模型下的主要定理与估计 心理测量学与教育测量学的主要模型与结果都是参数的,其中包括重要的 经典分数理论( c t t ) 以及项目反应理论( i r t ) 本篇论文首先考虑的就是这 种参数的情形本章的定理也是本篇论文的主要结果 3 1 参数模型下的主要定理 假设为测量种特质t ,我们进行了n 组独立的测验墨,咒,五。每个 测验均有实验样本m 个,我们可以选择x = :1 五作为特质t 的初始估 计 但我们知道,这样的估计是不够合理的,下面将b i r n b a u m 信息函数理论 应用于真分数理论的几种常见的变化形式如给出个已知的h 从而有变化 形式x = h ( t ) 十e ,在此模型上给出一个合理的估计y = 墨1 蚍五当然还 有其他变化形式,我们也要得到类似的结果 在上述前提假设的情况下,我们给出下面几个定理作为我们的结论 定理3 1 设测验五,恐,相互独立,假定五服从指数型分布族 f i ( x i 7 = 唧 专铲+ c ( x i 蝴, 如果我们假定综合能力的分数模型是参数形式 x = h ( t ) + e 其中假定h 已知,利用b i r n b a u m 信息函数求解组合分数y = 翟1 纰五 来对t 作估计则我们得到权重纰的最佳取值为蚍= 南笔畀器时, j ( 正y ) 取得最大值警。赢( 焉磬) 2 这个定理适用面较广,包括了般的真分数模型x = t + e 情况下应用 b i r n b a u m 信息函数所得到的结论( 引理2 3 3 ) 的使用范围,也就是包括了x 服从正态分布、泊松分布、二项分布等常用分布,克服了经典测验理论( c t t ) 以及项目反应理论( i r t ) 中的缺陷,并且包含了i r t 中的结论 9 山东大学硕士学位论文 例如,若五服从二项分布b ( 1 ,p i ) ,则对于指数型分布族 瓶咖) = 唧 等+ c ( 蝴) ) , 其中仇= z 扎( t ) ,并有6 做) = i n ( 1 + ,t ) ,仇= 口( 仇) = 1 以及c ,忱) = i n l = 0 ,我们这里取x i o ,1 ) 根据我们的定理,取h = 1 得,当权重蛾= 嘲掣鲁= 高霈 时,信息函数i ( t ,y ) 达到最大由于在二项分布中,正= e ( 五) = p i 则 = 忍f 1 可等= 而1 一p ;) d _ 打a ,这与i r t 中测验各项目分数的最佳组合法的结 果完全一致 这个定理突破了简单的c t t 中真分数模型x = t + e 的线性表达式的 局限,x 与t 之间可以选取各种形式的参数模型形式,应用范围较广 在1 9 0 4 年c h a r l e ss p e a r m a n 提出了因子分析的方法来解决智力测验得 分的统计分析同样的,这篇论文也将考虑心理测量的这种重要的情形下面 是一个简单因子的情形 例3 1f 1 0 ,p 2 9 3 ,实例一】 为了了解学生的学习能力,观测了仇个学生p 个科目的成绩,墨,咒,墨 用以表示p 个科目,确= ( t i ) ,z ( 蚺) 7 = 1 ,2 ,m ) 表示第t 个学生的 p 个科目的成绩我们对这些资料进行归纳分析,可以看出各个部分由两部分 组成: 五= 瓯f + 旬( i = 1 ,p ) , 其中f 是对所有磁0 = 1 ,窃都起作用的公共因子,是可以表示智能高低 的因子;系数a i 称为因子载荷,表示第i 个科目在智能高低因子上的体现;矗 是科目噩特有的特殊因子 当然它可以发展为复杂公共因子的情形我们可以把简单公共因子f 推广 到扎维向量的情形,假设公共因子z 是礼维向量,设x = p 十e ,这里p 也是 佗维向量与此同时,我们设五= 展+ 岛,0 = 1 ,2 ,n ) ,p = z ( 历,侥,风) , 如果假定五,咒,相互独立,墨的密度函数五,侠,妒i ) 为指数型分布 族,我们仍设为形式: 五 i ,仇,妒i ) = 翻节 ( 戤巩一6 ( 良) ) 口( 妒) + c ( x i ,妒) , 其中6 ) 存在三阶导数,6 ,限) 是巩的严格单调递增函数在上述情形下,我 们有如下结论 1 0 山东大学硕士学位论文 定理3 2 假设我们使用的分数模型形式为 五= z 屈十氏,p = z ( 岛,岛,风) 0 = 1 ,2 ,佗) 此时考虑p = z ( 尻,尾,风) 是可以通过因子分析的方法获得的,或者我们认 为是已知的如果选择测验分数信息阵为x ( z ,y ) = ( 生号笋) ( 皇号笋) y 口r ( y ) , 则对于下面形式的最佳组合估计y = 竺】咄噩中权重的取值,我们有结论: 当权重纰= 赢( 觑屈) 壶时,( 互y ) 可以取到最大值:1 赢腰屈 我们可以将上述复杂公共因子的问题进行扩展,假定k = 1 ,2 ,n ) 之 间具有独立性,五0 = 1 ,2 ,n ) 的密度函数五( 戤,吼,协) 假定为指数型分布 族,分布形式如式( 5 ) 满足6 ) 存在三阶导数,6 ,( 是巩的严格单调递增 函数等条件下面我们考虑分数模型的形式如下 五= h ( z 展) + 瓯,p = z ( 风,如,风) ( i = 1 ,2 ,n ) 得到如下结论 定理3 3 假设我们考虑分数模型的形式如下 五= 九( z 住) 十岛,p = f 池,屁,风) ( i = l ,2 ,n ) 洲验分数信息阵i c z ,y ) 的形式为i ( z ,y ) = ( 骂笋) 7 ( 警) y 口r ( y ) 可以 计算得当姚= 南( 刀反) ( 觑反) 专时,i ,y ) 可以取到最大值 邶,y ) = 砉南( 煅剐2 胁 这篇论文的几个重要定理是建立在真分数模型的基础上的,尽管本文不再 要求分数模型尾一个线性模型,但仍然要求测验分数x 1 ,托,x 。之间相互独 立,具有一定的局限性不过这样要求有利于提高组合分数的内容效度,具有一 定的积极意义由于论文安排的时间比较仓促,文章没有涉及到x 1 ,为,五。 的联合密度分布不是指数型分布族的情形,相信考虑分布族这一点会得出比较 好的结果不过我们首先要解决的问题尾如何将我们的结论用已知的数据表 示出来,也就是参数估计的问题 1 1 山东大学硕士学位论文 3 2 参数估计 我们第二章所述的三个定理从理论上解决r 几种特殊情况的测验分数的 最佳组合问题,所得到的结论 姑=上等等(i-var(xi) 1 1 2 ,_ 姑2 百面1 ,z 扎j 或者第二个定理中 1, 蛾2 而高似展) 专 以及最后的定理中 , 龇2 丙裔( z 慨) 似屈) 言 都含有未知元素,需要进行估计 在林路教授的( 【b i r n b a u m 信息与多个测验分数的最佳组合法中,文章 最后对x = t + e 模型下,设法利用样本值对纰= 南磬 = 1 ,2 ,n ) 在x 与五具有线性关系时给出了权重的估计, 矗2 夏永再m 葡- i 丽( i = 1 ,2 ,死)触2 霹曩i 习瓤两o 。刮,死, 具有较好的实际应用价值和意义 下面我们考虑分数模型是x = h ( t ) + e 的情形,对本论文的第一个定理 的结论馘= 赢皇罂器o = l ,2 ,绍) 给出个合理的估计 对于咄中的y o r ( x ) ( 即五的方差) 可以考虑用无偏估计替代,设噩的 容量为m 的样本为五1 ,五2 ,x m ,则v a r ( x ) 的无偏估计为 品= 壹i = l 喾,兄= 喜鲁 另外一个未知元素等的估计比较有难度如果我们考虑x 与五具有线 性模型 x = m9 - 玩戤+ 玩,e ( e i ) = 0 则e ( z ) = 毗+ b i e ( x i ) ,即危( t ) = 戗+ 巩 汜) ,两边同时取导数,得 阳) = 玩警等, 山东大学硕士学位论文 腼有 面d h ( t , ) 面t i t , :却皿打k r 若用x 1 ,幺,表示x 的m 个样本,这里的b i 我们利用最小二乘法给出 估计 墨。( 一兄) ( 冯一贾) 良= 鼍囊i = 1 掣厶 。l ,。1 , 其中又= 学对于p ) 的估计,我们采取下面方法给出估计: 由假定函数h 具有唯一的逆函数h ,则由x = h ( t ) + e 得到:t = 7 l 一1 ( x + e ) 由于e 是一个随机误差,我们给出考虑利用核估计的方法去做t 一21-1(五。)t= 兰三! 苎: ! :兰: 这里假设五;0 = l ,2 ,8 ) 在我们所要找的误差范围内的所有观测值,从而 得到) 的估计 悯= ,( 掣) 这样就可以得到权重挑的估计式: 蚍= 露1 酉e f 2 1 ( x , 瞩# - x , 2 面) ( 剿掣) 分数模型为x = 刀p + e 的情形下,定理结论纰= 瓦而1 屈的估计方式 首先,分数五的方差v a r ( x ) 可以考虑用无偏估计替代,即设五的容 盘为m 的样本为咒l ,x e 2 ,五m ,则v a t ( x , ) 的无偏估计为 鼠:竖掣,兄:囊趋 一i = 1 r r l 一上 萏7 7 解决这个问题,可以利用因子分析的估计方法,并根据b i r n b a u m 信息函 数给予一定的限定,给出风合理的估计不妨假设下面情形 考虑人的某种特质t 与几种因子历,易,磊之间存在的关系,我们假 设有m 个人分别进行了n 次考试,对于第i 个人的n 次考试成绩我们记为向 量x o ) = ( z mo 记,) 则样本数据阵为下面矩阵 件m llllllij, n n 啪? : 2 2 门砌? :轨 l 1 d钆? : 。一 = x 山东大学硕士学位论文 则我们应用下列步骤给出因子分析的主成分估计: 首先,由样本数据阵x 计算样本均值、样本离差阵及样本相关阵其中, 样本均值 贾= 丢妄确却m 勋,诹) ; 样本离差阵e 为 竹 e = ( ) 一贾) ( 批) 一贾) 7 = ( e 莳) , = l 其中= :l ( z t t 一牙t ) 0 巧一奶) ;样本相关阵r = ( ) ,其中r o = 赤o ,歹= 1 2 ,2 ,n ) 然后,求样本相关阵冗的特征值与标准化特征向量记入l a 2 入住0 为月的特征值,其相应的单位正交特征向量为z l ,1 2 ,k 下面开始求解因子模型的因子载荷矩阵a : 确定公共因子的个数s 在求解s 时必须考虑的一个因素是我们的分数模 型中氏的特殊要求,可能会要求( a 1 + a 2 + + a 。) 加0 9 0 等比较大的条 件这是我们与一般的因子模型分析方法不同的地方之一。 令a i = 碍如( i = 1 ,2 ,占) ,则a = ( 口l ,o 2 ,) 为因子载荷矩阵 求特殊因子方差钟 = 1 ,2 ,8 ) ,则五的共同度增的估计为 对s 个公共因子做出解释求出因子载阵a 后,即可得可测变量蜀,k 由s 个不可测的公共因子及各自特殊因子的表达式作解释时要根据所涉及 的业知识给出合理解释 这样就完成了h 是已知参数模型下的参数估计问题 1 4 忆 l = 旌 。鲥 = 穑 山东大学硕士学位论文 第四章非参数模型下的方法与估计 非参数分数模型已经在现代的心理及教育测量学中有着比较大的发展,事 实上考虑b i r n b a u m 信息函数在非参数模型的发展将是十分有趣的事情本 章内容将考虑在非参模型下如何应用b i r n b a u m 信息函数解决最佳组合权的 问题 考虑分数模型是非参数模型的情形,对于未知的非参函数z ,我们假定有 模型形式为真分数的变化形式x = l ( t ) + e ,在此基础上我们寻求该非参模型 所对应的有关最佳得分权的问题 我们假定要测量一种特质t ,进行了竹组独立的测验x 1 ,x 2 ,k 每个 测验对应于个单方面的特质,从而有五= 2 汜) + e ( i = 1 ,2 ,n ) 每个测 验均有实验样本m 个,不妨假定测验五的m 个实验样本可以记做五,0 = 1 ,2 ,m ) 我们可以选择x = 鬲1 銎l 五,作为特质z 伍) 的初始估计则对 应特质t 的变化z ( t ) ,我们有初始估计 n 1 n ,n 贾= 置= 去 i = l。i = lj - - 1 在知道了上述初始估计之后,我们可以利用非参数的方法去解决同题 我们要考虑的仍然是组合权的问题,组合分数y = :l 她五来对t 作 最终估计权重o j i ( i = 1 ,2 ,扎) 的求解过程,仍然利用b i r n b a u m 信息函数 ,d e i i t ,、2 的形式j y ) = v a 拦k v l t ) 我们有e ( y t ) = e ( :1 蚍x i t ) ,从而只需要去 对z ( 正) 的导数l ,仍) 进行估计,然后再估计方差v a r ( x i ) 即可不过由于时间 原因,论文未能给出权重求解的具体推导过程,而只是根据非参数局部多项式 拟合理论,给出了下面权重估计方法 同参数估计的内容一样,仍然取方差v a r ( x ) 的无偏

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论