(概率论与数理统计专业论文)有序的误分类数据的贝叶斯分析.pdf_第1页
(概率论与数理统计专业论文)有序的误分类数据的贝叶斯分析.pdf_第2页
(概率论与数理统计专业论文)有序的误分类数据的贝叶斯分析.pdf_第3页
(概率论与数理统计专业论文)有序的误分类数据的贝叶斯分析.pdf_第4页
(概率论与数理统计专业论文)有序的误分类数据的贝叶斯分析.pdf_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 如果一个个体被分到了不是其真实状态的类中,就产生了误分类通常可用 双重抽样的方法来估计误分类的概率。我们用含潜在变量的b a y e s 方法分析了多 元有序的误分类数据。我们利用g i b b s 抽样器和m e t r o p o l i s - h a s t i n g s 算法来抽取 联合后验分布的样本,继而进行统计推断。同时为了使算法快速收敛,我们进一 步采用了参数扩展技术。我们用仿真的方法验证了本文所建议的模型和算法的有 效性,并用之分析实际数据。 关键词:双抽样:g i b b s 抽样器;m e t r o p o l i s - h a s t i n g s 算法; 英文摘要 a b s t r a c t m i s c l a s s i f i c a t i o nh a p p e n e dw h e nas u b j e c th a sb e e nc l a s s i f i e di n t oac a t e g o r y t h a td o e sn o tr e f l e c tt h es u b j e c t ss t a t e i ng e n e r a l ,d o u b l es a m p l i n gt e c h n i q u ei s u s e f u lt oa n a l y z et h em i s c l a s s i f i e dc a t e g o r i c a ld a t a b a s e d0 1 1t h el a t e n tn o r m a l v a r i a b l em o d e l s ,w ed e v e l o pab a y e s i a nm e t h o dt oa n a l y z em u l t i v a r i a t eo r d i n a l c a t e g o r i c a ld a t aw i t hm i s c l a s s i f i c a t i o n g i b b ss a m p l e ra n dm e t r o p o l i s - h a s t i n g s a l g o r i t h ma l eu s e dt og e n e r a t es a m p l e sf r o mt h ep o s t e r i o ro ft h ep a r a m e t e r s t oo b t a i n ar a p i d l yc o n v e r g e n ta l g o r i t h m , t h ep a r a m e t e re x p a n s i o nt e c h n i q u ei sa p p l i e dt ot h e c o r r e l a t i o ns t r u c t u r eo f m u l t i v a r i a t em o d e l t h ep r o p o s e dm o d e la n ds a m p l i n gm e t h o d a r ed e m o n s t r a t e db ys i m u l a t i o na n da r ea p p l i e dt oa n a l y z et h er e a ld a t a k e y w o r d s :d o u b l es a m p l i n g ;g i b b ss a m p l e r ;m e t r o p o l i s - h a s t i n g sa l g o r i t h m ; 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研究成果。 本人在论文写作中参考的其他个人或集体的研究成果,均在文中以明 确方式标明。本人依法享有和承担由此论文产生的权利和责任。 ) 一 龛彻 日 五r k 厂6 。 名 # 签怨幽辫 人厶队厶 淹 厦门大学学位论文著作权使用声明 本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大 学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电子 版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校 图书馆被查阅,有权将学位论文的内容编入有关数据库进行检索,有 权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适用 本规定。 本学位论文属于 1 、保密( ) ,在年解密后适用本授权书。 2 、不保密( 作者签名:至麦赢日期工菇年乡月夕日 导师签名:伽名观入日期弘胗唔年6 月9 日 直庄的送盆娄数据的丑吐扭盆扳 第一章绪论 1 1 背景知识 调查研究过程中经常会碰到有序的分类变量,把所有的分类变量排列在调查表 中,根据被调查对象的回答进行分类就得到有序的分类数据。认为有序数据来自于 潜在的连续性变量是最近2 0 年才发展起来的一种分析方法。很多文献介绍了分析有 序变量的统计方法,然而,那些方法通常是针对正确的分类数据,因此当我们用那 些方法来分析误分类数据时显然不是很适合的 误分类数据在现实分类中是普遍存在的,也可以说是不可避免的。导致误分类 数据产生的原因很多。有可能是调查对象的误回答,例如:在对每天吸烟量和喝酒 量的实际数据的调查中,调查对象的回答很可能低于或高于其真正的消费量;也可 能是没有最佳的分类标准或由于花费昂贵,例如:在大量的心里健康调查中,不太 可能对所有的调查对象进行精神病的诊断,只能根据有关“健康问题”和“不是健 康问题”的调查信息内容来判断,一方面根据要调查的内容建立健康的判断标准, 另一方面根据判断标准和调查对象的回答把其分为“有精神病”和“没有精神病” 两类。在这种情况下,有可能把“有精神病 的人分到“没有精神病”的一类,也 可能把“没有精神病的人分到“有精神病的一类。总之,当一个调查对象被分 到有序分类中的一类,而实际上该类不是这一对象的真实状态时,误分类现象就产 生了 在6 0 年代人们就开始研究误分类数据t ( m o t a n da n d e r s o n ,1 9 6 5 t u ;a s s a k u la n d p r o c t o r ,1 9 6 7 2 ;p r e s s ,1 9 6 8 1 3 】:c h i a c c h i e r i n ia n da r n o l d ,1 9 7 7 h b 。双抽样的方法分 析误分类数据把统计学推向了新的发展阶段( t e n e n b e i n ,1 9 7 0 i s ;h o c h b e r g ,1 9 7 7 1 6 】; c h e n , 1 9 7 9 t 7 l ;e s l e l a n da n d ,o d o r f f , 1 9 8 5 t 8 l ;e s p e l a n da n dh u i ,1 9 8 7 1 9 1 :p a l m g r e n , 1 9 8 7 1 1 0 l ;b u o n a c c o r s i ,1 9 9 0 t n l ;p e p e ,1 9 9 2 t 1 2 】) 。后来人们把研究的变量扩展到象 征性意义的分类变量,例如关于对数线性模型以及对二元响应变量的回归分析 ( b o l l i n g e ra n dd a v i d , 1 9 7 7 t 1 3 1 ;c h e n ga n dh s u e h ,2 0 0 3 1 q 。e i c k h o f f a n da m e m i y a ( 2 0 0 5 ) t 1 5 1 假定误分类存在于一个方向上的有序分类,用e m 算法估计了潜在变量模型 中的参数。用贝叶斯的方法来分析有序数据是在最近十几年流行起来的。很多人对 有序的误分类数据进行过研究。p o o ha n dw a n g ( 2 0 0 6 ) t 1 嘶对多元有序的误分类数 据,建立了基本概率结构框架,并分别在误分类概率已知和双重抽样两种情形下, 直压酸送岔差熬堪殴匠吐瑟岔蕴 用e m 算法提出了模型中多元相关阵和门限参数的极大似然估计本文利用b a y e s 方 法研究双重抽样情形下模型中参数的估计问题。 1 2 基础知识 本节简单回顾一下我们将要用的一些算法 一、数据放大法( d a t aa u g m e n t a t i o n ) 设y 是观察数据,秒为未知参数。目的是从口的后验分布( o l y ) 中抽取秒的随 机数。但直接从f ( aly ) 中抽样可能很困难,因此引进潜在变量z ,而把观察数据y 放 大到完全数据x = ( y ,z ) 使得在完全数据x 下从0 的后验f ( a l y ,z ) 中容易抽样。则可 从下列迭代中实现从f ( o i 力中抽样的目的。 1 t a z - f ( z l a , y ) f ( y ,z 协抽出z t o ; 2 t a a - f ( a l z o , y ) 芘f ( y ,z o i d 厂( 固抽出口; 3 重复l - 2 步。 二、m e t r o p o l i s - h a s t i n g s 算法 m e t r o p o l i s - h a s t i n g s 算法,该算法最初在1 9 5 3 年被m e 脚o l i s 【1 7 l 等人提出,1 9 7 0 年h a s t i n g t l 叼进行了推广,但最近几年才被统计学界所重视。m e t r o p o l i s l d t 样器,独立 抽样器,随机流动链都是m e t r o p o l i s - h a s t i n g s 算法的特殊情况m e t r o p o l i s - h a s t i n g s 算 法的基本思想是:为了得到后验密度八伊l 力的样本,任意选择一个条件密度函数 丁( l d ( 称为侯选密度) ,采用如下方法产生马氏链: 1 给定或从某个分布中抽取开始点矿,使得r ( 矿1 ) ,) 0 ; 2 假定矿为马氏链的当前状态,从r ( 目渺) 中抽取一个候选值矿; 3 计算,= 4 从标准均匀分布中产生随机数甜。如果材 o ,f = l ,刀,则称矿= ( q ,幺) 服从狄里希里分布,记作9 一q ( 层,展) 或( q ,吃) 一d ( 层,孱) 。 1 3 研究内容 本文用贝叶斯的方法分析有序的误分类数据。具体内容如下: 第二章描述模型的结构并导出似然函数。第三章采用贝叶斯方法来估计模型中 的参数,充分利用了参数扩展( p a r a m e t e re x p a n s i o n ) 和数据放大法( t a n n e ra n dw o n g : 1 9 8 7 f 1 9 1 ) 。第四章利用仿真的方法来验证第三章给出方法的有效性。第五章应用本 文的方法分析汽车事故数据第六章是结论部分,对本文研究的内容进行了总结。 3 y i = m 若,n l z l 口l 棚, 其中m = l ,墨; x = y p若q ,昂一l 乃 :七= l ,刀 是双重抽样的样本观测值, 巧i :后= 糟+ l , 是易错抽样 的观察值。双重抽样 ( 华,) :磨= l ,力 的似然函数为 厶= 兀& i ) j 1 5 ( 霹n ,瑶”;力, ( 2 4 ) 而易错样本 巧”:七= 以+ l ,n 的似然函数为 岛= n l 地y f k ;鳓l 。 ( 2 5 ) 因为单纯易错样本和双重抽样是相互独立的,所以联合似然函数为 三=厶厶=11&。,矽c霹n,带;p,)rft;c“,yfkk=l l k = n + 1) ;缈- 1 j j 。c 2 6 , l jl 口 据此,可对门限参数、相关阵、和误分类概率结构中的参数等进行统计推断。但直 接利用( 2 6 ) 对参数推断是非常困难的。我们进步引进“删失数据厅。 把真实分类 霹”:七= 刀+ l ,) 和潜在变量 z ”:七= l ,n 看作是“删失数 据”,则完全数据 碲n ,z 仕:七= l ,n 的似然函数为 5 直庄酸迟盆袭数握的班吐逝筮扳 乞= 彝k ;鸬唾r p 气垮,) 酸矿,;畸 =r黔y;d怖2卉卅妒,叫譬l(z叫q)l(uj l k = l ,p ) 二 j f i k 血,k 础 出,。出, 可见,概率0 保持不变,但上面等式中对协方差阵巨没有任何限制。对于扩展后的 参数口= ( 口? ,口;) r ,巨和以及新的潜在变量 z 啡:七= 1 ,n ) ,完全数据 的似然函数变为 ,f i 、e :( “,v ;矽) r 。n r i , 倪邛t ,q 乙吖” 口l ,) ( “。v )k = li = 1 pl ( 2 万厂剐1e x p 一l z 1 1 一+ ) r 互“1 ( z 一) 。= n 砸,v ;回r n 彝, 妒_ 弓唯) 口。滞,) k ( 搿。 ,)= l ,1 。 6 ( 2 万) 警剐 酬一t 兰p 一扩,一。n k = l n 砸,y ;国】n1 7 1 - i ( 雎。心k = li = 1,k 驴q 弓啦) ,咖 ) = e x p 加似) ) 7 直压的送公差数握的亟吐堑盆蚯 第三章贝叶斯估计 3 1 先验分布 为。了完成贝叶斯结构,先对每个参数设一个先验分布,从而进一步得到参数和 潜在变量的条件后验分布。下面详细介绍扩展模型参数的先验分布。为了避免后验 分布受主观影响,使计算简便易行,这里对所有参数选择为无信息先验分布,即: 万( 功芘1 , ( 3 9 ) j e f f r e y s 先验 瓜声,巨) l e 。l 芋, ( 3 1 0 ) 刀 口。) 1 , ( 3 1 1 ) 并且假定上面的先验分布是相互独立的。 3 2 潜在变量的条件分布 给定观察数据和其他参数时,潜在变量 z :七= l ,以 的条件后验分布为均值 为。,协方差阵为e 的p 元的正态分布在超矩阵n ,缸f ,增 - l 矛量 上 的截断分布即 z 吖”l 甲,口,e 。( 渺,譬灯,嘞,_ 轳 o c n v - w i s h 口r t ( n 协么) m ( z ,青) , ( 3 - 1 5 ) 即正态一逆w i s h a r t 分布。 3 、门限参数口的后验分布 在给定完全数据和其他参数的条件下,门限参数口的后验分布与下面式子成正 比: 1 躺7 1 瑚7 ,一 + l ,珥l ( 1 3 + 1 ,强l 2 1 ) + l ,啊l 2 2 + 1 ,码i ( 2 3 ,+ 1 ) f ( 0 2 ,l ,岛,6 1 2 ( 1 i ) 2 t 1 2 ) ,码2 l ,) ,1 1 2 2 1 ) ,一2 2 2 ) ,啊2 l 嚣) ) 岔1 , h i 2 0t ) 口2 2 吨榔见 3 邶彦”,t 1 2 ( 2 1 ) 9 2 , , 5 岫勰加2 ,6 删 一见( 强2 ( 儿,+ l ,1 1 2 ( 1 2 ) + 1 ,1 1 2 ( 1 3 ) + 1 ,瑰2 1 2 1 ) + 1 ,1 1 2 i 恐) + 1 ,强2 2 3 ) + 1 ) f ( 0 3 l ,岛,6lb 【1 3 ( 1 1 ) ) n 1 3 ( 1 2 ) :, r 1 3 ( 1 3 ) , b 1 3 ( 2 1 ) , 琢3 ( 2 2 ) ,1 1 3 柳) p 3 , 1 3 力3 , 2 一,u 2 力3 。3 一,8 ,1 3 ( 2 1 ) 岛,5 3 荭岛。6 1 烈砧 一p n ( 伪3 ( 1 1 ) + 1 ,咒1 3 ( 1 2 ) + 1 ,以1 3 ( 1 3 ) + 1 ,n 1 3 ( 2 1 ) + l ,啊3 ( 2 2 ) + 1 ,强3 ( 2 3 ) + 1 ) f ( 0 4 。l ,幺,6i 2 1 ( 1 1 ) ) b 2 1 0 2 ) ) 心1 0 3 ) 2 l ( 2 1 ) ,刀2 l t 2 2 ) ,* q 2 l ( 2 3 ) ) o c 。i n 2 q m ) 州a 2 1 0 z ) 0 ,n 2 t ( t 3 ) 秒4 , 4 翰秒4 , 5 勃盈幺。6 矗 q ( 刀2 l 1 1 ) + 1 ,1 2 l ( 1 2 ) + l ,l 1 3 + 1 ,他l 2 1 ) + l ,1 2 l ( 2 2 ) + l ,1 2 i 2 3 ,+ 1 ) 1 6 虿压殴送岔蓉熬囊殴坦吐瑟岔班 一 ( 岛1 ,b ,6i ( i l ,( 1 2 ) ,( 1 3 ) ,( 2 i ) ,( 2 2 ,) 1 2 2 ( 2 3 ) ) 岛,l 膏硪1 9 1 5 , 2 屹n 移5 , 3 屹n 绣,4 吻2 ”b 5 屹丑岛。6 屹 一d l ( ,1 2 2 i l ,+ l ,行2 2 1 2 + 1 ,n 2 2 1 3 ) + l ,刀2 2 2 1 ) + 1 ,1 2 2 t 2 2 l + 1 ,刀2 2 ( 2 ,) + 1 ) ( 吃,l ,皖。61 ( 1 1 ) ,( 1 2 ) ,1 2 3 2 l ,刀2 3 2 2 ) ,i 2 3 ( ) ) o c 纯 l 嘶m 皖。2 物n 皖3 勃n 矽6 , 4 勃2 。矽6 , 5 皖,6 n 见( 月2 3 ( 1 i ,+ l ,1 2 ) + l ,刀2 3 ( 1 3 ,+ l ,一2 3 2 1 ) + l ,一2 3 2 2 ) + l ,r j 2 3 ( 2 3 ) + 1 ) 参数的初始值取玛= o ,段= o ,夕= 0 ,哆:to 5 ,秒的初始值如表5 - 5 所示: 表5 - 5 :误分类概率初始值 ( 1 ,1 )( 1 ,2 )( 1 ,3 )( 2 ,1 )( 2 ,2 )( 2 ,3 ) ( 1 ,1 ) 只,= 0 5哦。= 0 i职j = 氇l瞑= o 1q ,。0 i q 。= 0 1 ( 1 ,2 ) 岛,= 0 i吃:= 0 5气t 0 i& = o 1b j z0 i 岛= 0 i ( 1 ,3 ) 绣i = o i& := o 1气= m 5或一0 i屯= o 1g _ = 0 i ( 2 ,1 ) & i 。o i气;o 1只,= o 1e - = o 5e ,苹0 1只。;o 1 ( 2 ,2 ) 氏= o 1 只z z 0 i ;便l b t o 1b j ;0 5岛= 0 1 ( 2 ,3 ) 幺j = o 1 & := o 1吃j = 0 i & ;0 i吃j = 0 i钆= 0 5 共抽取1 2 0 0 0 次,其中前2 0 0 0 个作为预热,对后1 0 0 0 0 个数据采用等间隔采样 以消除相关性,从第2 0 0 1 个数据开始,每十个中取一个作为样本。参数的估计情况 如表5 - 6 所示。 1 7 表5 击:参数估计值 参数 鸬 p 2m 估计值 1 2 0 9 5 - 0 4 5 5 9- 0 2 2 3 0o 1 1 8 8 标准差 0 。0 8 4 50 0 4 6 6 o 1 1 9 50 。0 0 4 7 女 置信区间 【- 1 3 5 3 7 - 0 5 2 3 6【- 0 3 9 31【o 1 1 3 0 ( 5 _ 9 5 呦- 1 0 7 7 4 - 0 3 7 6 3 0 0 0 9 2 0 1 2 6 5 估计值一1 1 7 2 5 - 0 4 3 7 91 9 9 6o 1 1 9 3 标准差 o 0 7 6 1o 0 4 8 5 0 1 1 3 40 0 0 5 5 男 置信区间 【1 3 0 0 3【- 0 5 2 0 7 - 0 3 5 6 8 【0 1 1 2 1 ( 5 9 5 )- 1 0 5 9 7 国3 5 4 5 0 m 9 4 0 1 2 7 7 表5 7 :女驾驶员误分类概率结构估计表 u 矿( 1 ,1 )( 1 ,2 )( 1 ,3 ) ( 2 ,l ( 2 ,2 )( 2 ,3 ( 1 ,1 ) 气= 0 , 9 1 5 5 钆= o 0 5 0 9 钆;0 0 0 0 4 0 , 4 = o 0 2 3 3 气= 0 0 0 4 4b ;0 0 0 5 5 ( 1 ,2 ) b 1t 0 5 4 8 1 只:= 0 3 8 8 8吃,;0 0 1 9 4 屯t 0 0 1 7 1气r o l l0 0 1 4 5绣。0 0 1 2 0 ( 1 ,3 ) 绣i = o 3 9 1 0& 2 = 0 0 2 0 0屯= 0 5 2 1 8只= 0 0 5 0 2气= 0 0 0 2 5岛。= o 0 1 4 4 ( 2 ,1 ) 幺1 = 0 4 3 3 9幺2 = 0 0 3 2 0只,= 0 0 4 1 4幺= 0 4 6 7 8见j = 0 0 0 7 7色= 0 0 1 7 2 ( 2 ,2 ) & = 0 6 2 3 7色2 = 0 0 8 5 9气- - - 0 。0 7 3 6屯= 0 1 4 9 1屯= 0 0 2 6 2& = 0 0 4 1 5 ( 2 ,3 ) 吃_ i = 0 3 6 8 4吃- 2 = o 0 8 2 9吃j = o 1 3 1 7见= 0 2 6 8 5= 0 0 1 3 5吃6 = o 1 3 5 0 1 8 表s 8 :男驾驶员误分类概率结构估计表 u ( 1 ,1 )( 1 ,2 )( 1 ,3 )( 2 ,1 )( 2 ,2 )( 2 ,3 ) ( 1 ,1 ) 或i = 0 9 1 7 6q j = 0 0 4 8 8钆= 0 0 0 0 4辞。= 0 0 2 4 4屯;0 0 0 4 5鼋6 = 0 0 0 4 3 ( 1 ,2 ) 嚷i = 0 5 2 7 5绣:= 0 4 0 5 2气= 0 0 2 3 2嚷= 0 0 1 6 2气= o 0 1 3 1岛j ;0 0 1 4 8 ( 1 ,3 ) 氏;0 4 0 6 1酲2 = o 0 2 0 2& 3 = 0 5 2 0 3岛= o 0 3 6 4只j = 0 0 0 2 3b j = o 0 1 4 7 ( 2 ,1 ) 幺j = o 4 4 0 7只2 = 0 0 4 2 1幺j = o 0 3 0 5幺= 0 4 6 5 8只j = 0 0 0 7 5幺j ;0 0 1 3 5 ( 2 ,2 ) 绣- = 0 6 0 6 7 钆;0 0 8 3 9 气= , 0 0 8 4 9岛= 0 1 5 5 9绣j = 0 0 2 7 2绣jz 0 0 4 1 5 ( 2 ,3 ) 吃i = 0 3 6 8 0吃2 = 0 0 6 1 6钆= 0 1 1 3 4幺= 0 2 9 9 2钆= o 0 1 2 9- - 0 1 4 4 9 我们根据估计的误分类概率可以看出警察的报告存在比较大的误差,特别是警 察的报告对女驾驶员用了安全带且受伤中等的情况,分类的准确率最低只有2 6 2 , 容易分到没有使用安全带又没有受伤的一类,高达6 2 3 7 。其它分类的准确率都高 于1 3 5 0 。而对男驾驶员用了安全带且受伤中等的情况,分类的准确率最低只有 2 7 2 ,容易分到没有使用安全带又没有受伤的一类,高达6 0 6 7 。其它分类的准 确率都高于1 4 4 9 根据估计的参数相关系数p 为负数可以看出系安全带可以减少 受伤。女驾驶员和男驾驶员系安全带减少受伤程度还是有区别的,女驾驶员高于男 驾驶员。 1 9 直庄的迟岔娄数握的凰吐新盆扭 第六章总结 本文利用潜在的变量模型分析了有序的误分类数据。基于双抽样样本数据,我 们用m c m c 算法估计模型中的相关阵和门限参数。随机仿真验证了所建议方法的有 效性。进一步,我们应用该方法对一个具体的实际数据进行了分析。 参考文献 【l 】m o t e ,v l ,a n da n d e r s o n ,r l ,a ni n v e s t i g a t i o no f t h ee f f e c to fm i s c l a s s i f i c a t i o n o nt h ep r o p e r t i e so f _ 2 - t e s t si nt h ea n a l y s i so fc a t e g o r i c a ld a t a ,b i o m e t r i k a ,5 2 : 9 5 - 1 0 9 ( 1 9 6 5 ) 2 】a s s a k u l ,k ,a n dp r o c t o r , c ,h t e s t i n gi n d e p e n d e n ti nt w ow a yc o n t i n g e n c y t a b l e sw i t hd a t as u b j e c tt om i s c l a s s i f i c a t i o n , p s y c h o m e t r i k a ,3 2 :6 7 - 7 6 ( 1 9 6 7 ) 【3 】p r e s s ,s j e s t i m a t i n gf r o mm i s c l a s s i f i e dd a t a ,j o u r n a lo f t h e a m e r i c a ns t a t i s t i c a l a s s o c i a t i o n ,6 3 :1 2 3 - 1 3 2 ( 1 9 6 8 ) 【4 】c h i a c c h i e r i n i ,1 la n da r n o l d ,j at w os a m p l et e s tf o ri n d e p e n d e n c ei n2 x 2 c o n t i n g e n c yt a b l e w i t hb o t hm a r g i n ss u b j e c tt om i s c l a s s i f i c a t i o n , j o u r n a lo ft h e a m e r i c a ns t a t i s t i c a la s s o c i a t i o n ,7 2 ,1 7 0 - 1 7 4 ( 1 9 7 7 ) 【5 】t e n e n b e i n , a ,ad o u b l es a m p l i n gs c h e m ef o re s t i m a t i n gf r o mb i n o m i a ld a t aw i t h m i s c l a s s i f i c a t i o n s ,j o u r n a lo f t h ea m e r i c a ns t a t i s t i c a la s s o c i a t i o n ,6 5 :1 3 5 0 - 1 3 6 1 ( 1 9 7 0 ) 6 】h o c h b e r g ,y o nt h eu s e o fd o u b l es a m p l i n gs c h e m e si na n a l y z i n gc a t e g o r i c a l d a t aw i 也m i s c l a s s i f i c a t i o ne r r o r s ,j o u r n a lo ft h ea m e r i c a ns t a t i s t i c a la s s o c i a t i o n , 7 2 :9 1 4 - 9 2 1 ( 1 9 7 7 ) 【7 】c h e n ,t t l o g - l i n e a rm o d e l sf o rc a t e g o r i c a ld a t a 丽m m i s c l a s s i f i c a t i o na n d d o u b l es a m p l i n g , j o u r n a lo ft h ea m e r i c a ns t a t i s t i c a la s s o c i a t i o n , 7 4 :4 81 - 4 8 8 ( 1 9 7 9 ) 8 】e s p e l a n d , m a a n do d o r o f f , c l l o g l i n e a rm o d e l sf o rd o u b l ys a m p l e d c a t e g o r i c a ld a t af i t t e db yt h ee ma l g o r i t h m , j o u r n a lo f t h ea m e r i c a ns t a t i s t i c a l a s s o c i a t i o n ,8 0 :6 6 3 - 6 7 0 ( 19 8 5 ) 9 】e s p e l a n d ,m a a n dh u i ,s l ag e n e r a la p p r o a c ht oa n a l y z i n ge p i d e m i o l o g i cd a t a t h a tc o n t a i nm i s c l a s s i f i c a t i o ne r r o r s ,b i o m e t r i c s ,4 3 :10 0 1 1012 ( 19 8 5 ) 【1 0 】p a l m g r c n ,j p r e e i s i o no f d o u b l es a m p l i n ge s t i m a t o r sf o rc o m p a r i n gt w o p r o b a b i l i t i e s ,b i o m e t r i k a ,7 4 :6 8 7 - 6 9 4 ( 19 8 7 ) 【ll 】b u o n a c c o r s i ,j p d o u b l es a m p l i n gf o rt h ee x a c tv a l u e si ns o m e m u l t i v a r i a t e m e a s u r e m e n te r r o rp r o b l e m s ,j o u r n a lo f t h ea m e r i c a ns t a t i s t i c a la s s o c i a t i o n , 8 5 :1 0 7 5 1 0 8 2 。( 1 9 9 0 ) 【12 p e p e ,m s i n f e r e n c eu s i n gs u r r o g a t eo u t c o m ed a t aa n dav a l i d a t i o ns a m p l e , b i o m e t r i k a ,7 9 :3 5 5 3 6 5 ( 19 9 2 ) 2 1 直庄的送盆娄数据的贝吐逝筮蚯 13 1b o l l i n g e r , c 1 l ,a n dd a v i d ,m h m o d e l l i n gd i s c r e t ec h o i c ew i t hr e s p o n s ee r r o r : f o o ds t a m pp a r t i c i p a t i o n ,j o u r n a lo f t h ea m e r i c a ns t a t i s t i c a la s s o c i a t i o n , 9 2 : 8 2 7 - 8 3 5 ( 19 9 7 ) 【1 4 】c h e n g ,k g ,a n dh s u e h ,h m e s t i m a t i o no fal o g i s t i cr e g r e s s i o nm o d e l 1 i t l l m i s m e a s u r e do b s e r v a t i o n s ,跳t i s t i c as i n i c a ,13 :1ll 一12 7 ( 2 0 0 3 ) 【15 e i c k h o f f , j c a n da m e m i y a , y l a t e n tv a r i a b l em o d e l sf o rm i s e l a s s i f i e d p o l y t o m o u so u t c o m ev a r i a b l e s , b r i t i s hj o u r n a lo fm a t h e m a t i c a la n ds t a t i s t i c a l p s y c h o l o g y ,5 8 ,3 5 9 - 3 7 5 ( 2 0 0 5 ) 【16 】w a i - y mlo o na n dh a i - b i nw a n g ,t h ea n a l y s i so fo r d i n a lc a t e g o r i c a ld a t aw i t h m i s c l a s s i f i c a t i o n ( s u b m i t x 2 0 0 6 ) 【l7 】m e t r o p o l i s ,n ,r o s e n b l u t h ,九w ,r o s e n b l u t h , m n ,t e l l e r , a h a n dt e l l e r ,e e q u a t i o n so fs t a t ec a l c u l a t i o n sb yf a s tc o m p u t i n gm a c h i n e j o u r n a lo fc h e m i c a l p h y s i c s ,2 1 :1 0 8 7 - 1 0 9 1 ( 1 9 5 3 ) 【18 h a s t i n g s ,w i cm o n t ec a r l os a m p l i n gm e t h o d su s i n gm a r k o vc h a i n sa n d t h e i r a p p l i c a t i o n s b i o m e t r i k a ,5 7 :9 7 10 9 ( 19 7 0 ) 【19 t a n n e r , m 八a n dw o n g , w h ,t h ec a l c u l a t i o no fp o s t e r i o rd i s t r i b u t i o nb yd a t a a u g m e n t a t i o n , j o u r n a lo f t h ea m e r i c a ns t a t i s t i c a la s s o c i a t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论