(概率论与数理统计专业论文)随机化问答技术在复杂抽样中的应用.pdf_第1页
(概率论与数理统计专业论文)随机化问答技术在复杂抽样中的应用.pdf_第2页
(概率论与数理统计专业论文)随机化问答技术在复杂抽样中的应用.pdf_第3页
(概率论与数理统计专业论文)随机化问答技术在复杂抽样中的应用.pdf_第4页
(概率论与数理统计专业论文)随机化问答技术在复杂抽样中的应用.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 调查敏戆性闻题对,被调查卷谯经会拦篼回答或撼蜓纛假答案为了获得敏感性阿 疆懿粪实答豢,毽舞了爨护袭逶袋卷瓣憋拳,w 蠹n e r 凌1 9 弱年率是撼蹬了敏感建藏 疆鹣| 瞳撬豫阏答技术。毽所设计豹模薹中包鸯了蓠个鸯敏感健阏题有关部壳愈对立懿阕 题几十年来,猩随机化问答技术的研究领域中出现了大批w 缸n e r 楱溅的改谶模毽, 以及一螫新解调查方法。 为了避一步提高被谲鲞者的配学度,h o 嘶t ze ta i 猩1 9 6 7 年提出了改进的w 轴n e r 模型谴姐簿淡将援来匏逆同题敬成一个与敏感性将糕惫荧的非敏感缝阍鞑此后, 毡。薜旺9 7 l 叉对轴确纽模登擞窭了邃一步鐾改进。 2 0 辩年, s 珏巍铖嚣差挺出了 两个改进魏麓o 8 模登,这两个模熬有效媲弥补了醒o o 描模嚣破坏被谰囊者隐私懿缺 箔。 然而,襁隧凯亿问答技术的研究领域中出现的多数w 甜n e r 模型的改避攥激都是基 于有救回的德单髓机抽祥的。2 0 0 4 年,k i m 和w 酶d e 曾次将w 缸n e r ( 1 9 6 5 ) 模烈应用 于势瑟襻零 在本文孛,凌秘密s i 嚣垂武毅夔藉耱辏銎进一疹捺广至努器接襻嚣不等凝搴撼榉逮 秀种复杂撼样串。在髭萋础上,我目j 给出了所有揍藜f 慈傣中皴| 感性国疆跑髑憋无缡信 计,估计的方麓,以及冀它的褶燕性质 奘键调,| 骧魂亿i 珂签模型,敏感性闫题,分层控榉。不等概攀抽样,两榉本横毅,单 襻本模型 a b s t r a c t s u r v e yq u e s t i o n so fas e 璐i t i v en a 七u r ea r el i k e l yc ol e a dt or e f u s a i so ru n t r u t h f l l la n s w e r 8 t h er a n d o m j z e dr e 8 p o l l s e ( f t ) t e c 腻q u et op r o c u r et r u s t w o r 虹【yd 蚍ao ns e n s 她i v e m a t e 措b yp r o e c 艇珏gp r 主v 8 c y # h 8 瑚p 。n d e n 蛞w 8 sf l r 髓j n e d 硅c e d 谚萌黾r 硅e f ( 1 9 8 5 ) h i 8m o d e lu s e s 咖r a d d m 主z e dq u e s t i o 璐b o t he n q u i r i n ga b o u tt h er e s p o n d e 吐s8 t a t u 8 i nr d a t i o nt ot h e 靶璐呈t i v ec h 8 r a c t e r 0 v e rt h ep 船tf 哪d e c a d e s an u m b e r m o d i 最c a - t i o n so fw 抽e r sm e t h o da sw e na 8s e v e r a lo t h e rn e wm e t h o d sh 撕b e e ne m e r g e di nt h e u t e m t l l r eo fr r 趣o r d e rt om a 妇t h er e p o n d e 氆8m o r ee o _ o p e r 8 垃v e ,h o 蹦t ze ta l ( 1 9 6 7 ) s u 戥;e s t e d t h a to n eq u e s t i o ns h o l l l de n q u i r ea b o u t 七h es e n s i t i v e 如叫a c t e r i s t i cw h j l eo t h e rs h o l 王1 db e c o m p l e t e l yn e u t r a l t h e n ,m 0 0 r s ( 1 9 7 1 ) i m p r o v e dt h eh 州t z 8m o d e l i n2 0 0 0 ,s i n 曲 e t 姐p r o p 锵e d 押om o d 避c a t i o so fm o o r s sm o d e l ,诫c h 如n 酏j e o p a r d i z et h ep r i 、冶c y 0 fr e 8 p o n d e n t 簸o w e v e r ,m o s to ft h er rp r o d e d u r 鹳8 v a n a b l ei nt h e 址e 础t l r ea r ed e l ,e l o p e da n d s t u d i e d 丽t ht h er e 8 t r i c t i o t h a tt h e8 锄p l ei ss e 王e c t e db ys i m p l er 8 n d o ms 锄p l i n gw i t h r e p l a c e m e n t j o n 争m i nk i m ,w i l l i a md w 甜d e ( 2 0 0 4 ) p r o p 0 8 e das t r 砒城e dr a n d o m i z e d r e s p o n 8 em o d e | b 8 8 e do n v i l r n e r s ( 1 9 6 5 ) i nt 上1 i sp a p e r ,t h es i n g he ta l 8m e t h o d 8a r ee 斌e n d e dt ot h es t r 眦i 矗e ds a m p l i n ga n d u n e q u a lp r o b a b i 珏坶s a m p u n g 啦r e 鹃i o n 8f o r 如eu n b i a 8 e de s t i 越a t o ro f 七h ep o p u l a t i o n m e a n 姐dv a r i 8 n c eh 茚她b e e no b t a i n 越o t h e rr e l a t e dp r o p e r t i e s8 r ea l s od i s c u s s e di nt h e p a p e r k e y w o r d s :r 8 n d 0 h l i z e dr e s p o 璐em 。d e l ,s e s i t j v eq u e s t i o n ,s t r a t 遗e ds 8 m p l i n g u n e q u a lp r o b 8 b i l i t y8 锄p l i n 舀m s a m p l em o d e l ,o n e _ s 锄p l em o d e l 1 1 攀位论文独饿性声明 举人所呈交翦攀嬗论文燕我谨导厣瓣指导下逃卷鳃研究王作及取褥的鞒究戒果。据 器l 耪螺,狳支孛已筑注臻弓l 曩黪瘫骞铃,零埝艾苓彀鑫其缝个人基经发裘竣撰写避翡辑 究成暴,对本文的研究做出薰袋赞献的个人和集体,均巴在文中作了瞬确说疆并裁承谢 意。 佟鬻签名。 稍伤 日精。o 伸善j ,文厂 学位论文授权使用声明 零入党垒了躲差肇零瘳范大学肖关傈窝、谯黯攀搜逊文翦规寒,学校霄投保留学伐论 交势您嚣家吏霉部瓣凌葵撵定援褥逑交论文螅程予蹶繇纸质舨+ 毒鬏褥学攮论文愚予静 豢辎嚣瓣酶步蟹笺翻并允译论义遴入学校瓣书馆被瓷藏有权将学位论文瓣内容缡入骞 甍数据露避磐缎索。有较将学穗论文懿挺糕嚣藕要汇编出叛缳密熬学经论文在辫密薅 逡耀本浚定。 鼬瓣;醴爹+ o 。乏f 学位圣麓文撵者蘩名 稠嘭 嚣赣 弹撵签名 舻、主、以 法吨x 第一章绪论华东簿范大学硬圭论文 l 第一章绪论 第一节敏感性调查中的随褫化闻答技术 敏感性问题是指所调蠢的内容涉及私人机密而不愿或不便于公开袭态或陈述的问 蓬。诸如个人牧入、考试作弊瑗象、享主会上豹赌博l 殁毒、擒税漏穗等| 珂题都羼予这一类 问题,对这些问题的调查就称为敏感性调焘 对于敏感性调查,如果采取直接提问,被调查者往往会拒绝回答,或提供虚假答案 因此对敏感性闻蕊的调丧必须采糟经过特剐设计的谲查方法,i 2 上消除被谓查者的顾虑,使 他们能够如实回答问题随机化问答技术就是为敏感性问题调查特别设计的一种技术 其纂本特征是被调鸯者砖所i 两蠢的润题采取随枫回答的方式,从嚣避免在没有任 霹保护 的情况下直接回答敏感性同题如此一来,不仅保护了被调鸯者的隐私和秘密,而且能 使调查者获得所特要的冀实资料 按照指橛特征分类,敏感性瓣题胃分为定性持鬣辩题和定簧榜征阍矮在本文中我 们只讨论定性特征问题,此时调查目标量燕被调查对象中具有敏感性问题特征的比例 第= 节随机化问答技术的发展 为了捷被调查者无意藏之忧迪给出真实鋈答,1 9 6 5 年w 甜n e r 首先提出了敏感睦月 题的随机化问答技术他的设计怒向被调蠢者显示两个与敏感性问题( 具有特征a ) 有 关,但完全对立的问题:一个闻题是。你具有特征a 鸥? ”,另一个闻蹶是“你不具有特 征a 吗? ”对两个| 霹题的答案都只有4 肯定( 是p 与4 否定( 否) 。两种利用事先设 计的随机化问答装置( 如摸球装置或抽卡装置) ,使被调查者以概率p 回答第一个问题而 以概率l p 留答第二个| 霹蘧重要的是只宥被调查者本人知遭德究竟是回答哪个弼 题,而调查员并不知道被调碴者所回答的燕哪一个问题 例如某大学为正确估计本校学生在考试中曾发生过舞弊行为的比例肯,随机抽取n 个学生进行调奁,对每个学生显零了嚣个阔题: ( 1 ) 你在考试中宥过舞弊行为,是吗? ( 2 ) 赞淮考试中没有舞弊行为,是吗? 另外交给学生一个密 鞋容器,其中装有两种颜色( 例如黑与自) ,但大小、形状与重量完 全一样的球桀 球与白球的比例是p :( 1 一p ) 被调燕的学生在该容器中随机地摸一个球 ( 不向任倪人最示) ,孝麴裂黑球如实回答麓题f1 ) 著摸到自球煲! l 如实露答阏题( 2 ) 。 由于问题的答案只有4 是”与“否。,并且别人也不知道被调查者回答的是哪个问题因 此,学生可以毫无顾虑媳给出符合实际情况的答案 簿一章 鹫 诠 华东薄茳大学硕士论文 2 w 蔹硅e r 摸鍪兹霞蠡整:一方褥镶每拿撰煞了实验装置鳇装瀵奎者黎耱绘窭冀蜜嚣 籀,舅方嚣又魏够逶藏瀵查禧翻霹簿爨嚣静德 。毽是它也存在译多不是,露磐葵壤 溅审孵两个阅题都涉及敏感瞧闻题,霄臻狻滑淼誊可髓仍有鼹惑蔼不肯合终。 为了进一步提高被谖查者懿懿舍度, 鞭o r 啦t z 秘s i m m o n s 在1 9 6 一警提出了政避鳃 w 撕n e r 模型他们建议将原来的邀问题改成一个与敏感性特征无关的非敏感性闻题y 即他们的随机化问答模型包含如下两个问题* ( 1 ) 体是否具有敏感性特征a , ( 2 ) 你是否具有特征y ( 与敏感性特征at ,芒荧) 根据总体审具有特糕y 的比例弛照磷殴知,求解总体中敏感性特征”的比例估计 方法也努戚糨应的两种稽况。由予束辩的情激雯为一般,在这堇我船是绘出嘞柬辩 时,慧俸申敏感性特征霄的比例佑计, 势了获褥就模垄下慧棼孛簸蹙瞧耪征筇辩溅镶话诗, 奴峨掂释s 强盈锺s 双愍搭审独 敷溉接致薄缀枣效鏊翡麓摹夔援撵零,襻李黧努燕国n l ,n 。,霎襻率萋簿凳n = s i + 捉2 每令被菊壹意傍遵避搂球装燕寒嶷裳瓣签麟拿麓蕤雾i 蹙襻率孛鲍每争擎茺摸魏 黑球的横率为张,i = l ,2 ( 鼯鞲答笨个麓联孵攘搴) ;摸裂蠢荤鳇摄率蠢l 一辫( 弹 圆答第二个问题的概率) 于是,根据垒概帛公式荔褥e f8 t p l 霄十( 1 一焱) 魄 i 如:m 7 r 十( 1 一p 2 ) 屯, 篡啦馥袭录警摸到黑球戆概率为热时,掸零巾一个单元回等j 磬的概率 这榉将l = 署,2 = 鬻( m t 和m 2 分剐为两组样本中回答混”的人数) 健替 口l 、如褥劐;开:旦二丝壤毒掣( g r e e n b e r ge ta l1 9 6 9 ) 是f 的无偏估计,奠 方麓为, ¥= 毒奇 i ! 二姿2 :! i l ! = ! i 2 。i ! 二篓! :叁i ! 二叁i 1 9 7 8 年,壬( i m 秘焉壬壬o i t z 鞍s i m m o 黼糖窭懿蓬梳纯褥答模蝥,获总体申猿烹跑 抽敬随组不放霹的楚革髓枧撵本,榉李爨爨努荆为,l ,啦悲时,总体串敏感性将饺f 的比例估计形式依然是; 亓= 垒二塑攀暑弓 嫩但方整却有所改变,其形式为: v = 。南 掣+ 半 ( 1 一仇) 2 ( 竹l 一1 ) 刀i 霄( 1 一竹) + ( 1 一p 1 ) 2 b ( 1 一q ) ) 吼( 一1 ) i 一芦2 ) 。 ( 1 一p 1 ) 2 ( n 2 一1 ) 磐;汀( 1 一霄) + ( 1 一热) 2 岛( 1 一吩) 一丽瓦面i 鬲厂一 莠一掌鹫论 警寒薄莲丈学磺士论文 3 由上式我们淀意到p t ,鼽相差越火( 即其中一个接避予0 ,而另个接近乎1 ) , 膏的 精度也就黻离m r s 鹫提出,黪令p 2 一o ( e 黠嚣:组榉誊中魏个俸嶷按瀚| 霹英楚否 具有特征y ) ,此对,丹的精度将遮瓤最离。 、霉是褒2 0 年,s i 蹭l 截赫勰指鑫t 磁o o 疆搂黧霹麓会菝霉l :蔹壤釜雾瓣令人黪 糕。这一缺陷烹要俸瑷予舞下攮滚t 当疆囊遥接裴鼹缀榉率对,帮努革嚣胃麓游藏于两 组样本若策人具有敏感性特征a ,雨不萁有特征y ,段此人同属于两组样本尝他属 于第一缝榉本瓣,佳被要末使用隧橇 匕瓣答模垄鲍撰球装惹,经遘摸球后,其绘如懿回 答为:秽,幽他属于第:组样举时,他被要求直接蛳辚是香具有特征y ,其回答为 “蚕,。假设飕人鲍霉答均是真实鳇,郄么我扪立即可以知遭此人具有敏感性特缝a 。如 戴寒,这个被褥壹蠹瓣繇程簸遘戮了薮棼。 s 证g he 屯畦根据艺述理鸯,鬻争对摸鎏l 进行了改避,褥戮了嚣夸玫懿麴模缓第一 个摸窭主舞错对上述部分可托蕊糕子两缎襻零翦单瓮静闰答方式进行了改进,对这部分 单元第:次的调查不再采用宣撩问答的方式,面是改为襻次使用随机他闷罄方式在这 里,我们称熊为两样本模蛩第五个模型则是将捕取的一组样本随机分成辩组子样, 黠羹孛一绻采取藏融纯裁答方式,努一组烈采震塞凌麓臻方式+ 在这里,我砖张箕为擘 襻零壤罄。 诧静,畿藏棍纯阕莓技术发麓貔进程孝,镤长一羧时游以来,研究誊器锋辩簿革隧 杌榉本避行横毯改进。赢到2 0 0 唾警,k i m 辩w 出d e 才榭随梳亿闻答技术应雉予分屡样 本他们讨论了w 8 r n 册1 9 6 5 年掇搦的随机化同答模溆秘分层样本中的应用张调畿过程 孛,他船囊爨在每一层撵本中蟪使糟了个不弱的隧戡他同答模型,然詹刺聪转澄撵本 戆性质获得总捺孛敛蒜靛阕题的她铡膏静馈 及其方熬 蒸兰节主要绪论 在深入姘究了s i n g he t 越摄i 挡的m o o r 8 模型的簿个激进模型后,我9 1 姆遮掰张模型 推广至分聪抽样和不等橇率抽样遽两种复索 抽样中 在文章辩第二章中,我g 】主嚣讨论了努瑟搐榉申的辩榉本模型积单梯零横激的考关 缝爱,给赢了两释模鍪下慧蒋孛敏戆缝霹蓬琵赘鳇茏镶傣诤淡爱滚绩诗懿穷藏,势量秘 步研究了分艨捆样中单榉率模戮奋燃的样率量配嚣,礴怒了最傥精度下蠢罄予榉豹样本 量。 在文章的第兰章中,我j 仃主爨讨论了不等概率掏样串的嚣掸本模型穗单榉率模型的 有荧性质利用不放回的不等概率搠榉中目标量估计的h o r m z t h o m p s o n 思想,我们给 窭了两静攘鏊l 下慧婆串簸感性阍煺进攒懿秃镶嫠骨拨及浚髂诗的寅差, 莠二掌分屡撼撵辛薛随规亿鞠餐模型华东萍范犬攀磺士论文 4 第= 章分屡抽样中的隧机化问答模型 第一苇善l意 自1 9 6 5 年w 缸n e r 将随讥化问替模型g i 入敏感健f 可瓤的调查以来,许多掰究者对随 机他嚣答攘濑郄俸了大罴的改遴工俸,僵这些改进都仪麓限在楚单夔枕蝣岑意下。2 0 0 4 年,为了扩大随机化问答模型的使用范露,x i m 和w a r d e 首次将w 蔚n e r ( 1 9 6 5 ) 的随机 佬阉答模型藏嚣予分屡榉零中,始研究了攘关静性藤 在零寒孛,我嚣将在k 浊程w 射d e 鹣器宠基琏上,继续 孛i 龟努器襻零下蕤撬匏藏 答摸螫的改遴。我髓将s 泌癌武耩l ( 2 0 ) 攥盎静改逶瓣垂o o r s 模型推广蘩1 分艨襻本中, 通过深入瓣研究,获得了总律申鼹有敏感性特堑豹鲢:倒依汁形式及其方蓉 第= 节分层抽样下豹粥撵本模型 2 。2 l l - 搂黧浅硝 假谖慧俸镪食n 伞萃元,聂滚慧俸被努成毛个子慈体,嚣总俸包岔己撰,每个子 总体中有n , 个单元莆先,我锏分剐从l 屡子总俸申独点地抽取两组不放黼的简单随 机样本,样举懋分别为竹l , 一l ,l 和n , m1 ,五第h 层的 荦本量即为 锄蒜珏l 靠+ 赡2 盎。 然后,我j 在每一器懿第一爨棒岑串实藏篷枧诧翔答攘戳( 避为冗冀l 垴丸一l ,三) , 每拿嚣嚣l h ,矗一l ,三孛遗镪窘疆令蠢避r 1 ) 髓:是否具意敏感链特掇a 。 ( 2 ) 你是否具有非敏感性特征y ( y 与a 不糨燕) 第h 崖中的乱t n 个被褥套者利用摸球装景来决定回答麟个闫题,装置中有黑融黼色球, 每个被调查糟摸刘黑球的概率为p l ,摸到臼球的概率为l 一烈h 。摸到黑球者题答问题 1 ) ,攘到岛球者霉嚣闻题( 2 ) 。 袋霆,& 予第b 蒺静嚣缀襻零爨蔽第囊屡予惹薄申猿烹擒羧蠡,匪魏,迭鼹缀襻零 可靛会有舔分单元重合。于是,麓予第h 屡的第二筑样零,我们将分情凝采用不同的德 查方式,如果第h 层中有同属予两缀榉本的单元,我 门澍这些单元实施第二个随机化问 答模蟹( 记为r & ) 在r 飓 中同样包含( 1 ) 、( 2 ) 两个闯题,被谲套辩仍潦过摸 到球的颜色来决定鳗答哪个问题,此时,被调查者摸刹黑球的概率为p 抽,揽到自球的概 率势l 一魏& + 掇酵,我g j 建第h 豢鹣第二筑襻率孛鄂夔幂疆壤芎:第一驽襻零粒攀嚣实蕊 壹接惩答,黼符合这一条律懿每令镀灌蠢毒哭 要嚣答霹熬2 ) 。鑫子攘襻魏藏魏缝,嚣 此存在一种特殊豹情况,即第h 羼的两组样本不存程蕊合的萃元此时,我们将对第h 第二章分屡接搏中鼗遮媳甓惩答攘燕华寒簿莲大攀硬士论文 5 瑟鲢第二缓襻誊孛静嚣骞单元实壤煮接潮答,鼯每个簸潺查者只要霾答霹瑟fi ) 。速释 憾嚣捧当于嚣述骛瑟翡一静狰镶,箕镄话荦玎传诗静方蓑砉榴黠簿蕈,在魏裁不趣洋遴 采用两样本模型不仅保留了m o o r s 模嫩的实质,从而提高了估计的精度,砸髓遮到 r 保护被调查者隐私豹曩的。毽燕,辫榉席:模黧需簧在不同的层分别采甩两个隧枫他闼 答摸氆,医此,随着层效的增多,工俸激也会随之增加,从丽造成人力与经费的增加, 2 。2 2 。镣每 为了便于研究的开展,在这一小节我f 啊曾先绘出一些符号的定义,记 溉 = 珞= 球= 磊t = 第h 髅黎i 个摹元其霄敏感性糁薤a , 第h 瑟露i 个零嚣不箕毒蘸感瞧特薤a 繁h 瑟筹i 博嚣曩蠢霉敏蒸瞧簿薤y , 蕹纛暴露i 个攀元不翼毒敏感魏特征x 第h 髅第i 个单元簿黪敷感性阕遂, 第h 器黪i 个翠元蟊答非敏惑毪弼莲。 第h 膳第i 个单元的回答为。是”, 第h 屡第i 个单元的网答为“否” 凰 ;第h 层的第i 组样本,l = l ,2 ,h 一1 ,l 啦 ;第h 屡的第i 组样本的单元个数,t = l ,2 ,矗= l ,三 “蝴;第h 层中同属于两组棒奉游榉零蛩( 这量讨论靛愚n l o 的一般愤溅) 。 弛 2 :笨h 屡中属乎第二维撵本魏誉瓣予第一缀榉本酶榉本量 m :;第h 屡酶第一缝祥零孛瓣答4 建4 懿单蠢个效, m 2 h lt 嚣箍l 争葶霓孛器答。憝”瓣繁笼令数。 执勰,啦h 2 令攀嚣串窭答。蹩瓣摹笼个数。 日:总落孛吴毒特征a 辩耽赞,费液瓣禚应静偿计。 :总体中具有特征y 的比裥 钆液示梗应的估计 ” ;第h 层子总傣中具有特征a 的蹴例,氟袁示福应的估计 “。:第h 层予总体中具有特馥y 的托例,锄 却表示基于n 2 2 个单元襻劐辩” 的估计 口l ,墨摸蘩黑球的概率为舢时,第h 瑟鹃第一组祥本孛每个摹元匿答“憩”豹 概率,表示相应的估计 酝:当攫到黑球的概率为p 姥时,农第h 屡的髑属于两组样本的啦 1 个单燹巾, 每个蕈元匿签4 是5 静橇率,袭承裰皮的德诗。 l 0 l 0 1 0 l o ,ll,;,(;、,(,、,fl、 第二章 分屡籀样辛的陡祝亿问答模型华东师范大学硬士论定 6 l工 记n l = 拜l ,再n n 2 ,于是,n l + 锄一n 为憩样本薰。 = l 寓l 2 2 3 参数的估计爰方爰 在每一瀑子总体中,我们均聚用了不放鼙的筒革随机抽样方式来获褥两缀样本医 此,根据比例的特点,构造如下估计: 酝2 嚣。去; ( 2 。- t ) n 1 ”1 俐 k 2 等2 去善磊, ( 2 2 z ) n 铀l”2 1 篡 锄。v 。薏。去霎玩 ( 2 。_ 3 ) 锄2 v 。面。五磊鲁 水”。”) 另一方面。根据垒概率公式,我们易褥一 f 瓢搬 + ( 1 一p l ) 一p l 咖 + ( 1 一p ) 嘶= 如 将( 2 2 ,1 ) ( 2 2 + 3 ) 式中的如、酝、女h 翱分别代替上式的口l 、如 ,郅可获得 n 的两个估计九 、亓l , :堕上塑韭她,( 2 2 。4 ) 2 百一 4 j 开。:堕二坠竺地,f 2 2 5 ) 7 r 协= 一, l z z t 0 j 为了综会利用这两个估计,类似于s i n g he ta l ( 2 0 0 0 ) ,我f 日定义瓢的个加权估 计t 缸= 锄氟 + ( 1 一) 女n ,( 2 2 6 ) 其中钆为属乎【o ,l 】的任意实数,它是为了获得亓 时,利用骨曲和讯的权重。在本章 后两,我g 将给出精度最优情况下8 的取德。根据分层抽季筝的特点,我们定义总体中” 的估计为t 一 井= 亓 , ( 2 2 7 ) 其中为第h 层的屡权= 静 现已给出敏感性闯越挖例”的估计,下嚣我# 】将继续研究此估计的些牲质 定理2 2 1 ( 2 2 7 ) 式中的亓是霄的无偏估计 证明:因为# l = 甓,根据定义m t a 为第h 层的第一组样本中回答。燕的单元个数, 第二章分谣齄群中曲随棍他问答横垄华末萍范夫攀颈士论戈 7 而该组样本中任意一个单元回答“是。的概率为口1 同时,在第h 层中,我们是通过 筒单隧钒按撵获得榉本秘,羼蹶,掇据简单箍枕抽榉辩悛质,郄毒得到e ( 墩 ) 一8 l 如果令嚣2 为给定“2 l 下的期望( 郧第h 层中嗣爝鼍:两缎棒本的单元个数绘定下的 赣望) ,姥辩,露溉2 毫遂着啦i 静给定嚣绘定。e l 为农黪莓爵魏“t 下静裁整。扶嚣, 我髓霄t e ( 氏 ) 一e l e 2 ( 开2 2 ) 又鼷为屯 2 = 磊鬻,根器定义m 2 船为n 瓠2 个单嚣巾隧答4 楚。静单嚣个数( 雄啦 个单元中具精非敏感性特征y 的单元个数) ,而当n 轴2 给定时,n 2 h 2 个单元中任意一个 单蠢具有嚣敏感性特薤y 缒概攀鸯霄轴。嗣对,在第h 艨中,我g 】是遴避麓单隧瓿抽撵 蓑褥襻奉鳃,掰班,豢豢霪萃辫凝糖襻懿经爱,帮霹怒舞& ( 夔碡= 8 酶。予是, 冀( 卉h 幻) = e i ( 弧0 2 靠 因此, 瞩,一嚣( 生絮她) 。! 堡二i ! 二翌! 1 2 融 端7 潺瑗,e ( 女瓢) = 如。综合上述结论,霄戳撙刭 五 e ( 寿) 一芝:珏气譬( 8 稚+ ( 1 一# ) 稻 = l 西丽,定联绪论成立。心 为了获程佶计量卉的方蓑,我g j 将通过几个g l 理采分步诗算估计爨赴地。、a 挑、 兹黪方蓑,潋及三个菇诗量嚣瓣之阕懿骛方差;营篾,我翻遵过驻下g f 瑾懿彤南 2 。翡 方蓑。 i l 瑾2 + 2 1 。如 轴的方羡为: v t 酬一陋( 去) 一- 糍导 。固 证骥t 嚣 、e 2 鹃含义与定理2 2 。i 孛籍凄酶定义捧霹。瀵过谤葵,交嚣蠢: v ( 屯 2 ,) = e l v 2 ( 异2 对) + v l e 2 ( 隶甄龄) 襞三壅 坌薰鲎茎皇塞羹垫垒篓簦燕爨一一皇盎壹盔兰璺璧坠蔓垒墨 8 = e ;【端础一城 = 陋( 壶) 一1 篙掣 引理2 2 1 中e 1 ( 矗) 的糟确假燎冤激获得的,因此,开2 觇v 的方差只是一个激似 镶按下来,我躬通过葶l 理2 2 2 寒计算# l a 与鹩弼方差 l 骥2 2 2 袅a 与酝的协方差表述式为; 呶( 袅x ,氟 一篙t 蝴础一瓢) 硝嗍终咄溉菇一嘞嚣2 妨 瀵萌;令蕊,嘲务缭定襻零s l 赫鼬下豹颓螫,强方差,( 1 c ) 舞爨骞霹懿赡 s l ,s 缸下岛勰望,蜘努差。手鼍, g a v ( 毋l ,k ) 掣e 产c 嗣( 魂矗,赫;) 十c p ( e 拧( 魂 ) ,g 嚣( 毋锛) ) , 灏绘定样本s 1 。8 时, i 器程: 疆巍, 嚣盎穗a ) e 矗( 母臻) 扎, 个单元与竹个单元关于随机他问答装鬣是不棚关的,从 e d v ( 每l 。如 ) 掰a 卢( e a ( t ) ,e r ( 毒砧) 氛l 、 阢珞+ l 一珞) | j :去喜x m 孙c ,+ 去霎聪t 一蹦 = 弛( 熹喜弱z ) + e t 一芦( 去誉) , 刘q 去善孙j = 魄l 志蚤十蹦卜蹦j ;土溉糯( 魄) + 三毪e 嚣( 1 一珞; 。去墨溉蹦瑚+ ;去蚤毪鹾卜黝氇n 鬟薹 黼 三帐三孙 ,l,l,tl 酸 餐二章分屡撞榉孛辫醚规筵塑箜蕉翌垒塞堑茎查堂璧圭建塞 9 一魏一( 熹) 邙咱s ,( 去篓强) 。 弱虮记:去篓蕊:、膏;坶= 志冀、产去警溉;、 弱外,记2 去羞蕊t 、膏t 坶2 赤蚤、产志姜溉t 、 ,l 2 l 许洲g = 瓦:岳;,所以,我们有; e 吖( 目t 一。岛a ) = c ,p t 膏t 十( 1 一p t ) 靠x 耐,p 驰膏2 一- + ( 1 一现一) 锄砖 魏皋令( e s ,e s ) 、( 取,c 。,v 4 ) 分别裘永给建龇下的期望、协方差鄹所有可熊的籼 下螅凝蟹、游方差、方差那么,我8 1 有; c 。v ( t a ,岛a ) = c 4 芦s 魏t 膏t 一+ ( 1 一张n ) 骨l 姆 ,嚣s 瓤如t t ( 1 一孙) 热a t , + 嚣t 龟 l 膏l + l 一梦i ) 音l 酶 ,洳一蠢黯l + ( 1 一p 。s ) 锄轴 ! 。 遗s l 绘定簿,彘 与青l 姆鸯蠢薰,辑戳,融待协) 一番扭,嚣s 滞l 妨= 羲酶。魏对,s l h 簸好 院个确定的总体,我# 馈从羁n 个单蠢的总体巾,通过简单隧机抽榉抽取n 2 1 个单嚣。根 据简单| 疆机抽样的性质得e 5 ( 赴 1 ) = 膏l ,e 5 ( 丹2 螬) 一氕畸子是,c 5 ( 赴 ,赴 1 ) = o , 龟( 开l 岫,开2 岫) = o 并藏,根据特征a 肆y 的幂榴荧性,我们还有e 5 ( 卉l ,膏2 l v ) 一o , g 5 ( 丹,开) 一o 从丽c 5 p l 膏l + ( 1 一芦1 ) 话l 蛔) ,扣2 亓2 l + ( 1 一p 2 ) 开2 l ) 】* o 综上所述,我们毒以得到; c o v ( ) 。p ,m v “( 丹, ) + ( 1 一m ) ( 1 一m ) 砜( 卉l 蜥) + i ( 1 弛) 十搬 ( 1 一p t a ) l & 0 * ,瓤姆) 。 雯一穷嚣,缀援笼爨售诗骛泣质,我# l 遥毒: v 4 = 蒜娟一砒 v 4 ( 彘姆) = 揣卜嘲, c 4 ( 卉l ,骨l 口) = p y 、v 4 ( 丹挑) v 4 ( 卉l ) = 意蔬附佩焉磊( 一1 ) n l “v ”、 “”“ 练会上述结粜,鼗们得到; c o v ( 文一,致) = 糕黝醐一张) 坤呻剐1 一嫡酬1 一吲 茎三鲞熊墨燕鲎圭童蕉壑焦鋈蓬送鍪 璺塞塑堇塞黧登生浚塞 i o 十p a y ( p l h 十p 2 一2 p l p 2 ) _ ,石h ( 1 一霄 ) 霄h v ( 1 一霄 v ) 】, 其中p y 表泶特征a 苟特征y 宅溺的相荧系数,由予瑕定特莅a ( 敏感性特弦) 与特征 y ( 嚣毒感瞧姆翟) 爨襞既不籀甍瓣,帮尹 y = o ,蹬她,l a 与鬼戆蛰方熬碧2 ,2 。9 ) 瓣。蠢 引理2 ,2 ,3 ( 2 2 1 ) 式中的的方麓可表示为: v 慨扣驾拶一虹逊邈赫学堂坐剖江。加) 住1hn 1 l y h 一 j 诬竣;遭避计霉,蔫鞋褥裂t 啉扣卦( 霎蕊) 十e ( 霎霎霸) 一 e 偿鼠) 。童埘 令弱r 为给定样本5 l 和s 啦下的期掇,此时,我们只对i 嚷机化问答装鬣掌期勰,即只有 接受甓盼瓣越是随撬浆。岛为掰蒋萄嚣瓣s t a 窝s 缸下静疑整,弛= :i :, 印铀一器( 1 ,辩) 嚣舞,磊* 溉+ ( 1 一羝) ,掰鞋, e ( 薹瑞) me 户e r ( 薹磊t ) 一酗 巍一巍十( 1 一m ) 嘲 一z 溉+ ( 1 一芦聃) 强j 嚣p ( 鲰t ) e 改,* 嚣p 瓿 磊t 舀; 拳l ,i 、 = 1j l , b t h 妣h 一酬陆蕊,+ ( 1 一p 1 一) 2 + 2 p l ( 1 一p l ) 蜀“强 nin1 一麓* 底氩,十( 1 一m ) 2 魄 体t , 奸 + 2 p i ( 1 一p l ) 砺;l 孙( 鳓鳓) 第二掌 分瑟嵇撵孛酶琏规毯瓣昝襟墼 华东炻葱大学硕圭论文 l i 冀巾, 阏壤,鼍鞋褥懿t 弗息, nlnl = i 抵t x 玉( 1 一爹l a ;2 ;缸 毒lj 4 + 鼢 ( 1 一张“) 弱;】粼, ;f 釜12 一登磙 i l i = 1 ,帆、2 h ; 粕;一 世l i 罩1 一搬一暇散 = j 该搬( 蕊张一1 ) , 一弧峨”( m 靠”一i ) , ;= lj i ( 姜甄t ) ( 叁) 一( 姜)( 委瓢) ( 善) 一( 萎) 增“一眠觏张, :甄( 甄一l 钡口。 予楚,我辩簧; 嚣( 薹霎磊t ) = 汹一一t , 堡群婊+ 。瓢鲰嬷薄一搬a , + 掣c t 刊2 】 一洳一,) 盟鱼逊訾盘业趟 = n t a ( n t 一一- ) p 氛一苎样 一塾i ! = 2 1 丛! ! :数! 魅一l| 。 ( 2 2 i 3 ) 酥磁 硝 :i f | 垓 x m 硝 第二章分墨拯薛中爵醚规亿翘签摸型 华东掩范大学硬圭论文 1 2 就势,我髓还鸯; e ( 娄z 赢) 一霉,嚣n ( 娄磊) 然协l 秽l h ( 2 2 1 4 ) 将( 2 ,2 1 2 ) 一( 2 2 1 4 ) 代入( 2 2 1 1 ) ,即可得到( 2 2 1 0 ) 式口 猩给出, 的方差詹,我们可以通道粪似的方法由以下g i 理计算k 的方差 引爆2 2 4 ( 2 2 2 ) 式中的如n 的方差为 v 泓)= 卜”铱,+ 熟堕嵴鲁掣熹) 一鱼迎堡垮芝掣熟坠型。 l s ) f 甄一1 ) ”7 蓬骥;令( 秘,) 、( 嚣l ,v t ) 瓣禽义毒宠壤2 1 2 - l 孛懿定义罄瓣。类稷手弓 理2 。2 。3 , 我# 】霄; v 。= 笺一鲰拗掣鼍耀铲必。 并煞,摄据篱单涟辊接样辩性质,我弱叉胄我2 ( 酝) = 8 孙邋过计算,靼可得到; v ( ) = e t v 2 ( ) + v t e 。( ) 锄 篙裂匦型趣黯孥逝世型)l n 2 l n 2 l u v 一l jj + v l 如) = b p 讲垫堕离幽m 去) 一交垒l ! 二垒! ! i ! 二鎏2 1 熟翌= 麴2 f 蕊一1 ) 雕蛇,萼| 理结论成立,疆 ,、 与g l 理2 2 1 裙钕,我们无法获襻e l ( 赤) 的耩确僮。西忿,引理2 2 4 给高静岛 的方麓也只是一个近似使 按下来,我们将利用弓| 理2 2 。2 的结论,报警l h 与赶协以及酝与骨2 2 ,的两个 协帮差裘达式 s | 理2 2 ,5 l 与赴惦豹弱方差表达式为; 鼢( 蛔) 一揣( 1 哨加“l 一吼扭2 | 1 6 ) 第二章舟基嵇群孛秘随魂彳乜瓣答模壁华东捧范夫掌磺士论文 1 3 证明:由( 2 2 5 ) 式,我们可以樽劐; 致一龟 南 + ( 1 一p 溉) 南 , 窘土鼗中辨p 强= o ,南 一奇2 艟# 医就,我瓣炙瓣夸( 2 2 9 ) 式孛鲍抛 = o ,裁哥以 得到耕穗的结论口 e 舛 如) = 揣( 1 一孙) ( 1 一) 。譬2 翦) 证明:漆( 2 2 4 ) 式,我# j 可以樗掰, d 抽一轨 丸 + ( 1 一期 ) , 当上戏巾舱a = o ,袅 一盘聃鲫,医此,我们只瓣令( 2 2 9 ) 式中酶p i = o ,勰可以 霉到零l 瑗懿缝沦。疆 程获得i l 建2 ,2 。l 。2 2 罨缭沦的蓦疆土,我船霄鞭褥萋l 塔下萼l 莲。 g | 骥2 2 7 ( 2 2 6 ) 式中的如的方差表达式为: v ( 靠) * n 2 v ( 丸 ) + ( 1 一) 2 v ( 膏巩) + 2 ( 1 一却;) c 。y ( 丸 ,) , ( 2 2 1 8 ) 其串, v ) 一志一坠型巡司篙型燃 + 监掣卜e t ( 去) 帆一眠 ,。 v ) 一去脾t 嘞,+ 垫堕高燃卜 燕 稚( 1 ) 十( 1 一张 ) 2 积”( i 一霄妇) ( ,一1 ) + 拦谛羚趟胁涵( 丧卜一糯 , 锥l ( 一1 )i “”“释。埘,1 、一“lf ( 去) f 2 2 。2 0 1 e 。vb ,膏磕) 盛磊再晤 魏一嚣t 矗) 囊渤瓢f 王一搬) + ( 1 咱州,一酬酬t 咱。) 扣e ,( 去) 一- ) _ ( 2 。m ) 第二掌 分簧撞榉孛辩整鬣键阕答横熬璺塞夔蔓盎堂蔓圭渣塞 i 4 证硝:通过诗葵,2 2 ,4 ;式孛静蟊憋穷麓霹驻表嚣为: v ( 训一去 v 魄 ) + 卜灿) 2 v ( 锄珂) _ 2 ( 1 m ) c 卅一嫡) - 阏瑗,我们可以将( 2 2 。5 ) 式中懿趣 螅方熬,以及膏妇与危 约携方差分剐表趱为 v ( 。蠢 v ( ) + ( 1 一m ) 2 v ( 打2 ( 1 - p 2 ) c o v ( k ,他训卜 怒:f g a v ( 破 ,如 ) 十( 1 一p t ) ( 1 一p 2 ) v ( 卉h ) 负罅l 。 一( 1 一p i ) 鼢( 文h 舞弧) 一( 1 一芦弧j e 。v ( 致,恐施) 】。 魏辩,我 莛是要臻会葶l 理2 。2 。l 一萼l 懋2 2 ,s 瓣续论舔嚣襻裂藏萼l 理绫论。舀 交予散鸯鬓子鎏,l j 戆强意实妻毂麟魏,我爨希鋈薤褥刭一个诹爱褥v ( 氟) 最小, 酥糖褒最膏。 观察( 2 2 1 8 ) 式,我靛可以将葵敬笱为如下形式: v ( 氟) = v ( 礼 ) 十v ( 乱 ) 一2 0 。v ( 九 ,血 ) fa i + 1 2 g 。v 散 ,前锯) 一2 v ( 赶 ) | + v ( 骨酏) ( 2 ,2 2 2 ) l、,j ( 2 2 2 3 ) 式是我们常见的关于的一个一凭:次方程,我们可以通过一凭= 次方褪的饿 髓得到下述缩论:当 o ( 2 。2 2 3 ) 麓,v f 彘) 这蘩象,j 、, 。f 砧:型翌! i 竺晕塑;。( 2 。麒)v ;i n 瓠) = o o _ 7 上。1 2 。2 2 4 ) v ( 乱 ) 十v ( 开执) 一2 e o v 开柚,膏聃) 综合上述弓i 理,我们胃得到下述蹙毽 定璎2 2 2 由于v ( 丹) 一v 帆乱lm 嚣w i v ( 乱) ,因此,当觎满足( 2 2 2 3 ) 式 辩,我们可以得到膏的最小方差袭达式t ! 塑! ! 垫立 ! 竺f 竺:堑2 1 v ( ) 十v ) 一2 e 船岛 ,瓠1 ( 2 2 2 5 ) 斋躺 v 面 嘴 。脯 = 耳 嫠m v 第二章分屡糖榉孛的随规辱匕潮答模型华东颊范大学硬士论文 1 5 第兰节分层抽样下的单样本模型 2 3 1 模型说明 假设总体包含n 个单元,且该总体被分成l 个子总体,即总体包含l 层,每个子 总体孛有眠个单元。首先,我目j 分别从l 层子总体中抽取不放回皱薅攀睫枫样本,第 h 层的样本量为n ,危= l ,l ,此处称这” 个单元组成的样本为第h 层的母样我 们遴过简单随机抽榉,将这 个单元随机分戒两组,两缎子样的样本筮分别是“l 和 他 ,即从“ 个单元中通过简单随机抽样抽取n 1 个单元作为第一组予样,剩下的佗2 个单元作为第= 组子样 然后,我镌在每一层鳃第一缀榉搴率实施箍# 池瓣答模型,( 记为r 磁,矗= l ,) 每个艘 , 一1 ,上中均包含两个问题t ( 1 ) 你是否具有敏感性特征a 。 ( 2 ) 你是否具有 # 敏感性特征y ( y 与a 不耩关) 第h 层中的”拙个被调查者利用摸球装置来决定回答哪个问题装置中有黑白两色球。 每个被调查者摸刭黑球约概率为p ,摸到自球的概率为l 一舰。摸到黑球老露餮问题 ( 1 ) ,摸到自球者回答闻题( 2 ) 最后,在第h 层的第二组子榉中实施巍接问答,即这n 驰个被调查毒只要回答同题 ( 2 ) 采用单样本模型,我们既达到了保护被调查者隐私的目的,又避免了两样本模型中 两缌样本可能出现重合的复杂情况它减少了调查者的工作量以及分折时的计算量,弼对 减少了调查成本但是,单样本攘型将一缎母样随杌分成两组予样的做法帮改变了m o o r s 模烈的本质 2 3 2 符号 为了便予研究的展开,在这一小节我们首先给出一些符号的定义记 墨;、程磊。翦定义与2 2 2 给盘的定义穗弼 8 :第h 层母样, = l ,l s 让:第h 层第i 组子榉,i l ,2 , = l ,二 啦 ;第h 层第i 缀子样的单元个数, = l ,2 ,丸= l ,工 m l :第h 层的第一组样本中回答4 是”的单元个数 觋 ;第h 层静第五缀撵本中霉答4 是。薛单元个数 丌总体中具有特征a 的比例,亓表示相应的估计 ;总体中具有特征y 约毙钒袭示相应的估计 n :第h 器子总体中吴有特征a 辩眈饲,靠表示耜应的信计。 第二童分屡抽样中的睫棍亿翊答模型华东瘴范大学硬士论文 1 6 ”t 第h 层子总体中具有特征y 的比例,亓撕表示基于第h 屡第二组予榉得到 的霄妇的估计。 口1 :当摸到黑球的概率为p 时,第h 层第一组子样中每个单元回答。是“的概率, 。 表示相应的话计。 2 3 3 参数的估计殛方差 与2 2 3 相似,在这一节申,我们霹榉借鉴比铡接计的思糠,构造镶计自l 矗秘鹄蛔: 反。:坠:土孙, 8 l 祀1 苎彳 ,= 詈一去霎 根据全概率公式,我们易得, f 2 3 。1 ) ( 2 3 2 ) 丌 p h + ( 1 一妒h ) 7 7 蛔= 巩 将和开咖分别代替口1 和“,我们可以通过上述等式获樽乱的倍计,郎: 氟:! ! i 二l ! 二墅2 塾。f 2 3 3 1f 2 ,_ 。【z j 3 j 脚 总体中具有敏感性特征a 的比例楼计形式为; 二 膏= y 帆h ,( 2 3 4 ) 赫1 其中愀为第h 层的层权,一务 我们已经给出单样本模型下7 r 的估计,下面我们将继续研究此估计的一些陇质。 定瑗2 3 1 ( 2 3 4 ) 式中的开是7 r 的无偏估计 证明t 根据简单随机抽样的性质,我们易得: 阶,= 喜e ( 生警趣) = 妻华 所以,亓是丌的无偏估计口 第二掌分嫠搪棒中翦随撬霞翅答横羹警寒捧莲走学颐士论文1 7 为了获褥绩诗量骨缒方差,我髓将遘过n 个弓l 理来分步诗簿嫠诗薰 融毒酝秘方 菠,驻及这簿个售诗萤之阁懿协方藏嚣强

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论