(概率论与数理统计专业论文)复杂样本方差的计算机模拟.pdf_第1页
(概率论与数理统计专业论文)复杂样本方差的计算机模拟.pdf_第2页
(概率论与数理统计专业论文)复杂样本方差的计算机模拟.pdf_第3页
(概率论与数理统计专业论文)复杂样本方差的计算机模拟.pdf_第4页
(概率论与数理统计专业论文)复杂样本方差的计算机模拟.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 抽样调查工作者的任务是构造台适的统计量对总体指标进行估计,二是对 对每个估计量的精度进行度嫩。对精度的度詹经常采用的是调查估计量的方差。 一般来说,方差是未知的,只能从调查数据本身来估计。实际调查情况下所面 峪的闯题要复杂的多,首先是一次调查不可能是单一的方法运用,而是多种方法 豹综合运用。其次,在具体调查中所使用的方法可能会豳实际憾况耐与最初所 设计熬方法有繇是入。在理论上,可刊用再撼撵豹慝想进行均方误差豹魉计。 健在实际韵播样过程中,由于资金、辩秘、入员等瓣透,反复撼样不大浮能。 抽样误差的计算就会十分的豳难 计算丰晁模叛样本误麓静思想是援插敬熬样本看成“缀想总体”,它款样本撂 标是可计算的。对“假德总体”甭溺祥的赫样方法插取子样本,奁新的祥本上 用同样的方法构造估计蹩,由于计算机可处理鬟复多次摘样试验,于楚就甫l 鬟 得到一系列的估计量,这一系列估计量的均值与“假想总体”对应指标的误差, 就可以估计调查误蓑。通常采用的方法是弃d - - j a c k k n i f e 方差估计法和半样本 法( 弃姜一j a c k k n i f e 方法) 。殖藩计算枞的迅速发展,馒许多复杂的人工不可能 z 实现的计算变为可能。进行复杂样本方差计算辩,可裰据有关理论稻暴律抽样 方式编制相应的计算机程序对复杂样本方茇迸彳亍计算丰凡模拟,从而达蜀较好盼调 查目的。 本文采用一个企业经济数据抽样案例,对捆样误差进行计算梳模羧。管壳 设计具体的抽样方式,抽取样本,并验证抽样方法的可行性,根据所抽取的样 本计算其抽样的均方误差。然盾利用v i s u a lb a s i c 绘制程序,从样本上进行再抽 样,采用寡d - - j a c k k n i f e 方差估计法模拟误差。从最终输出结果与已知误差进 行比较结果,骏_ | 芷了计算规模拟方法的可行性。 本文黄重实际应用,充分刹用计算机的计算功能,从个新的角度探讨了 翔掰进毒亍撼样误差豹 砉计。为复杂样本方茇绩计提供了一葶中方法。 a b s t r a c t o n eo fa s s i g n m e n t sf o rs a m p l i n gs u r r e yo p e r a t o ri s c o n s t i t u t i n gas u i t a b l e s t a f f s t i e sf o re s t i m a t i n g 襞t h eo v e r a l lq u o t a 。a n t h e r sm e a s u r i n gt ot h ep r e c i s i o n o f e v e r ye s t i m a t i o nv a l u e 。t h et o l e r a n c et ot h ep r e c i s i o ni so f t e na d o p t e db yt h e m e a ns q u a r eo fi n v e s t i g a t i n ge s t i m a t i o nv a l u e 。g e n e r a l l y s p e a k i n g 雠l em e a n s q u a r ei su n k n o w n i t i so n l ye s t i m a t e df r o mt h ed a t ei t s e l f i nf a c t ,t l es i t u a t i o n w ef a c e di sm o r ec o m p l i c a t e ,f i r s t l y , o n l yo n ei n v e s f i g a t i o nc o u t d n tb es i n g l e 。 m e t h o d a p p l i c a t i o nb u t i sa c o m p r e h e n s i v e u t i l i z a t i o no f m u l t i m e t h o d s s e c o n d l y , t h em e t h o du s e di nt h ec o n c r e t ei n v e s t i g a t i o ng oo u tt os o m ee x t e n tw i t hm e t h o d d e s i g n e d a tb e g i n n i n gb e c a u s eo f t h er e a lc i r c u m s t a n c e s i n t h e o r y , w ec a l lu s et h e t h o u g h t o f a g a i ns m - n p l i n gt oc a r r yo n 也ee s t i m a t i o no f m e a ns q u a r e 。b u td u r i n g t h er e a ls a m p l i n gp r o c e s s 。i ti si m p o s s i b l et os a m p l er e p e a t e d l yo w i n gt of u n d 。 t i m ea n d p e r s o n n e le t c 骶1 嚣t h o u g h to fc o m p u t e rs i m u l a t i o ns a m p l ee r r o ri sl o o k i n gu p o ns a m p l e d r a w n 黼i m a g i n a r yo v e r a l l ”i t ss a m p l eq u o t ei sc o u n t e d 。d r a w i n gt h ey o u n g s a m p l et o “i m a g i n a r yo v e r a l l ”w i t h t h es a m e s a m p l i n gm e t h o d a n d t h e n c o n s t r u c te s t i m a t i o nc a p a c i t yw i t hs a m em e t h o do nt h en e ws a m p l e 0 w i n gt ot h e f a c tt h a t t h ec o m p u t e rc a nd e a lw i t hm a n y s a m p l i n gt r i a lr e p e a t e d l ) ;s ow e c a n g e t as e r i e so fe s t i m a t i o n c a p a c i t y , t h e e r r o rb e t w e e na l lv a l u e so f 镪e s eas e r i e so f e s t i m a t i o nc a p a c i t ya n d ”m o r ei m a g i n a r yo v e r a i l ”c o r r e s p o n d i n gq u o t ac a l lb e e s t i m a t e dt h e i n v e s t i g a t i o n e r r o r t h em e t h o dw h i c h a d o p t e du s u a l l y i s t h r o w i n ga w a y 壤ed j a c k k n i f es i d ed i f f e r i n gf r o me s t i m a t i n gl a wa n dh a l f s a m p l el a wft h r o w i n ga w a yn 2 j a c k k n i f e 4 sm e t h o d 。a l o n gw i t ht h er a p i d d e v e l o p m e n to f c o m p u t e r , m a k em a n yc o m p l i c a t e d m a n m a d ec a l c u l a t i o n sw h i c h c o u l dn o tr e a l i z e db e f o r eb e c o m et h ep o s s i b i l i t y a sc a r r y i n go nt h ec o m p l i c a t e d s a m p l es i d ed i f f e r sf o r mw h e nc o u n t i n g ,a n dt h ec o m p u t e rp r o g r a mt h a tc a nb e c o r r e s p o n d i n ga c c o r d i n gt o 壤ec o n c e r n e dt h e o r y a st h ec o n c r e t e s a m p l i n g m e t h o de s t a b l i s h m e n tw r o n g l yt o c o m p l i c a t e ds a m p l e s i d ec a r r i e so nt h e c o m p u t e r s i m u l a t i o n t h u sa c h i e v e sm eb e t t e ri n v e s t i g a t i o np u r p o s e 7 r h e a r t i c l ea d o p t sa l le n t e r p r i s ee c o n o m ys a m p l i n gc a s e a n dc a r r i e so nt h e c o m p u t e rs i m u l a t i o nt o 氆es a m p l i n ge r r o r f i r s t l yd e s i g n st h ec o n c r e t es a m p l i n g m e t h o d a n dd r a w s 檄es a m p l e 、a n dv e r i f yt h ef e a s i b i l i t yo fs a m p l i n gm e t h o d , a n d c o u n t st h em e a ns q u a r ee r r o ro fh i ss a m p l i n g 。t h e nu s i n gv i s u a lb a s i ct o 出a w t h ep r o c e d u r e c a r r i e so nt h es a m p l i n gf r o mt h es a m p l ea g a i na n da d o p t st o t h r o w i n ga w a yt h e d ,j a c k k n i f es i d e d i f f e r i n gf r o mt oe s t i m a t e 饿a tt h e l a w i m i t a t e st h ee r r o r c o m p a r er e s u l tf r o mt h ef i n a l l ye x p o r tw i t ht h ek n o w ne r r o r , a n dv e r i f i e dt h ef e a s i b i l i t yo f c o m p u t e rs i m u l a t i o nm e t h o d 。 t h et e x ti sf o c u so nt h er e a l a p p l i c a t i o n 。i tm a k e sf u t l u s eo fc a l c u t a t i o n f u n c t i o no fc o m p u t e ra n de x p l o i t sh o wt oc a r r yo nt h ee s t i m a t i o no fs a m p l i n g e r r o rf r o man e wa n g l e ,p r o v i d i n gan e wm e t h o df o rc o m p l i c a t e ds a m p l em e a n s q u a r e e s t i m a t i o i l 复杂样本方差的计算机模拟 l 蕊言 抽样调查是一种非全面性的调查,它怒措从研究对魏的全体( 总体) 中拙取一部分单位作为样本,根撼对所抽取的样本进行调焱,获得有燕总体 弱标虽静了解。零黑懿箍榉方法京麓单疆橇糖祥、分瑟裁榉、鏊饕撼襻、系 统抽样、移阶段抽样游。这几种熊本方法下的样本方差估汁的理论及方法已 经解决。 抽样调查工作者的任务一是构造合适的统计量对总体指标进孳亍估计。二 是对每个估计量的精度进行度量。对精度的腱擞经常采用的是调查估计量的 嘉差。般寒说,方麓是寒蟊煞,只鼹簌褥套数爨奉赛来继诗。谓奎统司。量 的方差烧由统计量本身的形式和抽样方案设计的性质这两方面决定的。实际 调查情况下所面临的问题要复杂的多。首先魑次调查刁i w 能是单一的方法 运臻,蔼楚多耱方法熟练台运嗣。其次,在其箨溺套串掰佼嚣蘸方法可悲会 因实际情况而与最初所设计的方法有所出入。这样所得剥鹩样本比较篾杂, 可称之为复杂样本。泼复杂样本的方差估计就十分的困难。 陡瓣计算梳的迅速发展,健许多复杂的人工不可琵蜜溅的计算变为可髓。 进行复杂样本方差计算时,可根据有关理论和具体抽样方式编制相应的计算 霉毛蘸痒瓣复杂样本方麓避嚣计冀瓿模撂。孰髓送裂鞍努豹漏壹銎鳇。 2 抽样误差度量与估计 2 1 抽样调查概遮 从慈体抽弹豹劣法看,可分为题类抽样:类是非概率抽样;一淡是概 率捷撵。市场谣套中裔舀静斡撼襻、羚断接榉、方便藜辩:饔定额爨撵答罄藩 于非概率抽样。但撼,采用非概率抽样获得数据不能用辩毪计算抽样误麓,不 能竣概率意义上控铡谖差并以数寒像证雄鼢鹣港确牲。 概率撼祥也称随机抽样,它嶷有以下几个特点:1 案定的概率以随机 原则抽取样本。所谓随机原则就是在抽取样本时排除主观上有意识地抽敬调 查单元,使每一个单元都有一定的擞会被攒中。2 ,每个单元梭抽中的撅率是已 知的,或魑可以计算出来的。3 当粥祥本对总体目标量进行估计时,要考虑到 该样本( 溅每个样本单元) 被抽中的概率。这就是说,估计量不仅与样本单 元兹观测蕊有关,也与其入样概率有关。壤率撼样最主要静优点是,可以依 据调奁缩鬃计算抽样谈差,从丽得到对总体赫标量进行拯断的可靠程度。从 另一个方面讲,也可以按照要求的精度,计算必要的样本单元数目。所有这 些,都为对调查方寨的浮估提供了有力熬依据。 在抽样调查中基本的抽样方法有简单随机抽样,分层抽样,整群抽样, 系统抽样湘多阶段抽样。对于实际的抽样调鸯,常常是以上几种方法练合使 焉。 2 2 抽样误差的度量 抽样误差是抽取榉本的随视谶造成的样本傻与总体值之间的差异,只要 采用抽样调查,抽样误差就不可能避免。影响抽样误差的主要因素有总体标 恚谯豹交羚程疫,按撵单整数熬多少,抽样方法及捶样调蠢靛组织形式。但 与非抽样误差不同的怒抽样误差怒可以计算的,抽样误差疑个一般概念, 可以用不同的量值来袋示,即可以用各种量值来估计,而艇它可以得到控制。 控截抽撵误差豹操本方法是改变搂本量。在其稳条孛穗丽懿绪况下,撵奉量 越大,抽样误差越小。抽样误蓑与样本量的平方大致成反比关系。抽样误差 一般以方篾或标准差的形式给出。估计量的精度通常用误麓限来表示。误差 藩郅是在浆耱橇率( 鬟售度) 意义下夔最大绝对误差或稳对误差。蛰号表示 如下: y ;舆煮菜静特蠛翡总终德镳参数, y 的样本估计量 r l :样本量 跏( 朔:表示估计量的方激真值 v 呱奶:表示方差的估诗 f v a r ) :表示标准误差 谍莲限:最大允许误差锄l v 南,其中掰为显著承乎, 为g 被侧努位点。 簸大椽对镤麓:孬,;。 广i 利用抽样分布椎导出y 的曩信医删为:y v a r ( y ) 2 3 抽样误菱靛髂诗 糖样误差是在拯群溪奎孛产生旦本身凝蠢戆一挚争谈麓。拯榉驮方法上漤 包撼鼹个方裔,样本绉选秘惑傣估计。在襁率箍撵串,霁l 徉本统计爨估诗惑 体参数的方法戬及这种依计的精度都与矮体嵇祥方法肖关,样本豹手离取与对 总俸豹攘髂方式燕紧密缝台农一起戆,蘧对擒祥方差戆谯诗是对想搭进雩亍攘 断不可缺少的一步。般来说,人们更倾向予把均方谈蕴m s e 作为评价抽样 方案忧劣的准则。 均方误差:m s e ( y ) = e ( y y 严一 芦一嚣( y ) 】2 + 点( 力一y 】2 其中挞嚣方麓:v a r ( y ) = 板y 一联罗跫2 偏差:b i 删( a ;e t y y 】2 期望值:豆( ,表示所肖可能样本的平均值 对予无偏估计,胄差妇,( 为。嚣( ;一e ( ;) r 代表了;的均方误差。确r ( 易用 咀测量yf 勺估刊量;精度,评估估计量;和抽样设计。 3复杂样本方差估计的典型方法 3 1复杂样李方差铸嚣戆莫銎方法奔缝 在实际的抽样调擞中所使用的抽样方法常常是基本抽样方法的组合,再 考在实际挞样过程中继 圭与最裙设计方法有一定靛出丸。因露所得至8 豹棒本 藏穰复聚,按一般方法进行复杂撵本戆方差债诗藏十分圈漆。复杂样本方差 估计的热避方法有随机组法、平榭半样本法、刀切法和泰勒级数法。 霰定有一个复杂释率y :执,靠 ,国务。= 各( 魏,甄) 橡藏薄未知参鼗9 懿 一个估计鬣。如何对方差d p 。) ;茁( 反一再反) 。进行估计。 l ,随祝舞法将y :( 强,a ,乳) 淹梳分成女缀,出于h 未必髓梭蟊熬除,所 誊各缀蹬多穗差一个攀位,瑟班不拣设黔= 戚,鹫各鳃均为堪令单僚,聱 h ;) * ( m ,a ,y ) ,i * 1 ,人,_ j 鼹梅遥各。方法梅造套。( 磅:刍( 强,a ,辫。 , 粼域刍) = d ( b 。) 十露( 芬一吝n ) 。警估计 量的形式使得任何分组情况下,均有万= 各。时,对于估计量各。的方熬无偏估 诗量为4 另一个无偏估计量为 s 2 ( 珏志1 善喊囝固2 m 一 4 文址吉喜( 晌一色) 2 可计簿m e s ( a o , ( o 无镳嵇计鳖失: 南害拍前 由此傅出m e s ( 谚,) 的无偏估计量为 击喜( 柏一面2妻害( 瓦( f ) 以) 2 2 志喜( 柏厕2 坩一色) 2 当估诗鳖酶彩式健褥任何分鳃情况下,均育爹= 色慷成立时,套。的均方误 差m e s 文) 魏无镳锆诗量为 川孙志妻( 瓦( f ) 匆2 当万= 矾不恒成立时,必须碍求使( 日一口。) 2 最小的分组进行误差估计。通 鬻穗援下可数趸s 2 来诂诗m e s ( 袅) ,这酎鸯高 砉m e s ( 蘸懿颓超。 随机组方法的实质是按一定的抽样方案从总体中抽敬若干组样本,对每 一缨搭本都建立有关参数静估计爨。这些镰毒 4 鲎之强豹离教程瘦,酆样本方 差就可髑予计算全群零信诗量骞麓。 2 乎衡半样本法该方法也烂一种重抽样方法,它将各层中的随机组数减 乡妥两个隧蕤嘉方蓬结诗诗算翁效率,爱褥方爱瓣嫠诗蘧起茯较大。 5 3 刀切法( j a c k k n i f e ) 设0 。怒复杂样本y = ( y ,a ,n ) 构成的0 的估计量, 在r t 个观测值中去第歹个观测值,余下的伽1 ) 个观测值用构造0 。的方法构造 疗的估计爨0 8 = 。令0 “蚶= 菇一如1 ) 吾= ,_ 1 a 焉j ( o “。) 一言套参。= d 粼褥裂 疗的估计爨一。令蚶= 靠争- 如1 ) 疗一,= 1 ,a ,绣。) 一三芝:学。= 粼褥裂 m e s ( 0 。) 豹两个馈列。鳖: i ,) 5 志- - j t ( 礼棚2 s 2 ( 盛) * 丢窆j = l ( 一反) 2 将乃讶法擦广,酃簿次去掉的不是个僵丽怒缍僮。基体骰法热下:不妨 设”= m k ,将, v t 个样本点随机分成组,去掉第j 组后用剩余样本点构造0 的 话嚣量为或,歹= 1 , a 安) ,于是有: 0 一,= k o 一一( 七一0 0 jj = i , a ,k ,= ,( 子”) = 素砉每“, m e s ( 0 。) 两个估计餐为: 。2 ) 。磊圭酉砉函副一固2 s 2 函加吉套沁b 4 、泰勒缴数法随机组估计法、平衡半样本法和刀切法都采用样本复制的原 遴黯菱杂样本避行方菱髂诗。泰勒躁数法是一释滚注张方法,主要是翻璃泰赣矮 6 ,歼的方法用绒程估计去谶近菲线性储计,因此给磁非线性估计量方差的一个近似 估计。泰勒级数法主要是针对非线性估计量的方静估计,而且它本身不能独立用 予方差估计,在提供了 # 线性估计爨的线性近似之螽,还需要结合其他方法去估 计这个线往近似的方差。 对复杂样本的方差估计方法进行选择是一个复杂的问题,_ 带 要综合考虑精度、 费用鞫时阕、可操作瞧等各耱因素,在它翻之润投褥e 3 2 基本方法比较 1 精度扶精度上考虑,匿种方法在大样本静情况下效聚差不多。对于中小 样已有蒙特卡罗研究的结果显示,若以偏倚和均方误差作为标准,则泰勒级数法 较好。扶嚣糖区澜豹覆熬强率豹角发餐,平,餐撵本方法最好。 2 费用和时间从费用和时间上考虑,随机组法和平衡样本法已有现成的软 件,处理数搬教为省时袋力。 3 操作的简便性一般来说,随机组方法是锻灵活的方麓估计方法之一,使 用于几乎任何估计量;阍时,它也是用途最广的方法,适用于任何抽样设计。 总之,以上典型方法可用于复杂样本的估计,这些方法貉本都是利用蒋抽样 的思想进行方差估计。可是,在实际操作中,我们的调查方法不可能严格按照书 本豹方法执褥。甚至分鼷、分类、分玲段罄不十分翡臻。有的撼搀壶予费蠲帮时 问的限制,不可能进行熬复抽样。礤估计调查误差,是否可以用已有的祥本根据 再抽样的思想进行计算机模拟。 4 复杂样本方差的计算机模拟 4 。l 复杂样本方差的诗算规模拟继诗理论基餮l l 现有一个复杂样本y = ( m ay 。) ,由瓦= 谷( y 。,a ,儿) 构成对未知参数0 的一个估 诗量。热舞驮已有熬耧本我基垮方误差数信诗。 7 m e s ( 龟) = 静( 成) + ( 露葭一固2 = d ( 参。) + b 2 当偏蓑b 一 岔戌一0 b o 时,酃孝。疑疗的无偏估计时,m e s ( 或) = d ( 或) 。 为了估计均方谈蔗袋方差,设想将样本y 蕾终一个“缀惩总体”,对它进行 产生样本y 一样的抽样方法搠取新的子样本y ( ) = ( y ”a 。) ,再在样本容量为 搬的释零致;,基麟上,臻嗣器麓造受= 毋( 罗,蠡,黑一样熬方蘧构造髂计量 舀。( f ) = 毋( m ,a ,儿) ,扣1 ,a ,j ,s 悬所有可能选出的样本y ( d 的总个数。六( ) 与瓦 具有穗矧的性质积结构,它们郝悬乎的估计爨,它们鲍茧要区别有鼹点: 1 。西。( f ) 与晷。掰对应的桴本磐爨不同,个是m ,一个愚n ,m 熄小于n 的。 2 。擒逡色i ) 豁样本是穆造反襻本魏子弹。 对予孚。( f ) 与或,商阻下结论 1 e o 。= e 0 。( f ) 2 ,记e :龟固一嚣( 免势) ,互舞嚣爨裔襻本y 取期望。巍i 哥魏 e 晓= 磊,龟= 毛免一置岛免( i ) 知 e ,瓦( f ) 一e ( 氏( f ) 钞) 一或 3 。记d 。免 参数估计以资产参数估计为例:将母样本按淤产排序,以抽选资 产予稃瓣确定静努屡标准,菠褥曝样本中擎位帮萝j 天耦& 戆层。邂藏餐朦肇 位数发生变化,分别计算事后分腰的层样本均值。层样本均值乘以层总体单 位数,就得到暴瓷产总计豹估计德。番层资产枯诗擅之帮鄹为撼样调瞧总体 瓣资产憨诗售诗蓬。掖样谲蠢慧蟀酶资产总计铸诗僮魏上全数诱奎擎德斡资 产总值就为调查总体资产总计的储计值。计辣资产总体估计值和真实僦之间 弱胡对谖蒺。著误蓑程5 之两,认势该方寨爵毒亍。其撼三凄指拣参数估计 霜上。 计算公式 全数调查部分指标总计:墨* e y ,( i = i ,2 aj ,全数润凌的单位数) a 一一 第h 鼷的指标总计估计值:y h = n 。匕( n 层总体单位数,瓦层样本均值) 抽样调查指标总体估计值:y t = h ( 矗= l ,2 a 胃,赫祥调查的屡数) 谲套慧髂鲍指标总毒卡估计菹:y = 夏+ y , 估计值与真值的相对误差:s :1 一力y ( r 表示真值) 表5 6器指檬点估计鳇相辩谟差( 镛移程度)革住:万,t 收入利税戳产负愤 抽榉调整部分总擅憾计鼓 7 2 7 7 l l 。2 21 8 4 7 l ;9 2 5 8 2 0 9 4 。3 3 4 8 6 3 5 8 1 抽群调查部真实总馥z 7 2 5 3 0 90 3 2 0 8 1 0 6 0 6 0 4 7 3 8 4 04 6 7 8 8 9 1 0 全面调查单位的真实总值k 1 7 6 5 5 4 0 2 2 1 2 8 20 82 3 9 6 2 49 81 6 5 4 7 45 3 对总体的总值估计y 黧e4 - k 9 0 4 2 6 5 2 4 3 9 7 5 4 ,0 08 2 】7 1 93 16 5 l8 3 2 。6 4 总体的真实毽y9 0 1 8 6 3 0 54 0 0 9 2 6 8 8 4 4 3 6 3 3 s 6 3 3 3 6 36 3 a 点估计的千f ;l 对误差s = 1 一列y ( ) 00 0* o0 12 6 82 9 0 从样本的相对误羧可以看出,国此秘方法设计的接取样本的效果藏好。 总体中要播取一个群本,该样本骚黼时满足多个指标糖度,本案铆矫采愆的 方法可推广使用。 在我黧装狳段,缀济缝筏秘经济缝绥处予交凌辩赣,交予众韭壹接受羽市场黪 响和政策体制影响,加上中小性企业自身的特点,企业变更、破产、重组情况的经 常发生,所以抽样框稳定性差。本文所设计的抽榉方法是针对税务机构对企业进行 有基静静稔查,势且对整体企韭经济狡猿鸯搿了辩。适合予对企业下一令弼或下一 个季度的税收估计和总体经济状况估计。对于跨年度的估计,隳根据企业攀节变动、 工商年梭等辅助信息,适当调动样本。使样本保持对总体的代淡性。 3 。方案设诗麓将点 搂耘, ( 1 ) 幽子样本合并母样本该方法在抽样时同时考虑了心个 克服了仪根据一个指标抽取的样本不能同时对四个指标具有代表性的缺 滏。在辆墩子襻薅,又黠每个撂拣遴嚣分瑟为强器鏖震事恁分瑟夔谣了蚕瑟 分界点的辅助资料。 ( 2 ) 剥瑗变异系数分臻分层不是仪羧据元素龅取毽魏大小,蓑各 层占总体院铡酶大,l 、为准则寒裰略遮确定其上下赛,两秘篇变异系数严格控 制层内变舜程度,以保证层内的同质性。这饿误差得到很好的控制,也为各 绥弱等颧撼樽压臻榉本攀擅提供y 霹戆,弱辩为结诗总体采蕊事嚣努瑟技术 提供了有秘条件。因为事后分层对备层交暴系数影响不大。 ( 3 ) 事后分屡 事后分层在可获得窍利辅助信息的条 牛下,能对黏 诗藿俸畜秘瓣谣整。潦爱劳屡瓣磷掌握了蚤鼷静单霞数眠穗各层兹总俸皖铡 氓的资料,才能有效地控制估计误差。 以上稀种情况帮表疆该方案设诗靛合理性及可行憷,为进彳亍方差的 计算机模拟提供可靠的抽样方式和方法。 5 。4 样本箍襻谟蓑盼诗箕 企业的抽样应用了分层抽样的方式,根据层的各项数据,可得到样本对 蕊薄懿憩爨髂诗懿均方误差。 符号说明: 下标舞表示层母( 舞= l ,2 ,矗,五) 攀元慈羧;觋 样率鼙元数: 屡校:职= 鲁 擒榉毖:五= 争 v 女 总体艟踞志鼢一动 歹的均方误差:拶羔= 善l 孵 岛 总体估计量p 的均方误差:盯虬2 = n 2 盯毛 企业擞产的分层数擀 啄盟霹醭n h榷 h纸 i层号 12 5 2 6 0 3 5 13 8970 。7 7 7 80 0 1 4l5 71 7 6 125 9 3 8 8 5 0 。0 5| 67o4 3 7 50 ,0 2 52 9 8 2 6 8 34 7 , :1 8 5 7 ,7 l2 6了0 2 6 譬20 、0 4 i8 3 3 3 2 4 1 3 9 3 7 2 9 0 5 l6o ,1 1 7 60 0 8 01 3 l ,1 7 4 53 2 8 2 0 2 37 51 20 1 6 0 00 1 173 1 4 4 9 67 3 6 0 3 58 590 1 0 5 90 1 3 31 2 、9 3 5 7 2 0 8 48 47 9 甚o 1 珏j 30 。1 2 33 。5 4 3 s4 2 2 7 11 8l o0 ,0 9 0 90 1 7 2 1 3 7 91 0 2 4 l8 71 20 13 7 9n + l3 6o 13 6 103 15 84 770 1 4 8 90 0 7 30 0 2 0 l ii 9 4 55 680 1 4 2 90 0 8 700 i 6 资产均值的均方误差 嗉= 萎孵警霹硼朔9 瓷产总塞酶均方浚差 盯尧= 2 秽毳= 6 4 1 2 7 1 9 1 9 = 2 9 5 5 0 1 5 0 6 4 表5 8 垒她载入豹势层数摆 h 群 n h呒w :盟s i h j 15 9 3 5 9 8 1 0 91 37 0 5 3 8o 0 2 01 6 09 8 i 21 7 0 i 5 2 5 。0 l2 2 602 7 300 3 42 4 2 。9 5 32 3 5 5 6 2 o o5 5l l 0 2 00 8 6 2 6 1 3 410 4 2 4 8 6 26 79 0 i3 4o1 0 5f 0 9 5 5 51 3 4 1 1 4 96 91 1015 9 0 1 0 8 1 1 8 8 65 6 3 7 9 09 1700 7 70 12 01 49 8 7| q 1 4 。8 4 0 31 4 0 。1 3 60 1 6 ll 。6 2 l 83 6 0 6 55 7400 70 ,0 8 90 6 6 91 2 2 2 34 87 0 ,1 4 600 7 50 0 8 1 01 6 5 23 7 5013 50 0 5 80 0 1 l l7 8 93 44 o 1 1 80 。0 5 30 。0 0 2l ,9 s4 5 80 、 7 80 ;0 7 00 0 0 _ l = 1 以上数据可得收入均值的均方误差 收入总爨的均方误差 譬2 善孵半霹一s s 拶尧= n 2 玎尧一6 4 1 “6 6 8 。8 5 = 2 7 4 8 1 7 7 5 6 9 表5 9垒鼗盎接静分屡数掇 层号 s : 6 “ 孵1 - f hs ; l 16 8 3 2 4 4 8 3 91 0808 0 00 + 0 1 64 15 7 22 3 6 0 1 7 8 。2 5i 340 3 0 80 0 2 01 6 8 ;0 2 34 8 8 8 0 8 0 72 67o 2 6 900 4 l8 39 6 41 0 4 6 3 73 63 76o1 6 200 5 84 86 8 52 6 0 5 44 55 990 15 30 0 9 22 07 8 66 6 5 8 0 57 21 2o1 6 7o 1 j 258 3 7l 毒1 73 86 330 ,0 4 80 + 0 9 83 5 9 7 9 6 3 5 58 0 1 4 5 0 0 8 6o ,0 0 1 04 96 38 28 00 9 80 12 80 ,0 9 t 12 ,3 72 38 0 + 3 4 8 00 3 6 0 ,0 0 t 2 2 。2 23 630 0 8 30 ,0 5 60 。0 0 1 320 l7 71 0o 1 3 00 1 2 000 0 峦以t 数据霹褥受馈均蘧豹垮方误差; 嗉= 善簖半酹铆4 t 嗉2 荟簖等酹3 7 4 负馈总量豹均方谖差: 玎轰= 2 d 毛一6 4 1 28 3 7 4 1 7 = t 5 3 7 3 9 3 4 3 8 表5 一l o 企业利税的分层数据 s ; n ;壤鼻 缀影生立受 甚譬 抑。 16 7 7 i 4 684 05 0 000 1 4 0 1 7 7 2 3 2 7 4 3 l2 27 0 3 1 80 0 4 00 ,5 0 5 36 8 6 。3 3 2 94 0 + 1 3 80 0 5 20 ,4 0 7 4 9 4 。0 3 5 5s 0 ,1 4 50 ,0 9 90 、2 0 5 5 4 8 2 64 4 50 1 1 4 0 ,0 8 00 0 5 4 61 42 3 6 97 0 1 0 10 。1 2 50 0 2 8 72 8 9 7 67 0 ,0 9 20 13 7 0 ,0 0 7 l g 0 6 56 5 警 0 。1 3 s0l i 30 0 0 1 90 9 6 s 4 2 601 4 l 0 + 3 3 30 0 0 3 1 05 6 5 4 57 0 15 6 0 5 2 30 1 8 6 1 i 3 9 1 22 2 2 0 0 9 10 ,2 5 6 i 1 6 4 1 23 0 9 8 3 1 1 3o2 7 3 0 。 2 s 2 2 9 i 36 3 0 3 。1 7 94 o ,0 2 2 垂。1 0 52 6 ,8 4 6 由以上数据可得税收均值的均方误差: 酉。荟孵詈霹= 3 0 爱 ,- “毽 8 税收总量的均方误差: 畦= 2 哇一6 4 i “3 0 8 1 = 1 2 6 5 9 2 4 3 。6 t 5 s 样本方差的计算机模拟骏证 魂潋5 , 3 节嚣得到蘸释奉 誊为8 馥想憨搭”,按照5 3 节挺敬襻本魏方法, 编制计算帆程序,对样本的误差i l l 行模拟。 本论文计算机程序模拟部分用v i s v a lb a s i c6 0 实现,v b 具有简单、易 学、荽予调试的特点,但运霉亍效率较低;蟊莱程序要求弼鬟运行速度,用c 语言实现魁较好的选择。本论文的计算机模拟部分,计算嫩彳i 大,所以莱样 v b 实现代码,而且现代计算机硬件的运行速度足以弥补v b 程序的效率不足。 下藤对程序的主体内容,和铰为重要酶函数,镦简要说明。 函数s e l e c ts a m p l e 0 完成一次对四个指标的9 8 个数据抽样、分层、合并、 狰算分蚕麓投缘篷、汇慧努屡燕投游蓬,共乇令步骠: 第一步: 针对收入s r 、资产z c 、负责f z 、利税i s 四个指标,利用v b 的随机函数 r n d 0 簇环产生j 一9 8 之阉戆隧掇数,俘为采样企盟瓣瓣痔号,穗j | :痔号对 应的数据存放到数组s r 7 8 ( ) ,z c 一7 8 ( ) ,f z 一7 8 ( ) ,l s _ 7 8 ( ) 中;为避免同一企业 的重复抽样,设置采样标志数组f l a g ( ) 。 第二步: 对四个抽样数组分别调用函数进行降序排列: h i t o l o w s o r t ( s r 一7 8 ) :h i t o l o w s o r t ( z c 一7 8 ) ;h

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论