《抽样技术》习题答案_第1页
《抽样技术》习题答案_第2页
《抽样技术》习题答案_第3页
《抽样技术》习题答案_第4页
《抽样技术》习题答案_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1都是根据从一个总体后定义样本均值为_ny=ny_n抽样理论中样本是从有限总体中按放回的抽样方法得(1)样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均(2)不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从(2)抽样理论中的样本均值的方差为V(y)=S2,其中S2=Σ2 y-Y V(y)y-E(y) V(y)近似服从标准正态分布,的1-a=95%的置信区间为y-za2V(y),y+za2V(y)=y-1.96V(y),y+1.96V(y)。2为|y-1.96s,y+1.96s|。「1-f1-f]为|y-1.96s,y+1.96s|。「1-f1-f]_1-f2_1-f22下一步计算样本量。绝对误差限d和相对误差限r的关系为d=r。lJV(y)V(y)lJV(y)V(y)2。V(y)22)|/。22.4解:总体中参加培训班的比例为P,那么这次简单随机抽样得到的P的估计值p的方差V(p)=P(1-P),利用中心极限定理可得在p-z2,p+z2。3信区间为0.2844,0.4156。y-z2V(y),y+z2V(y),用v(y)=s2来估计样本均值的方差V(y)。22.6解:根据样本信息估计可得每个乡的平均产量为1120吨,该地区今年的粮食总^_525,S2 NN377629,406371。2(1d2)如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为070%2.8解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关4 ^^x利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为X。文化_^xV(yR)~MSE(yR)~S2-2RPS.Sx+R2S),通过计算可以得到两个变量的样^本方差为s2=826,s=9.958x104,Y和X之间的相关系数的估计值为P=0.974,比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的1-=95%的置信区间为yR-z2v(yR),yR+z2v(yR把具体的数值代入可得置信区间为[143.57,149.03]。(_)V(_)(_) (_) s2^5现在可以得到肉牛现重量的回归估计量为lr=y+(|(-,代入数值可以得到lrlrlr~S2(1-p2),方差的估计值为lr2lr2lr3.1解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中(1)选择性别作为分层变量,是不合适的。首先,性别这个变量与研究最关心的变量(不同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量(2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查(4)按照部门进行分层,是合理的。因为学校有很多院、系或者所,直接进行简单随机6第二种方案:也可以按照性别进行分类,对他们进行编号,为1~800,使得男生的编完成后,每个组的新生进行编号为1~100,然后随机抽取出一个号码,再从所有的小组中st(_)(_) (_)(_)(_)(_)(__)1yst-r1(__)1yst-r172。样本均值的方差为V(yst)=Wh21-fhS=1ΣWh2S-1ΣWhS,ΣWh2ShΣWh2Shn==。a22+ΣWhSΣWS2ΣWS2a2-n2②按照内曼分配时,样本量在各层的分配满足h=WhShΣWhSh,这时样本量的计算公式变为(ΣWa22+ΣWhS2-n2p13层的层权,计算得到该市居民在家吃年夜饭的样本Phnh-fh),而其中每层的吃年夜饭的样本比例的方差的估计8值为v(ph)=ph(1-ph)=,则样本比例的方差的估计值-fh),把相应的数值代入计算可得方差的 V(pst)+ΣWhS aNrPZ22ΣWhSaNΣWS2rPza22+ΣWhΣWS2rPza22+ΣWhS23462463.5解:总体总共分为10个层,每个层中的样本均值已经知道,层权也得到,从而可tts,每个层的样本标准差已知,题目中已经注明各层的抽9stt3.6解:首先计算简单随机抽样的方差,根据各层的层权和各层的总体比例可以得到在N-1~N的条件下,通过简单随机抽样得到的样本比例的方差为-3通过分层抽样得到的样本比例的方差为V(pst)=ΣWh2S,但是因为不考虑有stE~1-Wh)s。3.8解1)根据简单随机抽样的公式,登记原始凭证的差错率的估计值为V(p)=S2=P(1-P)~P(1-P)1-fn2-2。______^^R12ΛΛ__ΛRS1=6.342,RC1=6.387,RS2=6.216,RC2=6.439,RS3=5.925,RC3=6.188,______yRS4=6.602,yRC4=6.243,yRS5=6.476yRC5=6.457,yRS6=6.185,yRC6=6.227,______yRS7=7.017,yRC7=6.947,yRS8=6.6,yRC8=6.6,yRS9=6.891,yRC9=6.875RSRS2s=bRC-2s=bRSRS(_)(_)((_)_)2RS(3)从分别比估计和联合比估计的偏差和均方误差可总的订报份数为:Mn-1(yi-y)2=0.358333所以估计方差为:1-0.01v()=N2M2v(y)=N2M2s=141900赞成比例yi123456789iMi所以该系统同意这一改革人数的比例为:- ym其估计的方差为:v(y)=N2(i-1y)2=N2n)2(i-1y)2=(i-1y)2所以其估计的标准误为:s(y)==3.7%(2)s(y)=v(y)=8%v(y)=N2(i-1y)2=N2n)2(i-1y)21f(yiy1f(yiy)2nm2n14.3解:该集团办公费用总支出额为:yi=48/10×(83+62+…+67+80)=3532.8(百元)v()=N2(i1y)2=72765.44所以其置信度为95%的置信区间为:[30niΣMin所以整个林区树的平均高度为:-m其估计的方差为: 21f(yiy)221f(yiy)2v(y)=NnM=Nn(mN)2nm2n1所以其估计的标准误为:s(y)=v(y)=0.246(米)4.5解:拍摄过艺术照的女生比例为:y=yij=9/30=30%其估计的方差为:1212其估计的标准差为:s(y)=v(y)=7.68% 21=optsuc2316222s=22s=ssuu126c=noptc+cn+居民总的锻炼时间为:yij=1650居民平均每天用于锻炼的时间为:其估计的标准差为:s(y)==0.404254居民总的锻炼时间为:R=M0yijjyijj=1iMi居民平均每天用于锻炼的时间为:其估计的标准差为:s(y)==0.267411Zi123456789Z10iZ10MiZiyijti1524384553 4ZiZj(1-Zi-Zj)(1-2Zi)(1-2Zj)(1+)πYˆY)2霍维茨-汤普森估计量的方差为V()=πiππij)2iZi123456789HH)2320212022902=((0.138-2217.0062)+(0.062-2217.0062)+(0.121-2320212022902MiM0MiM0。iMiZiπiπ122933425166π设yi分别为7,20,12,4,6,22,当入样单元为单元1和单元2时,由式(5.5)可有MSE(R)有MSE(R)。由式(5.6)可得。若直接进行计算,有由式(5.6)可得。若直接进行计算,有2πij)522222]E(22]522]X(3)pps抽样(3)pps抽样Zi=ΣXi。YiXiZi795532142E(HH)=5.142857x0.388889+6.48x0.277778+6x0.166667+7.2x0.055556通过以上计算可以看出,PPS抽样汉森-赫维茨估计量的均方误差最小;其次是简单估计量的均方误差;两种比估计的均方误差相差不大,但都要大于汉森-赫维茨和简单由于y1MiM00MiM0。MiZiyi yi1528354456697583973495299.4士1.96=495299.4士19122.05=[476177.4,514421.4]。1-n___1-f2N1简单随机抽样:V(ysrs)=nS=nN-1NP(1-P)=0.0034___1k21k2系统抽样:V(ysy)=kr1(yr-Y)=kr1(pr-P)=0.00141则V(ysy)<V(ysrs)。“系统样本”“系统样本”“系统样本”中汉族住户总数ar族住户比例pr1略(样本量723456978 系统抽样:V(ysy)=kr1(-)=k1N-1NP(1-P)=0.0204(pr-P)2=0.0256 则V(ysy)>V(ysrs)。“系统样本”“系统样本”的单元组成“系统样本”中男性总数ar“系统样本”中男性比例pr1525324557 系统抽样:V(ysy)=kr1(-)=kr1(pr-P)=0.0576 则V(ysy)>V(ysrs)。 1-f21-1简单随机抽样:V(ysrs)=nS=nN-1 系统抽样:V(ysy)=kr1(yr-Y)=kr1(pr-P)=0.0016则V(ysy)<V(ysrs)。 系统抽样:V(ysy)=kr1(yr-)=2“系统样本”“系统样本”“系统样本”样本均值yr162738495v1=1f..(y2i-y2i-1)2=0.1315561-f1n-12v2=n.2(n-1)i1(yi+1-yi)=0.167356m(m1)=1(yY)m(m1)=1(yY)7.1解:根据表中数据,可计算各层的权重:w=0.17,w=0.25,w=0.28,w=0.22,w=0全县棉花的种植面积为:ystD=wyh=(wyhj)=0.17×90/17+0.25×1806/25根据式(7.4),ystD的抽样方差为: 22v(ystD)=(nhn'h)w'hsh+(n'N 22h11(ynhy)+()w'h(yhstD)2=411w'(ynhy)+(1'Nh=1所以全县棉花种植面积的抽样标准误的估计为:s()=Nv(ystD)=2000x=12604.752hS12(1Pf1D=S1c22(S2WhS2h)f2D=S2S22=N21f1D=S1c22(S2WhS2h)f2D=S2S2cc21(S2WhS2h)f1D+n'W2f2D=1277x0.5x0.21x2~268nh=1nfhD1'S2nh=1nfhD1f2120.251f2120.25srsnn300 yRDx=NyRD=1238x1.000587x602~745713(头)根据式(7.15),yRD的方差估计为:2s2syx) xx2+ xx2+x所以该地区年末牛的总头数估计的标准差为:7.4解1)根据公式(7.10有x0.01xff0.131D1[620(0.7863120.214922)]ff0.131D1[620(0.7863120.214922)]x0.01x30.40.23x2D130.40.23x2D*T2hWhfhDf1D=620x0.786x0.13~63f2D=620x0.214x0.23~31V(ysrs)由于V(ysrs)=1fS2~S2 f30.42.28题2D1[620(0.7863120.214922)]题 f30.42.28题2D1[620(0.7863120.214922)]题 a a a题1Df题1D一题+题一题+题题aa*'T'Tn==2hWhfhDa+1.53f1D+n'W2f2D2n'S2n'S1S21f1D+n'W2f2D<12L22L2~2其抽样的标准误为:22(m7.6解:(1)由题意知:n1=7,n2=12,m=4,~(n12其抽样的标准误为: 2(m(n122(m~2其抽样的标准误为:22(m①总体是封闭的——两次抽样间没有渔民进入或离开该地区,即对每次抽样而言,N是相~人时是独立进行的,病人出现在NCRSR中的概率与出现在BDMP中的概率无关,那么作第一,满足总体是封闭的假设,NCRSR和BDMP登记系统都是针对全国人口进行登~(2)由公式(7.21)得每年的N如下表:NCRSR(n1)~N2306236191728392241400420300330031001(3)累计所有年份的数据,得到n10=263,n20=93,m0=19,由公式(7.21)得先天性风疹综合征的总病例数为:008.13解1)原假设:患有妇科疾病与是否遭受配偶性虐待相互独立。在原假设成立E(n12)所格2P(2如果显著性水平a=0.05,拒绝原假设,即认为妇科疾病与是否遭受配偶性虐待不独(3)应用传统的卡方检验方法的前提是样本中各观 [(xixu)(yiyu)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论