抽样技术题目_第1页
抽样技术题目_第2页
抽样技术题目_第3页
抽样技术题目_第4页
抽样技术题目_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、、简单随机抽样1、在简单随机抽样中,试证明比估计yR是总体均值Y的渐近无偏估计,并求其方差。证明:RXVwYRXXxEYrXEXXE所以EyRXEY得证。由于x所以VaryR2yRxEyRxVaryRx-sZn其中:ZYRX故VaryRYRXRX2RSxyr2sX2、对于简单随机抽样,总体均值Y的回归估计量定义为:yir(X为常数(记证明:3、在简单随机抽样中,已知变量总体均值Y的回归估计量定义为VlrV(X常数(记为),且有E(Vir)Y,求证:(1)1f22c2V(Vir)(Sy0Sxn20sxy)(2)使V(Vlr)最小的0为0SXysSx;其中Sxyssv证明:(1)1f1NWiJ0(

2、XXi)(2)求V(%)对0的偏导数:将0的值代入V(Vir),验证其最小值存在,此时N=200,现抽取一4、研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,个容量为20的样本,调查结果列于下表:编号文化支出编号文化支出1200111502150121603170131804150141305160151006130161807140171008100181809110191701024020120估计该小区平均的文化支出Y,并给出置信水平95%勺置信区间。解析:由已知得:N200n20根据表中数据计算得:yyi144.520ii因此该小区平均文化支出y的95函信区间为:wz_T

3、VL即是:,故估计该小区平2.均的文化支出Y=,置信水平95%勺置信区间为,。5、某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到y25,这些企业去年的平均产量为x22。试估计今年该地区化肥总产量。2135解析:由题可知x22,则,该地区化肥产量均值该地区化肥产量总值10021.35,YY的比率估计量为Y的比率估计量为y2521.35名24.2624YnYR100*24.262426所以,今年该地区化肥总产量的估计值为2426吨。二、分层随机抽样6、在分层随机抽样的分别比估计中:(1)试证明E(yRS)Y;(2)求出其方差。L

4、-_L_L_(1)证明:根据题意:E(Yrs)E(WhUXh)E(WhRhXh)WhXhE(Rh)h1xhh1h1又E(Rh)Xh上式-YhWhXhE(*)XhLWhYhY综上可得:h1E(yRs)Y(2)解:由第一问可知V(yRs)LV(WhRhXh)h1LWh2V(RhXh)h1而V(RX)V(y)-(Sy2RSyxR2S2)V(yRs)nLWh2h122、2RhSyxhRhSxh)根据经济及收入水平将居民8、调查某地区居民的奶制品年消费支出,以居民户为抽样单元,户划分为4层,每层按简单随机抽样抽取10户,调查后各层样本户的奶制品年消费支出的中间结果如下表所示:层号(h)层权(样本量样本平

5、均值(兀)第h层样本方差110210310410请估计该地区居民奶制品的年消费总支出及其95%勺置信区问A4解析:根据表中的数据可得YstNhyh209650(元);h1AAL估计量方差V(Kt)的无偏估计为v(Kt)Nh(Nhnh)Sh2/nh5.386108,h1进而有Jv(K)J5.38610823207.6(元)。AAAYst的95%勺置信区间为YstZ0.025g/v(Yst),其中z0.025=,经计算可得因此,可以有95%勺把握认为该地区居民奶制品的年消费总支出在164163255137元之间。7、试述分别比估计和联合比估计的比较。答:如果每一层都满足比率估计量有效的条件,则除非

6、hRR都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。实际使用时,如果各层的样本量都较大,且有理由认为各层的比率hR差异较大,则分别比率佑计优于联合比率估计。当各层的样本量不大,或各层比率hR差异很小,则联合比率估计更好些。三、等概率整群抽样和多阶段抽样9、邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,现随机抽取4个群,取得资料如下表所示:19201620yiMni11041.875(份)群各户订报数yj11,2,1,3,3,2,1,4,

7、1,11921,3,2,2,3,1,4,1,1,22032,1,1,1,1,3,2,1,3,11641,1,3,2,1,5,1,2,3,120试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差解:由题意得到N400,n4,M10,f0.01N400yMy101.87518.75(份)Ny104001.8757500(份)2SbMn_二2(yiy)n1i1于是由以上的计算结果得到平均每户的订报份数为,估计量方差为。该辖区总的订阅份数为7500,估计量方差为62700。10、某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200问,每间6人。学生会的同学运用两阶段抽

8、样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,样本佰舍拍照人数样本佰舍拍照人数126120703181429151100试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。解:题目已知N200,n10,M6,m3,f11也0.05,f20.5N200Ms(?)vV(i?)V0.0057470.0758在置信度95%F,p的置信区间为(?t/2Vvd?)-)=(0.31.960.0758)(0.151432,0.448568)。四、不等概抽样11、某公司欲了解职工上班交通所需的时间,该公司共有5个部门,根据每个部

9、门的人数采用PPS抽样出2个部门,并在2个部门中采用简单随机抽样分别抽出5名职工,调查结果部门i职工人数Mi时间(分钟)yj12040,10,20,30,4023560,30,20,60,30试估计该公司职工上班交通评价所需的时间,并给出估计的标准差nm解:已知n=2,m=5,%340设公司总人数为M。由于这个样本是自加权的,i1j1M_nmM_=Y所以有:Yyj34034M0(分钟)y34(分钟),nmi1j110M0所以该公司职工上班交通平均所需时间为34分钟。=1nm=21ooooyyjy4034210342A6034230342nmi1j1101ccc244024410syC15.62

10、(分钟)。五、系统抽样12、检查某书稿上的错别字,每隔5页检查一页上的错字数,系统抽取30页样品后的检查结10865988599910431234063503004080试估计这本书稿的平均错字数,并估计抽样方差解:由题,N=30,k=5,则n=30/5=6则按照所给顺序等距抽样,可能样本如下:123456样本均值样本内方差1108923028810354365440045930385991600Y的简单估计,ysy是Y的无偏估计量,对于系统抽样,作为根据上表中的数据,ysy15yr4.733345r1总体方差S2N2YrjY11.8575平均样本内方差S?r2117.46677.46676.

11、566711.466718.966712.386752k(n1)一2.S?r1.14。N1则:VysySyN六、综合知识点13、判断题(每题1分,共101、总体比率R与总体比例P分)两者是一样的概念,只是符号不一样。2、比估计量是有偏估计量。3、分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。4、对于同一总体,样本容量同抽样标准误差之间是正相关关系。(5、整群抽样设计总是比简单随机抽样效率低。6、其他条件相同时,重复抽样的误差小于不重复抽样的误差。(No7、设总体容量为N,样本容量n,采用有顺序放回简单随机抽样,样本配合种数为C8、一个调查单位只能对接与一个抽样单位。(10、9、营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。(当调查单位的抽样框不完整时,无法直接实施简单随机抽样。答案:1X;2V;3X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论