抽样技术与应用课程作业_第1页
抽样技术与应用课程作业_第2页
抽样技术与应用课程作业_第3页
抽样技术与应用课程作业_第4页
抽样技术与应用课程作业_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上首都经济贸易大学 抽样技术与应用作业文档2013年授课对象:统计学(经济分析)学生授课教师:教师:李锋 邮箱:lifeng20523 单位:统计学院(参考答案可能存在疏漏,欢迎指正。)平时成绩以100分计,占总评成绩的30%第一部分:考勤及课堂表现(约40%)第二部分作业(约60%) 不用抄题,写题号即可,作业要求:写公式、数据代入公式及结果。一、简单随机抽样:1、设总体N=5,其指标值为3,5,6,7,9 1)计算总体方差和; 2)从中抽取n=2的随机样本,直接用公式计算不放回抽样的方差V(); 3)列出不放回抽样的所有可能的样本并计算。验证E()=; 4)按不放回

2、抽样的所有可能的样本,计算其方差V()。并与公式计算的结果进行比较。5)对不放回抽样的所有的可能样本计算样本方差。并验证E()=。2、如何使用一棵普通的正方体(正六面体)骰子进行入样概率为1/2,1/3,1/4,1/5的随机抽样?3、从一叠单据中用简单随机抽样方法抽取了250张发现其中有50张单据出现错误。(1)以95的置信度估计这批单据中有错误的比例。(2)若已知这批单据共1000张,你的结论有何变化?(3)若要求估计的绝对误差不超过1,则至少应抽取多少张单据作样本?二、分层随机抽样1、一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽

3、样。已知下列资料:(1)若总样本量n =30,试用奈曼分配确定各层的样本量。(2)若实际调查了18 个工人,10 个技术人员,2 个行政人员,其损失的工时数如下:工人技术人员行政管理人员8,24,0,0,16,32,6,0,16,9,5,8,18,2,0,7,4,4,4,5,0,3,2,1,8,24,8,121,8试估计总的工时损失数并给出它的置信度为95的置信区间。2、 某林业局欲估计植树面积,该局共管辖240 个林场,按面积大小分为4 层,用等比例抽取40 个林场,取得下列资料(单位:公顷)试估计该林业局辖区总的植树面积及95的置信区间。样本数据计算如下: 层总量层均值层方差第一层第二层第

4、三层第四层91821963065236265.57183340.56472.4938.429054.1816794.2872376.3合计8541-3、在估计比例问题时:(1) 假设P0.5, W1W20.5,则P1与P2为何值时可以使按比例分配的分层抽样精度可以得益20(即deff=)。(2)若P =4,其中W1=0.05,P1=45;W20.2,P25;W30.75,P31。则采用按比例分配的分层抽样比简单随机抽样精度得益(1-deff)有多大?三、整群抽样1、 汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,在175辆车中抽中了25辆,其不安全轮胎数如下: 不安全轮胎数 汽车数 0

5、1 2 3 4 5 8 7 2 3 要求估计该运输公司的汽车中不安全轮胎的比例及其估计的标准误。四、系统抽样1、 在一条街上13户的户口册中将所有的居民列成下表:M男性成人,F女性成人,m男孩,f女孩。 住 户 1 2 3 4 5 6 7 8 9 10 11 12 13 M F f m f M F f m f M F m f M F M F m m f M F f m M F f f M F m f m M F m M F m f M F f m M F f M F 为估计下列各项指际: a) 男性所占的比例; b) 孩子所占的比例; c) 具有某种职业的住户中人员的比例(第1,2,3,12,

6、13这几户是具有某种职业的住户)。现从每5人中抽1人,取得一系统样本,又按20的比倒抽取一个简单随机样本,请比较这两种样本的方差。(系统样本的排列方法是每户自上至下依次排列)。 专心-专注-专业2、下表是28个样本村的产量数据,它是按产量由低到高顺序排列后的280个村按种植面积大小成比例的概率抽选的系统样本。 样本村 平均亩产 样本村 平均亩产 1 2 3 4 5 6 7 8 9 10 11 12 13 14 370 379 389 396 397 400 404 410 418 433 445 453 460 462 15 16 17 18 19 20 21 22 23 24 25 26 2

7、7 28 467 501 503 514 515 541 542 543 562 570 586 601 653 658 1) 用简单随机抽样的公式计算均值的抽样方差; v12) 用合并层的方法计算均值的抽样方差;v2 3) 用连续差的方法计算均值的抽样方差; v34) 你认为根据上述资料用哪一种方法计算比较接近实际。 样本数据如下: S2=6928.88五、比估计和回归估计1、 某县共有123 个村,欲估计全县当年的小麦总产量,按简单随机抽样抽取13 个村,取得资料如下:样本村上年产量(百斤)当年产量(百斤)123456789101112135507201500102062098092812

8、001350175067072915306107801600103060010509771440157022109808651710(1)若已知上年的小麦总产量为(百斤),采用比估计法估计当年的小麦总产量,并求置信度为95的置信区间。(2)采用差估计估计平均每村的小麦产量和小麦总产量,并估计其方差。(3)采用用样本回归系数的回归估计法估计平均每村的小麦产量和小麦总产量,并估计其方差。(4)比较差估计、回归估计与比估计的效率。去年小麦产量为x,今年为y,样本数据计算如下:均值指标总和方差(协方差)平方和(乘积和)去年小麦产量x今年小麦产量yxy1042.081186.311354715422.7

9、4.0641.9981附录一:参考答案一、简单随机抽样1、 (1)2=4,S2=5;(2)不放回1.5(用计算式);(3)不放回E()=6;(4)不放回1.5(用定义式);(5)不放回E(s2)=S2=5;2、(略)3、(1) 该批单据中有错误的比例估计为20%,95%置信度的近似置信区间为14.83%,25.17% (2) 若单据共有1000张,该批单据中有错误的比例估计为20%,95%置信度的近似置信区间为 15.50%,24.50% (3) 若要求估计的绝对误差不超过1%,应至少抽取6147张单据作为样本。二、分层抽样1、(1) n1=18, n2=10 n3=2(2)该公司总的工时损失

10、数估计为1903.9,95%置信度的近似置信区间为1457.0,2350.82、该林业局总的植树面积估计为51246公顷,95%置信度的近似置信区间为42728.2,59763.8;由于比例分配时样本量四舍五入,而且有些层的样本量较小、各层均值方差之间差异大,用比例分配公式和用分层通用公式计算结果之间差异较大,答案用比例分配公式3、 (1)p1=0.7236,p2=0.27648或p1=0.2764,p2=0.7236(2)精度得益为0.237三、整群抽样1、 估计该运输公司的汽车中不安全轮胎的比例为40%,估计的标准误为5.8248%四、系统抽样1、(1)男性所占比例估计为48%,系统抽样估计量的方差为2.56%,简单随机抽样估计量的方差为2.04%,简单随机抽样精度高;(2)孩子所占比例估计为48%,系统抽样估计量的方差为5.76%,简单随机抽样估计量的方差为2.04%,简单随机抽样精度高;(3)男性所占比例估计为38%,系统抽样估计量的方差为0.16%,简单随机抽样估计量的方差为1.923%,系统抽样精度高;2、 (1)v1=222.71(2)v2=3.141(3)v3=3.846 (4)略五、比估计和回归估计1、(1) 今年的小麦总产量估计为.7809百斤,95%的置信区间近似为.4783百斤,.6791百斤

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论