



已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分层抽样 抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当中。自从1895年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议上提出所谓“代表性调查”的抽样方法以来,经过100多年的理论探讨和时间积累,抽样理论更加科学,抽样技术日臻完善。抽样又称取样。其原理是从研究的全部样品中抽取一部分样品单位。从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。基本的抽样技术包括简单随机抽样,系统抽样,分层抽样,多阶段抽样等。在实际的抽样调查中我们常常会根据调查成本,调查规模等结合运用各种抽样方法进行实践。分层抽样是通过对总体单位进行分类,即分成若干子总体,子总体之间比较相似,使每一个字总体的方差变小,这样只需要在子总体中抽取少量样本单位,就能很好地代表子总体的特征,从而提高对整个总体估计的精度。分层抽样需要事先知道各层权重,但在现实情况下有些资料无法提前预知。这时我们可以先从总体中抽取一个大的初始样本,从而获得有关的辅助信息,然后再从初始样本中抽取一个字样本,这种方法就是双重抽样。其定义为,当简单性状与复杂性状存在关系时可用抽取简单性状来间接估计复杂性状的抽样方法。结合分层抽样的双重抽样方法即为分层的双重抽样。分层抽样,的主要特点就是可以提高估计精度,它不但能对总体进行估计。同时可以对各层子总体进行估计。如此便于实际中抽样的组织和实施。下面我们就分层抽样方法展开讨论,运用实例分析进行比较。1、 分层抽样的原理简介在抽样之前,先将总体N个单位划分成L个互不重复的子总体,每个子总体成为层,他们的大小分别为,这L层构成整个总体()。然后,在每个层中分别独立地进行抽样。1-1、分层抽样的总体均值估计在分层抽样中,对总体均值的估计是通过对各层的估计,安权层加权平均得到的,公式为如果得到的是分层随机样本,则总体均值的简单估计为估计量的性质有性质1:对于一般的分层抽样,如果是的无偏估计(h=1,2,3,L),则是的无偏估计。的方差为在分层抽样中只要对各层估计是无偏的,则对总体的估计也是无偏的。因此,各层可以采用的不同的抽样方法,只要相应的估计量是无偏的则对总体的推算也是无偏的。性质2:对于分层随机抽样,是的无偏估计,的方差为性质3:对于分层随机抽样,的一个无偏估计为1-2、分层抽样总体总值的估计总体总值的估计量为如果得到的是分层随机样本,则总体总值的简单估计为估计量的性质有性质1:对于一般的分层抽样,如果是的无偏估计,则是的无偏估计。的方差为性质2:对于分层随机抽样的方差为性质3:对于分层随机抽样,的一个无偏估计为1-3、样本量的分配分层抽样中,需要研究总样本量n一定时各层应该分配多少样本量。因为对总体进行估计时,估计量的方差不仅与各层的方差有关,还与各层所分配的样本量有关。实际工作中根据实际需要选取分配方法。分配方法1:比例分配比例分配指的是按各层单位数占总体单位数的比例,也就是按各层的权层进行分配,即 或 这时 对于分层抽样,总体均值的估计量是,总体比例P的估计量是,的方差为,的方差为。分配方法2:最优分配最优分配是指在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下,估计量的方差达到最小;或在给定估计量方差的条件下,使得费用最下,能满足这个条件的样本量分配就是最优分配。如果考虑简单线性费用函数,总费用。这时的最有分配是 (h=1,2,L)估计量方差为得出的结论为,如果某一层单位较多,内部差异较大,费用比较省,则对这一层的样本分配要多分配一些。这样得到的估计量方差称为最优方差。分配方法3:尼曼分配对于分层随机样本,作为特例,如果每层抽样的费用相同,即时,最优分配可简化为 (h=1,2,3,L)这种分配称为尼曼分配。这时,达到最小,称为最小方差。二、抽样设计思路和实施方法通过运用软件随机数生成的方法来对分层抽样方法进一步阐述,这里需要用到Excel随机数生成和抽样的基本方法,对于分层抽样而言,需要对随机生成的数据进行分组,然后再每层进行简单随机抽样即可。层的划分原则为,层内单位具有相同性质,通常暗点查对象的不同类型进行划分;尽可能使层内单位的标志值相近,层间单位的差异尽可能大,从而达到提高抽样估计精度的目的;既按类型又按层内单位标志相近的原则进行多重分层,达到提高估计值以及提高估计精度的目的。2-1、抽样设计的基本思路1. 调查对象(总体):用随机数生成的模拟数据总体2. 基本抽样方法:分层随机抽样3. 精度确定:置信水平为95%4. 抽样工具和方法:excel随机数据生成器和抽样函数5. 估计量的性质分析6 .样本最优分配的确定7.分层抽样设计的效果分析2-2、抽样的实施1.总体数据的生成点击excel2003菜单栏中的“工具”“数据分析”,在选择对话框中“随机数发生器”,选择“随机数发生器”;在弹出窗口中变量个数选择2,随机个数取100个,分布类型选择“正态”,平均值为50,标准差为4。通过上述方法可以得到200个随机数据,再对数据进行调整(见附录)。2.对随机抽样的数据进行实例模拟假设这200个数据是来自于某地区月水电费支出,以居民户为抽样单位,根据家庭可支配收入划分4层,每层按简单随机抽样抽取10户,用Excel随机抽样方法得到如下结果: 表2-1层户数样本户月水电费支出情况/元12345678910110046.36 47.05 52.70 52.55 45.54 51.86 50.24 50.23 51.03 52.55 215048.73 48.73 51.83 57.42 55.90 50.95 48.73 53.40 50.95 52.70 320051.03 49.93 49.87 44.51 52.09 44.54 54.56 48.84 56.75 56.75 425046.61 54.56 50.55 44.22 49.66 52.85 49.87 48.73 49.06 44.88 3.总体均值与总体总量的估计由上表2-1的模拟数据可以分别计算下面的结果,如下表所示:表2-21101000.14290.100050.01077.46167.42492101500.24130.066751.935812.62569.02403102000.28570.050050.888914.539018.99004102500.35710.004049.100617.533810.5354合计407001.000052.16根据上表可以结算得到如下结果:52.16(元)0.3437495%的置信区间为。式子,=1.96。经计算:平均家庭的月水电费的95%的置信区间为(51.0109,53.3091)元。4.样本量的分配以下采用比例分配、最优分配和尼曼分配量中样本量分配方法对随机抽取的数据进行实例模拟,采用的数据同样也来自于分层随机抽取的样本,如下所示:表2-3层户数样本户月水电费支出情况/元1234567891013050.24 57.97 49.87 51.83 51.74 49.41 50.29 50.41 57.42 55.79 25044.44 46.61 43.85 57.42 57.42 47.67 50.55 44.44 47.37 51.05 312047.37 55.79 50.80 39.74 50.18 57.54 45.20 53.03 49.04 50.11 (1)比例分配由上表数据得=30,=50,=120, =200 各层的层权与抽样比为: 0.3333 0.05各层样本的均值及方差如下表所示:52.4959 =10.761以此类推, 49.0822 =25.1716 49.8801 =26.2549 从而, 50.0730(元)按比例分配时,各层的样本量为 即各层的样本量分别为6,10,24。(2)最优分配对于最优分配,假设,=49,则可以得到总的成本费用函数为:最优分配是 因此=6.7297,同样的可以得到,。此时的样本估计量的方差为=(3)尼曼分配根据比例分配的计算结果,我们可以得到 0.4920+1.2543+3.0744=4.8207因此按尼曼分配时,各层应分配的样本量为 故 12.290 23.8235即各层的样本量分别为4,12,24.三、分层随机抽样设计效果分析分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。与其他抽样方法相比较,分层抽样是一种很重要的抽样技术,在那些区域跨度很大的例如全球性、全国性的调查中尤其受到瞩目。因为它有其自身的许多优点(1)由于抽样在每一层中独立进行,所以一方面各层可以选择适合本层的不同抽样方法;另一方面可同时对各层进行参数估计,而不单是对整个总体的参数进行估计。这在大区域且依托行政管理机构实施的调查里优势更为明显。如:我国城镇居民的消费支出情况的全国性调查,如果按照省级行政区进行分层,一方面每个省只需负责该省的调查工作,可以根据具体情况采用适合与自身的抽样方法;另一方面可以得到各省级行政区的人均年收入水平。(2)由于每层都进行抽样,这使得样本在总体中分布更加均匀、更
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 船舶焊接工艺过程控制考核试卷及答案
- 小麦脱皮工艺考核试卷及答案
- 锦纶纤维纤维耐高温处理工艺考核试卷及答案
- 粮食经纪人基础知识考核试卷及答案
- 压电石英晶体研磨工三级安全教育(班组级)考核试卷及答案
- 山西省晋中市榆次区2024-2025学年八年级下册期末测评数学试卷含解析
- 注册安全工程师安全生产法测试卷附答案
- 市场调查及咨询服务公司合同付款管理办法
- 产品供货协议
- 应届生面试题库及答案
- 第一单元 第2课《童真时光》 【人教版】美术 三年级上册
- 广州市公安局天河分局招聘辅警考试真题2024
- 2025年全国货运驾驶员职业技能资格考试试题(基础知识)含答案
- GB/T 46150.2-2025锅炉和压力容器第2部分:GB/T 46150.1的符合性检查程序要求
- 2025年甘肃省高考历史真题卷含答案解析
- 中华优传统文化(慕课版)教案
- 2025广东广州市国资委选调公务员2人笔试模拟试题及答案解析
- 美容美发店2025年营销方案创新解析
- 经济效益证明(模板)
- 《企业年度培训计划制定》
- 医疗机构卫生技术人员名录
评论
0/150
提交评论