已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本科毕业论文(设计)模板本科毕业论文(设计)论文题目:多目标分层抽样设计理论与应用研究 学生姓名: 学 号: 专 业: 数学与应用数学 班 级: 数学与应用数学0901 指导教师: 完成日期: 2013 年 5 月 20日目录序言1一、多目标分层抽样设计理论1(一)理论研究背景1(二)多目标分层抽样的基本概念2二、 多目标分层抽样的应用研究3(一)多目标分层抽样关于层的划分3(二)多目标矩形区域分层抽样的应用7三、设计总结10参 考 文 献:1111多目标分层抽样设计理论与应用研究 内 容 摘 要本文主要分了两大部分来论述:多目标分层抽样的设计理论和理论应用例举。第一部分通过对其理论背景即当前社会对抽样调查的新要求的介绍,以及对多目标抽样、分层次抽样、多目标分层两者的结合的抽样方法等基本概念的解释说明来予以介绍.第二部分,在多目标分层抽样的层的划分方法中着重论述了在矩形区域下多目标分层抽样的层的划分方法及其总体均值估计量的构造及性质和抽样误差的估计,以及多目标矩形区域分层抽样的简单应用.关键词:多目标 分层抽样 误差估计 矩形区域 Study on multi-objective stratified sampling design theory and ApplicationAbstract This paper the main points of two parts to discuss, on multi-objective stratified sampling design theory based on the theoretical background of the current social new requirements for sampling, and multi-objective sampling, stratified sampling, a multi-objective hierarchical sampling method of the combination of both, that are introduced by the explanation of the concept of. Multi-objective division of layers of stratified sampling method, emphatically discusses the multi-object stratified sampling under the rectangular area of layer division method and the estimation of population mean structure and nature and the estimate of sampling error, multi-objective rectangular area and the simple application of stratified sampling. Key words:Multiple target stratified sampling error estimate rectangular area 序言 抽样调查作为一种认识社会现象的有效工具,它需要能够全方位反映总体情况,这就要求了所需要调查的目标可以从各个方面对总体参数进行估计。所以,实践对多目标分层抽样理论有着很迫切的需求。多目标分层抽样方法对提高抽样精度有着特别好的作用,但是,这一方面尚未有很成熟的理论方法,这就需要我们去努力学习和探索。作为一种认识手段,抽样调查技术已经深入到社会、经济、生活等各个领域,在被广泛应用的同时,实践也要求着抽样调查能够尽可能服务多个目标。一项大型的抽样调查通常包含几十个,甚至上百个目标,这是因为实际工作中抽样调查工作展开和执行的规模和所需要的成本通常比较大,这样就要求了对于每一个样本单元都要调查尽量多的指标,这样才可以尽可能的降低调查所需要的人力、物力和财力,同时也能够多维度、多层次、全方位反映总体的情况,因此,对于多目标分层抽样进行研究在理论和实践上具有十分重要的意义,但同时,这种多目标的调查需求也给抽样调查的设计、目标量的估计、样本容量的确定以及抽样误差的控制等方面带来了困难,目前对多目标分层抽样还未曾有较系统的研究,因此,本文试图在已有的一些研究的基础之上,对其进行整理研究与创新,以实现多目标分层抽样研究的系统化。一、多目标分层抽样设计理论(一)理论研究背景长久以来,多目标和分层次抽样问题一直是抽样调查研究领域的热点问题。这都是因为实践对其有迫切的需求,但是理论研究却又无法完全满足。抽样调查方法一直以来都是从事较大规模数据的收集和分析的主要工具,人们很是希望能够一次抽样然后多方面地使用,这样来提高样本的使用效率。利用这套样本既能用来分析多种不同的目标要求,又能用来满足不同阶层的不同的调查愿望。特别是在我国,各级政府都有管理经济工作的职能,因此涉及到人口、社会、经济领域的信息资料,和与之相关的分析与研究,对各级政府来说都是十分重要的。中央政府需要掌握这些信息全部的资料以把握全局,地方政府需也要依靠这些信息来了解彼此。各级政府、各行各业也希望能够共享这些数据,因此也迫切的需要进行多目标的分层次抽样。事实上,政府部门的调查大多数都是多目标的调查,调查目标少则十几个,多则几十个甚至上百个。可以不夸张地说,如果政府的统计调查体系是以抽样调查为主体,那么多目标和分层次的抽样设计就必将成为我国政府统计调查体系中的主体的核心。国内国外对多目标和分层次抽样设计方法及理论作出了大量的研究,概括起来可以分成三个方面。一是以随机化过程或模型自由为基础的多目标或分层次抽样调查研究,如平衡抽样法、双重事后分层法、ABC 法等,这些方法都一度是抽样调查领域的主流方法。平衡抽样法是在不破坏随机原则的前提下,每次抽样都围绕着一个“中心”进行;双重事后分层法是先抽取一个大样本,然后从中再抽取若干小的样本。但是必须事先掌握或者需要人为造出一组与各个抽样目标具有较高线性相关的多维辅助变量是使用这些方法的前提,在实际使用中难度是较大的亦或浪费较大,实用性很不强;第二方面的研究,是以统计模型为基础的研究。这些方法的优点是他们的使用前提是获取不到其他信息或者无法进行再抽样,但其不足之处是容易以偏概全;第三方面,也是以随机化过程为基础,同时辅助以统计模型的方法。这类方法和模型的选择也密切相关,如果选择拟合度高的辅助模型和抽样问题,辅助模型的其他统计性质便能够很自然的应用到抽样问题上来,在这方面的突出成果有 MPPS(多目标与规模成比例的概率抽样设计)法、成本条件下的多目标复合抽样法和 PPS的样本追加法等,但他们的缺点就是辅助模型和抽样问题可能会不一致,这样抽样的结果就可能会有很大的偏差,但是这种方法却兼顾了模型化和随机化的一些优点,已经成为了当今抽样领域的主要方法。将多目标和分层次抽样设计结合起来研究,同时努力解决好样本抽取和方差估计的问题,是非常有理论意义和实践作用的。(二)多目标分层抽样的基本概念1、多目标抽样多目标抽样又称多主题抽样,它是通过适当的抽样设计,以达到利用一次抽样调查取得的样本去估计总体不同的指标的目的。在我国的统计调查实践中,无论是政府的抽样调查,还是各种市场调查,一次调查需要了解的指标少则十几个,多则几十个,因而实质上大部分属于多目标抽样。2、分层次抽样当总体规模N 与样本容量n都较大,总体单元之间的差异也相对较大时,进行简单随机抽样就会出现成本很高但精度很低的情况,即是这些情况不适合采用简单随机抽样,此时一种很自然的解决之道就是:设法缩小总体规模N 与需要抽取的样品数目n,这可以通过将总体划分为若干子总体达到目的,并且应尽量减少总体单元之间的差异,满足组内差异小,组间差异大,这就是分层抽样的目的。分层抽样也称作类型抽样或者分类抽样,通俗地说也就是异质性较强的总体被分成若干个同质性较强的子总体,然后再从不同的子总体中抽取样本分别代表该子总体,进而将所有总体中抽取的样本合并成一个样本来代表总体。与其他抽样方法相比较,分层抽样是一种非常重要的抽样技术,在那些区域跨度很大的(例如全球性、全国性的)调查中尤其受到瞩目。因为它自身有许多多优点,由于抽样在每一层中是独立进行的,所以,一方面各层可以选择适合本层的不同抽样方法;另一方面也可以同时对各层进行参数估计,而不是单对整个总体的参数进行估计。这在大区域且依托行管理机构实施的调查里优势更为明显。3、多目标分层抽样在抽样调查实践中,我们会遇到既不是单纯的多目标抽样设计问题,也不是单纯的分层次抽样设计问题,而是这两个问题的综合,这样的情况即多目标分层次抽样。对于分层次结构的总体和域总体同时对个目标进行抽样调查,可称为一个多目标的分层次抽样调查问题。相应的抽样设计就称为多目标的分层次抽样设计。这个设计问题实质就是抽取一套样本同时对总体和域总体的多个有关数字特征同时进行估计。这一问题显然要比单独的分层次抽样设计或单独的多目标抽样设计更加复杂。二、多目标分层抽样的应用研究(一)多目标分层抽样关于层的划分 多目标分层抽样是根据总体单元的特性,先把总体分为若干个层,使总体中差异较小的单位归于一层,差异较大的单位归于不同的层,这样做的目的是为了实现层间方差尽可能大,层内方差尽可能小。然后在每层中抽取样本来代表该层自然就会有较大的代表性,由于每层都进行了抽样,总样本就会对整个总体也有较大的代表性,这样就能够很好地提高抽样精度,更好地实现多目标抽样。 层的划分要依据调查项目的属性,有些项目对先给信息知之甚少,在没有任何辅助资料的情况下,我们可以按照总体的自然标志或者品质标志进行分层,例如按照行政区域划分层,可以将陕西省分为 8 个地级市,西安市、咸阳市、渭南市、宝鸡市、汉中市、铜川市、延安市、榆林市;也可以按照类型大小来划分层,比如国家统计局的关于全国城镇住户收入消费调查方案,按城市的规模进行分层,将其划分为大、中、小城市三层;同样也可以按照总体所含个体的区域、范围、经济属性等等来划分。有些调查项目先给信息了解充分,关于层的划分就比较明确,因此抽样调查之前,可以依据总体中的先给信息进行层的划分,我们下面矩形区域法就是这种情况。1、矩形区域法层的划分对单指标抽样来说,对总体进行分层,就是把单指标的值域表示在数轴上,用区域法进行分层就是把数轴上的一个大区间划分为若干个子区间。如:设单指标的值域为,假如把它分为层,我们可以这样分,X,X,X, 就分为个子区间,每个子区间称为一层,一共有层。平面上用矩形区域法进行分层就是把一个平面划分为若干个矩形子区域。当抽样调的目标有两个,即就是需要调查两个指标时,设这两个指标分别为,指标,的值域分别为,设将其分为个矩形子区域,那么我们这样用区域法进行层的划分: 将指标分为个水平,, , , ;将指标分为个水平,, , , ;然后将其按平行于各坐标平面的平面进行分割这样就会把平面分为个矩形子区域,每个子区域自成一层,一共分为了层。当抽样调查的指标有个时,设这个指标分别为,那么,(,)的值域就为维欧式空间的集合,我们用矩形区域法把这个空间分为若干个矩形子区域: 指标 的值域为,把它分为个水平: ,; 指标的值域为,把它分为个水平:,然后将其按平行于各坐标平面的平面进行分割,就可以把空间分为=个矩形子区域,每个子区域自成一层,一共分为了 N 层。而且用矩形区域法对多目标总体分层,用计算机处理也是比较简单的。2、矩形区域抽样关于总体均值的估计量的构造及性质设为一概率空间,为定义在上的随机变量的值域为维欧氏空间的集合,将其按平行于各坐标平面的平面进行分割。设分割为=个矩形子区域,在矩形子区域上取值的原像集记为(=1,2,;=1,2,) 其对应的子概率空间 (,)其中:(I)=;(,) 而 =(=0,1,1),(=0,1,1)且满足:(a) =, (b) 之间互不相容(=1,2,;=1,2,) . (II)((,))=(0;=1),且满足,()=().定理1:设=(=1,2,.,),其中(,.,)=(,)且相互独立,则具有以下性质:(1) ()=()(=1,2,.,);(2) ()()(=1,2,.,).在证明此定理之前,我们先给出下面一个引理:设每个在第个坐标轴上的投影为,对于第个分量,有()max(),只要证明存在,使得0,就有()max()引理:在上述的定义下,使得0。证明:所有在第 个坐标轴上的投影为,则之间或完全重合,或互不相交,对于互不相交的,设其个数为 个,( 3),其投影可以为.(可为, 可为 + )。设=,即要证明必存在,使得,(为 的样本空间),由于,则必属于区间(=1,2,.,)中的某一个。(a) 当不等于,.,时,即不等于断点值时使得,则有 或有,按照期望的性质就有 或者,只要选=1或,就有,或者.(b) 当为,.,中的某一个时,不妨设=,则在上,就有=综合以上叙述,则必使得0。所以,我们可以得出(1)()=()(2)至少存在一个使得0,那么就可以证明()()。3、概率分配样本下的抽样误差估计1)概率分配样本下的放回抽样在()()的基础上,设从总体(,)中有放回地抽取容量为的子样,其子样均值记为 ,其中从子总体(,.,)中抽到容量为的 子 样 , 记为,且满足=。子样均值记为 , 令,那么由定理 2 和引理,我们可以得出则具有以下性质:(1); (2)当时 .其中,为多目标简单随机抽样情况下容量为的样本第个指标的均值,为其方差。2) 概率分配样本下的放回抽样在()()的基础上,设从大小为的总体中不放回的抽取容量为的子样,其子样均值记为;其中从大小为的子总体上不放回的抽取了容量为的子样,记为 ;且满足,子样均值记为 ;第个子总体的方差记为 ,抽样比记为,由于是按比例抽样,所以,。现令 那么由定理 3 和引理我们可以得出则具有以下性质:(1); (2).其中,为多目标简单随机抽样情况下容量为 M 的样本第 j 个指标的均值,为其方差。从以上证明结果可以看出,矩形区域分层法有着优良的性质,子区域自成一层,构造的抽样统计量是总体均值的无偏估计量,而且抽样误差严格小于简单随机抽样情况下的抽样误差,很好地提高了抽样精度。(二)多目标矩形区域分层抽样的应用上面我们已经对用矩形区域划分法对多目标分层抽样进行分层做了分析,当把多指标变量的值域划分为若干矩形子区域时,构造出来的统计量的方差严格小于简单随机抽样时的方差,可见其具有非常良好的性质.下面我们就以案例来说明。1、矩形区域法对多目标抽样层的划分本次案例是以某省 2006 年 1 月份城镇居民家庭消费支出调查的统计数据作为总体数据,所以数据具有可靠性、真实性。本次调查的目标为 8 个指标:食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务、其他商品和服务。具体的调查对象包括:(1)户口在本地区的常住非农业户;(2)户口在本地区的常住农业户;(3)户口在外地,居住在本地区半年以上的非农业户;(4)户口在外地。居住在本地区半年以上的农业户。数据收集方式:是采用日记账方式来收集,每季上报一次。 对于 1450 个调查户的消费支出的资料,我们现在运用矩形区域划分法对其进行抽样实验,在实验中这 1450 个调查户的消费支出的资料作为总体,总体的大小为N =1450,所用的软件是 SPSS 软件。首先,为了研究的方便,分层易于操作,我们把这 8 个变量合并成 4 个新的变量:食品和衣着合并成一个变量,从而形成一个新的变量;医疗保健和教育文化娱乐服务合并成新变量 ;家庭设备用品及服务和交通和通信合并成新变量;其他商品和服务和居住合并成新变量。其次,对 4 个变量的相关关系进行分析。四个变量 、 、 、 的相关系数矩阵见下表1:从上面的相关系数矩阵来看,四个变量的相关系数都很小,可以认为它们是相互独立的。因为现实中的数据模拟,不是严格的独立。现实中严格的独立是不存在的。接着,进行分层。把这 4 个指标 、 、 、分别按照他们与中位数的大小关系分成 2 个水平,其中:指标 的中位数是 750.85,指标的中位数是 127.50,指标的中位数是 117.80,指标的中位数是 131.70。这样我们就把整个空间分成 个子总体,即就是把总体分成了 16 个层。子总体的大小分别为:,再接着,确定每一层的抽样数目。设每一层所要抽到的样本容量为总的样本容量为 M =103,且抽样比记为,按照等比例抽样,即来确定每一层所要抽到的样本容量。得到的结果为:,。最后,在每一层中进行不放回简单抽样。2、矩形区域法划分层的多目标分层抽样与简单随机抽样的比较用表示第层第 个指标的样本均值,因为,所以得到:,且,构造的抽样统计量为。最后得到的抽样结果及与简单随机抽样的比较见表2: 从抽样结果来看,按照矩形区域划分法对多目标抽样进行分层,达到了很好的抽样效果。虽然我们可以看出多目标分层抽样调查方案对总体均值的估计相对误差有的还是比较大,这是因为:我们进行抽样调查的各指标之间不是完全独立的,样本有可能不完全符合我们理论推导中的要求,所以给抽样精度带来了影响。但是在相同的样本容量M =103 下,矩形区域划分法的多目标分层抽样与简单随机抽样进行比较效果还是比较明显的,(1)在相同样本的情况下,多目标分层抽样抽取的样本对总体均值的估计精度明显高于简单随机抽样方案。(2)多目标分层抽样抽取的样本均值方差比简单随机抽样要小很多。可见用矩形区域划分法对多目标抽样进行分层能够很好地提高抽样精度。三、设计总结抽样调查作为一种有效工具用来认识社会现象,需要它能够尽可能全方位的反映总体情况,这就要求所需调查的目标对总体参数进行估计可以从多个方面进行。所以实践对多目标抽样理论有着迫切的需求。而多目标分层抽样方法同时对提高抽样精度也起着很好的作用,只是这方面还没有完全成熟的理论方法。在了解了选题背景、国内外研究状况、理论意义与实践意义和文章的主要内容的基础上解释了一些基本的概念概念,简述了一种全新的划分层的方法,矩形区域划分法,并构造了抽样统计量,而且证明了这种划分层的方法得到的抽样误差严格小于简单随机抽样的抽样误差。本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 欢乐颂教学设计小学音乐六年级下册人音版(主编:曹理)
- 2025-2026学年观潮大单元教学设计教案
- 疾病健康管理
- 物料提升机安装规范及防护规范
- 决明子的使用与老年人便秘的处理
- 儿童少年精神病学
- 生产运作管理新范式
- 2024-2025学年高中物理 第一章 电磁感应 第02节 研究产生感应电流的条件教学设计1 粤教版选修3-2
- 肠炎恢复训练方案培训
- 糖尿病并发症的评估与处理方案
- DZ/T 0430-2023 固体矿产资源储量核实报告编写规范(正式版)
- 历年中职高考《畜禽营养与饲料》考试真题题库(含答案)
- 【某矿井水处理工艺设计9600字】
- 《物业客服培训》课件
- 危险化学品存放与使用安全规范与要求培训
- 年智能化生产绿色轻质新型输送带300万平方米项目环境影响报告
- 宝马5系GT说明书
- JJF 1033-2023计量标准考核规范
- 输电线路消缺修理施工方案
- GB/T 4169.4-2006塑料注射模零件第4部分:带头导柱
- GB 9448-1999焊接与切割安全
评论
0/150
提交评论