




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样调查-第7章系统抽样2023/12/27抽样调查第7章系统抽样
系统抽样的特点
系统抽样是一种被广泛采用的抽样方法,系统抽样比简单随机抽样易于操作,但抽样误差的估计比较复杂。实践中,各种抽样调查,如人口调查、产品质量调查、城乡居民调查等都普遍采用系统抽样。系统抽样中最简单也是最常用的规则是等间隔抽取,这种系统抽样又称等距抽样。抽样调查第7章系统抽样二、系统抽样的一般方法1.直线等距抽样假设总体单元数为N,样本容量为n,N是n的整数倍.首先计算抽样间距,把总体分为n段,每段k个单元,然后在第一段的k个单元中随机抽出一个单元,假设为r,然后每隔k个单元抽出一个单元.即直到抽出n个单元.抽样调查第7章系统抽样例如
某学院共有200个学生,要抽10个学生做样本首先计算抽样间距然后在1~20中随机抽出一个数字,假设抽中排在第3位的学生,则其余样本单元依次为第23,43,63,83,103,123,143,163,183位共10个学生抽取.抽样调查第7章系统抽样2.循环等距抽样
当N不是n的整数倍,即抽样间距不是整数时,实际抽取的样本量是不确定的,每个总体单元入样的概率也是不等的,这时用直线等距抽样就有可能产生偏倚,若采用循环等距抽样则可以解决此问题.其方法是将N个总体单元排成首尾相接的一个圆从1到N中随机抽取一个起点作为起始单元,然后每隔k个单元抽出一个,直到抽出n个单元为止.抽样调查第7章系统抽样循环等距抽样例如总体有14个单元,欲抽取n=3,则取与之最近的整数然后在总体中随机抽取一个单元作为起点,假设抽中3,即依次抽取直到抽满。因此样本的编号为:3,8,13。81110133176452912抽样调查第7章系统抽样3.不等概系统抽样法不等概系统抽样中每个单元的入样概率不相等.最常用也是最简单的不等概系统抽样是抽样.即入样概率与单元大小成比例的系统抽样.令表示总体所有单元大小的总和,则实施不等概系统抽样最简单的方法是代码法:下面以例7.1来说明【例7.1】设总体由10个行政村组成,N=10,每个行政村的人数见下表.利用系统抽样抽取n=3个行政村.抽样调查第7章系统抽样行政村编号人数(Mi)累计人数抽中代码12345678910103432962468473205168146317103535631877961103412391407155318701007231346用系统抽样抽选行政村抽样调查第7章系统抽样从[1,k]中随机抽取一个整数r=100,则代码为:r=100,r+k=100+623=723,r+2k=100+2×623=1346,所对应的行政村入样,其序号依次为1,4,8.
在系统抽样中,对于特别大的单元一定要注意.如果出现,该单元肯定被抽入样本,而且还可能被重复抽到.为了避免这种情况,可以事先将这些单元抽出直接入样.抽样调查第7章系统抽样三、总体单元的排序
系统抽样时N个总体单元的排序情况大致有以下三种:(1)按无关标志排队(2)按有关标志排队(3)介于上述两者之间抽样调查第7章系统抽样四、系统抽样的优缺点系统抽样的优点:1.简便易行,容易确定样本单元2.样本单元在总体中分布比较均匀系统抽样的缺点:1.如果单元的排列存在周期性的变化,而抽样者对此缺乏了解或缺乏处理经验,抽取的样本的代表性就可能很差。2.系统抽样的方差估计较为复杂,一般不存在无偏估计量。抽样调查第7章系统抽样五、系统抽样、整群抽样和分层抽样的关系
系统抽样既可以看成一种特殊的整群抽样,又可以看成一种特殊的分层抽样。下面以一般的等距抽样为例说明:
假设抽样间距为k,总体单元数为N=nk。将总体的N个单元排列成k行n列,如下表所示。表中的每一行单元都是系统抽样的一个样本。抽样调查第7章系统抽样系统抽样的总体单元12jn平均12rk抽样调查第7章系统抽样12jn群平均12rk层平均令得下表:如果将每一行单元视为一个群,则总体由k个群组成每个群的大小都是n。系统抽样就是从中任选~一个单元,被选中单元所在行的所有单元就构成系统抽样的一个样本。抽样调查第7章系统抽样§7.2等概率系统抽样估计量一、符号说明第r行第j列的单元指标值:总体单元数:N样本单元数:n系统样本平均数:系统样本均值估计量:层均值:总体方差:系统样本内方差:抽样调查第7章系统抽样样本内相关系数:层内方差:同一系统内对层均值离差的相关系数:二、估计量假设起始值为R,相应系统样本的平均值为:抽样调查第7章系统抽样取系统样本的平均数作为总体均值的估计量:性质1
当N=nk时,有k个可能样本:因此是无偏估计量。是有偏的。个可能样本所包含的单元数不全相等,因此但是当时,采用直线等距抽样得到的抽样调查第7章系统抽样三、估计量方差的不同表示形式为方便起见,以后均假定时,系统样本的平均数作为总体均值的估计是无偏的。它的方差按定义为:下面给出方差的三种不同的表示形式。形式一
用样本内方差表示系统抽样估计量的方差。抽样调查第7章系统抽样式中,为总体方差;为样本内方差。如果从总体N中直接抽取样本量为n的简单随机样本,则总体均值的估计量的方差为:式中,为总体方差;n为样本量;f为抽样比。抽样调查第7章系统抽样
对于固定总体,总体方差是惟一确定的,因此,系统样本内的方差越大,系统抽样的精度越高.为了提高系统抽样的精度,总体单元的排列应尽可能增大样本内方差。比较等距抽样方差和简单随机抽样方差,抽样调查第7章系统抽样形式二
系统抽样可看作一种特殊的整群抽样系统抽样估计量的方差可以用样本内相关系数表示:式中,为样本内相关系数。系统样本内正相关越大,即系统内单元越相似,则估计量方差越大,等距抽样精度越差。抽样调查第7章系统抽样形式三、系统抽样可看做一种特殊的分层抽样,系统抽样估计量的方差可以用层内方差表示:式中,为层内方差;为同一系统样本内对层均值离差的相关系数。比较系统抽样方差与比例分配的分层随机抽样方差,比例分配的分层随机抽样总体均值估计量的方差。抽样调查第7章系统抽样
因此当系统抽样的精度低于分层随机抽样;系统抽样的精度与各层抽取一个单元的分层随机抽样相同;系统抽样的精度高于分层随机抽样。抽样调查第7章系统抽样【例6.3】
设某总个体N=30个单元,总体单元排列如下表,我们要产生一个样本量n=5为的系统样本,试与其他抽样方法的结果进行比较。
下面通过一个模拟的例子说明系统抽样与其他抽样方法的联系,并对不同抽样方法的效果进行比较。抽样调查第7章系统抽样N=30,k=6,n=45等距样本数据12345群平均群内方差1111213141513.002.52111213141513.002.53111213141513.002.54111213141513.002.55111213141513.002.56111213141513.002.5层平均11.0012.0013.0014.0015.0013.002.5层内方差0000002.07抽样调查第7章系统抽样从上表可计算出:总体方差平均群(行)内方差平均层(列)内方差下面我们按不同的抽样方法计算总体均值估计量的方差。抽样调查第7章系统抽样(1)以行为群的整群抽样或以行为“系统样本”的系统抽样k=6,n=5.抽样调查第7章系统抽样(1)以行为群的整群抽样或以行为“系统样本”的系统抽样k=6,n=5.抽样调查第7章系统抽样(2)以列为群的整群抽样或以列为“系统样本”的系统抽样k=5,n=6.抽样调查第7章系统抽样(3)以行为层的分层随机抽样(每层抽1个单元)L=6,n=6,f=6/30.(4)以列为层的分层随机抽样(每层抽1个单元)L=5,n=5,f=5/30.抽样调查第7章系统抽样(5)简单随机抽样n=5,f=5/30.(6)简单随机抽样n=6,f=6/30.抽样调查第7章系统抽样【评价】从上面的结果可以看出:(1)像整群抽样一样,系统抽样的估计精度几乎完全取决于其“系统样本”内差异与总体差异的对比。(2)系统抽样与其他抽样方法相比其优劣难以定论,可能好也可能差,这完全取决于其“系统样本”内差异与总体差异的对比,而这个对比则取决于系统抽样中的总体单元排列顺序。(3)另外三种方法的比较同样难定优劣,都需要具体情况具体分析。我们下面将上表中总体单元的顺序重新排列,来研究总体单元不同排列对系统抽样的影响。抽样调查第7章系统抽样依某种随机化程序将总体单元重新排列12345群平均群内方差1111211121513.002.692111211121513.002.693111213141513.002.504111213141513.002.505131413141513.000.706131413141513.000.70层平均11.6712.6712.3313.3315.0013.00层内方差1.071.071.071.07002.07抽样调查第7章系统抽样从上表可计算出:总体方差平均群(行)内方差平均层(列)内方差下面我们按不同的抽样方法计算总体均值估计量的方差。抽样调查第7章系统抽样(1)以行为群的整群抽样或以行为“系统样本”的系统抽样k=6,n=5.抽样调查第7章系统抽样(2)以列为群的整群抽样或以列为“系统样本”的系统抽样k=5,n=6.抽样调查第7章系统抽样(3)以行为层的分层随机抽样(每层抽1个单元)L=6,n=6,f=6/30.(4)以列为层的分层随机抽样(每层抽1个单元)L=5,n=5,f=5/30.抽样调查第7章系统抽样(5)简单随机抽样n=5,f=5/30.(6)简单随机抽样n=6,f=6/30.抽样调查第7章系统抽样【评价】将此结果与上例结果比较我们不难发现:(1)简单随机抽样的方差未变,说明简单随机抽样的结果与顺序无关;(2)系统抽样、整群抽样以及分层抽样都与单元顺序有关,这表明在选择抽样方式时,必须尽可能多地掌握有关单元的顺序和总体结构和特点。(3)本例中分层抽样方差的结果优于简单随机抽样,而简单随机抽样优于系统抽样和整群抽样。抽样调查第7章系统抽样【例6.5】
设某个总体有N=32个单元,总体单元排列显然有稳定上升的趋势。我们要产生一个样本量为4的等距样本,将总体单元排列如下表,k=8,n=4,每一列都是一个等距样本。共8个等距样本。抽样调查第7章系统抽样层ⅰⅱⅲⅳ等距样本编号层平均3.7511.521.87532.251234567817172718182838203031120314122434514243461625367162738总数5255616574778388------N=32,k=8,n=4等距样本数据抽样调查第7章系统抽样
显然,层内有正相关,前4个样本与各层均值的离差都是正数,后4个样本与各层均值的离差都是负数,由性质4,当时,系统抽样的精度低于分层随机抽样.层内方差与总方差分别为:抽样调查第7章系统抽样
因此,简单随机抽样均值估计的方差、分层随机抽样均值估计的方差以及等距抽样均值估计的方差如下:抽样调查第7章系统抽样【例7.3】利用例7.2的数据,但将第二层与第四层的观察值次序颠倒,数据见下表:层ⅰⅱⅲⅳ等距样本编号层均3.7511.521.87532.251234567811617381161836314203431220344112431582430682528772727总数7271716970676768------抽样调查第7章系统抽样
显然,等距样本内数据与各层均值得离差有正有负,例如第一个等距样本对各层均值的离差分别为-2.75,4.5,-4.875,5.75.该样本内六对离差组合中四对的乘积是负数.因此,由性质4,,系统抽样的精度高于分层随机抽样.
数据顺序的这种改变不会影响简单随机抽样均值估计的方差和分层随机抽样均值估计的方差。这时等距抽样均值估计的方差为:抽样调查第7章系统抽样
本例中,等距抽样比简单随机抽样和分层随机抽样都更有效。由此可见,相对于分层随机抽样和简单随机抽样来说,系统抽样的效率很大程度上取决于总体性质。即使是相同的总体数据,对于不同的单元排列顺序,就有不同的样本群内方差或相关系数从而系统抽样估计量的方差也就不同。因此,若要有效地采用系统抽样,必须先了解总体的特征。抽样调查第7章系统抽样§6.3方差估计及其改进一、方差的近似估计
虽然有各种各样的估计量方差的理论公式,但难以得到抽样估计量方差的无偏估计,这是系统抽样的最大的缺点。因此,许多从事抽样设计的业者在决定是否采用系统抽样时往往犹豫不决。为此,我们分别针对几种不同总体模型,介绍几种近似估计方法,以期选择较为合适的估计量。抽样调查第7章系统抽样(1)随机次序排列的总体
按照无关标志排列的总体单元,可以看着是随机排列的。在这种情况下,系统抽样方差与简单随机抽样方差是相等的。即总体单元按随机排列顺序时,就可以采用简单随机抽样的方差作为系统抽样的方差估计。抽样调查第7章系统抽样方差估计为:估计量的方差为:抽样调查第7章系统抽样趋势排列情形当总体存在或很易找到与研究变量相关程度较高的辅助变量作为排序依据时,或是自然的排列顺序与总体单元的变量值的大小分布呈现某种相依或相悖的趋势时,总体单元的排列顺序就处于趋势排列状态,其中线性趋势最为典型。对于来自趋势排列总体的等概系统样本,通常可视为分层样本,其整体均值的估计为:抽样调查第7章系统抽样抽样方差的无偏估计为:抽样调查第7章系统抽样二、线性排列情形抽样与估计的改进1.线性趋势的总体若总体单元按指标值从小到大顺序排列或按某个与其有线性相关的辅助变量的大小顺序排列,此时指标值与单元序号也线性相关.这种按有关标志排列的总体称为线性趋势的总体,如下图所示.抽样调查第7章系统抽样我们先假定一种简单的线性趋势总体,即单元指标值是单元序号i的线性函数,即经过线性变换后,记以下仍用表示系统抽样抽样调查第7章系统抽样在具有线性趋势总体下,比较系统抽样的方差、简单随机抽样的方差、分层随机抽样的方差它们的差别。当时,有故总体均值总体方差抽样调查第7章系统抽样从而简单随机抽样的方差:分层随机抽样的方差:系统抽样的方差:比较三式可知等号当且仅当时成立。抽样调查第7章系统抽样2.对线性趋势总体的系统抽样法的改进虽然严格的线性趋势排列总体在实际问题中很难成立,但其结论在定性上还是适合的.为了使系统抽样法达到更高的精度,有必要对线性趋势总体的系统抽样法进行改进.主要有两个途径:一种是抽样方法的改进;(如中心位置抽样法和对称系统抽样法)另一种是估计方法的改进(如首尾校正法).(1)中心位置抽样法初始样本不是随机抽取,而是直接取第一段的n个单元中处于中间位置的单元.抽样调查第7章系统抽样中点取奇数时,当k为偶数时,当k为中点取(2)对称系统抽样法Sethi对称系统抽样法(P206)Singn对称系统抽样法(P207)(3)首尾校正法Yates首尾校正法Bellhouse和Rao首尾校正法(见P205)抽样调查第7章系统抽样Bellhouse和Rao首尾校正法如果初始单元编号r较大,满足r+(n-1)k>N,则有越过单元N的样本单元有n2个,相应的权数如下:抽样调查第7章系统抽样【例7.4】总体有23个单位,拟抽取n=5,则取与之最近的整数k=5。然后在总体中随机抽取一个单位作为起点,假设抽中r=19,样本单位的顺序编号分别为:19,1,6,11,16。首样本单元为,尾单元为。求相应单元的权数。,6.4==nNk抽样调查第7章系统抽样解:由于其他3个样本单元的权数为:0.2首样本单元的权数为:尾样本单元的权数为:抽样调查第7章系统抽样三、周期波动的总体
周期性波动是指总体单元指标值按其顺序程周期性变化.例如商店的日销售额以7天为周期变化,一般周末为销售高峰期,周一、周二下降;城市交通量以24小时为周期变化,上下班时间为高峰期。对于周期性波动总体,使用系统抽样一定要特别注意。系统抽样的估计效果与抽样间距k及单元指标值的变化周期直接的关系。抽样调查第7章系统抽样§7.4系统抽样的方差估计
系统抽样法的缺点之一,就是很难得到估计方差的无偏估计。本节介绍几种形式相对简单的估计方法,这些方差估计方法只能进行近似计算而且不同的方法适应于不同的总体模型。一、等概系统抽样的方差估计我们讨论用估计总体均值时的方差的估计。(一)系统样本来自随机排列总体系统样本可视为简单随机样本,从而可用简单随机抽样下的抽样方差的无偏估计:抽样调查第7章系统抽样(二)系统样本分层随机抽取如果把系统样本看成从各层抽取两个单位分层随机抽样,可采用以下方法。1。从第二个样本单元开始,每个样本单元与前一个样本单元组成一对,共n-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CCS 011-2023采煤工作面智能化接续设计要求
- T/CCMA 0150-2023工业车辆用氢燃料电池动力系统技术规范
- T/CCBD 16-2022品牌价值评价环境保护企业
- T/CCAS 012-2019水泥密度测定方法(气体置换法)
- T/CBIA 009-2022饮料浓浆
- T/CARSA 3-2022商业遥感卫星运控及数据接收流程
- 副科面试题及答案
- 呼叫中心面试题及答案
- 阜阳语文面试题及答案
- 六上科学第一单元教学设计
- GB/T 2410-1980透明塑料透光率和雾度试验方法
- 六年级英语下册单词和短语默写版广州
- 矿井火灾防治课件
- 中考物理复习杠杆和滑轮课件
- 办公室拟办意见范文(优选十八篇)
- 最新安全生产管理教材电子版
- (完整版)马克思主义基本原理概论知识点
- 地表水水质自动监测站运行维护技术规范
- 健康证申请证明(通用)
- GB∕T 10054.1-2021 货用施工升降机 第1部分:运载装置可进人的升降机
- 生物安全委员会及组织架构
评论
0/150
提交评论