




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、森林资源抽样技术森林资源抽样技术 n性质性质:抽样调查是获取统计资料的重要手段,在社会、经济、科研等领域有着广泛的应用。抽样技术是统计学研究中的一个重要分支。主要介绍抽样技术的基本理论,是统计学专业的一门专业必修课。n内容内容:介绍一些基本的概率抽样方法,包括简单随机抽样、分层抽样、整群抽样、多阶抽样、等距抽样(系统抽样)及不等概率抽样等,着重讨论稀疏资源抽样调查、抽样设计的理论。对非抽样误差、调查实务(例如问卷设计、调查报告撰写等)作简要介绍。n要求要求:了解抽样技术的统计理论;了解六种基本抽样方法的原理、统计推断方法及抽样设计技术,重点了解稀疏资源抽样调查及其实际应用。我国森林调查体系我国
2、森林调查体系:一类调查一类调查(1)定义:国家森林资源连续清查)定义:国家森林资源连续清查(简称一类清查简称一类清查)是以掌握宏观森林资源现状与动态是以掌握宏观森林资源现状与动态为目的,以省(直辖市、自治区,以下简称省)为单位,利用固定样地为主进行为目的,以省(直辖市、自治区,以下简称省)为单位,利用固定样地为主进行定期复查的森林资源调查方法,是全国森林资源与生态状况综合监测体系的重要定期复查的森林资源调查方法,是全国森林资源与生态状况综合监测体系的重要组成部分。森林资源连续清查成果是反映全国和各省森林资源与生态状况,制定组成部分。森林资源连续清查成果是反映全国和各省森林资源与生态状况,制定和
3、调整林业方针政策、规划、计划,监督检查各地森林资源消长任期目标责任制和调整林业方针政策、规划、计划,监督检查各地森林资源消长任期目标责任制的重要依据。的重要依据。(2)内容:)内容:土地利用与覆盖:包括土地类型(地类)、植被类型的面积和分布土地利用与覆盖:包括土地类型(地类)、植被类型的面积和分布森林资源:包括森林、林木和林地的数量、质量、结构和分布,森林森林资源:包括森林、林木和林地的数量、质量、结构和分布,森林按起源、权属、龄组、林种、树种的面积和蓄积,生长量和消耗量及按起源、权属、龄组、林种、树种的面积和蓄积,生长量和消耗量及其动态变化其动态变化生态状况:包括森林健康状况与生态功能,森林
4、生态系统多样性,土地沙化生态状况:包括森林健康状况与生态功能,森林生态系统多样性,土地沙化、荒漠化和湿地类型的面积和分布及其动态变化、荒漠化和湿地类型的面积和分布及其动态变化 我国森林调查体系我国森林调查体系:二类调查二类调查 (1)定义:森林资源规划设计调查)定义:森林资源规划设计调查(简称二类调查简称二类调查)是以国有林业局是以国有林业局(场场)、自然保护区、自然保护区、森林公园等森林经营单位或县级行政区域为调查单位,以满足森林经营方案、森林公园等森林经营单位或县级行政区域为调查单位,以满足森林经营方案、总体设计、林业区划与规划设计需要而进行的森林资源清查。调查成果是建立总体设计、林业区划
5、与规划设计需要而进行的森林资源清查。调查成果是建立或更新森林资源档案,制定森林采伐限额,进行林业工程规划设计和森林资源或更新森林资源档案,制定森林采伐限额,进行林业工程规划设计和森林资源管理的基础,也是制定区域国民经济发展规划和林业发展规划,实行森林生态管理的基础,也是制定区域国民经济发展规划和林业发展规划,实行森林生态效益补偿和森林资源资产化管理,指导和规范森林科学经营的重要依据。效益补偿和森林资源资产化管理,指导和规范森林科学经营的重要依据。(2)内容:)内容: 核对森林经营单位的境界线,并在经营管理范围内进行或调整核对森林经营单位的境界线,并在经营管理范围内进行或调整(复查复查)经营区经
6、营区 调查各类土地的面积;调查各类土地的面积; 调查各类森林、林木蓄积;调查各类森林、林木蓄积; 调查与森林资源有关的自然地理环境和生态环境因素;调查与森林资源有关的自然地理环境和生态环境因素; 调查森林经营条件、前期主要经营措施与经营成效调查森林经营条件、前期主要经营措施与经营成效一类二类森林资源调查特点一类二类森林资源调查特点n调查目的不同。一类是导向国家制定林业政策和发展调查目的不同。一类是导向国家制定林业政策和发展国家林业战略,调查要求更加系统严格和规范以及完国家林业战略,调查要求更加系统严格和规范以及完备抽样理论和设计;二类是导向本地和林业经营单位备抽样理论和设计;二类是导向本地和林
7、业经营单位的森林经营制定,抽样和样地设计调查比较粗放(例的森林经营制定,抽样和样地设计调查比较粗放(例如有经验的目视和角规点)如有经验的目视和角规点)n抽样设计不同。一类调查是系统抽样设计,具有完备的抽抽样设计不同。一类调查是系统抽样设计,具有完备的抽样理论和设计;二类是典型调查和角规点调查,不是基于样理论和设计;二类是典型调查和角规点调查,不是基于抽样统计设计抽样统计设计n样地数量不同。一类是基于严格的数理统计确定,二类是样地数量不同。一类是基于严格的数理统计确定,二类是考虑不同林分和区划确定(要求每个林分和小班都有样地考虑不同林分和区划确定(要求每个林分和小班都有样地,因此样地数量很多),
8、因此样地数量很多)n一类样地是每一类样地是每5年发布一次,二类数据一般是每年发布一次,二类数据一般是每10年一年一次次存在的问题存在的问题n二类数据大于一类数据n从抽样统计原理的观点来看,简单相加二类数据来估计一省森林资源数据只是一个近似结果,不是一个有效的抽样统计结果n因此,现阶段将一类和二类调查体系结合存在困难n有机耦合一类二类资源调查结果的条件:抽样设计和样地设计一致相同稀疏总体调查稀疏总体调查n稀疏总体调查包括:生物多样性的调查、森林中病虫害发生分布的调查、林下非木质资源(non-timber)调查、森林中的倒木和珍贵濒危树种分布的调查 、林外的群立木、簇立木或林外的散生木的调查等等n
9、空间分布特点:稀疏(rare)、群团状(cluster)、散生状(spread)和条状(strip)等自然分布 与传统抽样方法比较与传统抽样方法比较n传统抽样方法(如简单随机抽样、分层抽样和系统抽样等等):1.调查总体观察值总和均值前要确定样地单元总数 2.不依赖于抽样总体分布,即选择概率函数是非零的或者是常数,与总体单元内观察值的大小无关3.以郁闭的森林资源的林地为主要调查目标4.对稀疏总体的估计是有偏估计n传统抽样方法没有考虑稀疏总体明显存在的空间分布差异 ,缺乏针对性,将必然导致调查成本大幅攀升和/或估计结果出现显著偏差 稀疏资源抽样方法比较稀疏资源抽样方法比较n针对稀疏、簇生和聚集分布
10、总体的抽样方法(如线截法、带抽样、样线法、适应性群团抽样等)较传统的抽样方法有更多的优点:1.在相同抽样工作量情况下估计量方差将会更小,获得更多的信息量,抽样估计是无偏的2.抽样设计灵活3.能够提高具有稀少且群聚特征总体的抽样效率,弥补了传统抽样方法失效、最终样本中观测目标信息几乎为零的缺点n在森林资源调查目标由传统的林木资源调查向森林多资源调查方向转变和发展 的形势下,研究针对稀疏总体的抽样方法是很有意义的,这里主要介绍近年来研究应用较多的三种方法:1.线截法(Line intersect sampling)2.带抽样(strip sampling )3.样线法(Line transect
11、sampling)4.适应性群团方法(Adaptive cluster sampling)一、线截法n线截抽样(Line intersect sampling,简称LIS),由Canfield提出并在1960s得到发展应用n适用于稀疏总体,抽样调查 伐倒木和薪才总量估计公路长度关于生物多样性的调查(如倒木数量的估计) 线截法估计方法线截法估计方法 n设某区域内一条线,则与该线相交的所有目标入样,每棵树的概率取决于入样线长度L和树的有效长度 ,如果将树看成一条线,则可直接根据其与抽样线所成的夹角 计算, l= sin( )l l ll样线调查目标线截法估计方法线截法估计方法n树i的有效长度的平均
12、值为 每单元面积A的目标变量总数,依据Horwitz-Thompson estimator估计为: (1) 式中: 2( ( )iilE l2( )( ( )nniiiillE l11()nilyTLl (数量/面积A)00sin( ) cos( )(cos( ) cos(0)( 1) 1)2E( ) E( sin( )E(sin( )dllllllll 线截法估计方法线截法估计方法则每平方米总量的估计值为: (2) 式中:L为线(m个)的总长度(米)、li为树i的长度(米)、 yi是第i单元目标变(如蓄积、质量、长度)、m为观测单元数量。 12miliyTLl (数量/平方米)线截法估计方法
13、线截法估计方法n若森林蓄积用Hubers公式定义为 ,式中di是第i棵树的直径(cm),则前面公式(2)可改为 ; 若要估计倒木长度,利用(2)即可,若估计其它值如每公顷倒木数量,则还需测得树的长度。nLIS估计量的方差可由线间方差算得: 式中n为线数、 为线j的每公顷总蓄积、 为研究区域的每公顷蓄积、Lj为线j长度。 22iiidvl1nijLjTT1(1)njjnL ( )2/ ( )Var T jTT2218milTdL (立方米/公顷)二、带抽样n带抽样(strip sampling )可以看成样地面积很大的样地抽样调查,根据计算,最简单情况是将研究区域分成N个非交叠样带,从中随机抽选
14、n个样带。样带可以间隔一定距离抽选,也可以重叠(部分)抽选。 n特点及适用情况:特点及适用情况:1.带抽样经常用于稀疏总体调查2.相对于点抽样,既然该法相对于普通样地调查典型地覆盖了大面积区域,则意味着用于活立木调查时工作量很大3.由于某方位两带状样地自相关性很大,该法对于活立木调查效果很低。虽然稀少总体的观测值分离很远,但自相关性并不成问题,当包含稀少总体时可用带抽样方法。 样带布设n将调查总体面积分成N条非重叠的样带,用简单随机方法随机抽取n条样带。n也可以用一定的宽度确定样带,这样可能有重叠。n测量带内的目标带抽样估计n总体蓄积(或其他目标变量): 式中Vi为第i条样带的总蓄积、 Ai是
15、第i条样带的面积、AT为总面积,如果目标为平均每公顷蓄积,那么可估计比率尽可为: RT11niiTTniiVRAAA11niiniiVRA平均值 (m3/hm2)带抽样估计n比率的方差为 : 式中: 为样带平均面积、N为调查区域样带总数、n为抽取的样带。 n总蓄积估计值方差: 21( )xSNnVar RnNTxAN ( )/( ), 2S21niiV221niiRA12niiiRAV1n()RVar T2( )TVar R Ag221TxSNnAnN三、样线法三、样线法 n样线法(Line transect sampling,简称LTS)是以观测目标所在的样线为基础的,样线可以是在地面设桩,
16、或者是在图像上和其他方式。调查人员可以徒步或乘车和空中飞行。这种方法主要用于估计野生动植物总体密度。设目标随机分布在区域内,设观察目标i的概率取决于距线的距离,如距离越长观测概率越小。 n样线调查方法的内容一般都要包括样线布设、数量调查和密度计算样线抽样图解样线抽样图解样线法样线布设样线法样线布设n样地布设1.随机布设2.系统布设n估计方法1.窄带法2.目视修正法3.参数法4.非参数法核函数估计富利叶级数法L00B随机抽样L00B系统抽样样线抽样估计方法样线抽样估计方法1.窄带法(Narrow-Strip method):密度为单位面积的个体数目,即条带内动物数量除以条带面积 (1) 式中,D
17、为野生动物种群密度;y0为条带内探测到的野生动物数量;L为样线总长度;w0为单侧样线宽度(米)。窄带法是最为常用的传统方法,简单易行,但是单侧样线w0宽度需要根据生境和野生动物的特点以及调查人员的实际观察能力进行经验估计。002yDLw (数量/m2)(一)窄带法n例:样线长L100米,有18个目标(如鸟和病虫害树木等)分别在距离样线0,0,1,3,7,11,11,12,15,15,18,19,21,23,28,33,34,44米。如何使用(1)式估计目标值密度(株/每公顷)。首先画以10米间隔的目标探测直方图;找到以直方图显著变化的距离所对应的目标探测数量,就为带宽w0的值。 密度值为:图图
18、1120.0032 20 100D样线距离1086420 10 20 30 40 50探测目标数目即30个/公顷(一)窄带法n特点:a)计算简单,但并不完全满意因为所有观察目标没有被用到估计;b)带宽w的确定有点强制性;c)探测目标率是随着样带宽度逐渐减少。n目视修正法(目视修正法(Smooth-by-eye method):为了使窄带法的直方图接近概率密度函数f,首先选择间隔宽度,然后用下面表达式确定一定距离x的直方图高 n特点:引入探测密度函数概念;因为间隔宽和目视探测密度的选择带有主观,所以不同人估计的结果不同。建立在相同概念,后面的参数方法能够克服这些不足。(二)目视修正法00( )y
19、xywf x在间隔距离内的观察数总观察数 间隔宽度(二)目视修正法n根据上面图1柱状图,第一个10米间段探测到5个目标,即5/(1810)=0.028;第二个10米间段探测到7个目标,值为7/(1810)=0.039;同样地后三个间段值分别为0.017、0.011和0.006,据此画出直方图,如图2n由概率密度表达式,种群密度可以表达为图图20.080.060.040.020.00 10 20 30 40 50样线距离探测密度(0)2y fDL (数量/m2)(三)参数法n由上面两种方法,得知关键是对f(0)和带宽w的估计,假设它们之间的关系为: ,由上式知道其中之一,则可估计f(0)或w 。
20、 n假如n个被观察到的调查对象的垂直距离x1, x2, xn 满足相互独立性。这些从样线到调查对象的垂直距离x被给出时,我们把调查对象被观测到的条件概率定义为探测函数g(x),g(x)是x的单调减少函数,当调查对象在样线上时,概率是1(g(0)=1)。被发现的调查对象的距离x的概率密度函数f(x)可以通过探测函数g(x)和带宽w来表示:f(x)=g(x)/w n为了估计f(x),使用最大似然估计方法估计探测函数的未知参数,就可得到f(0)或w的估计值为 或 。(0)f1(0)fw w(三)参数法n广泛应用的探测函数为指数函数指数函数形式,即g(x)=exp(-x/w)。最大似然估计为 ,即探测
21、目标距离的平均值。n拟合的指数曲线为图2曲线n依据上面的例子可以计算探测函数为指数形式的密度估计为: 22yyDLwLx =18/2(16.39)(100)=0.0055=55(数量/公顷) w x0.080.060.040.020.00 10 20 30 40 50样线距离探测密度g(x)(三)参数法n探测函数为指数曲线的估计特点: 1、简单容易估计 2、对种群总体估计不理想(曲线可看出) 所以人们一般选择“肩形”探测曲线加以修正。n如果假设探测函数为半正态函数g(x)=exp(-3.14x2/4w2),参数w的最大似然估计为: 以上面为例计算结果为: =25.61,则 拟合的半正态函数曲线
22、见图3。 图图323.1421yiyiwx wD= 18/2(25.61)(100)=0.0035=35(数量/公顷)0.080.060.040.020.00 10 20 30 40 50样线距离探测密度g(x)(四)非参数法n为了避免参数函数未知的探测函数的曲线形状,可以使用非参数函数估计方法,也就是直接估计概率密度函数f(0)。有两种方法估计f(0): 1、核函数方法估计(Kernel method) 2、富利叶级数方法(Fourier series method) 1 核函数方法 式中:h是带宽,xj是第j个观察目标值,K是核函数(这里假设为对称核函数 ) 从式中可以知道关键是估计h,
23、Silverman(1986) 给出了h的计算公式: 式中a=min (s, Q/1.34), s为x抽样样本目标观察值距样线的距离的标准差,Q是所有调查目标距离沿样线距离的中位值。 依据上面案例,中位值为15,计算的s12.56,得到a=min(12.56, 15/1.34=11.19)则窗宽h=0.9(11.19)(18)(-1/5) =5.65,核函数f(0)的估计为: 调查目标的密度: 2(1/2)(/ )221211(0)( )jjyyxx hyhhyhjjfKe1/50.9hay22220 /2(5.65)44 /2(5.65)218(5.65) 2(0).0.0376fee(0)
24、18(0.0376)0.003422(100)yfDL2(数量/m )2 富利叶级数法 n富利叶级数方法估计f(0) 式中:Ak是参数, f(0)为当垂直距离为0时发现目标个体的概率的密度函数;k依次取1、2、3、4、5等自然数;M为k的上限临界值,一般= C, 在最初样点上增加样方;否则,不增加包含概率包含概率(Inclusion probability):理解为网络Ai所包含单元的概率(不能从抽样数据中计算,实际计算中用偏边缘包含概率(PIP)代替)。非常重要的参数,是计算Horvitz-Thompson估计值的主要参数,计算式为:yi1/11kkNxNnnN-总的取样单元数,xk-在网络
25、Ak中总的单元数,n1-最初取样点数选择概率选择概率(Selective probability):是计算Hansen-Hurwitz估计值的主要参数()!11!1 !NNnnNn骣 =-桫选择概率和包含概率的计算选择概率和包含概率的计算总面积20D的面积4C 的面积4B的面积3O 的面积10A的面积1包含单元o的包含概率p(s)=0.75案例案例( (标准值标准值1010)(1)SRS2)ACS?=1/3(2+54+38)=31.3 ACS方法均值和方差估计方法方法均值和方差估计方法目前目前ACSACS有三种方法计算平均值和方差有三种方法计算平均值和方差(1)(1)Hansen-Hurwit
26、z Estimator (HH)Hansen-Hurwitz Estimator (HH)基于网络内均值基于网络内均值wi,wi,不考虑边缘单元不考虑边缘单元(2) Horvitz-Thompson Estimator (HT)(2) Horvitz-Thompson Estimator (HT)yk*为第k个网络内观察值和k为最初抽样入样第k个网络的包含概率jk表示最初抽样单元在第j个网络和第k个网络同时入样的包含概率 不考虑边缘单元是因为边缘单元不确定1jjkkjkNxNxxNxnnnNn(3) Rao-Blackwell Esimator (RB)(3) Rao-Blackwell Es
27、imator (RB)nTen networks samplednNetwork totals (yk*)nNine 0s and one network with an 11nIntersection probabilities (k)nFor network with 1 unit, k=0.025nFor network with 10 units, k=0.226nJoint intersection probabilities (jk)nFor 2 small networks, jk = 0.00056nFor small and large networks, jk = 0.00
28、515计算案例计算案例1217. 0226. 011025. 00025. 004001HT0115. 0226. 01226. 01114001r a v222HT密度估计:密度估计:方差估计:方差估计:20406080100120Final sample size0.40.81.21.6EfficiencyABCA B群团多群团多和小和小CV:1.345,6.75%群团少和大群团少和大CV:1.3网络内方差网络内方差44占有率占有率6.75%C群团少群团少和小和小CV:348%3.5%效率比较结果效率比较结果050100150200Number of quadrats0.00.20.40.
29、60.81.0Probability of sampling uncommon speciesAdaptive quadratsInitial quadrats适应性群团能提高探测稀疏物种的能力适应性群团能提高探测稀疏物种的能力3、估计方法研究估计方法研究(1) Thompson(1990)Thompson(1990)首先提出首先提出修正的修正的Hansen-HurwitzHansen-Hurwitz和和Horvitz-ThompsonHorvitz-Thompson两个无偏估计量,并给出了详细的算法两个无偏估计量,并给出了详细的算法。 同时,同时,Thompson(1990)Thompson
30、(1990) 提出了提出了Rao-BlackwellRao-Blackwell理论的理论的Hansen-Hansen-HurwitzHurwitz和和Horvitz-ThompsonHorvitz-Thompson估计量,但是没有给出算法,是估计量,但是没有给出算法,是因为计算复杂。因为计算复杂。 Salehi(1999)Salehi(1999)导出了容易计算的导出了容易计算的Rao-BlackwellRao-Blackwell理论的理论的Hansen-HurwitzHansen-Hurwitz和和Horvitz-ThompsonHorvitz-Thompson估计量估计量的算法,并用实例的算
31、法,并用实例说明了两个估计量算法的详细计算过程。说明了两个估计量算法的详细计算过程。nBrown and Manley(1998)Brown and Manley(1998)为了减少为了减少ACSACS抽样的最终抽样的最终样本数量,提出了限制性的样本数量,提出了限制性的ACSACS抽样,使用抽样,使用Hansen-ansen-HurwitzHurwitz和和Horvitz-ThompsonHorvitz-Thompson估计量估计,估计是有估计量估计,估计是有偏的偏的nSalehi and Seber (2002)Salehi and Seber (2002)认为认为B&M(1998)
32、B&M(1998)的估计有的估计有偏,基于偏,基于MurthyMurthy(19571957)估计方法,他们提出限制性估计方法,他们提出限制性ACSACS抽样的无偏估计,并用实例说明了两个估计量抽样的无偏估计,并用实例说明了两个估计量算法的详细计算过程。算法的详细计算过程。为了避免选择过多且不能提高估计精度的边缘单元,为了避免选择过多且不能提高估计精度的边缘单元,Salehi and Smith (2005)提出)提出二阶段序贯适应性群二阶段序贯适应性群团抽样及估计方法团抽样及估计方法3、4、适应性群团抽样设计适应性群团抽样设计 最初抽样设计方法、标准值、邻域形式和估计方法以及样地调查
33、成最初抽样设计方法、标准值、邻域形式和估计方法以及样地调查成本等因素的不同组合将会导致大量不同的适应性群团抽样设计(特本等因素的不同组合将会导致大量不同的适应性群团抽样设计(特别是标准值大小)别是标准值大小) 最终抽样样本量的随机性或不确定性最终抽样样本量的随机性或不确定性. . 因为最终抽样样本量的随机性或不确定因为最终抽样样本量的随机性或不确定性使得人们在调查前无法确定最终抽样样本量以及抽样调查的成本性使得人们在调查前无法确定最终抽样样本量以及抽样调查的成本 主要几种限制适应性群团抽样最终样本量的抽样设计主要几种限制适应性群团抽样最终样本量的抽样设计Condition = yi c, ma
34、ke the condition more restrictive (i.e., make c a bigger number) so that adaptive sampling is triggered less often.如何控制最终样本量(如何控制最终样本量(1)00100100032002010014120070310014021006000040036000071001111005010000010010003200201001412007031001402100600004003600007100111100501000A (yi0)B(yi1)限制最终抽样样本量方法限制最终抽
35、样样本量方法 叫停规则(如何确定标准值叫停规则(如何确定标准值C C) C大,网络包含的单元数(大,网络包含的单元数(network)减少以致减少边界单减少以致减少边界单元,对于比较稀疏和低密度的总体,元,对于比较稀疏和低密度的总体,ACS的效率减少。的效率减少。 C小,网络包含的单元数(小,网络包含的单元数(network)增加以致增加边界增加以致增加边界单元数,对于比较稀疏和低密度的总体,单元数,对于比较稀疏和低密度的总体,ACS的效率增加,的效率增加,但是可能无限制的继续抽样但是可能无限制的继续抽样, 抽样成本也将增加。抽样成本也将增加。O 是最初抽样单元是最初抽样单元邻域为一次邻域为一
36、次4单元单元S1,S2和和S3为为1,2和和3阶叫停阶叫停灰色单元为边缘单灰色单元为边缘单元元叫停规则适应性群团抽样示意图叫停规则适应性群团抽样示意图一次一次4单元和一次单元和一次2单元叫停群团抽样图单元叫停群团抽样图对于交叉型的样方(对于交叉型的样方(cross pattern), ,S=3的的叫停规则有叫停规则有24个自适个自适应群团样方应群团样方 对于线性型的样方对于线性型的样方(linear pattern), ,S=4的叫停规则最的叫停规则最大有大有8个自适应群团个自适应群团样方样方叫停规则的特点叫停规则的特点 自适应群团抽样设计的理论基础发生改变,可能导致不完全的网络(例如网络重叠
37、); 发生与总体格局不一致的变化。 相反,不使用叫停规则能在一定临界值条件下使网络完全分离,从而形成唯一的总体分化。这种分化(partition)是 HH和HT无偏估计的理论基础,因此如果使用叫停规则可能导致偏的估计。 限制性的适应群团抽样(限制性的适应群团抽样(Brown 1994)Brown 1994)(1)(1)确定最终样本数量确定最终样本数量n n(2)(2)按照序列形式选择最初抽样单元按照序列形式选择最初抽样单元(3)(3)当最初抽样单元和按照标准值所增加的单元等于或大当最初抽样单元和按照标准值所增加的单元等于或大于(于(1 1)所确定的样本数量)所确定的样本数量n n就停止就停止估
38、计方法采用修正的估计方法采用修正的HHHH和和HTHT,发现有偏。然后用发现有偏。然后用BootstrapBootstrap方法估计有偏量,用于调整方法估计有偏量,用于调整HHHH和和HTHT的有偏估计的有偏估计标准条件 0,邻域形式:一阶4单元,最初抽样方法:SRS,n1=10,当样本容量 15 停止,最后结果:最终样本量15,但只有n1=5限制性群团抽样过程示意图限制性群团抽样过程示意图 二阶段适应群团抽样(二阶段适应群团抽样(Salehi 1997)Salehi 1997)总体单元总体单元N200分成分成m=8个一级单元样方个一级单元样方(PSUs)用不放回用不放回SRS方法抽取方法抽取
39、4个个PSUs(如图中如图中1,2,3,8)在在4个个PSUs中的每个中用不中的每个中用不放回放回SRS方法抽取方法抽取3个二级个二级单元样方(图中单元样方(图中O)最后按照一次最后按照一次4单元邻域单元邻域和标准值(和标准值(y0)增加样方增加样方单元单元可以分成重叠(横跨可以分成重叠(横跨2个二级单元)和不个二级单元)和不重叠估计,但不重叠效率更高重叠估计,但不重叠效率更高 调整的调整的二阶段适应性群团抽样(二阶段适应性群团抽样(Muttlak 2002)Muttlak 2002)总体总体N200用不放回用不放回SRS抽取抽取12个样方单元(个样方单元(x)在最大的网络中随机在最大的网络中
40、随机抽取抽取3个样方单元,其个样方单元,其余余11个小网络计数个小网络计数导出了无偏估计公式导出了无偏估计公式 逆的逆的适应群团抽样(适应群团抽样(Inverse ACS)Inverse ACS)(Christman 2001)(Christman 2001)限制性限制性ACSACS在稀少分布的总体抽样可能不能产生足够量的或大量的样本在稀少分布的总体抽样可能不能产生足够量的或大量的样本量量(1 1)抽样前规定最初抽样单元)抽样前规定最初抽样单元n1n1中非零观察值的样本数量中非零观察值的样本数量k k2 2(2 2)如果最初抽样单元数量)如果最初抽样单元数量n1n1中不满足中不满足k k2 2
41、,则增加最初抽样单元数,则增加最初抽样单元数量,直至满足条件量,直至满足条件k k停止停止导出了总体均值的估计公式,但是方差估计比较复杂导出了总体均值的估计公式,但是方差估计比较复杂 限制性逆的限制性逆的适应性群团抽样(适应性群团抽样(Constrain Constrain Inverse ACS) (Rocco 2003)Inverse ACS) (Rocco 2003)与与IACSIACS设计基本相似,不同是对设计基本相似,不同是对2 2个非零观察值的处理方法个非零观察值的处理方法(1 1)保留满足最后一个非零观察值的最终抽样样本量)保留满足最后一个非零观察值的最终抽样样本量(2)拒绝满足
42、最后一个非零观察值的最终抽样样本量)拒绝满足最后一个非零观察值的最终抽样样本量 次序统计量和叫停规则的联合抽样设计次序统计量和叫停规则的联合抽样设计(Su 2003)Su 2003)对抽样总体很难预先确定临界值, 而临界值的大小直接影响最终抽样数量,因此为了获得抽样精度和抽样效率,Su et al(2003)在抽样设计中提出了偏差小的次序统计量(order statistics)方法来确定临界值。 一般经常采用次序统计量方法来确定临界值,所以临界值临界值大小随序列而确定大小随序列而确定,即临界值为Cy(n1-r),与最初ACS抽样技术事先确定的临界值不同。最初样本量为n11()nrcy即:111(1)(2)()(1)( ).n rn rnyyyyy 抽样设计案例抽样设计案例:单元数单元数10个,个,y值给定,总体值给定,总体 283 ,平均,平均数数28.3,方差,方差860.4556
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 行政管理经济法专注考点试题及答案
- 市政工程考试趋势与未来展望及试题及答案
- 行政管理与经济法教育试题及答案
- 酒店管理服务培训合作协议
- 物流管理与供应链知识测试卷
- 通信技术与网络应用知识考点
- 行政管理经济法热点追踪试题及答案汇编
- 经济师学术与实务结合试题及答案
- 优化药品使用管理的工作思路计划
- 宿舍门标设计
- 心脏骤停和心源性猝死诊疗规范诊疗指南
- 建筑智能化弱电系统建设项目设计方案建筑施工
- 航道治理工程施工组织设计
- 马工程教材《公共财政概论》PPT-第四章 政府消费支出
- GB/T 29531-2013泵的振动测量与评价方法
- GA/T 832-2014道路交通安全违法行为图像取证技术规范
- 博士生招生面试评分表
- SWOT分析法很全面课件
- 膀胱造瘘的护理课件
- 消防应急疏散演练人员签到表(标准通用版)
- 陕旅版五年级英语上册句型词汇知识点总结
评论
0/150
提交评论