abi.快速调查中的二级整群随机抽样(doc 10)_第1页
abi.快速调查中的二级整群随机抽样(doc 10)_第2页
abi.快速调查中的二级整群随机抽样(doc 10)_第3页
abi.快速调查中的二级整群随机抽样(doc 10)_第4页
abi.快速调查中的二级整群随机抽样(doc 10)_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、. HYPERLINK 3722 cnshu 中国最庞大的下载资料库 (整理. 版权归原作者一切) 假设您不是在 cnshu 网站下载此资料的, 不要随意置信. 请访问cnshu, 参与cnshu必要时可将此文件解密成可编辑的DOC或PPT格式:.;快速调查中的二级整群随机抽样 在社区安康效力研讨中,快速流行病学评价(rapid epidemiological assessment)是常用的方法。尤其当人力、物力及其它资源有限时,这是一种简单、经济而快速地获取信息的有效方法。该方法可及时提供实时调查结果作为制定决策的根据,当应急事件发生、需求在短时间内对人群安康作出评价时,更显出其独特的作用。

2、在快速流行病学调查中,依然须留意质量控制,比如,做好调查员的培训和组织任务,制定明确、客观的检测规范和详细、严厉的资料搜集方法等。计算机的运用可加快调查和分析进程,在能够的情况下,随机和网络采访等都是有用的技术。 快速流行病学调查评价中常采用多级抽样,二级整群随机抽样(two stage cluster sampling)是一种行之有效、值得引荐的人群调查抽样技术。在第一阶段采用概率比率抽样(probability proportionate to size,PPS)方法,即根据各群的规模按比例分配样本量,从目的人群中抽取假设干“群组;第二阶段再从第一阶段所抽到的各群组中抽取一样人数组成样本。

3、也可以“户为抽样单位,从第一阶段抽到的各群组中随机抽取一样户数,再进展第二阶段的调查。这两种方法分别用不同的公式计算率、均数及相应的可信区间。下面以调查某地人群吸烟行为(吸烟率和平均每日吸烟量)的两个小规模研讨为例进展引见。 1 研讨A (群内察看单位数相等) 1.1 方法 先采用PPS法从目的人群中抽取3个“群组,再用单纯随机抽样(SPS)从每个群组中抽取7人组成样本(图1)。为例如方便,在此仅选择3个群组,实践调查应不少于25个群组,否那么将能够产生偏倚。假设抽取30个群组,那么与世界卫生组织扩展免疫规划(expanded program on immunization,EPI)的抽样设计

4、一样。 1.2 率的计算 吸烟率P为: P=a m(式1) n i=1ai=n i=1m j=1aij(式2) P=n i=1ai nm(式3) 公式(式4)中:P为吸烟率,a为吸烟者数,m为调查人数,n为群组数,ai为各群组中吸烟者数,m为每群组的平均人数。aij表示第i群组,第j个察看对象,如第一群组的第一个察看对象a1,1是吸烟者,那么a1,11;第一群组的第四个察看对象a1,4是不吸烟者,那么a1,40。 群组吸烟率Pi为: Pi=m j=1 m(式4) Pi=1+1+1+0+0+0+0 7=0.43 P2=0+0+0+0+0+1+1 7=0.29 P3=0+1+1+1+1+1+1 7

5、=0.86 该样本人群吸烟率p=3+2+6 37=0.52,即调查对象吸烟率为52。或p=n i=1pi n,p=0.43+0.29+0.86 3=0.52,必需留意此公式适用于各群组抽样人数一样时的样本率估计。 1.3 率的可信区间计算 方差:v(p)=n i=1(pi-p)2 n(n-1)(式5) 率的规范误:se(p)=v(p)=n i=1(pi-p)2 n(n-1)(式6) CI90%(p)=p1.64se(p) CI95%(p)=p1.96se(p) CI99%(p)=p2.58se(p) 该人群吸烟率的95可信区间计算如下: v(p)=(0.43-0.52)2+(0.29-0.52

6、)2+(0.86-0.52)2 3(2)=0.029 se(p)=0.029=0.17 CI95%(p)=0.52(1960.17)=0.520.34,该地人群吸烟率及95可信限为0.52(0.19,0.86)。 1.4 样本均数的计算 平均吸烟量y: 察看对象中的吸烟者每日吸烟量在02包,平均1.5包。y为平均每日吸烟量,yij表示第i群组第j个察看对象(图3)。Yi为样本第i群内察看值之和,T为各Ti的均数。 y=n i=1m i=1 nm(式7)图3 调查对象(同时作为抽样单位和察看单位)每日吸烟量(包/日) Fig 3 Packs smoked per day among person

7、s serving as both sampling units and elementary units y=(1.5+1.5+0.5+0+0+0+0+)+(0+0+0+0+0 +2.0+0.5)+(0+1.0+2.0+0.5+1.5+1.5) 3(7) y=3.5+2.5+7.0 21=13 21=0.62 由于各群组抽取的人数一样,故可用下式估计y: y=n i=1y n(式8) 各群组吸烟者平均每日吸烟量计算如下: y=m j=1yij m(式9) y1=1.5+1.5+0.5+0+0+0+0 7=0.50 y2=0+0+0+0+0+2.0+0.4 7=0.36 y3=0+1.0+2.

8、0+0.5+0.5+1.5+1.5 7=1 y=0.50+0.36+1.00 3=0.62,结果同上式。 1.5 均数的可信区间计算 样本均数的方差和均数的规范误分别为 v(y)=n i=1(yi-y)2 n(n-1)(式10) se(y)=v(y)=n i=1(yi-y)2) n(n-1)(式11) 代入数据计算: v(y)=(0.50-0.62)2+(0.36-0.62)2 +(1.00-0.62)2 3(2)=0.038 se(y)=0.038=0.19 CI95%(y)=0.621.960.19)=0.620.38,0.62(0.24,1.00) 假设排除了偏倚和混杂,可以为该人群平均

9、每日吸烟量有95的能够是0.241包。 2 研讨B (群内察看单位数不等) 2.1 方法 第一阶段的抽样方法与研讨A一样,采用PPS法从目的人群中抽取3个“群组,而第二阶段是从所抽取的每群组中随机抽取2户进展调查。以“家庭户为抽样单位可以搜集有住户的信息,如每户报刊订阅情况,家庭收入,家庭常用的洗洁剂品牌等。但多数研讨还希望获得有关个人的信息,因此可对所抽中的“户内的察看对象再进展调查,这时的察看单位是“人,但每户被调查的人数不尽一样(图4)。 图4 第一阶段PPS抽样;第二阶段简单随机抽样(SPS), 抽取一样户数 Fig 4 PPS sampling at first stage and

10、SR sampling of equal number of households at second stage 研讨B所抽取的家庭户,每户有13人,6户共有13人。以m表示该对象能否居住本地,本地居民,m=1;非本地居民m=0(非本地居民不作为该研讨的调查对象)。aijk表示第i群组第j户第k个调查对象,如a1,1,11表示第1群组第1户第1个调查对象是吸烟者;a3,2,20表示第3群组、第2户、第2个调查对象是不吸烟者(图5)。 图5 以住户为抽样单位,调查对象(即察看单位,人)的吸烟情况 Fig 5 Packs smoked per day with households servin

11、g as sampling units and persons as elementary units 由于各群组抽取的户数一样(2户),可合并以简化分析。如图6的第1群组第2户第2个调查对象是不吸烟者.a1,2,20,m1,2,21,可表示为a1,50和m1,51(图6)。 图6 各群吸烟人数(抽样单位:户;察看单位:人) Fig 6 Tally of smokers per cluster-households serve as sampling units and persons as elementary units 2.2 率的计算 由于各户察看人数mi不同,a,m和吸烟率P计算公式

12、为 a=n i=1ai=n i=1mi j=1mij(式12) m=n i=1mi=n i=1mi j=1mij(式13) P=n i=1m j=1aij n i=1m j=1mij(式14) 代入数据计算: p=(1+1+0+0+0)+(1+0+1)+(1+1+0+1+0) (1+1+1+1+1)+(1+1+1)+(1+1+1+1+1) p=(1+1+0+0+0)+(1+0+1)+(1+1+0+1+0) (1+1+1+1+1)+(1+1+1)+(1+1+1+1+1) p=2+2+3 5+3+5=7 13=0.54,即样本人群中54是吸烟者。 2.3 率的可信区间计算 v(p)=n i=1(a

13、i-pmi)2 n(n-1)m2(式15) se(P)=v(p)+n i=1(ai-pmi)2 n(n-1)m2(式16) 代入数据计算: v(p)=2-(0.545)2=2-(0.543)2+3-0.545)2 324.32=0.0064 se(p)=0.0064=0.08 CI95%(p)=0.541.960.08)=0.540.16,0.54(0.38,0.70)。 估计该人群吸烟率的95可信区间为3870。 2.4 样本均数的计算 平均吸烟量y: 研讨B抽取的3个群组(共6户)的调查人数及吸烟量如图7所示,第1群组第1户的3人中有2人吸烟,其中1人平均每天吸烟0.5包(y1,1,1=0

14、.5),另1人平均每天吸烟2包(y1,1,2=2)。 图7 调查对象(抽样单位:户;察看单位:人)的每日吸烟量(包/日) Fig 7 Packs smoked per day with households serving as sampling units and persons as elementary units y=n i=1mi j=1yij n i=1mi j=1mij(式17) 以y表示样本人群平均每日吸烟量,yij表示第i群组第j个察看对象的平均每日吸烟量,n表示群组数,mi表示群组i中的察看对象数,mij1为本地居民,mij0为非本地居民。依公式17计算: y=(0.5+2

15、.0+0+0+0)+(1.0+0+1.0) +(1.0+0.5+0+1.5+0) (1+1+1+1+1)+(1+1+1)+(1+1+1+1+1) y=(2.5)+(2.0)+(3.0) 5+3+5=7.5 13=0.58,即该样本人群平均每日吸烟量0.58包。 假设计算吸烟者平均每日吸烟量,式6-19的分母以7取代13; y=(0.5+2.0)+(1.0+1.0)+(1.0+0.5+1.5) (1+1)+(1+1)+(1+1+1) y=(2.5)+(2.0)+(3.0) 2+2+3=7.5 7=1.07 即该样本人群中的吸烟者平均每日吸烟量大于1包。 2.5 样本均数可信区间计算 v(y)=n

16、 i=1(yi-ymi)2 n(n-1)m2(式18) se(y)=v(y)=n i=1(yi-ymi)2 n(n-1)m2(式19) 代入数据计算样本人群平均每日吸烟量的95可信区间为: v(y)=2.5-(0.5852+2.0-(0.583)3 +(3.0-(0.585)2 324.332=0.002 se(y)=0.002=0.005 CI95%(y)=0.581.960.05)=0.580.09,0.58(0.49,0.67) 该样本人群中的吸烟者平均每日吸烟量的95可信区间为: vy=2.5-(1.072)2+2.0-(1.072)2 +(3.0-(1.073)2 3(2)2.332=0.006 se(y)=0.006=0.08 CI95%(y)=1.07(1.960.08)=1.070.15,1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论