(统计学专业论文)美国2000年人口普查事后调查研究.pdf_第1页
(统计学专业论文)美国2000年人口普查事后调查研究.pdf_第2页
(统计学专业论文)美国2000年人口普查事后调查研究.pdf_第3页
(统计学专业论文)美国2000年人口普查事后调查研究.pdf_第4页
(统计学专业论文)美国2000年人口普查事后调查研究.pdf_第5页
已阅读5页,还剩138页未读 继续免费阅读

(统计学专业论文)美国2000年人口普查事后调查研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容摘要 新中国成立后,自1 9 5 3 年起,我国先后进行了五次人口普查和三次1 人口抽样调查 ( 又称小人口普查) 。每次人口普查后,都进行了抽样质量检查,一定程度上起到了监督和 评价人口普查的作用。不过,我国的事后质量抽查工作还比较粗糙,需要改进和完善。 1 7 9 0 年,美国进行了独立战争后的第一次人口普查。1 7 9 0 1 9 4 0 年问,每次人口普查 后都进行了质量抽查。不过范围十分有限,估计的净遗漏率的误差比较大。从1 9 5 0 年起, 对入口普查质量的评估已经成为美国每1 0 年进行1 次的人口普查必不可少的一部分,所用 的方法在不断改进,逐步科学化、完善化。 美国2 0 0 0 年人口普查的事后调查被称之为“准确性与普查数字评估”调查( 简称a c e 调查) 。到目前为止,a c e 调查被认为是世界上最先进的人口普查质量事后检查方法。我 们当然应该了解和运用它,以提高我国人口普查质量检查的水平。 本文研究美国2 0 0 0 年a c e 调查,旨在引起我国入口研究学者对它的关注,并逐步推 广到我国未来人口普查的质量检查中来。全文分为1 2 章。 第1 章介绍a c e 调查的主要活动,让读者对它有一个大致的了解。 第2 章为美国2 0 0 0 年人口普查事后调查文献综述,包括a c e 工作文献综述和评述文 献综述。 第3 章阐述双系统估计的一般原理。本章首先介绍了两样本捕获再捕获模型及理论条 件;然后,在该模型与人口普查和事后调查两者之间建立起对应关系;最后,介绍了美国 a c e 调查中所构建的双系统估计量。 第4 章介绍了美国a c e 调查中的抽样设计。在这个设计中包括了三个抽样步骤,并且 在抽取第二步样本之后还要抽取样本进行目标延伸搜索。 第5 章介绍了美国a c e 调查中对样本的事后分层。之所以要进行事后分层,是因为只 有在分层总体中构造双系统计量,才能够近似满足捕获再捕获模型的理论条件。 第6 章介绍如何在某一个事后层中构造该事后层人口总数的双系统估计量。双系统估计 量中有七个组成部分都需要用样本来估计。本章主要叙述了如何用一个三步( 实际上是四步) 样本来估计某一个组成部分。一个事后层人口数的双系统估计量就是把这七个估计结果合在 一起计算出来的。 第7 章介绍怎样估计某一事后层人口数的双系统估计量的方差。双系统估计量相当复 杂:它是由七个估计量组织在一起的,而每一个估计量又是由多步骤样本估计得到的,因此 无法直接推算出它的方差。美国在a c e 调查中采用了大折刀方法来估计双系统估计量的方 差。不过,在应用这个方法时,与常规的大折刀方法相比,a c e 方法还有其自身的特点。 第8 章介绍怎样把所有事后层的双系统估计量合成为对整个地区人口数的估计。前面所 说的某一个事后层的人口数字的估计,指的是以州为范围的事后层的人口数字。本章主要介 绍怎样依据对一个州各个事后层入口数字的估计结果,推出州内各个县的、各个普查制表区 的,以及各个街区人口数字的估计量,以及怎样得到这些估计量的方差。 第9 章介绍a c e 调查的现场调查活动和数据处理活动。其中包括:编制居住单位地址 目录的现场活动;居住单位比较的数据处理活动;目标延伸搜索中的现场活动;对最终样本 中的居民进行调查的现场活动,等等。 第1 0 章介绍在a c e 调查中处理缺失数据的方法。这里所谓缺失的数据,包括整个居 住单位数据缺失;一个居民的某一个被调查特征数据缺失以及一个人的状态悬而未决等三种 情况。 第1 l 章是对两个有关细节的说明。第一个是关于普查日到a c e 调查日之间人口移动 的问题;第二是关于后期加入者的剔除问题。所谓后期加入者是指在普查时点之后迁入某地 而错误地被计入该地人口普查人数的那些人。 第1 2 章是美国2 0 0 0 年人口普查事后调查工作经验在我国的应用研究。首先对我国2 0 0 0 年事后质量检查工作中存在的问题提出了弥补缺陷的建议;然后就我国2 0 1 0 年人口普查质 量检查方案提出若干建议;最后是2 0 0 0 年抽样方案和2 0 1 0 年抽样方案设计效应的研究以及 通过设计效应测算2 0 1 0 年和2 0 2 0 年样本量的研究。 关键词:人口普查;普查的事后调查;抽样调查;捕获一再捕获模型;双系统估 计量;大折刀方法( 刀切法) ;设计效应;样本量 2 a b s t r a c t o u rc o u n t r yh a sc a r r i e do u tc e n s u sf o rf i v et i m e sa n d1 p o p u l a t i o ns a m p l ef o rt h r e et i m e s s i n c e19 5 3 s a m p l i n gq u a t i t yc h e c kh a sb e e nc o n d u c t e da n 甜e a c hc e n s u sa n dp l a :y e dar o l ei n s u p e r v i s i o na n da p p r a i s a lo fc e n s u s h o w e v e r , i ti sn o td e n i a b l et h a ts a m p l i n gq u a l i t yc h e c k a f t e r c e n s u si sc o a r s e ra n dn e e db ei m p r o v e d 1 1 砖f i r s tc e n s u sw a sc o n d u c t e di n u s i n17 9 0a e t e ri t si n d e p e n d e n c e s a m p l i n gq u a l i t yc h e c k w a sc a r r i e do u ta f t e re a c hc e n s u sd u r i n g1 7 9 m 1 9 4 0 h o w e v e r , i t ss c o p ew a sl i m i t e da n da t o i so f t h en e tu n d e r c o v e r a g eo ro v e r c o v e r a g er a t em e a s u r e dw a sl a r g e t h ee v a l u a t i o no f t h e c o m p l e t e n e s so f e e n m se n u m e r a t i o nh a sb e e na ni n t e g r a lp a r to f t h ed e c e n n i a lc e n s u ss i n c et h e 19 5 0a n dm e t h o d su s e di ne v a l u a t i o nh a v eb e e ni m p r o v i n g 一p o s t - e n u m e r a t i o ns u r v e yo f t h ea m e r i c a nc a 国s i 玛2 0 0 0w a sc a l l e d 的t h ea c c u r a c ya n d c o v e r a g ee v a l u a t i o n ( s h o r tf o ra c e ) s u r v e y s of a 蚺c es u r v e yh a sb e e nr e g a r d e d 锻t h em o s t a d v a n c e dm e t h o d sa b o u ts a m p l i n gq u a l i t yc h e c k w es h o u l dl e a r na n dm a k eg o o du s eo fi t5 0a st o 加邛v es a m p l i n gq u a l i t yc h e c kl e v e lo fc o n s u so fo u rc o u n t r y t h et h e s i sd e l i b e r a t e st h ea c e i no r d e rt oa t t r a c td e m o g r a p h i cs p e c i a l i s t s a t t e n t i o nt oi ta n d a p p l y i t t os a m p l i n g q u a l i t y d 础o f t h e o e n s t l s o f o u r c o u n t r y t h e t h e s i s h a s l 2 c h a p t e r s t h ef i r s tc h a p t e r 飘n l a 妇st h em a j o ra c t i v i t i e so f a 。c e i no r d e rt ol e tt h er i 强田【e 娼 u n d e r s t a n di tb a s i c a l l y 1 1 的s e c o n dc h a p t e ri st h ed o c u m e n tc o m p r e h e n s i v er e p o r to f r h ea c e ,i n c l u d i n gt h e w o r k i n gd o c u m e n tc o m p r e h e n s i v er e p o r ta n de v a l u a t i n gd o c u m e n tc o m p r e h e n s i v er e p o r t t h et h i r dd l 印懈i sag e n e r a lp r i n c i p l eo f d s e t h i sc t m p t 盯f i r s t l ym 缸- o d u c e s c a p t u r e - r e c a p t u r em o d e lw i t ht w os a m p l e sa n di t sa s s u m p t i o n ;t b e n , i tb u i l d sc o r r e l a t i o nb e t w e e n t h em o d e la n dc e n s u sm a dp o s t - e n u m e r a t i o ns m v e y ;e v e n t u a l l y , l ts u t l e t 珊e sd s eo f t h ea m e r i c a n a c e s u r v e y t h ef o u r t hc h a p t e ri ss a m p l i n gd e s i g no f t h ea m e r i c a na c e s u r v e y t h i sd e s i g nh a st h r e e s a m p l i n gs t a g e sa n dc a r r i e so u tt a r g e t e de x t e n t e ds e a r c ha f t e rt h es e c o n ds a m p l e t h ef i f h lc h a p t e ri sp o s t - s t r a t i f i c a t i o no fs a m p l eo f t h ea m e r i c a na c e s u r v e y n 坞r e a s o nf o r 睨昕n go u t i ti st h a to r g ym p o s t - s t r a t i f i c a t i o nb u i l d i n gd u a ls y s t e me s t i m a t i o nc a na s s u m p t i o no f c a p t u r e - r e c a p t u r em o d e lb em e t t h es i x t hc h a p t e ri sh o wt ob u i l dt h ed u a ls y s t e me s t i m a t i o ni na p o s t - s l r a t i f i c a t i o n u s i n g s a m p l et oe s t i m a t et h es o v e nc o m p o n e n t si nt h ed u a ls y s t e me s t i m a t i o n t h i sc h a p t e rd i s c u s s e st o h o wt ou s et h r e e - s t a g e ( mf a c t ,f o u r - s t a g e ) s a m p l et oe s t i m a t ee a c ho f t h e v e nc o m p o n e n t s t h e d u a ls y s t e me s t i m a t i o ni sc a l c u l a t e db yc o m b i n gt h es e v e nc o m p o n e n t st o g e t h e r t h es e v e n t hc h a p t e rd i s c u s s e st oh o wt oe s t i m a t et h ev a r i a n c eo ft h ed u a ls y s t e me s t i m a t i o n i na p o s t - s t r a t i f i c a t i o n 1 1 硷d u a ls y s t e me s t i m a t i o ni sc o m p l e x i tc o n s i s t so f t h e 5 e v o nc o m p o n e n t s a n de a c hc o m p o n e n ti se s t i m a t e db ym u l t i s t a g es a m p l e t h u s ,i ti sn o t e a s yf o rt h ev a r i a n c eo f t h e d u a ls y s t e me s t i m a t i o nt ob ee 咖h e dd i r e c t l y t h ea m e r i c a nc e n s u sb u r e a uu s e dt h ej a c k - k n i f e v a r i a n c ee s t i m a t o rt oe s t i m a t e 也ev a r i a n c eo f t h ed u a ls y s t e me s t i m a t i o n h o w e v e r , c o m p a r e dw i t h 伽d i i l 锄了j a c k - k n i f ev a r i a n c em e t h o d , i th a si t sf e a t u r e t h ee i g h tc l l a :p t e rw i l ld i u s sh o wt oc o m b i n et h o s eg a m e dd u a ls y s t e me s t i m a t o r so fa l l 3 p o s t - s t r a t i f i c a t i o nt o g e t h e rt oo b t a i ni n t e g r a la r e ap o p u l a t i o nc o u n t 们”d u a ls y s t e me s t i m a t i o no f ap o s t - s t r a t i f i c a t i o nr e f e r s t op o p u l a t i o ne s t i m a t o rw i t h i nas t a t e t h i sc h a p t e rd i s c u s s e st oh o wt o u s ee s t i m a t o ro f e a c hp o s t - s t r a t i f i c a t i o nmas t a t et ob u i l de s t i m a t o ra n di t sv a r i a n c eo f e a c hc o u n t y a n dt a b u l a t i o nb l o c ka n db l o c ki nas t a t e t h en i n t hc h a p t e rm t r o d u c e st h ea c e f i e l da n dp r o c e s s i n ga c t i v i t i e s i ti n c l u d e sh o u s i n gu n i t l i s t i n g , c o m p a r i s i o nb e v e h o u s i n su n i t s , t a r g e t e de x t e n d e ds e a r c ha n do p e r a t i o n so f t h ef i n a l i n d i v i d u a ls a m p l e t h et e n t hc h a p t e ri m r o d u c e st oh o wt oh a n d l em i s s i n gd a t a i ti n c l u d e sm i s s i n gh o u s i n s u n i t s , m i s s i n gi n d i v i d u a lc h a r a c t e r i s t i c sa n du n r e s o l v e ds t a t u s 。t h ee l e v e n t hc h a p t e ri ss p e c i f i c a t i o n sf o rt w od e t a i l s 耶坼f i r s ti sp o p u l a t i o nm i g r a t i o n b c t w e 嘲lc n s t l s 盂蚵a n dt h e a c e d a y t h es e c o n di se x c l u s i o no f l a t ea d d s l a t ea d d sa r ep e r s o n s i nh o u s i n gu n i t sw h ow o r ea d d e dt ot h ec e n s u sa f t e rc g l l 5 u sd a y t h et w e l 抽c h a p t e ri st h a tt h ep o s t - e n u m e r a t i o ns m - v e yo f t h eu s c e n s u s2 0 0 0i su s e dt oo u r c o u n t r y f i r s t l y , s u g g e s t i o n sa r ep o s e df o r t h ee x i s t e dq u e s t i o n si nt h ep o s t - e n u m e r a t i o ns u r v e yo f 0 1 1 1 c o i i h 时c e n s u s2 0 0 0t om a k eu pf o ri t sd r a w b a c k s ;s e c o n d l y , s e v e r a ls u g g e s t i o n sa l ep u t f o r w a r df o rt h ep o s t - e n u m e r a t i o ns u r v e yo f o u rc o u n t r yc e n s u s2 0 1 0 二f i n a l l y , s a m p l ep r o j e c t 2 0 0 0a sw e l l 弱2 0 1 08 r cs t u d i e da n dh o wt om o s s h i es a m p l es i z eb e l o n g i n gt o2 0 1 0a n t i2 0 2 0 b ym c a r 氇o f u s i n gd e s i g ne f f e c ti ss t u d i e d k s yw o r d s :c e n s u s :p o s t - e n u m e r a t i o ns u r v e yo f t h ec e l l s u s ;s 锄咖s u r v e y ; c a p t u r e - r e c a p t u r em o d e l ;d o u b l es y s t e me s t i m a t i o n ;j a c k k n i f ev a r i a n c ee 嗣j | n 姗:d e s i g n e f f e c t :s a m p l es i z e 4 告知古 刖吾 本选题是在张尧庭教授的建议下确立的。在2 0 0 0 年,张尧庭教授特意推荐了关于美国 1 9 9 0 年入口普查的事后调查的3 篇论文。张教授认为,这个课题很有理论意义和现实意义, 有很大的研究空间。事后我的导师开始着手进行人口普查事后调查的研究工作。 2 0 0 3 年,本人被录取为天津财经大学统计学博士研究生。在导师周恒彤教授指导下, 确定了自己的这一研究方向,与导师共同进行该课题的研究工作。 进行该课题的研究,第一手资料是必不可少的。通过g o o g l e 网,我与美国加州贝克莱 大学统计系主任k e n w a c h t e r 教授取得了联系。在他的指点下,又与美国人口普查局的工作 人员g b u r 建立了联系。他们热情地邮来了美国普查局编写的a c e 调查工作指南等数件重 要文献。后又在他们的指点下,从网上下载了大量有价值的相关参考资料。 在撰写博士论文的前期研究工作中,我研读了关于美国1 9 9 0 年人口普查的事后调查、 关于美国2 0 0 0 年入口普查的事后调查、关于捕获再捕获模型理论与应用以及关于其它有关 问题的大量英文文献,还研读了我国人口普查事后质量检查以及l 人口抽样事后质量检查 的有关文献资料。通过比较研究,我深深体会到,美国在人口普查事后调查工作中的许多做 法和经验值得我们学习和借鉴。 本论文的主体部分是对美国2 0 0 0 年人口普查的事后调查文献资料的解读和研究。在进 行解读和研究时,我始终遵循这样一条宗旨:通过自己的研读,把文献彻底吃透、消化,然 后再用自己的语言,把事情清楚、明白地讲出来。因此,本论文所做的阐述,不是对文献资 料的编译,更不是对文献资料的翻译。在本论文的阐述中,包含了作者对文献资料所做的大 量的解读和研究工作。其中包括:为了说清事情的脉络,作者重新安排了阐述事情的框架体 系;对各个工作环节的阐述以及对各个公式的讲解中都包含了作者解读、消化文献的心得, 这些叙述表明了作者对事情本身的理解;对某些难点问题,为了把事情讲清楚,作者自己设 计了一些图、表或算例。另一方面,基于上述宗旨,本论文进行叙述时,仅仅是力求把事情 的本来面目说清楚,因此,不对文献进行任何点评。在论文的第2 章,讲到了对美国2 0 0 0 年人口普查事后调查工作的评论,这些评论,说的仍然是美国学术界对这个问题的评论,而 不是作者本人的意见。 鉴于本论文的上述写作宗旨,这份研究成果将有利于帮助我国读者了解美国2 0 0 0 年人 口普查的事后调查工作;将有利于帮助我国读者阅读美国2 0 0 0 年人口普查事后调查的原始 文献。但是,由于作者本人水平有限,本人对原始文献的理解难免有误,所以,这个研究成 果决不能代替原始文献。 论文的第1 2 章是美国2 0 0 0 年人口普查事后调查工作经验在我国的应用研究。在这一章, 不是简单照搬美国的做法,而是在对我国2 0 0 0 年和以前历次人口普查事后质量检查工作进 行广泛调查研究的基础上,基于美国的做法和我国自身特点提出了我国2 0 1 0 年人口普查事 后质量检查工作的建议。在设计效应的估计和样本量的计算方面也提出了自己的见解和方 案。 胡桂华 2 0 0 7 年4 月 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他入己经发表或撰写过的研究成果,也不包含 为获得天津财经大学或其他教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 学位论文作者签名:签字日期:年月 日 学位论文版权使用授权书 本学位论文作者完全了解天津财经大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权天津财经大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:导师签名: 签字日期:年月日签字日期:年 月 日 学位论文作者毕业后去向;南宁市广西财经学院数统系 工作单位:广西财经学院1电话:0 7 7 1 2 9 7 11 9 1 通讯地址:南宁市广西财经学院数统系邮编:5 3 0 0 0 3 第1 章美国2 0 0 0 年人口普查事后调查活动概述 自从有了人类,就有了人类的历史,也就有了人类人口普查史。人口普查是一国( 或地 区) 人口规模发展到一定程度的必然产物,是一项复杂的社会工程,是制订一国( 或地区) 政治、经济、军事和人口等政策的重要依据之一。 由于人口普查工作的复杂性和用于入口普查资源的有限性,人口普查不可能1 0 0 计数 每一个人,不可避免地重复或遗漏人口总体中的一部分人口( 如在校学生、小孩和无家可归 者等) ,使人口普查数字偏离人口总体“真实”人口数。 人口普查结果对一国( 或地区) 的重要性是不言而喻的。但有必要强调的是,其重要性 必须建立在准确性的基础上。那我们又如何知道人口普查数据是否准确呢? 如果我们组织一 次独立子人口普查的调查,就能获得这个问题的答案。这种独立于人口普查的调查被统计学 家们称之为人口普查后的质量检查,又称事后调查。通过事后调查和人口普查结果的比较, 估计人口普查数字偏离人口总体真实人口数的程度。 1 7 9 0 年美国进行了独立后每隔1 0 年1 次的第一次人口普查及其质量检查。这次人口普 查数为3 9 0 万,估计净遗漏1 0 - - 2 0 万人口。到目前为止,美国已经进行了2 2 次人口普查。 2 0 0 0 年人口普查是最近的一次。 美国历来十分重视人口普查后的质量检查工作。按质量检查方法的不同,大致分为两个 阶段:第一阶段,1 7 9 0 - 1 9 4 0 年,使用个人档案记录检查法、逆记录检查法、个人行政记录 检查法、与当前人口调查记录比较法和人口统计分析法检查人口普查的质量。然而,这些方 法要么缺乏理论根据,要么所需要的数据资料无法直接获取,因而计算的人口普查误差率的 稳定性和准确性都比较差。第二阶段,自1 9 5 0 年人口普查起,美国入口普查局第一次正式 使用事后调查法评价人口普查的完整性,并且作为人口普查计划的一部分。t 、 为区别于1 9 5 0 , - 1 9 9 0 年间的事后调查,美国人口普查局将2 0 0 0 年人口普查的事后调查 命名为“准确性与普查数字评估”( a c c u r a c ya n dc o v e r a g ee v a l u a t i o n ,简称k c e ) 调 查。进行a c e 调查主要两个目的。一是给出入口总体“真实”入口数字的估计量( 包括总 人口数字和主要类别的人口数字) ;二是提供本次人口普查过程的详细信息,为下次人口普 查方案的制订指明方向。 , 那么,什么是a c e - 调查昵2 简单地说,a c e 调查就是在人口普查结束后抽取一个适 当的样本,一方面事后追忆该样本在人口普查时点上的人口状况;另一方面将这份资料与该 样本的人口普查资料结合在起,使用这两套资料估计人口总体真实人口数。这种估计方法 称之为双系统估计。这里的双系统包括入口普查资料系统和a c e 调查资料系统。 a c e 调查属于抽样调查,其工作活动包括抽样设计,编制地址目录,初始调查,比较 和后续调查,缺失信息处理,以及双系统估计量构造等。为了及时完成这些工作和实现其主 要目的,k c e 调查应该独立于入口普查,并且在开始任何一项工作之前编制和测试软件程 序系统,以使各项工作如期顺利完成。 : 概括来讲,a c e 调查活动包括下面四项: 1 抽取样本 一。 a c e 调查样本分三步抽取。在2 0 0 0 年,美国全国范围内有普查小区约7 2 2 万个,街 区群约3 7 6 万个。最终样本包括街区群1 13 0 3 个,含居住单位约3 0 万个。 第一步,以州为抽样范围,街区群( 由若干地理位置上邻近的普查小区组成,平均包括 普查小区1 9 个,含3 1 5 个居住单位) 为抽样单位。为提高样本的代表性,抽样前,按街区 群规模将每个州的所有街区群分在四个抽样层:小型层( 每个街区群含0 2 个居住单位) ; 中型层( 每个街区群含3 7 9 个居住单位) ;大型层( 每个街区群含8 0 多个居住单位) ;美洲 印第安人居留地层( 每个街区群含3 个以上居住单位) 。在每个抽样层,使用等概率方法抽 取等距街区群样本。第一步样本包括街区群2 9 1 3 6 个,含居住单位1 9 8 万个。 第一步抽样结束后,由a c e 调查现场工作人员编制抽取的每一个街区群的居住单位 地址目录( 称之为独立地址目录) 。这样一来,同一样本街区群就有两个居住单位地址目录: 一个是普查地址目录;另外一个是独立地址目录。两个目录的居住单位数可能存在差异。差 异大致可以分为以下几种情况:独立地址目录居住单位数与普查地址目录居住单位数差异在 2 5 以内;独立地址目录居住单位数大于普查地址目录居住单位数+ 2 5 ;独立地址目录居 住单位数小于普查地址目录居住单位数- 2 5 。 第二步,仍然以街区群为抽样单位,抽取第一步样本的子样本。在抽取第二步样本之 前,对抽取的第一步样本分别中型、大型、小型样本街区群进一步按有关标志分层。比如说, 第一步样本中的中型街区群按民族和前面两个地址目录居住单位数的差异划分在以下五个 抽样层中:少数民族层;非少数民族一致性层;非少数民族高予层;非少数民族低于层;美 洲印第安人居留地层。然后,按照与第一步抽取街区群的相同方法,从这五个抽样层分别抽 取等概率样本。第二步样本包括街区群l1 3 0 3 个,含居住单位8 4 4 0 0 0 个。第二步抽样后, 在同一样本街区群比较两个地址目录的居住单位。对于存在不匹配问题的样本街区群,从中 选出一些对其进行目标延伸搜索,即在周边街区群的相应名单中搜索,看能否在其中找到本 样本街区群名单中缺失的居住单位。 第三步,就是从第二步样本的大型街区群中抽取一部分居住单位。抽取的方法是:将大 型街区群划分成若干“片一( 由大型街区群内邻近的居住单位组成) ,以“片”为抽样单位, 在每个大型街区群抽样层内( 而不是在每个大型街区群内) 等概率抽取“片一样本。第三步 样本包括街区群1 1 3 0 3 个,含居住单位3 0 万个,达到了a c e 调查最终样本的要求。 、 2 调查和比较( 个人) 样本 第三步样本抽取后,a c e 调查机构组织调查员调查样本街区群居住单位的个人。进行 a c e 个人调查的目的是为个人比较提供普查日和a c e 调查日样本街区群居住单位个人 花名册。花名册包括个人地址、与户主的关系、姓名、性别、年龄、种族、民族和是否拉美 血统。 为提早完成调查任务,对普查表填写完整,并且在表中留有电话号码的居住单位个人, 使用电话调查。无房屋号码和街道名称的居住单位,使用个人访问。禁止外人( 包括调查员) 进入建筑物居住单位的情况,一律使用电话调查。 在个人调查的头3 个星期,调查员只能与居住单位个人本人联系。如果3 个星期后无法 与居住单位个人本人联系上,就从其邻居收集其个人特征信息。 个人调查结束后,进行个人比较。为使比较顺利进行和避免可能的偏差进入比较结果中, 在比较之前,检查用于比较的个人信息是否充分是必要的。如果信息不充分,比较将无法进 行或勉强进行。姓名、性别和年龄是用于比较的基本信息,是不能缺少的。 个人比较,就是对比同一样本街区群居住单位的p 样本个人( 由样本街区群a c e 调查 日的那些人组成) 记录和e 样本个人( 由与p 样本个人同一样本街区群普查日的那些人组 成) 记录,包括姓名、地址、出生日期、性别、种族、拉美血统和与户主的关系。 与e 样本个人匹配的p 样本个人称之为匹配( p 样本个人在e 样本中找到了与其相同 的入) 。与p 样本个人匹配的e 样本个人称之为正确调查。没有与p 样本个人匹配的e 样本 个人转入个人后续调查,以确定其是正确调查还是错误调查。 要特别注意p 样本个人和e 样本个人是否重复记录。为提高个人匹配率和发现重复记 录,一般要进行目标延伸搜索,即在样本街区群的周围区域进行搜索,看是否能够找到相匹 配的个人和被重复记录的个人。 为提高p 样本个人匹配率和e 样本个人正确调查率,对未匹配和已匹配但普查日住处 2 悬而未决的p 样本个人和未匹配e 样本个人进行个人后续调查,收集额外信息,即普查日 是否实际居住在样本街区群,进行再次个人比较。 p 样本个人匹配率用来估计人口普查中的个人遗漏率。e 样本个人正确调查率用来估计 人口普查中的错误调查率。两者结合在一起用来估计人口普查中的净遗漏率。 3 双系统估计( d u a ls y s t e me s t i m a t i o n ,简称d s e ) 样本抽出来,并且现场调查结束后,便进入了估计阶段,即用来源于同一人口总体的两 个独立的样本资料系统( a c e 调查资料系统和普查资料系统) 来估计该总体的人口数,也 就是说,构造双系统估计量对该人口总体的人口数进行估计。 双系统估计要求或假设人口总体中的每一个人在人口普查中被登记的概率相同,并且在 a c e 调查中被登记的概率也相同。事实当然并非如此,如黑人比白人容易在普查中遗漏。 为此,须将样本中的人在进行个人调查和比较后按被登记概率的差别分配在若干层( 称之为 事后层) 。双系统估计量则在每个事后层内分别构造。事后分层在州的范围内进行。 4 小区域人口数字合成估计 经过上面的工作步骤,我们得到了州的每一个事后层的真实人口数的估计量。将各州所 有事后层人口数的估计量汇总即得到各州入口数估计量。在每个事后层内,用这个估计量除 以这个州在这个事后层的人口普查登记数,便得到了该事后层人口普查数字修正因子。 有时候,我们不仅仅是需要了解各州真实人口数的估计数,还需要了解比州小的区域( 如 县、普查制表区、街区和国会行政区) 的真实人口数的估计数。合成估计是为解决这个问题 而设计的程序。将上述修正因子乘以某个县( 或普查制表区、街区和国会行政区) 在该事后 层的人口普查最终登记数,就得到这个县( 或普查制表区,或街区) 在该事后层“真实人 口数字的估计数。然后,将所有事后层的估计结果求和,便得到某个县( 或普查制表区、街 区和国会行政区) 的“真实一入口数字的估计量。 合成估计假设各个事后层的人口普查数字修正因子在其中的各个地区具有同质性,即该 事后层内各个地区的人口普查净遗漏率是相同的。这个假设一般是难以成立的,因为各个地 区的普查结果主要取决于这个地区的普查传统和当地政府对普查的重视程度。违背该假设而 引起的误差称之为合成误差。相关研究表明,地区规模越大,合成误差越小,反之亦然。 3 第2 章美国2 0 0 0 年人口普查事后调查文献综述 这里的文献包括a c e 工作文献和a c e 评述文献。首先对工作文献进行综述,然后对 评述文献进行综述。 1 a c e 工作文献综述 美国人口普查局的c h a r l 酷l o r e sk m c a n n o n ,h e n n a m mh 曲明瑚旧n ,v a c a n t ,p r e s t o nj a y 、确l i 钯,n 鲫c ym g o r d o n ,c y n t h i az e c l a r k ,m a r v i nd r a 证o $ 和a r n o l da j a c k s o n 合作撰写 了a c e 工作文献美国2 0 0 0 年人口普查的准确性和数字评估:设计和方法。这个文献分 为两个部分:第一部分叫做2 0 0 1 年3 月a c e 初始版。2 0 0 0 年入口普查后的事后调查( 2 0 0 1 年进行) 就是按照这个方案进行操作的。第二部分叫做2 0 0 3 年3 月a c e 修订版。它是在 2 0 0 0 年人口普查事后调查工作结束后,美国普查局针对所发现的问题对上述初始方案进行 修订后而得到的一个修订版。这个修订版完成后,于2 0 0 3 年进行了试操作。这两个部分合 成一个文件于2 0 0 4 年9 月对外发布。 第一部分由8 个题目组成:a c e 介绍;a c e 的主要活动;a c e 抽样设计;a c e 现场和数据处理活动;目标延伸搜索;缺失数据处理;双系统估计;小区域合成估计。另外 还有4 个附录:2 0 0 0 年人口普查数据缺失估算;人口统计分析法;抽样权数减少;a c e 估计误差( 包括p 样本比较误差和e 样本处理误差、p 样本和e 样本数据收集误差、抽样 误差、统计相关偏差、合成估计误差,以及事后分层不一致性误差和平衡误差,等等) 。 第二部分由7 个题目组成:a c e 修订本介绍;a c e _ 修订本方法总结;计数误差数据 修正;a c e 修订本处理缺失数据;对美国2 0 0 0 年人口普查个人重复记录的进一步研究; a c e 修订本双系统估计;a c e 修订本双系统估计的评价。 本论文主要是对该文件第一部分所做的研究。在研究过程中,也参阅了第二部分的有关 内容。除此之外,还参考了大量与之相关的论文和专题研究资料,如,准确性和数字评估: 双系统估计的结果( d a i v i s 。p 2 0 0 1 ) ; 2 0 0 0 年人口普查程序和操作备忘录( g r i f f i n ,r a n dh a i n e s ,d 2 0 0 0 ) ;准确性和数字评估调查:为双系统估计而进行的事后分层( g r i f f i n , r a n dh a in e s ,d 2 0 0 0 b ) ;准确性和数字评估调查:合成估计( h a i n e s , d 2 0 0 1 ) ;准 确性和数字评估调查:个人双系统估计的计算说明( i - i a m 鹤, d 2 0 0 1 b ) 和准确性和数字 评估:理论和应用( h o 殳a n ,h 2 0 0 0 ) 。 2 a c e 评述文献综述 a c e - 调查结束之后,美国学者对这项工作进行了评述。评述文献主要有:对2 0 0 0 年 人口普查的评价( p r o f e s s o re u g e n ee r i c k s e n , t e m p l eu m v e r s i b j , d e p a r t m e n to fs o c i o l o 舒a n d s t a t i s t i c s ) ;人口普查数据估计的决定( m a r c h1 2 ,2 0 0 3 u sc e n s u sb u r e a u ) ; 2 0 0 0 年人口普 查方法和和统计修正( d a 们da f r e e d m a na n dk e n n e t hw w a c h 把r ) ;2 0 0 0 年入口普查总误差 模型:怎样估计误差的构成成分( b n l c ed s p e n 啪1 i ,2 0 0 0 ) ;2 0 0 0 年人口普查的准确 性和数字评估:设计和方法一第一部分附录d ,a c e 估计中的误差。学者们在这些文献中 从不同角度对a c e 调查进行了评述。以下是他们的主要观点。 ( 1 ) a c e 调查在某些环节上没有很好地满足双系统估计所需要的假设条件 第一,人口总体中的个人没有很好地满足等概率这个假设条件。人口总体中的个人,在 人口普查中被登记的概率是有所差别的。有房子的人比无房子的人登记的概率大、非少数民 族的入比少数民族的人登记的概率犬、黑人比白人容易遗漏和年轻人比老年人容易遗漏等。 不相信政府的人、不愿意别人知道自己居住在何处的入、无家可归的人、在逃罪犯、贩毒分 4 子、外来移民、居住在边远地区的人等,在人口

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论