




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 26 人口学研究方法:规范与发展 认识人口与计划生育统计的特点 避免统计方法和数据的误用 由于工作关系和职业习惯,笔者对各种各样有关人口和计划生育的工作报告、分析文章中的统计方法和统计数据比较关注,经常可以发现统计方法和统计数据被误用的情况。本文通过一些实例,分析由于不了解人口和计划生育的特点而造成统计方法和数据误用的情况。 1 个案与群体 实例 1某调查报告称,某村 2001 年出生婴儿 10人, 其其中男婴 6人,女婴 4 人人,出生性别比高达 1550,严重失调。 实实例 2某乡给某村下 达达人口计划,其中一项 指指标是计划生育率,要 求求当年的计划生育率不 低低于 95%,而该村一 般般每年出生不足 20人 。 实例 3某地计 生生委根据群众举报,查 出出某县一个超生5 胎的 情情况,据此称该县超生 问问题严重。 实例 4某县总人口不足 50 万万人,近年来在孕妇中 推推广服用 “ 福施福 ” 。 上上级要求检查服用 “ 福 施施福 ” 后,人口缺陷发 生生率是否逐年下降。还 有有不少地方把孕产妇死 亡亡率是否逐年下降当作 生生殖健康服务工作的考 核核内容。 这几个例子 所所出现的问题都是以个 案案或少量发生的情况, 说说明一个地方宏观的情 况况。人口和计划生育统 计计所分析2 / 26 的对 象或事例 具具有群体性,这个群体 是是由每个个体的人或事 件件集合而成。每个个体 是是否发现这种现象是偶 然然的,作为表现群体规 律律的统计数据,只有当 群群体具有相当的规模后 才才有意义。群体的规模 太太小,尽管对每个个体 的的统计是准确的,指标 的的计算也是正确的,但 计计算结果并不能客观地 反反映群体的规律。 如 实实例 1,一个村的出生 人人数仅为 10人,计算 的的出生性别比要么是 1000,要么就是男女比 例例严重失调。实例 2 中 计计划生育率受出生总数 的的影响,要么计生率正 好好 100%,只要有一 个个计划外出生,计划生 育育率就低于 95%。 例 4 涉及的出生缺陷发生 率率或孕产妇死亡率一般 统统计时均以 10万作为 分分母,对于一个县,每 年年出生几千人或 1 万多 人人,即使按照出生缺陷 、孕产妇死亡发生的平 均均水平,每年也只有几 例例,偶然性很大,在统 计计数据上很难表现为逐 年年下降。至于例 3,以 一一个特例说明全县的情 况况,更是欠妥。各种人 口口和计划生育统计教材 上上并未说明各项统计指 标标适用的 人群至少要达 到到多少,但一般说来这 些些统计指标绝大部分不 能能用于分析规模在几百 人人到一千多人的村级情 况况,许多指标在县、乡 级级使用也不太合适。多 年年来各级是通过报表收 集集 人口和计划生育统计 数数据。报表由上级制发 ,基层单位按统一的口 径径填报每个项目,然后 逐逐级汇总、上报。这样 以以来,上、下级的报表 式式样相同,只是数量大 小小有差别,于是,上级 单单位计算哪些指标,3 / 26 下 级级单位“照葫芦画瓢” 计计算相同指标。特别是 实实行人口与计划生育目 标标管理责任制后,各项 工工作任务和责任要逐级 分分解、落实,相应地, 工工作指标也被层层分解 ,上一级控制的指标也 被被一直套用到基层单位 。在这种情况下,群体 性性的要求很容易被忽视 。 2 自然属性与社 会会属性 实例 5 19995年 8 月,在全国 上上半年人 口形势分析会 上上,某省计生委分析本 省省当年上半年二孩出生 数数量比上一年同期减少 的的原因时称,由于自当 年年起全省广泛推行 “ 三 结结合 ” ,许多群众为了 发发家致富,主动退出二 孩孩指标,于是二孩出生 明明显减少。笔者的同事 立立即对此理由提出了置 疑疑:既然是主动退出二 孩孩指标导致二孩出生减 少少,那么原来应在19995 年上半年生育二孩 的的妇女至少在 1994 年年上半年就应退出二孩 指指标,而那时候,该省 并并未开展计划生育 “ 三 结结合 ” ;至于 1995 年年上半年开展 “ 三结合 ” 后退出的二孩指标, 其其二孩出生减少的效果 应应在 1996 年 以后 才 能能表现出来。群众退出 二二孩指标与二孩出生数 量量的减少在时间上出现 了了“矛盾”。 实例 6 许多文章分析妇女 受受教育程度越高,生育 的的孩子越少。 这两个 例例子说明分析人口出生 数数量的变化应考虑人口 的的自然属性和社会属性 。人口首先是生物意义 上上的人口,具4 / 26 有自然属 性性,同时,人口生活、 存存在于一定的社会环境 中中,具有社会属性。人 口口现象的发生既受自然 属属性的影响,也受社会 属属性的影响。从根本上 说说,社会属性对人口现 象象的影响和制约是有条 件件的、间接的。而自然 属属性的影响和制约是无 条条件的、直接的。社会 属属性的影响和制约常常 要要通过自然属性来实现 。在分析人口现象的时 候候,首先要解释人口的 自自然属性,然后再解释 社社会属性。就实例 5而 言言,从妇女退出二孩指 标标到二孩出生减少,至 少少间隔 10 个月,即妇 女女的 怀孕期,无论推行 “三结合”力度多大, 妇妇女 10个月的怀孕期 不不能缩短。退指标的发 生生与出生数的减少在时 间间上不 “ 同步 ” ,至少 要要 “ 滞后 ” 一年。也就 是是说, 1995 年上半 年年因开展 “ 三结合 ” 妇 女女退出二孩生育指标不 会会影响这个时期的二孩 出出生数量。关于实例 6,一个人的受教育程度 属属于社会属性,妇女受 教教育 水平提高,的确会 影影响其生育行为。然而 ,影响生育的自然因素 ,直接因素是避孕节育 行行为,具体地说,影响 生生育的生物因素包括推 迟迟结婚、采取避孕措施 和和流产。妇女文化程度 影影响到上述生物因素发 生生变化,并通过上述因 素素影响生育孩子的数量 。直接讲文化程 度与孩 子子数量的关系,未免有 些些牵强。 3 定量与 定定性 实例 7各地 每每年都要分析当年的人 口口形势,将当年的数据 与与上一年的数据进行对 比比。许多分析报告在列 举举了对5 / 26 比数据后得出结 论论: “ 今年的工作比上 一一年有明显的进步,取 得得了巨大的成绩,上了 一一个新台阶 ” 。但如果 我我们仔细察看各项指标 的的数量,发现变化并不 大大,如计划生育率由 %上上升到 89%,出生率 由由 下降为 ,多孩出 生生由 165 人减少为1449 人,多孩率由 %下 降降为 2%等等。根据这 些些数据的变化,得出的 定定性结论应当是: “ 工 作作稳步发展,人口增长 保保持平稳的态势 ” 。人 口口和计划生育的统计分 析析主要是指对数据的分 析析,并由 “ 定量 ” 的描 述述引申到定性的判 断。 如如果忽视定性的分析, 那那么,所谓定量分析不 过过是数量变化的文字描 述述而已。把握好定性分 析析的关键在于,定性分 析析应以定量分析为基础 ,即“定量”在前 ,“ 定定性”在后。那种先“ 定定性”,再计算数量变 化化的做法,违背了“定 量量”与“定性”的基本 规规律。这样进行的定量 分分析,只是给定性的结 论论加一些数量的点缀。 4 模糊和精确 实实例 8某地区的一份 材材料称,根据 20年来 每每年总和生育率的变化 ,推算本地区 20年来 少少生了 1831275 人人。 实例 9某县 计计生委利用农村赶集日 人人口比较集中的机会, 出出动服务车,设置咨询 台台,向群众宣传计划生 育育知识,提供咨询服务 。县计生委的汇报材料 称称, “ 一个月来在集日 上上接受宣传、咨询的群 众众累计达到 127328 人次 ” 。 6 / 26 乍一看, 实实例 8和实例 9 中的人 数数和人次数的统计和计 算算十分认真仔细,数字 如如此精确,令人钦佩。 但但转念一想,不免生疑 :实例 8 中利用总和生 育育率计算少生人口,需 要要以年龄别生育率与分 年年龄妇女人数相乘计算 出出生人数,一般来看, 每每个年龄组的计算结果 都都不会是整数,只好四 舍舍五入。每一年若干个 年年龄组累计下来,个位 数数已经含糊不清了。再 把把 20 年的少生人数累 计计起来,怎么可能精确 到到个位数呢?况且 20 年年间,该地区的人口并 非非处于 “ 封闭状态 ” , 各各年龄组人数因为人口 迁迁移而变化,也会影响 到到计算 少生的数量。至 于于实例 9,在一个开放 的的、人们频繁走动的集 市市 上,如何判定哪个人 接接受了宣传,哪个人接 受受了咨询,并没有一个 客客观的标准;即使有标 准准,实际操作中也很难 把把握,因此,根本没有 可可能逐人统计。实例 8、实例 9 中看似精确的 数数据令人感到滑稽,倒 不不如模糊一些,说 “2 0 年大约少生了 18万 人人 ” , “ 一个月在集市 上上接受了计划生育宣传 、咨询服务的人次达 10 余万 ” ,或许有几分 可可信。从某种意义上讲 ,人口和计划生育所涉 及及的是宏观层面的事情 ,与此相应的统计数据 所所反映的是大致的状态 或或趋势,没有 必要也没 有有可能做到精确。许多 同同志在应用统计方法时 ,往往注意的是方法本 身身的定义和计算过程, 而而对计算中数 据的来源 不不了解。人口和计划生 育育统计属于社会经济统 计计范畴,很多数据是通 过过抽样调查获得,允许 有有一定的误差;即使是 全全面的调查,在7 / 26 实施过 程程中,也会遇到这样、 那那样的干扰或影响,存 在在着调查误差,这是无 法法完全避免的。从某种 意意义上讲,数据存在一 定定的误差,这是人口和 计计划生育统计的特点之 一一。 5 原因与结果 实例 10最典型 的的例子莫过于 “ 人口出 生生率每降低 1个千分点 ,人均 GDP提高多 少 个个百分点 ” 的说法。这 种种说法的依据是利用相 关关分析法对全国各省的 人人口出生率和人均GDP 的数量变化进行计算 ,得出二者之间的函数 关关系式和相关系数。把 人人口出生率作为自变量 ,看自变量的单位变化 影影响因变量变化的数量 大大小。 在这个例子中 相相关分析法本身以及有 关关的数据都是正确的, 然然而,用这样一个函数 式式来解释人口增长与经 济济增长的相互关系是有 问问题的。其一,就统计 方方法来说,相关分析只 反反映变量之间的相关关 系系,而不说明因果关系 ;其二,人口增长与经 济济增长固然相互影响, 但但从本质上来说,是经 济济发展影响人们的思想 ,进而影响人们的生育 行行为,最终导致生育率 下下降,人口增长率降低 ,即经济增长是“因” ,而人口增长是“果” 。颠倒了因果关系,不 仅仅逻辑上讲不通,数量 上上的“相关性”也失去 了了意义。 笔者在多年 的的工作中体会到,由于 人人口和计划生育所具有 的的特点,人口和计划生 育育统计分析方法的应用 和和统计数据8 / 26 的解释有别 于于其它部门和领域对于 统统计的一般要求。正确 地地应用统计分析有助于 我我们认识人口和计划生 育育的特点和规律,只有 科科学地认识和把握人口 和和计划生育的特点和规 律律,才能避免在统计分 析析中陷入 误区。 社会 科科学实证研究中的统计 分分析方法应用 郑真真 统计学的应用随着 微微型计算机的普及越来 越越广泛,在社会科学实 证证研究中几乎是无处不 在在。有了一定规模的数 据据和一个统计分析软件 ,就可以很方便地进行 各各种估算和分析。然而 由由于统计分析方法本身 并并不像加减乘除那样简 单单,而一些统计分析软 件件已经发展到几乎是人 人人都可使用的程度,如 果果使用者在只知其然不 知知其所以然的情况下操 作作并得到结果,可能出 现现对统计分析方法误用 或或滥用的现象。本文仅 对对一些统计分析中比较 常常见的问题进行讨论, 以以引起各方面的重视。 1 描述性统计 描述 性性统计是社会科学实证 研研究中最常用的方法。 准准确、全面、正确的描 述述是所有实证分析的基 础础,如果对某个事件或 某某种现象的描述不清楚 或或存在偏差,那么其后 的的所有分析都将是值得 怀怀疑的。一项研究能够 将将所研究的现象或对象 描描述清楚,就是一个极 大大的贡献;而描述的偏 差差可能会引起公众或学 术术界对某些社会现象的 误误解,甚至误导政府决 策9 / 26 策。但是因为描述性统 计计所用方法简单易得, 往往往没有得到足够的重 视视。 均值的局限 普 遍遍用于描述样本集中趋 势势的测量之一是均值。 它它对于近似正态的对称 分分布样本来说是比较好 的的测量,对于不对称分 布布则不然,尤其会受到 极极端值的影响。两个分 布布完全不同的样本可能 会会有相同的均值,因此 均均值在某种程度上抹杀 了了样本内部的差异,而 往往往这种内部差异正是 需需要我们进行深入研究 的的、或应当引起人们注 意意的。为了弥补均值的 这这个缺陷,一般在报告 均均值的同时也报告方差 ,或用直方图散点图 的的形式描述分布,以提 请请读者注意群体内部的 差差异。 不同群体的可 比比性 在描述性统计中 ,往往涉及到对不同时 期期或不同人群的总体描 述述,以反映社会变化或 地地区差异。在社会科学 中中、 尤其是人口研究中 ,不少事件的发生都是 与与年龄密切相关的,如 我我国妇女大部分在 35 岁岁以前完成了生育,从 而而导致 35岁以上育龄 妇妇女中极高的避孕现用 率率。在这种情况下,两 个个样本之间存在避孕现 用用率的差异可能只是年 龄龄结构的差异,而不是 年年龄别避孕现用率的差 异异。又如在报告流动人 口口犯罪问题时,给人的 印印象往往是流动人口犯 罪罪率高于常住人口,但 忽忽视了流动人口的年龄 和和性别构成与常住人口 完完全不同,且青年男性 是是犯罪率较高的人群 。 这这种对两个不同群体的 比比较往往会导致错误的 结结论。 10 / 26 绝对数的使用 由于中国 人口数量巨 大大,调查研究也比较容 易易得到大容量的样本, 所所以对任何小概率事件 用用绝对数报告都会出现 惊惊人的巨大数字,单纯 对对绝对数的强调往往会 产产生戏剧性的效果。比 较较合理的方式一般是在 报报告某事件绝对数的同 时时,给出该事件的发生 率率或占研究人群的比例 。 小样本的代表性 在在一次抽样的小样本中 求求得的率或比例会非常 不不稳定,与另一次抽样 的的结果可能会有较大差 距距。因此当研究仅限于 从从小样本获得的资料时 ,应当在报告比例的同 时时也报告样本量。 2 双变量统计分析 在 社社会科学研究中,首先 分分析的往往是两个 变量 之之间的关系,如用相关 或或列联表等方法。一般 在在确定两个变量之间确 实实有某种关系,如在经 过过统计检验后证实两变 量量有显著相关关系,进 行行更进一步的分析才有 意意义。因此,双变量统 计计分析在实证分析中占 有有重要地位。但是,由 于于在应用中对有些问题 的的忽视,双变量统计分 析析也很容易出现偏差或 错错误。 卡方检验的局 限限 在利用列联表对两 个个定序定类变量进行 相相关分析时,需要进行 统统计检验来判断两个变 量量的相关是否有统计上 的的显著意义。不少研究 结结果都用卡方检验的显 著著性报告相关状况。但 值值得注意的是,卡方统 计计量的计算本身是有局 限限性的,样本越大,卡 方方值就会相应增大,因 此此大样本的卡方检验很 容容易得到显著结果。所 以以一般在报告卡11 / 26 方检验 结结果以说明两变量是否 显显著相关时,还应当同 时时报告相关强度,即相 应应的相关系数,如 Gam ma,Lambda 等等。 统计意义上的显 著著与差别的实际意义 在在检验两个定距变量的 均均值差别是否具有统计 上上的显著性时,也存在 相相似的问题。由于样本 量量越大,样本均值分布 的的方差就越小,因此常 用用的 t检验结果就越可 能能显著,任何细微的差 别别都可能有统计上的显 著著性。但有时具有统计 意意义显 著性的差异,在 实实际生活中可能意义并 不不大,如同在两个草堆 之之间找出一根草的差距 ,对判断两个草堆的大 小小没有实际意义。因此 ,对任何检验结果都应 当当有符合实际的解释和 说说明。 虚假相关问题 双变量分析中的虚假 相相关问题,几乎在所有 关关于社会科学研究方法 的的教科书中都会涉及到 ,在统计分析方法的教 学学中也被视为经典问题 。但是多少年来,人们 仍仍然在不断地重复着这 个个“经典的错误”,即 认认为可见的或统计检验 结结果显著的相关就是真 正正的相关;更为大胆的 做做法是把这种相关关系 推推向因果关系。我们知 道道,对于有的 变量来说 ,即使是经过检验判定 两两者具有统计上显著的 相相关关系,也不一定存 在在实际意义上的关系, 因因为可能有未考虑到的 变变量或不可测量的变量 在在同时对两个研究变量 起起作用,有时甚至可能 完完全是偶然的巧合。例 如如,火灾的大小是以火 灾灾损失来衡量的,而参 加加灭火的消防员人数是 与与火灾大小有关的,火 灾灾越大,出动的消防员 就就越多,但凡是具有常 识识的人12 / 26 都不会根据出动 消消防员人数和火灾损失 两两个变量之间的高度相 关关,断定出动消防员越 多多火灾损失就越大,因 为为火灾的规模是决定因 素素。在有关人口科学研 究究中也有报告虚假相 关 的的现象,如人口增长率 的的降低导致了经济增长 的的提法就是一例。因此 ,在分析相关关系时, 应应当根据理论、知识、 经经验、甚至常识来判断 这这种分析是否有意义、 是是否存在其他变量的作 用用,避免得出有悖于常 理理的分析结果。有些虚 假假相关是可以通过统计 分分析方法判别的,如在 控控制了另外一些变量后 观观察两个变量的偏相关 ,或在双变量分析的基 础础上,进一步用多变量 分分析深入研究。 3 多多变量分析 回归分析 是是多变量分析中应用最 多多的方法,尤其是逻辑 斯斯蒂回归更是被广泛地 应应用。在众多应用中, 比比较明显的问题是使用 方方 法是否得当和对结果 的的报告和解释是否规范 、合理。此外还有一些 应应当引起注意的问题。 分析框架的重要性 在 社社会科学研究中,各变 量量之间往往存在错综复 杂杂的关系,如果在进行 回回归分析之前没有一个 清清晰合理的分析框架, 那那么回归的结果有可能 会会引起质疑。一般应在 报报告回归分析结果之前 ,介绍该分析的框架, 如如各变量的定义、各自 变变量与因变量的假设关 系系及其理由等,对建立 的的回归模型做出合理性 论论证。有一些变量可能 是是作为控制变量纳入回 归归模型的,如性别、年 龄龄等,最好事先解释清 楚13 / 26 楚。对假设因果关系的 模模型,应 当至少能够说 明明: (1)该因果关系 在在理论上是正确的、在 实实践中是合理的; (2) 从事件发生的时间上 来来说,应当是原因发生 在在先、结果 发生在后。 如如有些回归分析中,未 加加说明即把所有与因变 量量显著相关的变量都囊 括括在自变量中,甚至有 些些自变量与因变量有明 显显的互为因果关系,显 得得分析逻辑混乱;还有 的的论文在简单介绍研究 背背景和数据来源之后, 急急于建立因果关系并推 出出回归分析结果,然后 再再根据各变量在回归模 型型中的显著性一一说明 ,这相当于事后解释; 这这些做法都是错误的。 在具备“奔 4” 微机 和和较易操作的软 件的今 天天,转瞬间就可完成一 次次回归分析,但是在此 之之前,需要有大量的前 期期准备工作,包括文献 检检索和理论框架构建, 才才能确保统计分析的科 学学性。 分析方法应用 的的条件 每种多变量方 法法都有各自的前提条件 或或假设,如果这些条件 不不具备或者假设不成立 ,该方法的应用就成问 题题。如 Pearson 相相关是考察线性相关关 系系,多元方差分析只能 辨辨别线性相关因变量的 多多元差异,线性回归分 析析假设自变量与因变量 之之间为线性关系,因子 分分析方法也是建立在各 变变量具有一定的线性相 关关基础之上的;另外, 在在逻辑斯蒂回归中,每 个个分类都应保证有足够 的的频数,如果频数太少 就就会影响参数估计的稳 定定性;等等。尽管一般 不不在14 / 26 报告分析结果时说 明明各种假设是否成立或 条条件是否满足,但是在 进进行分析时应当自觉地 进进行考察。如果不能 满 足足条件或假设不能成立 ,就对数据进行转换或 调调整后再分析,或者改 变变分析方法。 多变量 分分析结果的展示和解释 多变量分析的结果一 般般是通过列表来展示的 。现在一种并不少见的 做做法是直接把统计软件 的的输出直接复制到论文 中中,我们往往会在文章 中中看到包括回归参数估 计计、参数标准差、检验 统统计值、检验显著性、 偏偏相关系数等等 n 行 m 列列的大表,使人有目不 暇暇接的感觉。实际上参 数数标准差和检验统计值 是是提供给分析者的信息 ,没有必要列在结果中 ;如果不是有特别需要 的的话,偏相关系数也不 是是关注重点;最主要的 应应当是回归参数估计及 其其显著性。转贴于论文 联联盟 http:/ 在列出分析结果之后 ,应当对结果的实际意 义义进行解释和讨论,而 不不是复述分析结果的数 学学意义。此外,在多元 统统计分析中一个常见的 问问题是分析者对变量作 用用不具有预期统计显著 性性的失望,因此绕开不 显显著的变量,甚至对数 据据或模型进行各种调整 以以获得 显著结果。其实 ,统计分析结果不显著 往往往也是有实际意义的 。例如在分析我国高龄 老老人的地区分布时发现 ,高龄老人比例与当地 医医疗卫生指标没有显著 关关系,这说明我国医疗 系系统还没有具备延长老 人人寿命的功15 / 26 能;另一方 面面也说明这些高龄老人 的的存活不是主要靠医药 维维持的。所以,在解释 分分析结果时,只要是在 分分析框架中涉及并参与 分分析的变量,无论作用 显显著与否,都应当给予 充充分的讨论;对于那些 由由于知识或信息的限制 难难以下结论的结果,可 以以作为问题提出,以便 进进行更有针对性的进一 步步研究。 此外,任何 方方法都有其局 限性,分 析析结果也不会十分完美 。因此在讨论结果的同 时时,也应当就此向读者 说说明。例如当一个多元 线线性回归分析的确定系 数数较低时,需要指出该 模模型有限的解释能力, 探探讨可能存在但没有纳 入入分析的更重要的影响 因因素。 不必求最新、 只只求最合适 有些研究 生生在撰写学位论文时, 常常常因为自己没有应用 最最新的统计分析方法而 感感到忐忑不安;在评论 某某项研究的创新性时, 有有时也出现把学术创新 和和应用新方法混为一谈 的的现象,例如认为应用 描描述性统计方法的研究 水水平低于应用解释性或 预预测性方法的研究。新 方方法是层出不穷的。 但 是是,出现了新方法并不 意意味着传统方法就不再 适适用,而是各有千秋。 统统计分析方法是工具, 哪哪件合适就用哪件,能 用用锤子解决的问题不必 开开冲床。有时越是复杂 的的方法,假设条件也会 相相应较多,应用的局限 性性更大。因此,盲目追 求求方法的新颖并不是高 水水平研究的保证,真正 需需要注意的是使用最合 适适的方法。而对所用方 法法的真正了解,是正确 运运用统计分析方法的前 提提。 16 / 26 总和生育率的内 在在缺陷及其改进 郭志 刚刚 1 总和生育率 的的应用目的及评价原则 年龄别生育率及其概 括括性指标总和生育率 (TTFR)是生育研究中 最最 常用的指标体系。但 是是现在它们面临很多实 际际问题。本文不讨论出 生生漏报导致统计失实的 问问题,因为其性质并不 在在于统计方法,而是一 个个社会问题。本文只局 限限于这一指标体系内在 的的有效性问题的方法论 讨讨论。一个指标是否有 效效应该以研究目的为标 准准来判断,因此这一讨 论论将结合当前实际工作 的的需要来进行。 统计 指指标有两种功能:一种 是是对调查对象本身特征 的的直接描述,另一种则 用用于推断估计。很多情 况况下,统计指标同时承 担担着这两种功能,比如 样样本统计量反映了样本 对对象的特征,同时又服 务务于推断估计总体参数 。既然是 一种估计,自 然然会有推断偏差或误差 。评价不同估计的优劣 是是看谁的偏差或误差更 小小。 那么通常我们应 用用 TFR到底要反映什 么么?一是为了在控制育 龄龄妇女结构的条件下概 括括时期生育水平,二是 作作为终身生育水平的估 计计。两种性质都反映在 各各年龄组生育率的合计 上上。通常,不同基数的 相相对数指标不可以直接 相相加。为什么年龄别生 育育率可加,是因为设置 了了假设队列的概念。 TFFR 主17 / 26 要不是平均的概 念念,而是总和的概念。 因因此, TFR一身兼两 任任,其内容为时期生育 率率总和,其形式为队列 终终身生育水平。从前一 种种意义上使用时 描述了 该该时期生育水平,从后 一一种意义上使用时则是 假假设队列终身生育水平 的的估计。其值实际上涉 及及了 35 个实际队列, 并并且只有在生育水 平及 年年龄模式长期不变的苛 刻刻条件下,它才真正与 实实际队列终身生育水平 相相吻合。尽管这一假设 队队列与真实队列并不能 很很好对应,但起码可以 及及时提供一种队列终身 生生育的估计来满足实际 需需要。 2 缺陷一: 总总和生育率对终身生育 水水平的背离 表现 A: 最最早对 TFR 的批评是 由由于其剧烈的时期波动 。一逢时期突发事件, 实实际生育量发生了变化 , TFR 就会大幅度下 降降。应该说,批评并不 是是指向其描述时期生育 水水平的功能,而是指向 其其作为终身生育估计的 功功能。因为,这时 TFR的下降只是由于时期 特特殊原因影响,并不意 味味着终身生育水平真的 下下降。实际上,时期效 应应一过, TFR 马上便 会会出现反弹,然而反弹 的的水平也并不能标志终 身身生育水平真的那样高 。总之, TFR 短期内 剧剧烈波动时,将其作为 终终身生育率估计来理解 很很成问题。其中最引人 注注目的是,反弹年份的 分分孩次 TFR(i)会 超超过 1,特别是一孩 TF R(1)会大大超过 1 , 1963年 TFR= ,其中各孩次 TFR 都都大于 1,最高的是 TFFR(1)=。作为队 列列估计,即是说每人生 育育一个半一孩,显得很 荒荒唐。)。人口统计学 对对此采取的对策是,避 免免采用这些年份的 TFR 来18 / 26 作为终身生育水平 的的估计,或者采用若干 年年份的 TFR 的平均值 来来作为终身生育水平的 估估计,希望将欠年与盈 年年的误差相抵消。 表 现现 B:然而,有时即使 社社会中似乎并没有什么 特特殊事件, TFR 也会 背背离终身生育水平。但 是是,往往只是在 TFR 提提高时才会受到一定关 注注。理论分析可以证明 ,这种背离既可以是正 的的,也可以是负的。特 别别是在负偏离的情况下 ,往往可能持续较长的 时时间。并且 ,这种负背 离离实际上正是当前所面 临临的实际情况,因此特 别别需要重视。 这种背 离离产生的原因是婚育年 龄龄的变化,或者说是队 列列的年龄别生育模式的 改改变。而负偏离则对应 着着婚育年龄的推迟。与 时时期突发事件对婚育年 龄龄的推迟的暴发性影响 不不同,生育模式的自身 转转变具有较长时期的持 续续性、变化上的渐进性 、现象的隐蔽性等特征 ,并且它并不一定伴随 生生育补偿现象。甚至有 时时人们根本没有意识到 这这种偏离的存在。 人 口口统计学早就揭示出, 晚晚婚晚育可以延缓人口 增增长,但这是从长期人 口口发展的角度来证明的 。而晚婚晚育对年 份TFFR 有什么影响,则很 少少有人涉及。从理论上 说说,取得同样的终身生 育育总量,可以有不同的 进进程表。即假定各队列 的的终身生育数量不变, 从从某一时期开始各队列 的的生育年龄开始推延, 这这一过程可以持续较长 一一段时期,直至最终稳 定定在一个新的生育模式 上上。我对此做过一些模 拟拟计算,在这种情况下 ,19 / 26 生育模式转变时期中 每每年的 TFR一定会低 于于事先所设的队列终身 生生育量,而这段时期两 端端及以外各年份的 TFR 则可以等于事先所设 的的终身生育水平。这表 明明,即使 将整个转变过 程程或更长时期中各年的 TTFR都加在一起平均 ,得到的还是 个偏低 的的终身生育估计。 更 普普遍的情况是生育模式 的的变化与终身生育量的 变变化同时发生,这时 TFFR下降同时受这两个 因因素变化的影响,由生 育育模式变化导致 TFR 对对终身生育水平的偏离 便便较难分析。 实际问 题题:实际工作需要不允 许许我们等很多年再提供 真真实队列终身生育统计 ,而现在只有 TFR一 种种估计方法,并且我们 知知道 TFR还会经常偏 离离队列终身生育水平, 因因此急需寻找一种更好 的的估计来取代它。否则 尽尽管当前 TFR的值虽 然然很低,即使不论统计 失失真问题,我们也不知 道道这是否仅仅反映TFR 发生 了负偏离,那么 我我们凭什么肯定生育率 已已经下降到更替水平了 。我们又怎么能知道, 当当生育年龄推迟告一段 落落时, TFR 向终身生 育育水平回归时会回升多 少少。要知道更替水平的 真真正概念是实际上某队 列列与其终身生育后代数 量量的比。 有关改进: B ongaarts 和 F eeney(19988)提出了去进度效应 总总和生育率 (TFR) 。该方法旨在提供一 种种根据时期数据对终身 生生育水平的较好估计的 年年份。)。郭志刚 (20 01)对此进行了介 绍绍,并用中国多年生育 数数据对该方法进行了检 测测和评价,结果是 TFRR作为终身 生育水平 的的估计的确大大优于 TFFR。 20 / 26 该方法基本原 理理可以这样来理解:现 实实中生育模式转变时, 除除了导致该年生育数量 有有所变化以外,还会有 其其他共生现象,如分孩 次次的平均生育年龄 (MA Ci)也会变化。 MAACi实际上是生育模 式式转变的测量值,可以 在在理论上建立其变化量 与与时期生育变化量之间 的的函数关系。 TFR便便是在常规分孩次TFRR(i)的基础上利用 MMACi 的变化信息来 调调整,得到去进度效应 的的分孩次 TFR(i) ,然后再汇总为 TFRR。经过调整, TFRR可以在相当程度上 修修正 TFR 距终身生 育 水水平的偏离,因此TFRR更接近于队列终身 生生育水平。也就是说, 我我们可以用TFR来 替替代 TFR 原来所承担 的的终身生育估计的功能 ,而 TFR还可以继续 承承担描述时期生育水平 的的功能, TFR与 TFFR之差可以作为生育 推推延对当前生育水平影 响响的估计。 我认为, 尽尽管 TFR指标还有 继继续改进的余地,但显 然然Bongarrts 和和 Feeney为解决 这这一估计问题指出了极 富富于科学价值的方法论 途途径。并且,这一新指 标标不仅可以用于监测队 列列终身生育水平,也可 以以用于分析以往的生育 数数据,帮助我们更好地 理理 解我国的生育转变史 和和计划生育史。 3 缺缺陷二:总和生育率不 能能控制育龄妇女的孩次 结结构 对某些重要因素 进进行统计控制可以为不 同同年份或不同地区的比 较较提供更大的可比性。 尽尽管 TFR 控制了育龄 妇妇女的年龄结构,但是 它它并没有控制育龄妇女 的的孩次结构。然而,当 前前许多人口模拟研究都 不不能再忽略育龄妇女的 孩孩次结构21 / 26 问题,否则会 有有损其研究结果的有效 性性也有类似问题。)。 问题的表现:实际上 生生育过程是严格的递进 事事件,也就是说,只有 未未生育者才能生育一孩 ,只有生育过一孩且尚 未未生育二孩者才能生育 二二孩。而 常规生育率则 是是以年龄别所有妇女总 数数作为基数,因而没有 容容纳育龄妇女的曾生孩 次次信息,也就不能控制 曾曾生孩次这种结构影响 。因此,比较孩次结构 差差别较大的年份或地区 之之间的年龄别生育率, 便便不能区分其差异到底 是是出于生育水平不同还 是是出于孩次结构不同。 当当其用于人口预测模拟 时时,如果假定两地区育 龄龄妇女年龄结构相同, 同同样的系列生育率的假 设设会导致孩次结构十分 不不同的地区将会有相同 的的出生人数,显然这严 重重地偏离实际情况。因 此此,面对当前的许多研 究究需要,基于年龄别生 育育率的TFR 方法无论 是是用于比较分析 上还是 用用于预测模拟,都会影 响响其结果的有效性划分 了了孩次类别,但是并没 有有对育龄妇女本身划分 孩孩次结构。其基数没有 控控制孩次结构,因而从 本本质上说也没有控制孩 次次结构。)。 替代方 法法的产生:实际上,计 划划生育采取了分类指导 原原则后,便产生了多种 生生育政策类型,其显著 特特征便是孩次控制上的 不不同。在不同地区实施 不不同政策时,育龄妇女 的的孩次结构便取得了越 来来越重要的意义。从这 一一角度出发,导致Fee ney(1985)和和马瀛通等 (1986) 分别以不同思路创建 了了孩22 / 26 次递进生育指标体 系系。 他们的共同点在 于于采用孩次递进比作为 生生育测量的基础来构建 指指标体系。如前所述, 每每年的出生可以划分孩 次次。如果再将某一群体 生生育指标的基数由对应 口口径的年中妇女总数换 成成年初对应孩次妇女时 ,便称为孩次递进比只 有有一孩的妇女中在本年 生生育二孩的比例。)。 然然后,还可以将孩次递 进进比换算成递进总和生 育育率。 Feeney 的的模型突出地考虑了孩 次次递进间隔因素,不考 虑虑年龄结构,因而常被 称称为间隔递进模型。而 马马瀛通等的模型则突出 地地考虑了年龄递进因素 ,因此常被称为年龄递 进进模型。 这两种方法 不不仅可用于在控制妇女 孩孩次 结构条件下的比较 分分析,也可以用于预测 模模拟生育率预测法中也 已已经包含了控制孩次结 构构影响的思想。)。递 进进方法不仅可以在预测 中中控制孩次结构,而且 应应用于模拟预测时实际 上上比常规生育率方法更 方方便。由于递进比的概 率率性质,还能根本避免 孩孩次别总和生育率出现 的的那种超过 1的现象。 主持人评论 本期论 坛坛邀请的三位专家都有 多多年从事人口统计和数 据据分析的经验,对人口 学学研究方法有很深的造 诣诣。王谦副司长通过从 多多年工作中积累的大量 实实例,分析了在人口和 计计划23 / 26 生育工作中经常发 生生的统计方法和统计数 据据被误用的 情况;郑真 真真副教授则对统计分析 中中比较常见的问题进行 丁丁独到的分析和总结; 郭郭志刚教授对总和生育 率率指标进行了深入全面 的的剖析,分析了其内在 缺缺陷和改进方法。 王 谦谦副司长通过 10 个典 型型实例说明在人口和计 划划生育实际工作中,统 计计方法和统计数据在五 个个方面经常被误用。这 五五个方面的问题有些属 于于统计分析中容易犯的 错错误,带有普遍性,如 ,错误地解释变量之间 的的因果关系,在统计分 析析中忽视定性分析与定 量量分析的关系,结论不 是是由统计分析中得出, 使使得定量分析只是定性 结结果的一种点缀。有些 问问题则由于人口与 计划 生生育领域的特点而显得 更更为严重,如他指出的 ,大部分人口和计划生 育育统计指标在村一级或 县县、乡不适用是因为总 体体规模不够。统计所研 究究的是总体的数量关系 而而不是个别的数量关系 ,所以统计指标在一定 的的总体规 模下才有意义 ,这是统计学中的基本 概概念,但是在实际中却 经经常被误用。我们经常 看看到的错误都是统计学 上上的一些“基本概念错 误误”,而不是“高深错 误误”。统计学上的概念 和和方法可能很简单,也 容容易理解,但是要在实 际际工作中正确地、恰如 其其分地运用并不容易, 需需要结合研究对象的特 点点。 郑真真副教授从 另另一个角度对描述性统 计计、双变量统计和多变 量量统计分析中经常被忽 视视的问题进行了讨论和 分分析。她不仅指出了问 题题的所在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年数字化娱乐行业新型娱乐模式探索报告
- 2025年人工智能医疗行业医疗机器人应用研究报告
- 2025年保健品行业天然保健品与保健科技研究报告
- 2025环保会计面试题目及答案
- 2025年文娱产业行业IP开发与文化输出研究报告
- 2025年数字营销行业市场趋势与消费者行为变化研究报告
- 2025年及未来5年中国零售业信息化行业市场调查研究及投资战略咨询报告
- 2025上海轨道交通培训中心(集团党委党校)招聘(集团公司内部招聘)笔试题库历年考点版附带答案详解
- 2025年环境保护行业绿色技术与环保产业应用研究报告
- 注射用头孢米诺钠临床应用考核试题
- 血透患者跌倒的预防及管理
- 自产自销收购合同范本
- 砼回弹强度自动计算表
- 医防融合知识讲座
- 培养幼儿的语言能力
- 《认识几种常见的岩石》说课稿、教案和教学设计
- 黑布林英语阅读初一年级16《柳林风声》译文和答案
- 广东省监理从业人员网络继续教育平台题库
- YY/T 1268-2023环氧乙烷灭菌的产品追加和过程等效
- 平地机操作规程
- HY/T 0302-2021沸石离子筛法海水提钾工程设计规范
评论
0/150
提交评论