方法调查设计和抽样问题.ppt_第1页
方法调查设计和抽样问题.ppt_第2页
方法调查设计和抽样问题.ppt_第3页
方法调查设计和抽样问题.ppt_第4页
方法调查设计和抽样问题.ppt_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第10部分 定量分析方法、调查设计和抽样问题应用和举例,乔晓春 教授、博士生导师 北京大学人口研究所,2006年4月12日,2,评估什么?,项目实施前 的贫困状况,项目实施后 的贫困状况,贫困状况的 变化,项目干预,3,如何评估?,贫困状况的改善,项目干预,非项目干预,在控制或排除非项目干预因素的情况下,测量仅仅由于项目干预对改善 贫困状况的作用。,4,可能会出现什么问题?,项目干预:为项目点提供良种,原因:项目点外出人口为40%;非项目点外出人口为20%,5,用什么办法来解决问题?,实验设计(事前):Randomization; Treatment Group and Control Group; Comparing the result between the two groups 调查设计(事后):利用多元回归分析 比如:Y = a + b1X1 + b2X2 +u Y为被解释变量(如贫困状况); X1为解释变量(如干预变量); X2为控制变量(如非干预变量) 度量Y的变化:Y = b1X1 + b2X2 当X2 不变时,b2X2=0 那么 Y= b1X1 与人有关的社会项目很难用实验设计的办法来评估,通常只能通过抽样调查,收集有关数据进行评估。,6,评估设计:以西南扶贫项目为例,项目总目标: 研究、探索和验证跨地区、跨行业、综合性扶贫项目的有效性 大幅度降低35个国定特困县的绝对贫困程度 促进贫困地区剩余劳动力健康、有序地向较为富裕的农村地区和快速发展的中等城市输出 强化扶贫机构,培养项目管理队伍,提高对扶贫项目的管理水平和对贫困程度的监测水平 通过土地的改良及水土保持工程,遏制贫困的石山地区环境的恶化状况 通过让农户在项目设计和执行过程中发挥决定性作用而鼓励当地公众的大力参与,7,评估第二个总目标:降低绝对贫困程度,理论框架: 干预项目建设内容:教育、卫生、农村基础设施、土地与农户开发、劳务输出、乡镇企业、机构建设、项目管理、贫困检测、城市就业 非干预可能导致贫困状况变化的其他因素 降低绝对贫困程度项目效益(总目标之一),脱贫,干预,非干预,教育,卫生,基础设施,土地农户开发,劳务输出,乡镇企业,机构建设,初始贫困状态,资源地理条件,贫困程度变化,人均纯收入,稳定性,特征变量,8,变量的测量:可操作性定义,被解释变量(Y):脱贫状况 贫困程度变化:贫困发生率、贫困强度指数、贫困深度指数 农民人均纯收入:家庭一年内的净收入 贫困减缓稳定性:返贫率 解释变量(X1):干预行动 由项目带来的教育的改善:小学生入学率、义务教育完成率 由项目带来的农村基础设施改善:打井、灌溉系统 由项目带来的劳务输出:劳动力输出比例变化 控制变量(X2):非干预行动 家庭生产投入的增加 自然灾害减少 非项目带来的劳务输出,9,将可操作性定义转化为调查问题 形成调查问卷,问卷是一种测量工具 干预可能针对不同的层次:如针对家庭、针对自然村、针对县或乡 调查对象也要有所不同:个人、家庭、自然村、乡镇、县 不同的调查对象要有不同的问卷,由不同的人来回答 要掌握问卷设计方法:比如开放性和封闭性问题;陈述式和提问式问题等,10,问卷设计的一些原则,明确你要从中发现什么 对提出的问题要进行检验:它是否测量了你要测量的问题 要使提出的问题简单、清楚,没有歧义 问题要具体,不能过于宏观和抽象 要使提出的问题与前面提出的可操作性定义联系起来 确定是否用封闭型问题还是用开放型问题 不能鼓励或暗示被调查者回答你喜欢的结果 为问题答案提供多项选择,而不仅仅是回答同意或不同意 一个问题只问一件事情 要注意提问题的顺序,11,调查方法,定性调查和定量调查的结合更有意义的调查方式,12,抽样调查,定义:按照随机的原则,从总体中抽取部分样本进行调查。其目的是要反映总体特征。 特点: 对总体的一部分进行调查 调查的目的不是为了说明或反映样本本身的情况,而是为了推断说明总体的状况 要遵循随机性原则 用样本来反映总体必然存在误差,但这一误差是可以控制的 抽样调查的优点是:省时省力、花费较小,13,好的样本指的是什么?,它能尽可能精确地反映你想要的总体特征的信息 它是通过每个样本单位来代表总体中的一群人,来实现对总体的代表性 要想使样本能够尽可能地代表总体,必须采取随机抽样原则,14,一些定义,调查单位:要测量的单位个人、家庭、村或乡 目标总体:要研究的总体,如西南项目为广西、云南、贵州三省 样本:总体的一部分 抽样总体:可以真正从中抽取样本的总体,在这里总体中的每一个单元都有可能被抽中 抽样单位:实际要抽取的单位 抽样框:抽样单位的列表,15,目标总体和抽样总体,理想的情况是抽样总体与目标总体完全一致,目标总体,抽样总体-抽样框,未被抽样框 涵盖的部分,不可获得,拒绝回答,不能够回答,抽样总体,不合格,16,调查偏差,样本选择性偏差: 目标总体定义的不准确 目标总体的部分人没有被包含在抽样总体(抽样框)中 人为地选取某些样本;将方便调查的样本替换设计样本 无应答: 如果无应答具有选择性,会导致对总体的有偏估计 自愿进入调查: 自愿作为被调查者往往是有偏的,如网上调查、报纸调查、打进电话调查等。,17,测量误差,测量工具(问卷)未能反映所要测量的内容 被调查者不讲真话 被调查者对问题不理解或理解的不一致 遗忘 被调查者回答你期望要的答案 不同调查员得到的回答结果不一样 提问用语或问题顺序会影响到回答问题的质量,18,抽样调查:基于总体的概率抽样,总体是明确的,是有限总体 按照随机原则对样本进行选取 总体的每一个单位都可能被抽中,而且被抽中的概率是已知的 比如等概率抽样方法:每个单位被选中的可能性都一样;也叫自加权抽样法 抽样误差:它是样本代表总体的偏差,具体指样本指标与总体指标之间的数量差异,19,对抽样误差的理解,抽样误差是指抽样的随机性而产生的那一部分误差,不包括登记误差,也不包括可能发生的偏差。这种误差是必然会产生的,是不可避免的,但我们可以对它进行计算,并设法加以控制。 随机误差有两种,实际误差和平均误差。实际误差是一个样本指标与总体指标之间的差别,这是我们无法知道的误差。抽样平均误差是指所有可能出现的样本指标的标准差,也可以说是所有样本指标和总体指标的平均离差。 抽样实际误差是无法知道的,而抽样平均误差是可以计算的。在谈到抽样误差时指的是抽样平均误差,而不是抽样实际误差。,20,抽样平均误差,指所有可能样本的平均数与总体平均数的平均离差 中心极限定理指出:所有可能样本平均数的平均数等与总体平均数,21,标准误的计算,抽样误差是所有可能的样本指标的标准差(也叫标准误),是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。标准误的计算如下: 标准误 (SE)= 总体标准差 ()/样本规模(n)开平方根 抽样误差的数值大小受三个因素的影响。 受总体单位之间标志变异程度的影响,也就是受总体方差或总体标准差数值大小的影响。总体标准差数值大则抽样误差也大,总体标准差数值小,抽样误差也小 受样本单位数目多少的影响。抽取的样本单位数越多则抽样误差越小;样本单位数越少,则抽样误差越大。 抽样误差的大小还和抽取样本单位的抽样方式有关。,22,抽样误差的计算,对于简单随机抽样: 允许误差 (e) = 概率度(z)x 标准误 (SE) 在这里概率度与把握程度是相对应的,可以查表得到。比如,当 z = 1 时把握程度为68%, 当z=1.96时把握程度为95%。 实际上总体方差是不知道的,但一般用样本标准差(s)来代替总体方差。样本标准差的计算公式为: 如果估计的指标不是平均数,而是比例的话。样本方差= P(1-P)。这里P为比例,23,举例,根据2000年全国老年人调查,样本数据估计云南省2000年老年人年平均收入为640.6元;调查样本为497人;样本标准差为1969.8。由此估计标准误为 样本数据估计的云南2000年老年贫困人口比例为32.4%;标准误为1.48%;对总体的区间估计(95%把握)为:29.5%,35.3%,24,样本规模的估计,在进行抽样调查以前,首先要做的工作是估计应该抽取的样本规模有多大。根据上面的公式,按照简单随机抽样,样本规模:n = z2 x s2 / e2 根据前面老年人收入情况: 已知: s=1969.8; z=1.96; 若要求e=20元; n = 37266人,25,抽样方式,简单随机抽样:对总体不作任何处理,不进行分类也不进行排队,而是从总体的全部单位中随机抽选样本单位。 分层抽样:它先将总体中所有的单位按照某个标志分成若干类(或者叫层),然后在各类中随机抽取样本单位。样本单位在各类之间分配有两种方法。第一,等比例分层抽样。就是说,样本单位在各类之间的分配与总体单位的分配比例相同。第二,不等比例分层抽样。 系统抽样:它先将总体单位按一定的顺序排队,根据总体单位数和样本单位数计算出抽选间隔(或叫抽选距离),然后按照一定的间隔抽选样本单位。由于抽选间隔相等,所以又叫做等距抽样。 整群抽样是先将总体分为若干群(或者叫组),然后按随机原则抽取群,群内的所有样本都作为被调查单位。整群抽样的好处是抽选时不必编制总体单位的名单,而只需要编制群的名单;同时,抽中的单位比较集中,调查工作比较方便。总的讲来,可以节省人力,物力和财力。,26,抽样方式与抽样误差:设计效果,分层抽样: Deff 1,通过抽样调查就可以得到评估所需要的数据,然后将获得的数据带到前面给定的模型: Y = a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论