抽样调查第1章引言.ppt_第1页
抽样调查第1章引言.ppt_第2页
抽样调查第1章引言.ppt_第3页
抽样调查第1章引言.ppt_第4页
抽样调查第1章引言.ppt_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样调查,教师:胡松华,课程要求,每次实验课需撰写实验报告,并统一提交,作为实验成绩 利用本课程所学方法,选取一个实际问题,进行调查问卷分析,并撰写课程论文,计入平时成绩,考核要求,本课程以考核为主,总成绩包括: 平时成绩占10% 实验成绩占20% 期末成绩占70%,参考教材,抽样论,许宝禄编著,北京大学出版社 抽样调查,孙山泽编著,北京大学出版社 抽样技术(第四版),金勇进等编著,中国人民大学出版社,目 录,第一章 引言 第二章 简单随机抽样 第三章 不等概抽样 第四章 分层抽样 第五章 多阶抽样 第六章 整群抽样与系统抽样 第七章 二相抽样,第一章 引言,1.1 大规模抽样调查,1.2 有

2、限总体抽样的样本分布,1.3 概率抽样的几种基本 的抽样方法,抽样调查的意义与分类,总体与样本,抽样调查的操作流程,1.1 大规模抽样调查,抽样调查的概念,广义上讲抽样调查即非全面调查,狭义上讲指从构成总体的所有单元中按一定程序选择一部分单元,并根据这部分单元的特征估计或推断总体特征的调查,Sample survey,抽样调查的意义,在一些场合,找到总体的所有单位客观上根本不可能,在一些场合,能找到所有单元,但时间与费用代价太高,在一些场合,能找到所有单元,代价也 能承受,但在保证效果前提下可提高效率,抽样调查的分类,概率抽样调查,非概率抽样调查,按照一定概率从构成总体的所有单元中随机选择一部

3、分单元进入样本的抽样方法,典型抽样 便利抽样 “自愿”抽样,课堂练习一,下列情况是否属于概率抽样? (1)从装有30只小鸡的箱子抓5只,不做任何挑选,随便抓满5只为止。 (2)将箱中30只小鸡编上130号,从 130中随机抽取5个数字,将对应小鸡抓出来。,Jessen的实验(1978),求126个石头的平均重量,Jessen的实验(1978),可以看出: (1)样本容量的增加对典型抽样的精度改进不大,而随机抽样的精度随样本量的增加有明显改善;,典型调查的特点: 取样很少,无法获得客观的误差评价;要以普查或概率调查为基础。,(2)样本量很小时,依靠充足的先验信息获取的典型样本为佳,而样本量较大时

4、,随机样本的估计更好。,总体与样本,总体与个体:所有调查客体的集合称为 调查总体,构成总体的调查客体称为个体,数理统计中总体一般为服从某种分布的无限总体,这里是有限总体。,记号:U(N)=U1 , U2 , ,UN,指标量记号:Y1 ,Y2 , ,YN,总体与样本,抽样框与抽样单元:其单元满足“与实际总 体的每个单元之间存在确定的对应关系, 凭借这种对应关系可以找到实际总体中特定 的一个或一些单元”条件的实际总体的映射总 体称为抽样框,构成映射总体的单元称为抽 样单元。,抽样框可认为是一个目录性清单。其形式可为:名单、手册、地图、数据库等。,抽样框必须是有序的,其包含的抽样单元务必“不重不漏”

5、。,抽样单元不仅是“影子”,还指“实体”,又称样本单元或样本点,不一定是基本单元,可划分、分级。,总体与样本,抽样与样本:从总体全部单位中选择部分 单元的活动称为抽样,而抽样的结果 从总体全部单元选出的部分单元,其全体 称为样本总体,简称样本。,记号:y1 ,y2 , ,yn,抽样比:f =n/N,课堂练习二,区分以下概念: (1)个体与样本 (2)总体与抽样框 (3)个体与抽样单元,抽样调查的操作流程,1、建立课题,明确调查目的,2、调查的准备阶段,3、现场工作阶段,4、数据处理阶段,5、写出报告结论,总体及目标量的确定,抽样框,收集数据的方法,抽样设计,问卷设计,数据的验收编辑,估计、分析

6、,抽样的样本分布,入样概率,常见待估计总体特征,1.2 有限总体抽样的样本分布,对估计量的要求,抽样的样本分布,对于有限总体U(N)=U1 , U2 , ,UN, 其指标量为Y1 ,Y2 , ,YN,从中抽取 样本y1,y2,yn,由于是概率抽样,每个可能样本有一个确定出现概率,称为由抽样设计形成的样本概率分布。,在某种抽样设计下,由样本概率分布得到的样本统计量的期望方差称为基于设计的期望、方差。,抽样的样本分布,对有限总体U(N)=U1 , U2 , ,UN作有放回抽样,每次随机抽出一个单元观测后放回再抽下一个单元,得样本y1,y2,yn,对有限总体U(N)=U1 , U2 , ,UN作无放

7、回抽样,每次随机抽出一个单元观测后不放回再抽下一个单元,得样本y1,y2,yn,不计每个单元出现顺序。,样本总数:Nn,每个样本出现概率:1/Nn,样本总数:,每个样本出现概率:,入样概率,概念:一个总体单元出现在样本中的概率称为入样概率,例:对有7个单元的总体 1,2,3,4,5,6,7 进行抽样,先分成两个子总体 1,2,3,4和5,6,7 再从每个子总体中随机抽取两个单元,共4个单元组成样本,求样本分布与 各单元入样概率。,每个样本出现概率为1/18;1,2,3,4入样概率为1/2;5,6,7入样概率为2/3。,性质1:,记一个可能样本为s,样本出现概率为p(s),则有,对任一单元Yk,

8、,入样概率,即为Yk的入样概率。,性质2:,入样概率,定理1 对总体Y1 ,Y2 , ,YN 抽取一个样本量为n的无重复样本(即同一单元不在样本中重复出现),对任一抽样设计,记Yk的入样概率为 ,记两个单元Yk,Yl同时入样的 概率为 ,则有:,常见待估计总体特征,常见待估计总体特征,总体总值、均值、比例的统一关系:,总体总值、比例都可以用均值来表示,对估计量的要求,偏量,以样本统计量w估计总体的数字特征W, B(w)=E(w-W)=E (w)-W 称为偏量。,均方偏差MSE(mean square erro),MSE(w)=E(w-W)2=var(w)+B2(w),对估计量的要求,样本量n增

9、大时,B (w)与MSE (w)同时变小,且应有,即:B (w)的量级低于MSE (w).,比较两种估计量的好坏,以MSE (w)为准,MSE (w)小者为佳。,优良抽样方案的衡量准则,几种基本的抽样方法,1.3 概率抽样的几种基本抽样方法,优良抽样方案的衡量准则,目的性:,可度量性:,可行性:,经济性:,高要求大样本,复杂设计; 低要求小样本,简单设计,可给出估计值可能的误差范围,设计方案能够得到忠实执行,在经费与精度之间折衷,几种基本的抽样方法,简单随机抽样,从一个单元数为N的总体逐个抽取单元且无放回,每次都在所有尚未进入样本的单元中等概率地抽取,直到n个单元抽完。,Simple rand

10、om sample (SRS),每个样本出现概率为,特点:,简单直观,N很大时,受抽样框限制较难执行,系统抽样,先将总体中的抽样单元按某种顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。,Systematic sample,仅初始单元需随机抽取,实施简便,特点:,对抽样框要求不高,估计精度较困难,几种基本的抽样方法,特别地,若在抽取初始单元后按照相等间距抽取其余单元,则称等距抽样。,不等概抽样,几种基本的抽样方法,每个单元的入样概率不同,常以辅助信息为依据决定个体的入样概率。,Non-equal-probability sample,赋予适当的入样概率可以提高

11、精度,特点:,需要辅助信息,分层抽样,先按照某种规则把总体划分为不同的层,然后在层内再进行抽样。各层的抽样独立进行;估计在各层内进行,再由各层估计量加权平均或求和得出总体估计。,Stratified sample,几种基本的抽样方法,分层适当时可显著提高精度,特点:,抽样单元集中,利于调查实施,分层需要辅助信息,整群抽样,抽样仅对初级抽样单元进行,对抽中的初级单元中调查其全部抽样单元,对没抽中初级单元不调查(群即初级抽样单元)。,几种基本的抽样方法,样本集中,特点:,Cluster sample,只需初级抽样框,精度较差,(一般比同样本量SRS差),多阶抽样,是整群抽样的发展,抽得初级单元后,再从中抽取次级单元,直至达到基本单元。,几种基本的抽样方法,样本集中,特点:,Multi-stage sample,编制抽样框较方便,估计方差较复杂,阶段不宜过多,多重(相)抽样,对总体进行一次以上抽样。通常先以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论