




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第二章 抽样调查的基本原理,第一节 有关基本概念 第二节 样本统计量的抽样分布 第三节 抽样误差 第四节 抽样估计,2,第一节 有关基本概念,一、总体 总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。组成总体的每个个体叫做单位。 在抽样以前,把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的。抽样单元又有大小之分,一个大的抽样单元可以分成若干个小的抽样单元,最小的抽样单元就是每一个个体。,3,总体应具备同质性、大量性和差异性的特征。在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有: 总体总和、总体均值、总体比率、总体比例。,4,二、样本 样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。抽样前,样本是一个n维随机变量,属样本空间;抽样后,样本是一个n元数组,是样本空间的一个点。 抽样的效果好不好,依赖于样本对总体是否有充分的代表性。影响样本代表性的因素有以下几个方面: (1)总体标志值分布的离散程度。 (2)抽样单元数的多少(或称样本容量的大小)。 (3)抽样方法。,5,一般将反映样本数量特征的综合指标称之为统计量。统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。主要的样本统计量有:样本总和、样本均值、样本比率、样本比例。,6,三、必要样本容量和样本可能数目 样本中包含的抽样单元个数称为样本容量。样本容量与总体容量之比为抽样比,用f表示,即f=n/N。 样本可能数目则是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数。正确理解样本可能数目的概念,对于准确理解和把握抽样误差的计算、样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。,7,四、抽样框 抽样框是在抽样前,为便于抽样工作的组织,在可能条件下编制的用来进行抽样的、记录或表明总体所有抽样单元的框架,在抽样框中,每个抽样单元都被编上号码。 抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框),也可以是一段时序。,8,第二节 样本统计量的抽样分布,标准的统计问题为:总体未知,故需从总体中抽取一个较小的、花费不多的随机样本,然后构造样本统计量,并以其估计总体。问题是用样本指标估计总体指标的可靠程度如何?为此要研究样本统计量的抽样分布。 在此之前,有必要先回顾一下有关正态分布的知识。,9,一、正态分布 一个正态分布完全由总体的理论平均数和理论方差这两个参数所决定。如果一个随机变量X服从正态分布,则其分布的密度函数(分布曲线方程)为:,任何正态分布,它的样本落在任意区间(a,b)内的概率等于直线x=a,x=b,横坐标和曲线f(x)所夹的面积(可由正态分布概率积分表查得)。经计算,正态总体的样本落在:,10,二、抽样分布 样本统计量是个随机变量。把根据所有可能样本计算出来的某一统计量的数值分布,称为抽样分布。抽样分布理论是理解抽样调查基本原理的基础。常见的抽样分布有极限分布和精确分布两类。 极限分布也叫做大样本分布,它只有正态分布一种形式。 精确分布又叫做小样本分布,其前提是总体服从正态分布,它是正态分布的导出分布,包括有t分布、F分布和2分布等形式。,11,第三节 抽样误差,一、抽样调查中的误差来源 误差就是调查结果与现象的实际结果之间的偏差。在抽样调查中,按照形成原因的不同,一般可将误差分成抽样误差和非抽样误差两大类。 抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差。抽样误差通常会随样本量的大小而增减;影响抽样误差的因素还有:所研究现象总体变异程度的大小;抽样的方式方法。,12,非抽样误差不是由于抽样引起的。它又包括调查误差、无回答误差、抽样框误差以及登记性误差。同抽样误差相反,非抽样误差是随着样本量的增加而增大的。,13,二、抽样误差的计算 由于从一个总体中抽取容量为n的样本时,有多种可能的结果,所以样本指标是随机变量,而总体指标是唯一确定的常量,故抽样误差也是一个随机变量。 一般情况下,均方误差说明了估计量的准确性,而估计量的方差则表明了其估计结果的精确性。通常将精确度定义为估计量方差的倒数,而将准确度定义为估计量均方误差的倒数。,14,第四节 抽样估计,抽样估计就是以样本的实际资料为依据,计算一定的样本统计量,并按照一定的方法对总体参数作出估计和推断。 一、抽样估计的特点 第一,抽样估计在逻辑上运用的是归纳推理而不是演绎推理。 第二,抽样估计在方法上运用不确定的概率估计法而不是运用确定的数学分析法。 第三,抽样估计的结论存在着一定程度的抽样误差。,15,二、抽样估计的方法 抽样估计的方法多种多样。如果以估计中所依据的资料不同来区分,一般可以有简单估计、比估计和回归估计等三种方法。简单估计是最简单、最基本的一种估计方法,在实际中应用也最为广泛。 如果以估计结果的表示方式来区分,则抽样估计可以有两种形式,即定值估计和区间估计。 定值估计是指给所要估计的总体参数只给出一个明确的点估计值,同时确定出估计结果的误差。,16,区间估计则是在一定的概率保证程度(置信度)之下,根据允许的最大绝对误差范围,确定出一个以点估计值为中心的区间作为总体待估参数的估计区间。,17,三、置信区间 一般地说,若估计量是无偏的,且呈正态分布,则参数的置信度为1-的置信区间可以写成 ( -KS( ), +KS( ) 当调查变量的总体方差2已知时,上述置信区间可表示为 ( -Z/2S( ), + Z/2S( ) 即取K= Z/2, Z/2的值可以通过查正态分布双侧临界值表加以确定。,18,19,当调查变量的总体方差2未知时,则用相应的样本方差s2代替。然而,这时有可能会使误差产生一个增量,特别是当样本较小时,更容易影响估计的精度。因此,为了保持1-的置信度,就应该适当加宽置信区间,即用较大的t/2值来代替Z/2。此时,置信区间就可以表示成 ( -t/2 ( ), +t/2 ( ) 其中t/2的值可通过查t分布临界值表来确定,在这里自由度为df=n-1;( )表示以s2代替2后对抽样标准误S( )的估计量。,四、估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年桂林市临桂区吾悦幼儿园招聘教师考试笔试试题(含答案)
- 动物骨骼在文物保护与修复中的应用创新创业项目商业计划书
- 物体识别AR购物体验创新创业项目商业计划书
- 动物专用止痒产品创新创业项目商业计划书
- 2025年直播电商主播影响力与直播广告营销策略研究报告
- 2025年工业互联网平台数字水印技术在数据安全治理中的应用与效果评估
- 2025年干细胞治疗神经系统疾病临床应用创新案例解析报告
- 2025年城市河道生态修复项目生态修复效果与生态修复实施
- 2026届内蒙古赤峰市宁城县化学高二上期末综合测试试题含答案
- 民法典物业培训课件
- bc-6800产品中心医院
- 中国古代文学史 马工程课件(下)24第九编晚清文学 第三章 宋诗派的兴起与桐城派的承变
- GB/T 40565.2-2021液压传动连接快换接头第2部分:20 MPa~31.5 MPa平面型
- GB/T 38537-2020纤维增强树脂基复合材料超声检测方法C扫描法
- GB/T 11446.10-1997电子级水中细菌总数的滤膜培养测试方法
- 儿童生长发育监测课件
- 混凝土结构跳仓施工方案
- 页岩气开发地震监测技术要求DB50-T 1234-2022
- 实验室病原微生物危害 评估报告
- 科技项目申报专员系列培训(技术攻关项目)
- 品质异常处罚细则及奖罚制度
评论
0/150
提交评论