




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第二章抽样调查的基本原理 第一节有关基本概念第二节样本统计量的抽样分布第三节抽样误差第四节抽样估计 2 第一节有关基本概念 一 总体总体也叫母体 它是所要认识对象的全体 是具有同一性质的许多单位的集合 组成总体的每个个体叫做单位 在抽样以前 把总体划分成若干个互不重叠并且能组合成总体的部分 每个部分称为一个抽样单元 不论总体是否有限 总体中的抽样单元数一定是有限的 抽样单元又有大小之分 一个大的抽样单元可以分成若干个小的抽样单元 最小的抽样单元就是每一个个体 3 总体应具备同质性 大量性和差异性的特征 在抽样调查中 通常将反映总体数量特征的综合指标称为总体参数 常见的总体参数主要有 总体总和 总体均值 总体比率 总体比例 4 二 样本样本是由从总体中所抽选出来的若干个抽样单元组成的集合体 抽样前 样本是一个n维随机变量 属样本空间 抽样后 样本是一个n元数组 是样本空间的一个点 抽样的效果好不好 依赖于样本对总体是否有充分的代表性 影响样本代表性的因素有以下几个方面 1 总体标志值分布的离散程度 2 抽样单元数的多少 或称样本容量的大小 3 抽样方法 5 一般将反映样本数量特征的综合指标称之为统计量 统计量是n元样本的一个实值函数 是一个随机变量 统计量的一个具体取值即为统计值 主要的样本统计量有 样本总和 样本均值 样本比率 样本比例 6 三 必要样本容量和样本可能数目样本中包含的抽样单元个数称为样本容量 样本容量与总体容量之比为抽样比 用f表示 即f n N 样本可能数目则是在容量为N的总体中抽取容量为n的样本时 所有可能被抽中的不同样本的个数 正确理解样本可能数目的概念 对于准确理解和把握抽样误差的计算 样本统计量的抽样分布 抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助 7 四 抽样框抽样框是在抽样前 为便于抽样工作的组织 在可能条件下编制的用来进行抽样的 记录或表明总体所有抽样单元的框架 在抽样框中 每个抽样单元都被编上号码 抽样框可以是一份清单 名单抽样框 一张地图 区域抽样框 也可以是一段时序 8 第二节样本统计量的抽样分布 标准的统计问题为 总体未知 故需从总体中抽取一个较小的 花费不多的随机样本 然后构造样本统计量 并以其估计总体 问题是用样本指标估计总体指标的可靠程度如何 为此要研究样本统计量的抽样分布 在此之前 有必要先回顾一下有关正态分布的知识 9 一 正态分布一个正态分布完全由总体的理论平均数和理论方差这两个参数所决定 如果一个随机变量X服从正态分布 则其分布的密度函数 分布曲线方程 为 任何正态分布 它的样本落在任意区间 a b 内的概率等于直线x a x b 横坐标和曲线f x 所夹的面积 可由正态分布概率积分表查得 经计算 正态总体的样本落在 10 二 抽样分布样本统计量是个随机变量 把根据所有可能样本计算出来的某一统计量的数值分布 称为抽样分布 抽样分布理论是理解抽样调查基本原理的基础 常见的抽样分布有极限分布和精确分布两类 极限分布也叫做大样本分布 它只有正态分布一种形式 精确分布又叫做小样本分布 其前提是总体服从正态分布 它是正态分布的导出分布 包括有t分布 F分布和 2分布等形式 11 第三节抽样误差 一 抽样调查中的误差来源误差就是调查结果与现象的实际结果之间的偏差 在抽样调查中 按照形成原因的不同 一般可将误差分成抽样误差和非抽样误差两大类 抽样误差是用样本统计量推断总体参数时的误差 它属于一种代表性误差 抽样误差通常会随样本量的大小而增减 影响抽样误差的因素还有 所研究现象总体变异程度的大小 抽样的方式方法 12 非抽样误差不是由于抽样引起的 它又包括调查误差 无回答误差 抽样框误差以及登记性误差 同抽样误差相反 非抽样误差是随着样本量的增加而增大的 13 二 抽样误差的计算由于从一个总体中抽取容量为n的样本时 有多种可能的结果 所以样本指标是随机变量 而总体指标是唯一确定的常量 故抽样误差也是一个随机变量 一般情况下 均方误差说明了估计量的准确性 而估计量的方差则表明了其估计结果的精确性 通常将精确度定义为估计量方差的倒数 而将准确度定义为估计量均方误差的倒数 14 第四节抽样估计 抽样估计就是以样本的实际资料为依据 计算一定的样本统计量 并按照一定的方法对总体参数作出估计和推断 一 抽样估计的特点第一 抽样估计在逻辑上运用的是归纳推理而不是演绎推理 第二 抽样估计在方法上运用不确定的概率估计法而不是运用确定的数学分析法 第三 抽样估计的结论存在着一定程度的抽样误差 15 二 抽样估计的方法抽样估计的方法多种多样 如果以估计中所依据的资料不同来区分 一般可以有简单估计 比估计和回归估计等三种方法 简单估计是最简单 最基本的一种估计方法 在实际中应用也最为广泛 如果以估计结果的表示方式来区分 则抽样估计可以有两种形式 即定值估计和区间估计 定值估计是指给所要估计的总体参数只给出一个明确的点估计值 同时确定出估计结果的误差 16 区间估计则是在一定的概率保证程度 置信度 之下 根据允许的最大绝对误差范围 确定出一个以点估计值为中心的区间作为总体待估参数 的估计区间 17 三 置信区间一般地说 若估计量是无偏的 且呈正态分布 则参数 的置信度为1 的置信区间可以写成 KS KS 当调查变量的总体方差 2已知时 上述置信区间可表示为 Z 2S Z 2S 即取K Z 2 Z 2的值可以通过查正态分布双侧临界值表加以确定 18 19 当调查变量的总体方差 2未知时 则用相应的样本方差s2代替 然而 这时有可能会使误差产生一个增量 特别是当样本较小时 更容易影响估计的精度 因此 为了保持1 的置信度 就应该适当加宽置信区间 即用较大的t 2值来代替Z 2 此时 置信区间就可以表示成 t 2 t 2 其中t 2的值可通过查t分布临界值表来确定 在这里自由度为df n 1 表示以s2代替 2后对抽样标准误S 的估计量 四 估计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业互联网平台中AR交互技术在设备调试与故障诊断中的应用报告001
- 安全考试试题及答案复制
- 特色主题餐厅餐饮业食品安全监管政策解读研究报告2025
- 2025年航空货运市场竞争格局变化及发展策略研究报告
- 中国发型发展史
- 中国历史趣味课件
- 《编制说明-公安交通应急管理装备配备要求》
- 周志华人工智能课件
- 员工职业规划培训课件
- 南昌市南大附中2025届英语七下期中学业质量监测模拟试题含答案
- GB/T 23932-2009建筑用金属面绝热夹芯板
- 防静电手环测试指导书
- 机电控制工程
- 码头承包经营合同
- 建筑工程防水(防渗漏)处理PPT
- WTO世界贸易组织概论期末复习题
- 温病学讲义刘景源
- 幼儿园教育活动设计与指导幼儿园教育活动设计的基本模式
- 校企共建校内实训基地协议模版
- 嵌顿疝病人应急预案
- 影响全国房价因素的多元回归分析-中南财经政法大学《统计分析软件》论文报告
评论
0/150
提交评论