第五章抽样推断_第1页
第五章抽样推断_第2页
第五章抽样推断_第3页
第五章抽样推断_第4页
第五章抽样推断_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节抽样推断概述 第三节参数估计 第二节随机抽样的概率分布 第四节抽样设计 第五章抽样推断 第一节抽样推断概述 指样本单位的抽取不受主观因素及其他系统性因素的影响 每个总体单位都有均等的被抽中机会 抽样推断 按照随机原则从全部研究对象中抽取一部分单位进行调查 并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断 从而认识总体的一种统计方法 随机原则的实现 抽签法 是将总体中每个单位的编号写在外形完全一致的签上 将其搅拌均匀 从中任意抽选 签上的号码所对应的单位就是样本单位 随机数表法 将总体中每个单位编上号码 然后使用随机数表 查出所要抽取的调查单位 计算机模拟法 是将随机数字编制为程序存储在计算机中 需要时将总体中各单位编上号码 启用随机数字发生器输出随机数字 然后从总体中找到相应总体单位形成样本 按随机原则抽取样本单位以样本的数量特征推断总体的数量特征抽样推断产生抽样误差 但抽样误差可以事先计算并控制 抽样推断的特点 统计学 第五章抽样推断 与全面调查相比 抽样调查既节省了人力 物力 财力和时间 又达到了认识总体数量特征的目的 我国在1994年确立了以周期性普查为基础 以经常性抽样调整为主体 同时辅之以重点调查 科学核算等综合运用的统计调查方法体系 抽样推断的基本概念 全及总体 抽样总体 又称总体或母体 是所要认识研究对象的全体 它由具有某种共同性质或特征的单位所组成 常用N表示全及总体的单位数目 又称样本或子样 是指从全及总体中按照随机原则抽取的那部分个体的组合 抽样总体的单位数称为样本容量 通常用n表示 1 n N 例如 在100万户居民中 随机抽取1000户居民进行家庭收支情况调查 其中的100万户居民就是全及总体 而被抽中的1000户居民则构成抽样总体 n 30称为大样本 n 30称为小样本 n N称为抽样比 设总体中个总体单位某项标志的标志值分别为 其中具有某种属性的有个单位 不具有某种属性的有个单位 则 总体平均数 又叫总体均值 根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标 又称总体参数 全及指标 统计学 第五章抽样推断 总体单位标志值的标准差 总体单位标志值的方差 统计学 第五章抽样推断 总体成数 总体是非标志的标准差 总体是非标志的方差 统计学 第五章抽样推断 设样本中个样本单位某项标志的标志值分别为 其中具有和不具有某种属性的样本单位数目分别为和个 则 样本平均数 又叫样本均值 统计学 第五章抽样推断 样本单位标志值的标准差 样本单位标志值的方差 为的无偏估计 为的无偏估计 样本成数 样本单位是非标志的标准差 样本单位是非标志的方差 为的无偏估计 为的无偏估计 统计学 第五章抽样推断 抽样方法的分类 重复抽样 从总体N个单位中随机抽取一个样本容量为n的样本 每次从总体中抽取一个 并把结果登记下来 又放回总体中重新参加下一次的抽选 又称放回抽样 不重复抽样 每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选 又称不放回抽样 总体单位数N不变 同一单位可能多次被抽中 总体单位数减少n 同一单位只可能被抽中一次 根据取样方式不同 可分为 统计学 第五章抽样推断 第二节随机抽样的概率分布 主要样本统计量 平均数比率 成数 方差 分布的形状及接近总体参数的程度 学生 成绩30405060708090 按随机原则抽选出 名学生 并计算平均分数 平均数的抽样分布 二者均值相等 学生 成绩30405060708090 离差 30 20 100102030 统计学 第五章抽样推断 平均数的抽样分布 全部可能样本平均数的均值等于总体均值 即 从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布 样本均值的标准差为总体标准差的 统计学 第五章抽样推断 比率的抽样分布 全部可能样本比率的均值等于总体比率 即 从非正态总体中抽取的样本比率 当n足够大时其分布接近正态分布 从正态总体中抽取的样本比率 不论容量大小其分布均为正态分布 样本比率的标准差为总体标准的 统计学 第五章抽样推断 比率的抽样分布 教师是否博士 是 是 否 否 否 是 具有博士学位的比率 0 5比率的标准差 0 5 从总体中按重复抽样方法随机抽取 人 计算其比率 和标准差 统计学 第五章抽样推断 比率的抽样分布 统计学 第五章抽样推断 全部可能样本比率的均值等于总体比率 即 从非正态总体中抽取的样本比率当n足够大时其分布接近正态分布 从正态总体中抽取的样本比率不论容量大小其分布均为正态分布 样本比率的标准差为总体标准差的 比率的抽样分布 统计学 第五章抽样推断 学生 成绩60708090均值 75方差 125 从中按重复抽样方式抽取 人 计算样本的均值及方差S 方差的抽样分布 统计学 第五章抽样推断 抽样误差 167CM 169CM 172CM 160CM 162CM 167CM 175CM 180CM 165CM 167CM 170CM 175CM 178CM 180CM 162CM 173CM 155CM 160CM 170CM 165CM 平均身高 169 8CM 平均身高 174 6CM 总平均身高 168 6CM 统计学 第五章抽样推断 第三节参数估计 也叫抽样估计 就是根据样本指标数值对总体指标数值作出估计或推断 参数估计 通常 把用来估计总体特征的样本指标叫估计量或统计量 待估计的总体指标叫总体参数 特点 1 它在逻辑上运用归纳推理而不是演绎推理 2 在方法上运用不确定的概率估计方法 而不是运用确定的数学分析方法 3 抽样估计存在抽样误差 点估计 从总体中抽取一个随机样本 计算与总体参数相应的样本统计量 然后把该统计量视为总体参数的估计值 称为参数的点估计 区间估计 给出一个区间 置信区间 并推断真正的参数以一定的概率存在于这个区间的方法 抽样平均误差 指每一个可能样本的指标值与总体指标值之间平均离差 即一系列样本指标的标准差 式中 为样本平均数的抽样平均误差 为可能的样本数目 为第个可能样本的平均数 为总体平均数 注意 不要混淆抽样标准差与样本标准差 抽样平均误差的计算 样本平均数的抽样平均误差 当N 500时 有 重复抽样时 不重复抽样时 统计学 第五章抽样推断 样本成数的抽样平均误差 重复抽样时 不重复抽样时 当N 500时 有 抽样平均误差的计算公式 统计学 第五章抽样推断 关于总体方差的估计方法 用过去同类问题全面调查或抽样调查的经验数据代替 用样本标准差代替总体标准差 用代替 抽样平均误差的计算公式 统计学 第五章抽样推断 影响抽样误差的因素 总体各单位标志值的差异程度 即标准差的大小 越大 抽样误差越大 样本单位数的多少 越大 抽样误差越小 抽样方法 不重复抽样的抽样误差比重复抽样的抽样误差小 抽样组织方式 简单随机抽样的误差最大 统计学 第五章抽样推断 抽样极限误差 指在一定的概率保证程度下 抽样指标与总体指标之间抽样误差的最大可能范围 也称作抽样允许误差 常用 表示 上式表明 样本平均数 成数 是以总体平均数 成数 为中心 在相应的区间内变动 统计学 第五章抽样推断 由于总体成数和总体平均数是未知的 它要求靠实测的抽样平均数和抽样成数来估计 因而抽样误差的实际意义是希望总体平均数 成数 落在某个已知的范围内 抽样极限误差 所以前面的不等式应变换为 在一个特定的全及总体中 当抽样方法和样本容量固定时 抽样平均误差是一个定值 因此 抽样极限误差通常以抽样平均误差为标准单位来衡量 即抽样极限误差通常表示为抽样平均误差的多少倍 由于t值与样本估计值落入允许误差范围内的概率有关 因此 t也称为概率度 抽样估计的置信度 抽样指标和总体指标的误差不超过一定范围的概率大小 我们将它称之为概率保证程度 也叫抽样估计的置信度 一般用F t 表示 即 置信度 t值与相应的概率保证程度存在一一对应关 常用t值及相应的概率保证程度为 t值概率保证程度1 000 68271 960 95002 000 95453 000 9973 在大样本下 68 27 95 45 99 73 抽样极限误差 统计学 第五章抽样推断 以样本统计量为中心 以抽样平均误差为距离单位 可以构造一个区间 并可以一定的概率保证待估计的总体参数落在这个区间之中 区间越大 则概率保证程度越高 区间估计原理 区间估计原理 0 6827 落在范围内的概率为68 27 统计学 第五章抽样推断 区间估计原理 0 9545 落在范围内的概率为95 45 样本抽样分布曲线 原总体分布曲线 统计学 第五章抽样推断 区间估计原理 0 9973 落在范围内的概率为99 73 样本抽样分布曲线 总体分布曲线 统计学 第五章抽样推断 总体平均数的区间估计 表达式 其中 为极限误差 统计学 第五章抽样推断 步骤 计算样本平均数 搜集总体方差的经验数据 或计算样本标准差 即 总体平均数的区间估计 统计学 第五章抽样推断 步骤 计算抽样平均误差 重复抽样时 不重复抽样时 总体平均数的区间估计 统计学 第五章抽样推断 步骤 计算抽样极限误差 确定总体平均数的置信区间 总体平均数的区间估计 统计学 第五章抽样推断 例A 某企业生产某种产品的工人有1000人 某日采用不重复抽样从中随机抽取100人调查他们的当日产量 要求在95 的概率保证程度下 估计该厂全部工人的日平均产量和日总产量 总体平均数的区间估计 统计学 第五章抽样推断 100名工人的日产量分组资料 统计学 第五章抽样推断 解 统计学 第五章抽样推断 则该企业工人人均产量及日总产量的置信区间为 即该企业工人人均产量在124 797至127 203件之间 其日总产量在124797至127303件之间 估计的可靠程度为95 统计学 第五章抽样推断 总体成数的区间估计 表达式 其中 为极限误差 统计学 第五章抽样推断 步骤 计算样本成数 搜集总体方差的经验数据 计算抽样平均误差 重复抽样条件下 不重复抽样条件下 总体成数的区间估计 统计学 第五章抽样推断 步骤 计算抽样极限误差 确定总体成数的置信区间 总体成数的区间估计 统计学 第五章抽样推断 例B 若例A中工人日产量在118件以上者为完成生产定额任务 要求在95 的概率保证程度下 估计该厂全部工人中完成定额的工人比重及完成定额的工人总数 总体成数的区间估计 统计学 第五章抽样推断 100名工人的日产量分组资料 完成定额的人数 统计学 第五章抽样推断 解 统计学 第五章抽样推断 则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为 即该企业工人中完成定额的工人比重在0 8432至0 9568之间 完成定额的工人总数在843 2至956 8人之间 估计的可靠程度为95 统计学 第五章抽样推断 样本容量的确定 影响样本容量的因素 总体各单位标志值的差异程度 即标准差的大小 越大 所需样本容量越多允许的极限误差 的大小 越大 所需样本容量越小 推断的可靠程度 即置信度 对可靠程度要求越高 所需样本容量越大 抽样方法和抽样组织方式 重复抽样比不重复抽样所需样本容量要多 类型抽样比简单随机抽样所需样本容量多 确定方法 推断总体平均数所需的样本容量 重复抽样条件下 通常的做法是先确定置信度 然后限定抽样极限误差 或S通常未知 一般按以下方法确定其估计值 过去的经验数据 试验调查样本的S 计算结果通常向上进位 统计学 第五章抽样推断 不重复抽样条件下 确定方法 推断总体平均数所需的样本容量 统计学 第五章抽样推断 例A 某食品厂要检验本月生产的10000袋某产品的重量 根据上月资料 这种产品每袋重量的标准差为25克 要求在95 45 的概率保证程度下 平均每袋重量的误差范围不超过5克 应抽查多少袋产品 统计学 第五章抽样推断 解 统计学 第五章抽样推断 在不重复抽样下 确定方法 推断总体成数所需的样本容量 重复抽样条件下 统计学 第五章抽样推断 不重复抽样条件下 确定方法 推断总体成数所需的样本容量 统计学 第五章抽样推断 例B 某企业对一批总数为5000件的产品进行质量检查 过去几次同类调查所得的产品合格率为93 95 96 为了使合格率的允许误差不超过3 在99 73 的概率保证程度下 应抽查多少件产品 分析 因为共有三个过去的合格率的资料 为保证推断的把握程度 应选其中方差最大者 即P 93 统计学 第五章抽样推断 统计学 第五章抽样推断 必要样本容量的影响因素 总体方差的大小 允许误差范围的大小 概率保证程度 抽样方法 抽样的组织方式 统计学 第五章抽样推断 第四节抽样设计 抽样方案设计的基本原则 随机原则 抽取样本单位时 应确保每个总体单位都有被抽取的可能 在对样本单位的资料进行搜集和整理时 不能随意遗漏或更换样本单位 最大抽样效果原则 抽样误差最小 在其他条件相同的情况下 选抽样误差最小的方案 费用最少 在其他条件相同的情况下 选费用最少的方案 设计抽样方案时 通常是在误差达到一定要求的条件下 选择费用最少的方案 简单随机抽样 对总体未作任何处理的情况下 然后按随机原则直接从总体中抽出若干单位构成样本 抽样平均误差的计算公式见书 P243 抽取样本的具体方法 抽签法 是将总体中每个单位的编号写在外形完全一致的签上 将其搅拌均匀 从中任意抽选 签上的号码所对应的单位就是样本单位 随机数表法 将总体中每个单位编上号码 然后使用随机数表 查出所要抽取的调查单位 统计学 第五章抽样推断 简单随机抽样的特点 1 直接从总体中抽取所要调查的单位 无须分组 分类 排队等处理 2 必须事先对总体中的所有单位进行编码和编号 3 抽取样本时不借助有关标志的辅助信息 4 当总体各单位村志值之间差异很大时 采用此方法不能保证样本的代表性 先将总体全部单位按某一标志分类 然后从各类型中按随机原则抽取样本单位组成样本 类型抽样 实质上是分组法与随机原则的结合 例如 在居民生活水平调查中 先按职业分类 然后每种职业分别随机抽取部分居民进行调查 统计学 第五章抽样推断 类型抽样的优点 能提高样本的代表性 能降低影响抽样平均误差的总方差 组织起来较为方便 类型抽样分组的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论