《第六章抽样》PPT课件.ppt_第1页
《第六章抽样》PPT课件.ppt_第2页
《第六章抽样》PPT课件.ppt_第3页
《第六章抽样》PPT课件.ppt_第4页
《第六章抽样》PPT课件.ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统 计 学 x o y 统计学讲授内容 第一章 绪论 第二章 统计调查与整理 第三章 综合指标 第四章 动态数列分析 第五章 统计指数 第六章 抽样推断 第七章 相关与回归分析 第六章 抽样推断 v第一节 抽样推断的基本问题 v第二节 抽样误差 v第三节 抽样估计 v第四节 抽样单位数目的确定 第六章 抽样推断 第一节 抽样推断的基本问题 v一、抽样推断的概念 v二、抽样推断的特点 v三、抽样推断的作用 v四、抽样推断的有关概念 v五、抽样方法 v六、抽样的组织方式 第六章 抽样推断基本问题 v抽样推断是指从被研究现象的总体中 v按照随机原则抽取一部分单位进行调查, v并依据调查结果对全部研究对象的数量特征 v作出具有一定可靠程度的估计, v以达到对全部研究对象认识的 v一种统计方法。 一、抽样推断的概念 第六章 抽样推断基本问题 二、抽样推断的特点 v(一)按照随机原则从总体中抽取样本单位。 v典型单位是有意识的选取有代表性的单位。 v重点单位是客观存在的事物。 v(二)用样本的指标数值推断总体的指标数值。 v重点调查是通过重点单位的调查了解总体的基本情 况,并不对总体数量特征进行估计。 v典型调查一般也不用于推断总体指标,有时虽然也 对总体数量特征做出大致的估计,但这种估计无法 确定其精确程度和可靠性。 v(三)抽样误差不可避免,但可以事先计算并加以控 制。 第六章 抽样推断基本问题 三、抽样推断的作用 v(一)无法进行全面调查 v具有破坏性的产品质量检验 v无限总体 v难以确定总体(推出一种饮料、调查多少人喜欢节目 v(二)实际上没有必要或很难进行全面调查 v水库的鱼苗数、森林的木材蓄积量、沙漠上沙粒数。 v城乡居民收支调查、物价调查、民意调查。 v(三)用于工业生产过程的质量控制 v(四)可以验证和补充全面调查资料 v对总体的某种假设进行检验 第六章 抽样推断基本问题 四、抽样推断的有关概念 v(一)全及总体和抽样总体 v1.全及总体 v所要认识对象的全体 v总体单位数: N v(1)有限总体 v(2)无限总体 v2.抽样总体 v所抽取的一部分单位 v样本单位数: n v(1)大样本 v(n30) v(2)小样本(n30) 第六章 抽样推断基本问题 v(二)全及指标和抽样指标 第六章 抽样推断基本问题 1.全及指标 用来描述全及总体的指标 2.抽样指标 根据样本单位计算的指标 五、抽样方法 v(一)按抽取样本单位的方法不同 v1.重复抽样 v从总体中抽选样本单位时,每次把抽中的单位登记后, 又重新放回总体中,再进行下一个样本单位的抽选。 v在整个抽选样本单位的过程中,总体单位数始终保持不 变,同一单位有多次重复中选的可能。 v2.不重复抽样 v从总体中抽选样本单位时,每次把抽中的单位不再放回 总体中,而在剩余的总体单位中进行下一个样本单位的 抽选。 v在整个抽选样本单位的过程中,每抽中一个样本单位, 总体单位数就减少一个,同一单位不会出现重复中选的 可能。 第六章 抽样推断基本问题 v(二)根据对样本的要求不同 v1.考虑顺序的抽样 v不但要考虑样本各单位的不同性质,而且还 考虑不同性质各单位的中选顺序。 v ABBA v2.不考虑顺序的抽样 v只考虑样本各单位的不同性质,不考虑出现 的先后顺序。 v AB=BA 第六章 抽样推断基本问题 v(三)两种分类交叉 v1.考虑顺序的不重复抽样 v2.考虑顺序的重复抽样 v3.不考虑顺序的不重复抽样 v4.不考虑顺序的重复抽样 第六章 抽样推断基本问题 六、抽样的组织方式 v1.简单随机抽样 v(1)概念 v对总体单位不作任何分类或排队,完全按随机原则逐 个地抽取样本单位。 v(2)优缺点 v最符合随机性原则。 v当总体规模很大时,难以操作。 v总体内部差异较大时,不能保证抽中的样本单位在总 体中有均匀的分布,以致抽样误差偏大。 v(3)适用条件 v简单随机抽样限于总体规模不大,内部差异也不很大 的情况。 第六章 抽样推断基本问题 2.类型抽样 v(1)概念 v将总体全部单位按某个标志分成若干个类型组, 然后从各类型组中采用简单随机抽样方式或其它 方式抽取样本单位。 v将总体划分成若干个类型组后,各类型组内部的 差异必定小于总体的差异,从各组中抽取的样本 单位其代表性较强,同时,各类型组都有一定的 单位入选,就可能使样本的结构更近似于总体的 结构。 v因此类型抽样的抽样误差比简单随机抽样小,抽 样推断的效果比较好。 第六章 抽样推断基本问题 v(2)样本单位数在各类型组中的分配方式 v等额分配 v在各类型组中分配同等单位数。 v如果各类型组的规模相等或差不多,用这种分配法 抽样是适宜的,且计算简便。 v但在实践中,总体各类型组规模相等或差不多的情 况并不多见,所以等额分配法很少采用。 v等比例分配 v按各类型组在总体中所占比例分配样本单位数。 第六章 抽样推断基本问题 把总体分为K个类型组 v考虑了各类型组规模大小的因素,有利于减少人 为的抽样偏差,且计算操作方便,应用普遍。 v最优分配 v按各类型组的规模大小和差异程度,确定各类型 组的样本单位数。 v这种样本单位分配方法,既考虑了各类型组的规 模大小,同时也考虑了各类型组的差异程度,由 此确定各类型组的样本单位数,无疑是减少抽样 误差的最理想的方法。 v在抽样技术上称为最优分配,但实际上很少采用 ,因为除非有历史资料可以参考,在调查之前, 一般不可能知道各类型组内部的差异大小。 第六章 抽样推断基本问题 3.等距抽样 v(1)概念 v将总体各单位标志值按某一标志顺序排队,然而 按一定的间隔抽取样本单位。 v(2)排队的方法 v 无关标志排队 v 有关标志排队 v(3)抽取样本单位的方法 v按相等的距离取样 v对称等距取样 v(4)抽取第一个样本单位的方法 v随机抽取 v居中抽取 第六章 抽样推断基本问题 v4.整群抽样 v把总体分为若干群,从总体群中抽取若干样本群, 对抽中的群进行全数登记调查。 v抽取的样本单位比较集中,登记调查较为方便,可 以节省人力、财力。 v因抽取的样本单位比较集中,影响了样本单位在总 体中的均匀分布,与其他抽样方式比较,抽样误差 较大。 v为了减少抽样误差要尽可能多抽一些群,而且这些 群是均匀分布于总体中的。 v5.多阶段抽样 v抽样时,先抽总体中较大范围的单位,再从中选的 较大范围的单位中抽取较小范围的单位,依此类推 ,最后得到样本的基本单位。 第六章 抽样推断基本问题 第二节 抽样误差 v一、抽样误差的概念及影响因素 v二、抽样平均误差 v(一)概念 v(二)计算 v 1.简单随机抽样 v 2.类型抽样 v 3.等距抽样 v 4.整群抽样 v 5.阶段抽样 v三、抽样极限误差 v四、抽样极限误差与抽样平均误差的关系 第六章 抽样推断抽样误差 一、抽样误差的概念及影响因素 v(一)抽样误差的概念 v1.登记汇总性误差 v由于观察、登记、计量、计算上的差错而产生的抽样 指标与总体指标之间的误差。 v2.代表性误差 v由于样本的结构不足以代表总体的结构而产生的抽样 指标与总体指标之间的误差。 v(1)偏差 v由于违背了随机原则,而产生的样本的代表性不强所 引起的误差。 v(2)随机误差(抽样误差) v是指随机抽样的偶然因素而引起的抽样指标和总体指 标之间的差距。 (二)影响抽样平均误差的因素 v1.总体标准差的大小 v在其他条件一定的情况下,总体标准差与抽样平 均误差成正比关系。 v2.样本单位数的多少 v在其他条件一定的情况下,抽取的样本单位数越 多,抽样误差越小。反之亦然。 v3.抽样方法的不同 v在其他条件一定的情况下,不重复抽样的抽样误 差小于重复抽样的抽样误差。 v4.抽样组织方式的差别 v在其他条件一定的情况下,抽样组织方式不同, 抽样误差大小也不同。 第六章 抽样推断抽样误差 二、抽样平均误差 v(一)抽样平均误差的含义 v抽样平均误差是反映抽样误差一般水平的指标。 实际误差 平均误差 抽样平均误差是样本指标与总体指标之间的平均离差 第六章 抽样推断抽样误差 随机 误差 (二)抽样平均误差的计算 v1.简单随机抽样 v平均数的抽样平均误差 第六章 抽样推断抽样误差 v成数的抽样平均误差 没有总体资料时用样本资料代替 不重复: 当N很大时: 重复抽样下,样本变量是独立的。则 第六章 抽样推断抽样误差 共n个 某冷库冻鸡平均每只重1200克,标准差70克, 如果重复随机抽取100只和200只, 分别计算抽样平均误差。 该冷库冻鸡合格率为97%,如果重复随机抽取100只 和200只,分别计算抽样平均误差。 第六章 抽样推断抽样误差 2.类型抽样平均误差的计算公式 v平均数的抽样平均误差 v重复 第六章 抽样推断抽样误差 v不重复且等比例 v成数的抽样平均误差 v重复 第六章 抽样推断抽样误差 v不重复且等比例 没有总体资料时用样本资料代替 有12块小麦地,每块1亩。 6块处于丘陵地带,亩产量(斤)分别为:300 330 330 340 370 370 。 6块处于平原地带,亩产量(斤)分别为:420 420 450 460 490 520。 抽查4块,测定12块地的平均亩产量,计算其抽样 误差。 设亩产在350以上的为高产田,抽查4块,测定12 块地高产田的比重,计算其抽样误差。 用类型抽样,每类抽2块 第六章 抽样推断抽样误差 亩产量 3001600 330100 330100 3400 370900 370900 合计3600 丘陵 第六章 抽样推断抽样误差 亩产量 4201600 4201600 450100 4600 490900 5203600 合计7800 平原 第六章 抽样推断抽样误差 第六章 抽样推断抽样误差 地块 数 高产 田数 高产田 比重% 丘陵6233.366.6722.2 平原6610000 第六章 抽样推断抽样误差 亩产量 300 330 330 340 370 370 420 420 450 460 490 520 10000 4900 4900 3600 900 900 400 400 2500 3600 8100 14400 合计54600 第六章 抽样推断抽样误差 地块数高产田数高产田比重% % 12866.6722.22 第六章 抽样推断抽样误差 3.等距抽样平均误差的计算公式 v按无关标志排队 v同不重复简单随机抽样 v按有关标志排队 第六章 抽样推断抽样误差 没有总体资料时用样本资料代替 亩产量: 亩产量: 亩产量: 亩产量: 抽选间隔为 300 330 330 340 370 370 420 420 450 460 490 520 第六章 抽样推断抽样误差 4.整群抽样抽样平均误差的计算公式 第六章 抽样推断抽样误差 没有总体资料时用样本资料代替 某水泥厂一昼夜的产量为14400袋,现每隔144 分钟抽取1分钟的水泥(10袋)检查平均每袋重量 和一级品率,根据如下样本资料,计算抽样平均误 差 一昼夜有1440分钟,即把总体分为1440群,R=1440 每隔144分钟抽取1分钟的水泥(10袋),r= 10 第六章 抽样推断抽样误差 样本群平均每袋重量一级品比重 1 2 3 4 5 6 7 8 9 10 49 51 52 53 50 49 50 48 50 53 2.25 0.25 2.25 6.25 0.25 2.25 0.25 6.25 0.25 6.25 0.80 0.75 0.83 0.82 0.80 0.79 0.78 0.80 0.81 0.82 0 0.0025 0.0009 0.0004 0 0.0001 0.0004 0 0.0001 0.0004 合计50526.258.000.0048 第六章 抽样推断抽样误差 第六章 抽样推断抽样误差 5.阶段抽样抽样平均误差的计算公式 (以两阶段为例) 第六章 抽样推断抽样误差 没有总体资料时用样本资料代替 某地区有300户居民,分成10群,现从10群中抽6群, 再从抽中的群中每群抽2户调查其平均收入, 计算抽样平均误差。 群1:300 330(户收入) 群2:户收入330 340 群3:户收入370 390 第六章 抽样推断抽样误差 群4:户收入418 434 群5:户收入462 484 群6;户收入507 525 第六章 抽样推断抽样误差 第六章 抽样推断抽样误差 三、抽样极限误差 样本指标围绕总体指标左右两侧波动形成的一定 范围允许(极限)误差。 第六章 抽样推断抽样误差 总体指标是一个未知的确定的量,样本指标是随机变 量,且围绕总体指标左右变动,它与总体指标可能 产生正离差,也可能产生负离差,形成的一定的范 围即样本指标与总体指标的误差范围极限误差。 样本指标在概率上收敛于总体指标 随着样本单位数的增加,样本指标有接近于总体指标 的趋势 大数定理 v根据中心极限定理, v当总体为正态或总体非正态但n30时, v样本均值的分布趋近于正态分布; v当n足够大时,样本成数的分布近似为正态分布 。 四、抽样极限误差与抽样平均误差的关系 第六章 抽样推断抽样误差 概率积分表都是根据标准正态分布密度函数编制的。 怎样将一般正态分布转化为标准正态分布? 令 证明 第三节 抽样误差 这时一般正态分布转化为: 第三节 抽样误差 Z值越大概 率就越大 概率 正态分布的标准化? 概率计算 (查概率分 布表) 第六章 抽样推断抽样误差 而这里,随机变量不是x,而是 , 服从正态分布 第三节 抽样误差 1 -1 2 -2 第六章 抽样推断抽样误差 168.27% 1.9695% 295.45% 399.73% 第三节 抽样估计 v一、估计量的优良标准 v(一)无偏性 v(二)有效性 v(三)一致性 v二、抽样估计的方法 v(一)点估计 v(二)区间估计 v 1.平均数的区间估计 v 2.成数的区间估计 第六章 抽样推断抽样估计 v(一)无偏性 v1.概念 v如果样本统计量的期望值等于该统计量所估计的总 体参数,这个估计量叫无偏估计量。 v2.样本平均数是总体平均数的无偏估计量 v总体变量值有N个( ), v样本容量为n个( )。 一、估计量的优良标准 第六章 抽样推断抽样估计 v(1)重复抽样 第六章 抽样推断抽样估计 v(2)不重复抽样 v3.样本成数是总体成数的无偏估计量 第六章 抽样推断抽样估计 4.样本方差是总体方差的无偏估计量 v(二)有效性 v有两个无偏估计量( ), v如果那个估计量与总体参数间的平均离差小,这 个估计量更有效。 和 都是的无偏估计量, 与 间的平均离差为 , 与 间的平均离差为 所以在估计 时, 更有效。 第六章 抽样推断抽样估计 是P的一致估计量。 随着样本容量的增大,估计量与被估参数的偏差越 来越小。 是一致估计量。 有限总体时,n最大为N,这时 = 无限总体时, 当n 时, 与间的偏差 的极限为0。 的一致估计量。 是 v(三)一致性 二、抽样估计的方法 v(一)点估计 v直接用样本指标代替总体指标 v点估计方法简单,但不能说明抽样误差 大小、抽样准确性以及可靠程度大小。 第六章 抽样推断抽样估计 v1.平均数的区间估计(大样本) (二)区间估计 第六章 抽样推断抽样估计 v2.成数的区间估计(大样本) 例1. 某制造厂质量管理部门希望估计本厂生产的 5500包原材料的平均重量,抽出250包,测得平均重量 65千克。总体标准差15千克。总体为正态分布。 在置信水平为95%的条件下建立这种原材料的置信 区间。 5500包原材料的平均重量在63.1466.86之间。 N=5500n=250 第六章 抽样推断抽样估计 例2.某职业介绍所从申请某一职业的1000名申请 者中采用不重复抽样方式随机抽取了200名,以此来 估计1000名的平均成绩。200名的平均分为78,由以 往经验知总体方差90,不知总体服从何种分布。 在置信水平为90%的条件下建立1000名申请者平 均成绩的置信区间。 1000名申请者平均成绩在77-79之间。 N=1000n=200 第六章 抽样推断抽样估计 例3.某超市通过100位的样本研究每次购买 额,均值和标准差分别为80元和20元。 在置信水平为90%的条件下建立所有顾客购买额 的置信区间。 所有顾客购买额在76.71和83.29之间。 n=100 第六章 抽样推断抽样估计 例4.某企业在一项关于职工流动原因的研究中, 从原职工中随机抽取了200人访问,有140人离开的原 因是工资太低。 以95%的置信水平对总体这种原因离开的人员比例进行 区间估计。 该企业由于工资低离开的职工比例为63.6% 76.4% 之间. n=200 第六章 抽样推断抽样估计 第四节 抽样单位数目的确定 v一、抽样单位数目的计算 v(一)简单随机抽样 v(二)类型抽样 v(三)等距抽样 v(四)整群抽样 v二、影响抽样单位数目的因素 第六章 抽样推断抽样单位数目 一、 抽样单位数目的计算 v(一)简单随机抽样 1.计算公式 (1)平均数 (2)成数 第六章 抽样推断抽样单位数目 (1)某类产品根据以往资料的估计,总体方差5.456 千克,现对一批进行简单随机抽样以推断该批产品 的平均重量,要求可靠程度达到99.73%,误差范围 不超过0.9千克,需要抽多少样本单位? 按题意 (2)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为99.73%,误差范围不超过5%,推 断该批产品的一等品率,需要抽多少样本单位? 按题意 第六章 抽样推断抽样单位数目 (二)类型抽样 重复抽样不重复抽样 平均数 成数 第六章 抽样推断抽样单位数目 v某工厂早、中、晚生产罐头10000瓶,根据以往资料 的估计平均重量的类型平均方差为0.549克,合格率的 类型平均方差为0.02787,要求可靠程度为何95%, 平均重量的允许误差为0.11克,合格率的允许误差为 0.025,用类型抽样推断10000瓶罐头的平均重量和合 格率,需要抽多少样本单位? 据题意 第六章 抽样推断抽样单位数目 (三)等距抽样 v计算公式 v(1)按有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论