统计学原理第五版课件.ppt_第1页
统计学原理第五版课件.ppt_第2页
统计学原理第五版课件.ppt_第3页
统计学原理第五版课件.ppt_第4页
统计学原理第五版课件.ppt_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 抽样推断,教学内容与要求:,理解抽样推断的意义、特点及有关的基本概念; 理解并掌握抽样误差、平均抽样误差、极限误差 的涵义与计算,理解影响抽样误差的因素。 掌握点估计的优劣判别准则,区间估计的基本要素与计算过程和方法; 必要样本单位数的确定;,教学重点与难点:,重点:抽样误差的特点及计算,总体参数的区间 估计法。 难点:抽样平均误差的涵义与计算、区间 估计的原理及过程。,教学方式与学时安排,思考练习题,抽样误差的影响因素 样本容量的影响因素,5.1 抽样推断的一般问题,一、 抽样推断的意义,概念,抽样推断法又称为抽样调查法,简称抽样法,指样本单位的抽取不受主观因素及其他系统性因素的影响

2、,每个总体单位都有均等的被抽中机会,按照随机原则 从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法,特点,按随机原则抽取样本单位 以部分推断总体的数量特征 抽样误差可以事先计算并控制 抽样法运用概率估计的方法,作用,(见第二章),全及总体,全及总体即统计总体,所要研究的调查单位的 全体,简称总体或母体; 分:有限总体和无限总体 。 用N表示有限总体的单位数,称总体容量。,样本总体,样本总体或抽样总体,简称样本或子样。 用n表示样本容量。 n30,为大样本;n 30,为小样本,二、抽样估计的基本概念,对同一问题,全及总体是

3、唯一的,样本总体不唯一,总体单位和样本单位,总体单位:组成全及总体的每一个单位或分子 样本单位:抽样单位,构成样本的每一个单位或分子,又称为全及指标,用来描述全及总体特征的综合指标。 总体指标只有唯一确定的值,也称为参数,总体指标,a、 总体平均数(又叫总体均值):,b、总体方差 ,总体标准差,c、总体成数 P,对总体中不能用数量表示的单位品质标志,总体参数是以总体中具有某种性质的单位数占总体全部单位数的比重来反映,这种参数称为成数,用P表示,Q表示另一部分成数。,设总体容量N, 具有某种性质, 不具有某种性质,具有某种性质的 单位数所占的成数,不具有某种性质 的单位数所占的成数,若品质标志表

4、现为“是”、“非”两种,称是非标志,用1表示“是”,用0表示“非”,则是非标志可看成 (0,1)分布,P是(0,1)分布的平均数。,均 值,标 准 差,方 差,当P=1/2时,达最大值,a、 样本平均数(又叫样本均值):,用来描述样本特征的综合指标,也叫统计量,又被称为估计量或统计量,样本指标,样本指标是随机变量,不同样本有不同的 样本指标,b、 样本方差、标准差:,c、 样本成数:,重复抽样,又被称作重置抽样、有放回抽样,抽出 个体,登记 特征,放回 总体,继续 抽取,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,不重复抽样,又被称作不重置抽样、不放回抽样,抽出 个体,登记

5、特征,继续 抽取,特点,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行,是最为常用的抽样方法。,样本的可能数目,在考虑顺序的抽样条件下,从总体N中随机抽取n个样本单位共有多少种可能的抽选结果, 重复抽样的可能样本数目:, 不重复抽样的可能样本数目:,在不考虑顺序的抽样条件下:, 重复抽样的可能样本数目:, 不重复抽样的可能样本数目:,抽样单元,抽样框,将总体划分成互不重叠又穷尽的有限多个部分,每个部分称为抽样单元。 抽样单元有若干个体组成,当然也可以只包含一个个体 。,又叫抽样结构,一份包含所有抽样单元的名单或清册。在抽样框中,每个抽样单元被编上一个号码。 抽样框

6、可以多种形式:除名单或清册外,还可以是一张地图或其他适当的形式,一、抽样误差的概念,5.2 抽样误差,调查结果与总体真实值之差。,抽样调查方式所产生的调查误差,调查误差:,抽样调查误差:,抽样调查误差=登记性误差+系统性误差+,用部分推断总体而引起的误差,可控制,不可避免。,抽样误差,二、抽样误差的实质,1、抽样实际误差,一个总体有多个样本,每一个样本与总体之间有 一个离差,叫抽样实际误差。,例5.1,设有4个工人,其每周工资分别为70,90, 130,150元,从4人中随机抽取2人构成样本:,可能产生的样本如下:,重复抽样,样本平均数的平均数等于总体平均数,抽样实际误差,不重复抽样,抽样实际

7、误差,2、抽样误差不是某个抽样实际误差,而是所有可能的 抽样实际误差的平均值,称抽样平均误差或平均抽 样误差 。,3、抽样平均误差是反映抽样误差一般水平的指标,用 表示。简称为抽样误差。,用抽样平均数(或成数)的标准差来表示,令:M为全部样本数, 总体平均数, P总体成数。,抽样成数的平均误差:,抽样平均数的平均误差:,1、抽样平均数的抽样误差(平均数指标抽样误差),重复抽样:,不重复抽样:,三、抽样误差的计算,当总体很大,n很小,可代替不重复抽样,当N远远大于n时,总体方差,分析:,* 不重复抽样误差小于重复抽样误差;,重复抽样,不重复抽样,2、抽样成数的抽样误差(成数指标抽样误差),重复抽

8、样:,不重复抽样:,P:总体成数,可用样本成数代替,例5.2 要估计某地区100000名适龄儿童的入学率, 随机从这一地区抽取500名儿童,检查有400 名儿童入学,求抽样误差。,或:,例5.3:对某天生产的2000件电子元件的耐用时间 进行全面检测,又抽取5%进行复测,根据规定耐用时间在3000小时以下为不合格品,根据以上资料,计算该电子元件平均耐用时间及合格率的抽样平均误差,平均耐用时间的抽样平均误差,合格率的抽样平均误差,四、影响抽样误差的因素,总体各单位的差异程度(即标准差的大小): 越大,抽样误差越大;,抽样组织方式:对相同的n,类型抽样和等距抽 样小于简单随机抽样,单个抽 样小于整

9、群抽样 。,抽样方法:不重复抽样的抽样误差比重复抽样的 抽样误差小;,样本容量: 越大,抽样误差越小;,在进行抽样估计时,根据总体标志变异程度和抽样调查的任务要求确定一个可允许的误差范围,也称作允许误差、误差范围等。,五、抽样极限误差,设:,抽样平均数极限误差,抽样成数极限误差,或:,F(t),六、抽样误差的概率度,通常以抽样误差为尺度来度量抽样极限 误差的大小,它们的数量关系为:,1、t表示误差范围的倍数,称为概率度。,2、调查结果落在一定平均误差范围的概率,称为 把握程度、概率保证程度或置信度。,3、根据大数定律的正态分布定理,抽样误差范围 的大小和概率的关系是:,t值 概率保证程度F(t

10、) 1.00 0.6827 (68.27%) 1.65 0.9000 (90%) 1.96 0.9500(95%) 2.00 0.9545(95.45) 2.58 0.9900(99%) 3.00 0.9973(99.73%),抽样极限误差与把握程度的大小成正比,但和准确性的要求成反比。,例5.4, 调查某县的水稻产量 ,从150个村中抽30个村,若=5公斤,若要求调查结果的把握程度在95.45%,则:,若,公斤,则:,公斤,t=2,即有95.45%的把握:,5.3 抽样估计,1、指直接以样本指标估计总体指标,估 计一个确定的值。,一、点估计,2、抽样估计量的优良标准,设为待估计的总体参数,

11、为样本统计量,则的优良标准为:,若,则称为的无偏估计量,若,则称为比更有效的估计量,二、区间估计,1、在一定误差范围内,估计出一个可能区间,2、参数区间估计三要素, 估计值(统计量的值、样本指标值), 抽样误差, 概率度(置信度),例5.5,某灯具厂生产日光灯管100000只,从中随机抽取500只测定其寿命,分组资料如下:,试根据上述资料,以95.45%的把握程度估计这100000只灯管的平均耐用时间。,解:,或:,区间估计:,有95.45%的把握,总体平均数落在估计区间内。,置信度为95.45%的置信区间。,例5.6,若灯管寿命低于850小时以下为不合格品, 假设用不重复抽样抽取样本,试以6

12、8.27%的把握程度,对这批灯管的不合格品率作区间估计。,解:,区间估计:,置信度为68.27%的置信区间。,调查对象的性质特点 对调查对象的了解程度(抽样框的特点) 抽样误差的大小 人力、财力和物力等条件的限制,在实际工作中,选择适当的抽样组织方式主要应考虑:,5.4 抽样调查的组织方式,一、简单随机抽样,按随机原则直接从总体中抽出若干单位构成样本。,是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式,又称完全随机抽样或纯随机抽样,适用于均匀总体。,* 直接抽选法 * 抽签法 * 随机数码表法,二、类型抽样(分层抽样),将总体全部单位分类,形成若干个类型组,然后从各类型

13、中按水剂随机原则分别抽取样本单位组成样本。,是一种限制随机性抽样方式,适用于情况复杂、各单位之间差异较大、单位数量较多的情况。,优越性,* 提高样本代表性,提高样本指标对总体指标估计 的准确性。 * 分层抽样不仅可以得到总体指标的估计值,而且 可以得到各层子总体指标的估计值。,总体 N,样本 n,等额抽取,等比例抽取,最优抽取,抽取方式,等比例分层抽样 :,各组应抽取的样本单位数的计算公式为:,抽样误差的计算,先求出各层的方差,(或,),总体方差,(或,),或,或,为各层单位数,,分层抽样的抽样平均误差与组间方差无关, 取决于组内方差的平均水平。,注意,应扩大组间方差,缩小组内方差 总方差=组

14、内方差+组间方差 分层抽样误差小于简单抽样误差,三、等距抽样(机械抽样或系统抽样),将总体单位按某一标志排序,而后按一定的顺序和间隔抽取样本单位。,随机起点,(总体单位按某一标志排序),无关标志排队等距抽样,抽样距离:,起点,有关标志排队等距抽样,中点等距法,对称等距法,抽样误差的计算,先求出各距离的方差,总体方差,或,四、整群抽样(集体抽样), 将总体全部单位分为若干“群”,然后随机抽取一部分“群”,对被抽中群体的所有单位进行全面调查。,群的抽取方法可按前面三种方法。,简单、方便,能节省人力、物力、财力和时间, 但其样本代表性可能较差。 当群内差异大、群间差异小,代表性较好,群的划分,自然划

15、分:家庭,学校,村庄。 人为划分:一打帽子,一箱钉子。 群内单位数可相同,可不同。,抽样误差的计算,N分为R群,每群M个单位,N=RM,随机抽取r群。,表示群平均数,,表示群的方差,注,整群抽样取决于群间方差,与群内方差无关。,五、多阶段抽样, 指分两个或两个以上的阶段来完成抽取样本单位的过程。,例:在某省100多万农户抽取1000户调查农户生产性投资情况。,5.5 必要抽样数目的确定,一、意义,1、合理确定抽样必要单位数,可以控制抽样误差。 2、合理确定抽样必要单位数,可以在确保样本对总 体的代表性的前提下,提高抽样调查的效率及经 济效益。,二、确定抽样单位数的依据 (或:影响抽样单位数的依

16、据),1、调查者对一项抽样推断的可靠程度和精确程度 的要求。 (估计的概率保证程度,极限误差),2、总体各单位的差异程度。,3、抽样组织形式。 类型抽样和等距抽样比简单随机抽样需要的抽样单 位数少,单个抽样比整群抽样需要的抽样单位数少,4、抽样方法。 不重复抽样比重复抽样需要的抽样单位数少,5、另外,还要考虑人力、物力和财力的许可情况。,三、计算公式,原理:事先确定极限误差,根据抽样误差公式求, 重复抽样条件下:, 不重复抽样条件下:,【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?,【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93、95、96,为了使合格率的允许误差不超过3,在99.73的概率保证程度下,应抽查多少件产品?,【分析】因为共有三个过去的合格率的 资料,为保证推断的把握程度,应选其 中方差最大者,即P=93。,解:,1、某企业生产一批灯泡10000只,随机抽取400只作耐用时间试验和合格检验,测算结果,平均使用时间为2000小时,标准差12小时,其中有80只不合格,计算平均使用时间和合格率的抽样平均误差,若以95.45的可靠性,计算抽样极限误差。,作业:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论