统计 抽样推断_第1页
统计 抽样推断_第2页
统计 抽样推断_第3页
统计 抽样推断_第4页
统计 抽样推断_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第七章抽样推断,.,人们在认识过程中,往往由于某种原因不能直接获得对现象总体的认识,而只能通过其它途径获得对总体某些方面的间接认识。抽样推断是间接认识总体的方法之一。,.,一、抽样推断的概念抽样推断又称为抽样调查。它是按随机原则从总体中抽取一部分单位进行调查,并以一定的把握程度从数量上推断总体指标。二、抽样推断的特点按随机原则从总体中抽取一部分单位,保证总体中每一单位都有相同的机会被抽中。可保证被抽中的单位能很好的代表总体,并且是计算抽样误差的基础。虽然调查的是一部分单位,但可以推断总体。抽样推断一定存在误差,但误差可以计算并加以控制。,第一节抽样推断的概念和特点,.,三、抽样推断的作用对于无限总体,对于具有破坏性的试验,必须使用抽样推断法。对于有限总体,理论上可以进行全面调查,但进行抽样调查,可节省人力、物力和财力。对全面调查结果进行检验。对产品进行质量控制。,.,第二节抽样推断的相关概念,一、总体(又称全及总体)即所要调查研究的对象。总体单位数通常用N表示。二、样本(又称样本总体)即从总体中抽取的那一部分单位所组成的小总体。组成样本的个体叫样本单位。一个样本中样本单位的个数叫样本容量,用n表示。n30为大样本,n30为小样本。,.,总体指标:反映总体特征的数值,是常数,需估计,又被称为参数。样本指标:是反映样本特征值的指标。它随样本的不同而不同,是一个随机变量,是估计总体指标的依据。,三、总体指标与样本指标,总体平均数:,总体成数:,总体方差:,样本平均数,样本方差,样本成数,.,例:假设总体有A、B、C、D、四个单位,若按随机重复抽取方法,从总体中随机抽取两个单位组成样本,则其样本容量为,而所有可能的样本个数为42个。,所有可能的样本数目:,四、重复抽样与不重复抽样,从总体中抽取容量为n的样本重复抽样也叫做有放回的抽样或重置抽样。,不重复抽样也叫做无放回抽样或非重置抽样。,所有可能的样本数目:,AAABACADBABBBCBDCACBCCCDDADBDCDD,.,第三节抽样平均误差,一、抽样误差的概念在统计调查中,调查资料与实际情况的差异称为统计误差。,1.登记性误差,2.代表性误差(1)系统性误差:由于破坏随机原则而产生的误差(2)随机误差(即抽样误差),(一)统计误差的种类,(二)抽样误差:是指不包括登记性误差和系统性误差在内的随机误差,即:,或,.,二、抽样平均误差,(一)抽样平均误差的定义公式,平均数的抽样平均误差,成数的抽样平均误差,.,(二)、抽样平均误差的等价计算公式,重复抽样:,不重复抽样:,1.平均数的抽样平均误差,重复抽样:,不重复抽样:,2.成数的抽样平均误差,.,对上述公式的验证例:有甲乙丙丁四个人,年龄分别为20、21、23、24岁,现随机抽2人调查年龄,试计算抽样平均误差。,抽样平均误差计算表:,.,重复抽样的抽样平均误差:,按定义公式计算:按等价公式计算:,.,对上述公式的验证例:有甲乙丙丁四个人,年龄分别为20、21、23、24岁,现随机抽2人调查年龄,试计算抽样平均误差。,抽样平均误差计算表:,10,264,.,不重复抽样的抽样平均误差:,按定义公式计算:按等价公式计算:,.,10,264,抽样平均误差计算表:,.,无论是重复抽样还是不重复抽样,所有样本平均数的平均数等于总体平均数,即:,即:平均数的抽样平均误差是样本平均数的标准差。,同理,无论是重复抽样还是不重复抽样,所有样本成数的平均数等于总体成数,即:,即:成数的抽样平均误差是样本成数的标准差。,简言之,抽样平均误差是样本指标的标准差。,.,(三)、计算抽样平均误差时,总体方差、或未知时的处理方法:,用过去调查所得到的资料代替组织试验抽样,用样本资料代替用样本的资料代替,.,(四)、影响抽样平均误差的因素,第一,样本单位数的多少第二,总体被研究标志的变异程度第三,抽样方法第四,抽样的组织形式(第六节),.,第四节、抽样估计方法,抽样估计方法可以分为两大类:,点估计:以样本指标直接作为总体指标的估计值。,区间估计:以一定的把握程度估计总体指标的区间范围。,.,对总体指标的区间估计,(一)对总体平均数的区间估计公式:,的概率为F(t)。,的概率为68.27%。,的概率为95.45%。,的概率为99.73%。,的概率为95%。,(二)对总体成数的区间估计公式:,的概率为F(t)。,.,小结:,抽样调查目的:用样本指标估计总体指标。,方法:,点估计:,区间估计:,估计总体成数:,估计总体平均数:,.,例1:对一批零件随机抽取100件,测量其长度,得样本平均长度为10厘米,长度的标准差为0.5厘米。试以95.45%的概率估计该批产品平均长度的区间范围。,答:有95.45%的概率认为该批零件的平均长度在9.9厘米至10.1厘米之间。,.,对某地农户随机抽取200户,调查其收入情况。得平均每户年收入为18000元,年收入的标准差为500元。试以95%的概率估计该地农户平均年收入的区间范围。,答:该地农户年平均收入在17930.69元至18069.31元之间,概率是95%。,练习,.,例2:某进出口公司出口一批茶叶,规定每包重量不低于150克。现用不重复抽样方法随机抽取其中1%进行检验,结果如下表:,试以99.73%的概率估计这批茶叶平均每包的重量范围,以确定是否达到重量规格要求。,f,解:,结论:以99.73%的概率认为该批茶叶达到了重量规格。,.,某灯泡厂某月生产灯泡400万个,随机抽取400个进行检验,得资料如下表:,试估计该厂全部灯泡的平均耐用时间的置信区间(以概率为99.73%来保证)。,f,解:,结论:以99.73%的概率认为该批灯泡耐用时间在917.62小时至944.38小时之间。,练习,.,某灯泡厂某月生产灯泡400万个,对其随机抽取400个进行检验,得到如下资料:,若耐用时间在800小时以下为不合格品,试计算概率为95.45%时,这些产品中不合格率的可能范围。,解:,例,答:,.,例3:对一批粮食作物的种子随机抽取200粒进行发芽实验,结果有180粒发芽。试以95%的概率估计该批种子发芽率的置信区间。,答:该批种子的发芽率在85.84%至94.16%之间,概率是95%。,.,某灯泡厂为了使生产的螺丝口与卡口灯泡的比例很好地适应用户需要,从全市所有用户中随机抽取1500盏,查得其中卡口灯泡占15%。试以95%的把握程度估计螺丝口灯泡的百分比区间。,答:螺丝口灯泡的比例在83.2%至86.8%之间,概率是95%。,练习,.,例:某农场今年共播种小麦2000亩,随机抽取100亩,实割实测,得平均亩产量为450公斤,亩产量的标准差为50公斤。试计算:,1)平均亩产量的抽样平均误差。2)概率为95%时,平均亩产量的可能范围。3)概率为95%时,2000亩小麦总产量的可能范围。,3)概率为95%时,2000亩小麦总产量的可能范围是,2000440.2,2000459.8公斤,即880400,919600公斤。,即概率为95%时,小麦平均亩产量的可能范围是440.2,459.8公斤。,.,练习对我国某城市进行居民家庭人均旅游消费支出调查,随机抽取400户居民家庭,调查得知居民家庭人均年旅游消费支出为350元,标准差为100元,要求以95%的概率保证程度,估计该市人均年旅游消费支出额。,答:该市人均年旅游消费支出在340.2元至359.8元之间,概率是95%。,.,练习某市电视台为了解观众对某电视栏目的喜爱程度,在该市随机对900名居民进行调查,结果有540名喜欢该电视栏目,要求以90%的概率保证程度,估计该市居民喜欢该电视栏目的比率。,答:该市居民喜欢该电视栏目的比例在57.33%至62.67%之间,概率是90%。,第五节必要样本容量的确定,一、推断总体平均数时的必要样本容量,1.重复抽样时:,2.不重复抽样时:,二、推断总体成数时的必要样本容量,1.重复抽样时:,2.不重复抽样时:,.,例:对一批产品随机抽取100件,检查发现90件合格。要求:1)试以95.45%的概率估计该批产品合格率的区间范围。2)若抽样极限误差缩小二分之一,其他条件不变,应至少抽取多少件产品?3)若抽样极限误差缩小三分之一呢?,答:有95.45%的概率估计该批产品合格率在84%至96%之间。,.,某批产品的合格率估计为30%,若要求抽样极限误差不超过5%,在99.73%的概率保证下,试确定重复抽样时的必要样本容量。,练习,若抽样误差减少40%,其他条件不变,抽样单位数应是多少?,注意:小数只入不舍。,解:1),2),.,练习:某国营农场共饲养2000头牛,现准备用抽样方法研究其平均体重。先抽取35头牛调查,得到牛的体重标准差为60公斤,按规定牛平均体重的误差不得超过12公斤,推断的概率保证程度为95.45%。问:采用重复抽样和不重复抽样各应抽多少头牛?,.,某冷库对贮藏的一批禽蛋的变质情况进行抽样调查。根据以往的数据资料,禽蛋贮藏期变质率分别为53%,49%、48%。规定允许误差不超过5%,推断的概率保证程度为95.45%,问至少要抽取多少只蛋进行检查?,练习,即应抽取400只禽蛋进行调查。,.,某工厂拟以95%的可靠程度对生产产品的合格率进行抽样调查,希望对合格率估计的误差不超过3%,最少应抽取多少件产品?,练习,即:为以95%的概率保证抽样误差不超过3%,应最少抽取1068件产品进行调查。,.,例:某灯泡厂对一批灯泡的平均使用寿命和合格品率进行检验,要求置信度为95%。且根据前几批灯泡的经验资料有:平均使用寿命的标准差为200、250、300小时,合格品率为92%、93%、95%。要求:推断平均寿命的抽样误差不超过50小时,推断合格率的误差不超过5%,试问应至少抽多少只灯泡。,有多个总体指标进行估计时,为了满足共同的需要,应选取最大的n值。,作业:1、为检查某批电子元件的质量,随机抽取1%的产品,将测得结果整理成如下表:,质量标准规定:元件的耐用时间在1200小时以下为不合格品。若给定可靠度为95%,试确定:该批电子元件的平均耐用时间。该批元件的合格品率。该批元件的合格品数量。,2、为研究某市居民家庭收入状况,以1%比例从该市的所有住户中按照简单随机重复抽样的方法抽取515户进行调查,结果为:户均收入为8235元,每户收入的标准差为935元。要求:以99.73%的置信度估计该市的户均收入;如果允许误差减少三分之一,其它条件不变,则需要抽取多少户?,.,三、影响样本容量n的因素:(1)总体各单位的变异程度(2)允许误差的大小(3)概率保证程度(4)抽样方法(5)抽样的组织形式,.,第六节抽样的组织方式,抽样调查有以下几种基本的组织方式,即简单随机抽样、等距抽样、分层抽样、整群抽样。在具体的抽样调查中,可根据调查对象的特点,单独使用其中一种方式,也可以多种方式结合使用。一、简单随机抽样简单随机抽样也叫纯随机抽样。它对总体中的所有单位不进行任何分组、排队,而是直接从总体中完全随机地抽取样本单位。,.,二、分层抽样分层抽样也叫类型抽样。它是先将总体各单位按某一标志划分为几个组,然后在各组中按随机原则或其他方式抽取样本单位。适用于总体单位在被研究标志上有明显差异的情况。分层抽样的方法又分两种:等比例抽样和不等比例抽样。,.,(一)等比例抽样,推断总体平均数时:,样本平均数,平均组内方差,重复抽样的抽样平均误差:,不重复抽样的抽样平均误差:,(二)不等比例抽样(略),推断总体成数时:,.,例:某地区对居民在一年内用于某类消费的支出进行了等比例分层抽样,调查结果如下表,要求以95.45%的概率估计该地区平均每户支出的区间。,解:样本平均数,平均组内方差,抽样平均误差:,平均每户支出额的区间为290-9.45,290+9.45,即概率为95.45%时,该地区平均每户支出额在280.55至299.45元之间。,练习:某企业对职工用于某类消费的支出进行了等比例分层抽样,调查结果如下表,要求以95.45%的概率估计该企业职工平均支出和总支出的区间。,解:样本平均数,平均组内方差,重复抽样时:,即该企业职工用于此类消费的平均支出区间为186.2,201.8元,概率为95.45%。,当概率为95.45%时,该企业职工在此类消费上的总支出区间为,4000186.2,4000201.8元,即744800,807200元。,.,三、等距抽样(机械抽样或系统抽样)等距抽样是先将总体单位按某一标志排列,然后按相等的距离来抽取样本单位的组织形式。排列的标志可以与调查标志无关,也可以与调查标志有关。在抽取样本单位时,要避免抽样间隔和现象本身的周期性节奏相重合引起的系统性影响。,.,四、整群抽样是将总体划分为若干群,然后以群为单位按简单随机抽样或等距抽样方式抽取部分群,对抽中群中的所有单位一一调查的组织方式。整群抽样抽取的是群,简化了抽样工作程序。对于大规模的调查,若总体单位多且分布区域广,难以或不宜编制抽样框,可采用整群抽样。其缺点是样本在总体中太集中,分布不均匀,与其他几种抽样方式比较,误差较大,代表性较差。,.,推断总体平均数时:,样本平均数,总体群间方差,抽样平均误差:,推断总体成数时:,样本群间方差,若r比较小,用,.,例:某商场有某种饮料500箱、每箱6瓶,现随机抽取10箱检查每瓶的含菌量,测得这10箱的平均每瓶含菌量分别为:90、80、65、85、75、70、50、70、60、65个。要求推断这批饮料的平均含菌数的区间(概率为95%),解:样本平均数,样本群间方差,抽样平均误差,即概率为95%时,这批饮料平均含菌量的区间为62.51,79.49个。,.,五、多阶段抽样,又称为多级抽样,它是将抽取样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论