




已阅读5页,还剩111页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章抽样推断,第六章抽样推断,1抽样推断及有关概念2抽样误差3抽样估计和推算4抽样推断的组织形式,第一节抽样推断及有关概念,一、抽样推断的意义、内容,(一)概念按照随机原则从总体中抽取一部分单位进行观察,并根据被抽取的那部分单位的结果,对总体作出具有一定可靠程度的推断。,统计推断的过程,(二)特点,1、按照随机原则抽取部分单位,抽样推断运用概率估计的方法。2、部分单位特征总体特征。3、抽样误差可以计算和控制。无论全面调查还是非全面调查误差来自两方面:一是登记误差;二是抽样误差。登记误差尽量避免,抽样误差是可以计算和控制的。,(三)抽样推断的内容,参数估计依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。假设检验利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。,二、抽样推断的作用,抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。建立起以周期性普查为基础、经常性抽样调查为主体,必要的统计报表、重点调查、综合分析等为补充的国家统计调查方法体系,是我国统计方法制度改革的指导思想。,1.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;,2.虽可进行全面调查观察,但比较困难或并不必要;,3.对普查或全面调查统计资料的质量进行检查和修正;,4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;,5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。,三、抽样推断的基本概念,(一)全及总体和抽样总体(总体和样本),全及总体:所要调查观察的全部事物。总体单位数用N表示。,抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n表示。n30大样本n30小样本,(二)抽样方法,1、重复抽样:2、不重复抽样:,重复抽样和不重复抽样会产生三个差别:抽取的样本数目不同抽样误差的计算公式不同抽样误差的大小不同,(三)参数和统计量(全及指标和抽样指标、总体指标和样本指标),全及指标:全及总体的那些指标。抽样指标:抽样总体的那些指标。,参数,统计量,(四)抽样框即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框),它是设计和实施随机抽样所必备的基础条件。,(五)样本容量指一个样本所包括的单位数。,(六)抽样比例抽样比例是指在抽取样本时,所抽取的样本单位数与总体单位数之比。,(七)样本个数指从总体中可能抽取的最多的样本数量。,1、重复抽样:,2、不重复抽样:,可能样本数目的计算公式,置信度也称为可靠度,或置信水平、置信系数。即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。,(八)置信度,第二节抽样误差,一、抽样误差的概念及种类,在抽样调查中,总体指标与样本指标不一致,两者的偏差称为抽样误差。,抽样误差即指随机误差,这是抽样调查固有的误差,是无法避免的。,抽样误差的作用:,1.在于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差等于0,则样本指标和总体指标一样大。,2.说明样本指标和总体指标相差的一般范围。,二、抽样平均误差,(一)概念,抽样平均误差是所有可能出现的样本指标的标准差。反映样本指标与总体指标之间误差的一般水平。通常用表示。即是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。,(二)理论公式,(三)实际计算公式(以纯随机抽样为例),1.重复抽样,2.不重复抽样,总体方差未知时解决方法:,1、用样本方差代替,2、用过去全面调查的资料,也可以用过去抽样调查的资料代替。,某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时,根据以往资料=20小时,试求抽样平均误差。,重复抽样:,不重复抽样:,某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方法从中抽取150只进行质量检验,有147只合格,试求这批印花玻璃杯合格率的抽样平均误差。,(四)抽样平均误差的影响因素:,4.不同的抽样组织形式。,1.全及总体标志变异程度。,2.抽样单位数目的多少。,3.不同的抽样方法。,例:假定抽样单位数增加2倍、0.5倍时,其他条件不变,抽样平均误差怎样变化?,解:抽样单位数增加2倍,即为原来的3倍,抽样单位数增加0.5倍,即为原来的1.5倍,即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。,即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。,例:假定抽样平均误差缩小40%时,其他条件不变,抽样单位数怎样变化?,解:抽样平均误差缩小40%时,即为原来的60%,,即:当抽样平均误差缩小40%时,样本单位数增加1.78倍。,一、抽样极限误差,样本指标与总体指标之间允许的误差范围叫抽样极限误差。也称抽样允许误差。它是样本指标可允许变动的上限或下限与总体指标之差的绝对值。,即:,第三节抽样估计和推算,根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)(置信度)的保证下:,=t,(t为概率度),当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);,可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。,上例资料编成次数分配表如下:,-30样本个数样本频率样本累计频率05101520合计,-30样本个数样本频率样本累计频率050.200.20580.320.521060.240.761540.160.922020.081.00合计251.00-,P409,(一)点估计,二、抽样估计方法,(定值估计),理论基础是抽样分布,点估计量优劣的标准:,(三)有效性,(一)无偏性,(二)一致性,无偏性,估计量的数学期望等于被估计的总体参数,一致性,随着样本容量的增大,估计量越来越接近被估计的总体参数,有效性,一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量,(二)区间估计,是根据样本指标和抽样误差去推断全及指标的可能范围,并能反映出估计的准确程度和把握程度。,由于区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是说,推断全及指标在这个范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率。,落在总体均值某一区间内的样本,换句话说,对于总体的被估计指标X,找出样本的两个估计量x1和x2,使被估计指标X落在区间(x1,x2)内的概率1-01,为已知的。即P(x1Xx2)=1-是给定的。我们称区间(x1,x2)为总体指标X的置信区间,其估计置信度为1一,称为显著性水平,x1是置信下限,x2是置信上限。,?,某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。试以概率95.45%保证,估计该农场10000亩小麦平均亩产量的可能范围。,某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。试以概率95.45%保证,估计该农场10000亩小麦平均亩产量的可能范围。则:,某机械厂日产某种产品8000件,现采用纯随机重复抽样方式,从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。,某机械厂日产某种产品8000件,现采用纯随机重复抽样方式,从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。,三、全及总体总量指标的推断,(一)直接推断法,1.如果采用点估计方法:上例1中:40010000=400(万千克)如果用区间估计方法:上例1中该农场小麦总产量的范围为:t=2:(397.62402.38)10000=397.62402.38(万千克)t=3:(396.43403.57)10000=396.43403.57(万千克),2.上例2中,全部一级品数量的范围为:(92.82%97.18%)8000=7425.67774.4(件),(二)修正系数法,就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。,某村6000农户,2005年年末统计养猪头数,上报的是9000头,现抽10(600户)的农户复查,发现有漏报,也有重报。按600户,原来数字是890头,实际复查为935头。,某市房地局,年报工资总额3218.1万元。现抽查14个单位:年报:415.03万元多报:0.44万元少报:1.47万元抵冲后1.47-0.44=1.03(万元),第四节抽样设计与组织实施,一、抽样设计的有关问题,(一)设计抽样调查方案的基本要求,1、遵循随机原则2、控制误差范围3、考虑投入产出关系4、保证必要的样本容量5、选择适宜的抽样组织方式,(二)抽样框的编制,抽样框一般有三种形式:1、名录抽样框2、区域抽样框3、时间抽样框,一个理想的抽样框的要求是,它应该尽可能地与目标总体相一致。一般而言,如果总体中的每个元素在清单上分别只出现一次,且清单上又没有总体以外的其他元素出现,则该清单就是一个完备的抽样框。在完备的抽样框中,每个元素必须且只能同一个号码对应。,简单随机抽样(纯随机抽样),类型抽样(分类抽样),机械抽样(等距抽样),整群抽样(分群抽样),二、抽样组织方式,(一)简单随机抽样(纯随机抽样),1、内容:,2、随机抽取样本的具体做法:,(1)直接抽取法;(2)抽签法;(3)随机数字表法。,对总体中所有单位除编号外不加任何处理,完全随机地抽取调查单位。,3、特点:,(1)是最基本的抽样方式;,(2)简便易行;,(3)适用于总体单位数不太多的均匀总体。,(四个公式),4、抽样平均误差的计算,5、总体指标的区间估计,(两个不等式),例1:,从某县农民家庭中随机抽取100户调查其年收入情况,农民家庭按年人均纯收入分组资料如下,试以95%的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收入在10000元以上户数所占比重作出区间估计.年人均纯收入(元)户数(户)9000以下39000-10000710000-110002811000-120003212000-130002013000以上10合计100,例1:,从某县农民家庭中随机抽取100户调查其年收入情况,农民家庭按年人均纯收入分组资料如下,试以95%的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收入在10000元以上户数所占比重作出区间估计.年人均纯收入(元)户数(户)fxxf9000以下39000-10000710000-110002811000-120003212000-130002013000以上10合计100,例1:,从某县农民家庭中随机抽取100户调查其年收入情况,农民家庭按年人均纯收入分组资料如下,试以95%的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收入在10000元以上户数所占比重作出区间估计.年人均纯收入(元)户数(户)fxxf9000以下3850025500250563009000-1000079500665002500470010000-1100028105002940002217880011000-1200032115003680038720012000-130002012500250002464200013000以上101350013500044521000合计100-1139000141790000,例2:,电视台某栏目主持人欲知观众对该栏目是否喜欢,随机抽取400名观众调查,其中喜欢的有240人.试在95.45%的概率保证下,估计喜欢该栏目的观众比重范围.如果该主持人希望估计的误差不超过5%,则有多大的把握程度?,例3:,某学校随机抽查10名男生,平均身高170cm,标准差12cm,问有多大把握估计全校男生身高介于160.5179.5cm之间?,(二)类型抽样(分类抽样),1、内容:,先对总体各单位按一定标志加以分类(组),然后再从各类(组)中按随机原则抽取样本。,2、样本分配形式:,(1)等比例抽样;,(2)不等比例抽样。,(3)抽样调查成本较低。,3、特点:,(1)先分组,后抽样;,(2)样本代表性高、抽样误差较小;,4、抽样平均误差的计算:,(1)重复抽样:,(2)不重复抽样:,5、总体指标的区间估计,两个不等式,某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷。现用类型等比例抽样调查1200公顷,平均单位面积产量15000千克,高产田面积比重79%。资料如下表。试以68.27%概率保证估计该农场小麦单位面积产量的区间。以同样概率保证估计该农场小麦高产田面积比重的区间。,某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷。现用类型等比例抽样调查1200公顷,平均单位面积产量15000千克,高产田面积比重79%。资料如下表。试以68.27%概率保证估计该农场小麦单位面积产量的区间。以同样概率保证估计该农场小麦高产田面积比重的区间。,某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷。现用类型等比例抽样调查1200公顷,平均单位面积产量15000千克,高产田面积比重79%。资料如下表。试以68.27%概率保证估计该农场小麦单位面积产量的区间。以同样概率保证估计该农场小麦高产田面积比重的区间。,(三)机械抽样(等距抽样),先将全及总体的所有单位按某一标志顺序排队,然后按固定的间隔抽取样本。,1、内容:,(1)无关标志:选择标志与抽样调查内容无关。,(2)有关标志:选择标志与抽样调查内容有关。,2、样本抽取方法:,(1)随机起点等距抽样,(2)半距起点等距抽样,kkk,k,(k为抽取间隔),(3)对称等距抽样,kkk,2k-a2k+a4k-a4k+a,a,k,(k为抽取间隔),3、特点:,(2)第一个样本是随机的;后面的样本是确定的;,(1)先排队,后抽样;按无关标志排队,相当于简单随机抽样,按有关标志排队,相当于类型抽样。,(3)注意避免抽样间隔与现象本身的周期重合。,4、抽样平均误差的计算(不重复抽样):,(1)无关标志排队,按简单随机抽样方法计算。,(2)有关标志排队,按类型抽样的方法计算。,5、总体指标的区间估计,两个不等式,(四)整群抽样(分群抽样),先将总体分成若干群,再以群为单位从总体中抽取样本群,对抽中的群内所有单位都进行观察。,2、特点:,(2)一般比其它抽样方式的抽样误差大。,(3)抽样误差受群间方差的影响。,(1)工作比较简单;,1、内容:,3、抽样平均误差的计算(不重复抽样):,4、总体指标的区间估计,两个不等式,把某企业大量生产的一种零件分成288群,现从中抽取24群产品进行检验,用以检查产品的合格率,检查结果如下表。试以99.73%的概率保证估计全部零件合格率的区间。,三、抽样数目的确定,(一)影响必要抽样数目的因素,(二)必要抽样数目的计算(简单随机抽样),建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料为1.5M3、1.36M3和1.48M3,求样本数应是多少?如果误差范围缩小一半,其他条件不变,样本数又应是多少?,某笔厂月产10000支金笔,以前多次抽样调查,一等品率为90%、92%、96%和94%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?,注意:必要抽样数目计算时方差问题:1、取最大值。最大2、p取最接近0.5的值。最小0.5,一、名词解释,二、简答,三、判断,抽样推断,抽样误差,抽样平均误差,抽样极限误差,1、影响抽样平均误差大小的因素有哪些?,2、影响样本容量的因素有哪些?,1、重复抽样的抽样误差不一定大于不重复抽样的抽样误差。(),三、选择,2、因为不知道总体方差或标准差,所以无法计算抽样平均误差。(),3、抽样平均误差总是小于抽样极限误差。(),4、在简单随机抽样中,如果重复抽样的抽样极限误差增长40%,其它条件不变,则样本单位数只需要原来的一半左右。(),1、抽样调查的主要目的()A、用样本指标来推算总体指标B、对调查单位作深入研究C、计算和控制抽样误差D、广泛运用数学方法,2、抽样平均误差反映了样本指标与总体指标之间的()A、实际误差B、实际误差的绝对值C、平均误差程度D、可能误差范围,4、在抽样调查中,()A、既有登记误差,也有代表性误差B、只有登记误差,没有代表性误差C、没有登记误差,只有代表性误差D、既没有登记误差,也没有代表性误差,3、反映样本指标与总体指标之间抽样误差可能范围的指标是()A、抽样平均误差B、抽样极限误差C、抽样允许误差D、精确程度,5、在其他条件不变的情况下,提高抽样估计的可靠程度,其精确程度将()A、保持不变B、随之扩大C、随之缩小D、无法确定,6、极限误差与抽样平均误差数值之间的关系为()A、前者一定小于后者B、前者一定大于后者C、前者一定等于后者D、前者既可以大于后者,也可以小于后者,7、成数方差的最大值,是()A、0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 入职安全教育培训理解课件
- 2024年山西警察学院军训动员大会校长发言稿9000字
- 龙胜县裕朗滑石制品有限公司项目建设项目环境影响报告表
- 2025年福建省“超级全能生”物理高三第一学期期末检测试题
- 防疫管理办法解说稿
- 企业现场安全知识培训
- 企业春季安全教育培训课件
- 环境监察培训管理办法
- 智能语音导览系统-洞察及研究
- 至阴穴脑功能重塑-洞察及研究
- 探讨跨界融合创新在智能数字服装设计中的应用和发展前景
- 面料培训资料
- 失血性贫血的护理
- 相控阵超声波检测技术培训
- 职业培训学校管理制度
- 《党政机关厉行节约反对浪费条例》培训课件
- 工商业光伏施工总承包合同
- 参考儿科急危重症抢救预案及流程
- 中信集团管理制度
- 2025年调解员资格考试卷及答案
- 卫生间6s管理制度
评论
0/150
提交评论