




已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学PPT,第七章统计指数,教学目的要求:通过学习,掌握抽样推断的基本原理,熟练运用误差公式进行抽样估计,并能结合实际加以灵活应用。重难点:重点是抽样误差的计算原理、区间估计及简单随机抽样的基本原理;难点是抽样误差的基本原理。计划讲授课时:8学时.,第七章抽样调查,本章主要内容,第一节抽样调查的一般问题,本节主要介绍了抽样调查概念、优点、作用、组织方式等基本理论问题。重点掌握抽样调查的概念、优点及其组织方式.,一、抽样调查的概念与作用,(一)抽样调查的概念所谓抽样调查是指从总体中按随机原则抽取一部分单位构成样本进行观测,然后根据这一部分单位的资料推断总体数量特征的一种方法.,(二)抽样调查的特点,1.按照随机原则抽取样本单位;2.抽样调查建立在随机抽样的基础上;3.抽样调查的目的就是由样本指标推断总体指标;4.抽样调查结论存在抽样误差,但可以事先计算和加以控制.,(三)抽样调查的优点,(四)抽样调查的作用,用于不可能进行全面调查的无限总体;用于不可能进行全面调查而又需要了解其全面情况的现象;用于不必要进行全面调查的现象;用于对全面调查资料的评价与修正;用于工业生产过程的控制,等等。上述作用也可以说是抽样调查的应用范围.,(五)抽样调查的理论基础,1.大数法则:是关于大量的随机现象具有某种稳定性质的法则。它论证了样本平均数趋近于总体平均数的趋势,从而为抽样推断提供了重要的理论依据。2.中心极限定理:是关于研究变量和的分布序列的极限定理。它论证了在大样本的情况下,抽样误差服从于正态分布,从而为抽样误差的概率估计提供了理论基础及使用的方便。(注意:本部分内容重在逻辑思维上的理解即可,深层次的内容可参看有关数理统计方面的书籍).,二、抽样调查中的几个基本概念,(一)总体与样本1.总体:指要调查研究对象的全体,通常称为全及总体或母体。2.样本:指在全及总体中按随机原则抽取的那部分单位所构成的集合体,通常称为抽样总体或样本总体或子体.,(二)总体指标与样本指标,1.总体指标:指根据全及总体各单位标志值计算的有关综合指标。由于全及总体是唯一确定的,故根据全及总体计算的总体指标也是唯一确定的。常用的总体指标有总体单位数、平均数、成数、标准差及方差等,常用各种大写符号表示。2.样本指标:是根据抽样总体各单位标志值计算的综合指标。由于从一个全及总体中可以抽取许多个不同的样本,故样本指标是一个不确定的随机变量。常用的样本指标有样本单位数、平均数、成数、标准差及方差等,常用小写符号表示.,关于成数P的有关概念及计算问题,在抽样调查中,成数是针对交替(或是非)标志而言的。所谓交替标志,是指只有两种可能结果的标志(是否,或是非)。如性别要么是男性,要么是女性;再如考试成绩要么及格,要么是不及格,等等。所谓成数,就是指交替标志中具有某种特征的单位数占全部总体单位数的比重.,(1)成数的平均数,下面以以总体成数为例说明。设:N表示总体单位数;0表示不具有某种特征;1表示具有某种特征。则:,表示不具有某种特征的单位数;,表示具有某种特征的单位数;,显然有:,则:,则成数的平均数为:,即,成数就是指总体中具有某种特征的单位数占全部总体单位数的比重。,(2)成数的标准差,则:,故:,各种抽样基本公式一览表,(三)重复抽样与不重复抽样,1.重复抽样:是指把从总体中抽中的单位,经登记调查后,再将其放回去,重新参加下一次的抽选,直到抽取n个总体单位。又称为重置抽样或有放回抽样。显然,采用此方法抽取样本时,某个总体单位有重复抽中的可能,故其名。2.不重复抽样:是指把从总体中抽中的单位,经调查登记后,不再放回去参加下一次的抽选,直到抽取n个总体单位。显然,采用此法抽取样本时,某个总体单位不可能被重复抽中,故其名。,(四)考虑顺序与不考虑顺序,1.考虑顺序:指抽取样本单位时,要考虑抽中单位出现的先后顺序,如AB与BA是两种不同的抽样组合。2.不考虑顺序:指抽取样本单位时,不考虑抽中单位出现的先后顺序,如AB与BA只算一种可能的样本组合。,注意:,由于在社会经济统计中,抽中的样本单位的先后顺序,对所研究现象的数量计算结果没有影响,故通常采用不考虑顺序的抽样方法,而考虑顺序的抽样方法则在自然科学研究中采用较多。考虑顺序与不考虑顺序抽样所得到的样本组合是不同的。,各种抽样方法下可能的样本组合计算公式,(五)单阶段抽样与多阶段抽样,所谓单阶段抽样是指某次抽样时一次就抽出样本单位的抽样。所谓多阶段抽样是指需经两次或两次以上的抽样,最后才抽样具体样本单位的抽样。如我国职工家计抽样调查采用省抽县市区(街)居民家庭户三阶段抽样技术.,三、抽样调查的组织方式,(一)简单随机抽样1、简单随机抽样的概念和特点(1)概念:是从总体全部单位中不加任何排队或分类,完全按照随机原则抽取样本单位进行调查的方式。也叫做单纯随机抽样或纯随机抽样。(2)基本特点:按随机原则的定义直接从总体中抽取样本单位.,(3)适用条件:简单随机抽样适宜于总体单位数不多且各单位之间差异不大时使用。,(4)优缺点:简单随机抽样优点是最符合随机抽样原则;不足是编号做签的工作量较大,总体单位数较多时无法使用且误差往往较大.,2、简单随机抽样抽取样本单位的方法,简单随机抽样抽取样本单位的具体方法主要有:(1)抽签法(抓阄法)。具体作法是:当给总体各个单位编号后,把号码写在结构均匀的签(如同等大小的纸片等)上,将签混合均匀后即可以从中抽取。抽签法简便易行,然而对于较大的总体来说,编号、做签条的工作量很大,且不易做到混合均匀。因此,抽签法的应用有一定的局限性.,(2)机械摇号法,它是先对全部总体单位编号,然后再利用某种特制的机械,通过机械震动产生需要抽取调查样本单位号码的方法。此法抽取的样本单位随机性高,但购置设备的费用较高,只适宜于经常开展抽样调查的单位使用.,(3)随机数字表法,所谓随机数字,就是指用某种机械方法或电子计算机产生的数字序列,数中的0,1,2,9这10个数字出现的机会是等概率的,但排列顺序则是随机的。将随机产生的数字用表格的形式表现出来,就是随机数字表。所谓随机数字表法,就是利用随机数字表随机抽取样本单位的方法。有关随机数字表法的具体内容,详见教材(略).,(二)类型抽样,1、类型抽样的概念和特点(1)概念:是先将总体中所有单位按某一标志分成若干组(或类),然后再在各组中随机抽取样本单位的方式。(2)基本特点:先分组,再在各组中随机抽取样本单位。(3)适用条件:适宜于总体单位多、情况复杂、差异较大时使用。(4)优缺点:优点是样本代表性较高、误差较小;不足是误差的计算较麻烦.,2、抽取样本单位的具体方法,由于类型抽样是在分组后从各组中抽取样本单位,因此,类型抽样条件下抽取样本单位主要问题是,在总的样本容量确定后,样本数目如何在各个组之间分配的问题。类型抽样中,常用以下两种方法确定各层间样本单位的分配比例。(1)等比例抽样:即各组按相同的比例抽取样本单位。(2)不等比例抽样:即各组抽取样本单位的比例不完全相同。,(三)等距抽样,1、等距抽样的概念和特点(1)概念:是指先按有关或无关标志将总体单位按一定顺序排列,然后再按相等的距离或间隔抽取样本单位的方式,又叫机械抽样。(2)基本特点:先排队,再等距抽选样本。具体特点有二:一是抽取样本单位的方法简便易行;二是估计量的方差小,样本的代表性较高。(3)适用条件:适用面广,特别适宜于连续、大批量生产的现象的调查。(4)优缺点:优点是通常能保证样本均匀分布,减少误差,提高样本的代表性;不足是有时可能有系统(周期)性误差.,2、抽取样本单位的具体方法,只有不重复抽样方法。关键是第一个样本单位的抽选。先按N/n=K求出抽样间隔;再在第一组中按简单随机抽样的方法,抽出第一个样本单位;然后再按抽样间隔K随之确定其余样本单位。具体又可分为两种:(1)按有关标志排队的等距抽样;(2)按无关标志排队的等距抽样.,(四)整群抽样,1、整群抽样的概念和特点(1)概念:是先将总体全部单位划分为若干群(组),然后以群为单位随机抽取若干群,对抽中群内的所有单位全部进行调查的方式。(2)基本特点:先分群,再以群为单位抽取样本。(3)适用条件:适宜于群内差异较小而群与群之间差异较大现象的调查。(4)优缺点:优点是抽样组织工作较方便;不足是有时误差较大,样本代表性较低.,2、抽取样本单位的具体方法,在整群抽样中,为避免抽样误差过大,一般采用不重复抽样的方法;抽选群的方法与简单随机抽样相同.,第二节抽样误差,抽样理论是在研究误差的基础上逐步发展和完善起来的,误差理论是抽样理论的核心。本节介绍了抽样误差的概念、影响因素、抽样平均误差的概念及其计算原理。重点掌握简单随机抽样方式下抽样平均误差的计算方法.,一、抽样误差的概念,抽样误差是指随机抽样所得的样本指标与总体指标的随机误差。,(一)登记性误差与代表性误差,所谓登记性误差,又称为调查误差或工作误差,它是指调查人员在调查过程中,由于工作不认真(如粗心大意抄错、写错、写漏等)或计量工具不准确而形成的调查结果与实际结果之间的差别。这种误差是可以尽量加以克服或避免的。所谓代表性误差,是指根据部分(少数)单位调查的结果去代表(或推断)全部单位的数量特征时,两者之间的差别。这种误差通常是不可避免的.,(二)偏差与随机误差,所谓偏差,是指在随机抽样中调查人员(有意识地)破坏了随机原则抽样(即不按随机原则抽样),由此形成的样本指标与总体指标之间的差别。在抽样调查中,通常所说的抽样误差是不包括偏差的,又称为系统性误差。所谓随机误差,是指由于随机抽样的随机性由此而形成的样本指标与总体指标之间的差别,通常也叫做抽样误差.,(三)抽样误差,所谓抽样误差,就是指在随机抽样中按随机原则从总体中抽取一部分单位构成样本,并计算出有关样本指标(如样本平均数或成数),再通过样本指标去推断总体有关指标(如总体平均数或成数)时两者之间存在着的差别。简而言之,抽样误差就是样本指标与总体指标之间的差别。抽样误差是抽样调查不可避免的误差。因为部分单位与全部单位的数量特征通常是不可能完全一致的.,(四)抽样实际误差,所谓抽样实际误差,是指在对某现象实际进行抽样时,其样本指标与总体指标之间的差别。如对某校大学生随机抽取100人进行身高调查,得知这100人的平均身高为168公分;又知该校全部大学生的平均身高为169公分,两者之间相差1公分,这就是抽样实际误差。抽样实际误差实际上是未知的。因为总体指标通常是未知的,如果总体指标已知,也就没有必要进行抽样调查了!.,二、抽样平均误差,1.抽样平均误差的概念:是指所有可能的样本的样本指标与总体指标之间的平均误差(标准差)。2.抽样平均误差计算方法(1)抽样平均误差的定义公式:根据抽样平均误差的定义,其平均数与成数的计算公式分别为:,(2)抽样平均误差的应用公式,关于应用公式的几点说明:修正系数的处理问题:当N较大时可用代替重复抽样与不重复抽样误差的关系问题:在其它条件相同的情况下不重复抽样的误差比重复的误差小。总体方差未知的处理问题:当总体方差()未知时,可用样本方差()、历史方差或试验方差代替.,【例1】(根据定义公式计算)设有A、B、C三个小孩的年龄分别为1、2、3岁。现从三个中随机抽二个进行调查。试根据抽样平均误差的定义计算抽样平均误差。,解:(1)计算可能的样本数:,考虑顺序重复抽样时:,即:1、2;2、1;1、3;3、1;2、3;3、2;1、1;2、2;3、3;,考虑顺序不重复抽样时:,即:1、2;2、1;1、3;3、1;2、3;3、2;,不考虑顺序不重复抽样时:,不考虑顺序重复抽样时:,即:1、2;1、3;2、3;,即:1、2;1、3;2、3;1、1;2、2;3、3;,(2)下面以不考虑顺序不重复抽样为例说明其计算方法:,总体平均数:,三个可能样本的样本平均数分别为:,由于三个样本的样本平均数与总体平均数的离差之和等于0,故不能用离差的算术平均数的方法计算其平均离差,为避免离差的总和等于0,其方法之一就是将离差平方,再求其平均的离差,由于分子平方了,故需再开方还原,即:,【例2】(根据应用公式计算)从某乡1000亩稻田中随机抽取50亩,经秤重量得平均亩产量为560公斤,标准差为50公斤。试计算抽样平均误差。,解:由于总体方差未知,故用样本方差代替。则:,即抽样平均误差为6.89公斤.,【例3】(根据应用公式计算)某公司从购买的1000件产品中随机抽取160件进行检验,发现其中有144件合格。试求合格产品成数的抽样平均误差。,解:因总体方差未知,故用样本方差代替。则:,即合格品成数的抽样平均误差为2.17%.,3.其它方式下抽样平均误差的计算公式,(2)等距抽样平均误差的计算方法,一般认为,如果总体是按无关标志排队的机械抽样,其实质与简单随机抽样类似,它的抽样误差就十分接近简单随机抽样的误差。为简便起见,实际中常采用简单随机抽样误差公式来近似计算。如果是按有关标志排队的机械抽样,其实质又与类型抽样相接近。因此,从理论上讲,其抽样误差可以借助类型抽样误差公式近似计算。但在实际中也可按简单随机抽样误差公式来近似计算.,(3)整群抽样平均误差的计算方法,设:总体单位数为N,将总体的全部单位数划分为R群,现从R个群中随机抽取r个群组成样本,并对中选的r个群内的全部单位进行全面调查。则其估计与推断的公式分别为:,三、影响抽样误差的因素,四、抽样极限误差,由于总体指标是一个确定的量,而样本指标是一个围绕着总体指标上下波动的随机变量,即它可能与总体指标发生正、负离差,这就产生了抽样极限误差的概念。1.概念:是在一定概率保证条件下,样本指标与总体指标之间抽样实际误差的最大可能范围。,2.计算方法(或极限误差与平均误差、概率度的关系),3.作用:为抽样推断及其可靠性判断提供依据.,五、抽样误差的分布,所谓抽样误差分布,是指总体全部可能样本的抽样误差的分布状况。数理统计证明:大样本(n30)的抽样误差分布为正态分布。这就为抽样极限误差的计算提供了理论上的依据。如果我们把全部可能样本的样本平均数编制成变量数列并绘制成图形,就可得到一个钟形的光滑曲线,即正态分布曲线。,从正态分布曲线图可总结两个特点:一是样本指标高于或低于总体指标的概率分布是完全对称的;二是样本指标接近于总体指标的概率越大(小)出现的可能性也就越大(小)。在抽样中概率F(t)是指抽样估计的可靠性,即把握程度。概率随概率度(t)的变化而变化,故概率是概率度的函数。为了便于实际使用,通常可按事先编制好的正态分布概率表,来根据事先给定的t值查找出相应的概率F(t).,-1-0.67-0.3300.330.671,60%,抽样误差分布图示,几个常用的正态分布概率,第三节总体指标的推断,抽样调查的目的在于用样本指标去推断总体指标。抽样推断的方法有点估计和区间估计两种。重点掌握区间估计的基本原理.,一.点估计,点估计就是用样本指标直接代替(估计)总体指标的方法。例如:从某班全部同学抽出10人进行调查得知其平均身高为170公分,男生占60%;则在点估计条件下,可以说该班全部学生的身高为170公分,男生所占比重为60%。点估计的优点是直观、简单、方便。不足是没有考虑估计的误差问题及估计的可靠性。评价优良估计量的三大标准:一致性;无偏性;有效性.,二.区间估计,区间估计是根据根据样本指标确定总体指标的置信区间和置信度。利用抽样所得的样本平均数(或成数p)。,即可确定估计的上限(或)和估计的下限(或)。上限和下限之间的范围称为置信区间;而落在这个范围的可靠程度叫做置信度t。,区间估计必备的三要素:抽样估计值(或p)、估计的误差范围即极限误差、估计的概率F(t)。,区间估计的基本公式:,区间估计的一般步骤,根据给定的抽样资料,计算样本指标(样本平均数或样本成数p);,计算抽样极限误差();,计算抽样平均误差();,计算确定总体平均数或总体成数的区间:,如果总体方差()资料未知,则根据抽样资料,计算样本方差(或标准差S);,【例4】某大学有4500名学生。现采用不重复简单随机抽样方式从中随机抽取10%的学生,调查其每月生活费用支出情况。抽样结果显示:学生平均每人每月生活费用支出350元,标准差80元,生活费用支出在500元以上的学生占20%。要求:在95.45%的概率保证下估计全部学生月平均生活费用支出的可能范围,以及月生活费用在500元以上的学生所占比重的可能范围。解:,【例5】对某企业100名职工的工资进行抽样调查得下表资料。试以0.9545的概率估计该企业全部职工月平均工资(元)的可能范围。,解:有关计算如下:,则以0.9545的概率估计该企业全部职工的月平均工资在899.9元940.1元之间.,【例6】对某批商品按不重复抽样方法抽取200件进行检验,其中合格品为160件。又知道所抽检商品件数占总件数的1/20。试以99.73%的概率估计该批商品合格率的区间范围。,解:有关计算如下:,故以99.73%的概率估计全部商品合格率在71.72%88.28%之间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025重庆市綦江区教育事业单位面向应届毕业公费师范生考核招聘60人笔试备考试题及答案解析
- 2025中级软考通关题库及答案详解
- 心理危机干预报告
- 2025浙江温州瑞安市司法局编外人员招聘1人笔试备考试题及答案解析
- 企业人文内涵塑造策略
- 大学化学教学方法与实践
- 绿化工程的推广及意义
- 纺织品包装设计手册
- 2025西安雁塔区长延堡社区卫生服务中心招聘笔试含答案
- 2025年口腔颌面外科颌骨骨折固定术后并发症处理技巧模拟考试试卷答案及解析
- 《2025年9.3纪念抗日战争胜利80周年阅兵式观后感》
- 2025年时事政治考试100题(含参考答案)
- 香港永久性居民在内地所生中国籍子女赴香港定居申请表
- 学习的基本理论
- 天津市新版就业、劳动合同登记名册
- 部编人教版五年级上册小学道德与法治 第5课 协商决定班级事务 课件
- 跨境电商亚马逊运营实务完整版ppt课件-整套课件-最全教学教程
- GB∕T 31038-2014 高电压柴油发电机组通用技术条件
- 基层工会经费财务规范化建设
- 亚硒酸 MSDS危险化学品安全技术说明书
- 预防接种家长课堂(课堂PPT)
评论
0/150
提交评论