《统计学》 课件 廖颖文 6. 参数估计_第1页
《统计学》 课件 廖颖文 6. 参数估计_第2页
《统计学》 课件 廖颖文 6. 参数估计_第3页
《统计学》 课件 廖颖文 6. 参数估计_第4页
《统计学》 课件 廖颖文 6. 参数估计_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计学》第七章参数估计logo授课教师:廖颖文目录抽样调查概述1234概率和概率分布抽样误差总体指标的估计1抽样调查概述●理解抽样调查的基本原理;抽样分布的含义及总体分布、样本分布和抽样分布三者之间的关系,掌握常用的抽样分布定理●通过对抽样中误差构成的了解,正确理解抽样误差的含义及其与表现形式之间的关系

●熟练掌握区间估计的基本原理●掌握各种抽样组织形式下总体均值、总体成数的区间估计,尤其是掌握各自不同的抽样标准误差公式及相应的估计方法学习目标抽样估计在统计方法中的地位统计方法描述统计推断统计抽样理论假设检验参数估计概率理论回归分析§7.1抽样调查概述§7.1抽样调查概述(一)按调查对象包括的范围不同,分为……非全面调查全面调查重点调查抽样调查典型调查部分统计报表制度§7.1抽样调查概述§7.1抽样调查概述大学生恋爱观调查采用抽样调查有什么优势呢?1.非常经济2.时效性更高3.准确性也能够保证科学的抽样调查,实际上是非常准确的。§7.1抽样调查概述想知道梨子的味道,要亲口尝一尝你不必吃完一整头牛才知道它的肉是咬不动的§7.1抽样调查概述破坏性的调查:§7.1抽样调查概述一、抽样调查的概念和特点(一)抽样调查的概念抽样调查属非全面调查,它是从总体中按照随机原则抽取部分单位组成样本,通过对样本调查并计算而取得的指标数值对总体相应指标数值作出的具有一定可靠性的估计和判断一种统计调查方法。§7.1抽样调查概述(二)抽样调查的特点第一,按照随机原则进行抽样。第二,推断被调查现的总体特征。第三,计算推断的精确性和可靠性。(一)全及总体和抽样总体

全及总体是指研究对象的全部单位,即具有同一性质的若干单位的集合体,简称总体(或母体),一般用大写字母N来代表总体单位数。

抽样总体是按随机原则从总体中抽取一部分单位组成的小总体,简称样本,一般用小写字母n表示。样本单位数也称样本容量。三、抽样调查中的几个基本概念§7.1抽样调查概述

n≥30大样本n<30小样本§7.1抽样调查概述1.样本容量指从一个总体中可能抽取的样本个数()判断题答案:

错误(二)全及指标和样本指标1.全及指标根据全及总体各个单位标志值计算的反映其某种特征的综合指标,称全及指标,一般用大写英文字母表示。常用的全级指标有:(1)全及平均数()是全及总体某一变量值的算术平均数。(2)全及成数(P)是指全及总体具有某种标志的单位数在总体中所占比重。§7.1抽样调查概述(3)总体数量标志的方差和标准差σ是测定全及总体数量标志变异程度的指标。(4)总体是非标志的方差P(1-P)和标准差是测定总体是非标志变异程度的指标。§7.1抽样调查概述有些社会经济现象的特征,只表现为两种性质上的差异,如全部产品分为合格品与不合格品;对某一电视节目,表现为收看与不收看,等等。这些只表现为“是”、“否”或“有”、“无”的标志,称为是非标志,又称交替标志。(1)抽样平均数()是抽样总体中某一变量值的算术平均数。2.样本指标根据抽样总体各个单位标志值计算的综合指标,与全及指标是对应的,通常用小写英文字母表示,常用的样本指标有:§7.1抽样调查概述(4)样本是非标志的标准差和方差。(3)样本标准差(samplestandarddeviation)S和样本方差(samplevariance)S2是说明抽样总体标志变异程度的指标。(2)抽样成数(p)是某种具有某一标志的单位数在抽样总体中所占比重。§7.1抽样调查概述(三)重复抽样和不重复抽样

1.重复抽样(重置抽样)重复抽样是从全及总体N个单位中抽取n个样本,每次从总体中随机抽出一个单位进行登记后,再放回总体中重新参加下一次抽取。§7.1抽样调查概述各单位每次被抽中的机会是一样的吗?

2.不重复抽样(不重置抽样)不重复抽样是从全及总体N个单位中抽取n个样本,当某一单位被随机抽出登记以后,不再放回总体,即不参加下次抽取。§7.1抽样调查概述各单位每次被抽中的机会是一样的吗?§7.1抽样调查概述简单随机抽样分层随机抽样等距抽样方便抽样滚雪球抽样是否依据随机原则§7.1抽样调查概述§7.1抽样调查概述§7.1抽样调查概述简单随机抽样:其他抽样组织方法的理论基础。§7.1抽样调查概述简单随机抽样的缺陷:需要对总体中的每一个单位进行编号§7.1抽样调查概述§7.1抽样调查概述1.抽样调查的主要目的是(

)A、用样本指标来推算总体指标

B、对调查单位作深入研究

C、计算和控制抽样误差

D、广泛运用数学方法单选题答案:

A3抽样误差§7.3抽样误差抽样误差真相拦路虎§7.3抽样误差一、抽样误差的概念(一)抽样误差的一般概念用样本对总体进行估计,样本指标和被它估计的总体相应指标必然存在一定的误差。§7.3抽样误差(二)抽样误差的种类在抽样调查中,产生抽样误差的原因主要有三个方面。1.登记性误差

2.系统误差3.随机误差§7.3抽样误差

登记性误差——也叫调查误差或工作误差,是指在调查登记、汇总计算过程中发生的误差(应设法避免)。

代表性误差——这是指用部分单位的统计数据去推算总体数据时所产生的误差(即样本不足以代表总体产生的误差)。(抽样误差)§7.3抽样误差1.抽样推断是利用全体中的一部份进行推断,就不可避免的会出现误差()判断题答案:正确§7.3抽样误差2.抽样误差是由于抽样的偶然因素而产生的误差,这种误差既可以避免也可以控制其大小()判断题答案:错误且它们也都是等可能出现的,换句话说,它们每一个出现的概率都是。重复抽样

二、抽样平均误差的概念和计算§7.3抽样误差总体单位数:N样本容量:n所有可能出现的组合情况个数:且它们也都是等可能出现的,换句话说,它们每一个出现的概率都是。不重复抽样

二、抽样平均误差的概念和计算§7.3抽样误差总体单位数:N样本容量:n所有可能出现的组合情况个数:§7.3抽样误差1.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的()判断题答案:错误(二)抽样平均误差的概念抽样实际误差是指某一样本指标与被它估计的总体指标的差数。§7.3抽样误差

——抽样平均数的平均误差;

k

——样本配合数目;

——样本平均数(i=1,2,…,k);

——样本平均数的平均数。1.重复抽样的抽样平均误差公式:§7.3抽样误差式中:§7.3抽样误差可以证明,样本平均数的平均数等于总体平均数,即11.18元的含义是对于16个样本来说,无论你抽到哪个,平均来说误差为11.18元。1.重复抽样的抽样平均误差P151表7.322520002.不重复抽样的抽样平均误差§7.3抽样误差P152表7.4(三)抽样平均误差的计算抽样平均误差采用的公式是:§7.3抽样误差运用条件将所有样本都抽出来总体均值已知式中:——抽样平均数的平均误差;1.重复抽样的抽样平均误差(1)抽样平均数的平均误差:

σ——总体数量标志标准差;

n——样本容量。§7.3抽样误差式中:——抽样成数的平均误差;(2)抽样成数的平均误差:

——总体是非标志标准差;

n——样本容量。§7.3抽样误差2.不重复抽样的平均误差(1)抽样平均数的平均误差:(2)抽样成数的平均误差:§7.3抽样误差第二,公式中的σ和是未知的,只有通过全面调查才能取得。第一,对比两种方法的公式,相差了一个修正系(1-),因其是一个小于1的正数,所以不重复抽样的误差要小于重复抽样的误差。但实际工作中,因为N很大,所以(1-)是一个接近于1的数,所以二者公式结果相差无几。实际工作中,尽可采用不重复方法取样,而采用重复公式来计算误差。关于上述公式,有两点需要说明:§7.3抽样误差(1)用样本标准差代替总体的标准差,即用S代替σ,用代替;计算时需要作如下处理:(2)用过去同类问题全面调查或抽样调查的经验数据代替;(3)在正式抽样调查之前,先组织试验性抽样,用试验样本资料代替。§7.3抽样误差§7.3抽样误差1.不知道总体方差或标准差时无法计算抽样误差()判断题答案:错误§7.3抽样误差

推断指标重复抽样不重复抽样

平均数成数

2、抽样平均误差的实际计算(中心极限定理的启发)P153例:7.6P154例:7.7§7.3抽样误差

某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(设为重复抽样),根据以往资料:σ=20小时,试计算其抽样平均误差。根据以往资料,产品质量不太稳定,若σ=200小时,则其抽样平均误差为:练习1§7.3抽样误差

某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差,若采用不重复抽样,其抽样平均误差为多少?练习2(四)抽样平均误差的影响因素1.样本容量n的大小2.全及总体的标志变异程度3.抽样的方式和方法§7.3抽样误差§7.3抽样误差1.影响抽样误差大小的因素是抽样单位数目的多少,与总体被研究标志变异程度大小无关()判断题答案:错误§7.3抽样误差1.对两个工厂工人工资做纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差一样,但第二个工厂工人数多一倍,则抽样平均误差(

)A、第一个工厂大

B、第二个工厂大

C、两个工厂一样大

D、不能做结论单选题答案:B4总体指标的估计§7.4总体指标的估计请举出一些生活中参数估计的例子§7.4总体指标的估计

参数估计就是用样本统计量去推断总体的参数。§7.4总体指标的估计估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如:样本均值就是总体均值的一个估计量参数用

表示,估计量用表示估计量与估计值

估计值:估计参数时计算出来的统计量的具体值

如果样本均值

x

=80,则80就是

的估计值§7.4总体指标的估计估计量的数学期望等于被估计的参数,这个估计量称为被估计参数的无偏估计量。若用θ和分别被估计参数及其无偏估计量,则(一)无偏性总体参数中最重要的一个参数是总体平均数,样本平均数是它的无偏估计量,即。一、估计量优劣的判别标准§7.4总体指标的估计(二)一致性

当样本容量n充分大时,样本指标充分靠近总体指标,即随着n的无限增大,样本指标与未知的总体指标之间的绝对离差任意小的可能性趋于实际必然性。一、估计量优劣的判别标准§7.4总体指标的估计(三)有效性有效性要求作为估计量的方差比其他估计量的方差要小。(四)充分性从直观意义上解释,如果一个统计量能把含在样本中有关总体(或未知参数)的信息完全提取出来,那么这种统计量就是充分估计量。一、估计量优劣的判别标准符合无偏性、一致性和有效性原则,而且它的分布是正态分布。(1)总体平均数的估计量,即样本平均值:二、几种常用的估计量§7.4总体指标的估计二、几种常用的估计量(2)总体方差和标准差的估计量,它们分别是样本方差:样本标准差:(3)总体成数的估计量,即样本成数:即样本中具有某一标志的单位数a占样本容量n的比重。§7.4总体指标的估计二、几种常用的估计量§7.4总体指标的估计1.从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计例如:用样本均值作为总体未知均值的估计值就是一个点估计2.点估计没有给出估计值接近总体未知参数程度的信息点估计三、抽样估计方法:点估计§7.4总体指标的估计点估计三、抽样估计方法:点估计§7.4总体指标的估计三、抽样估计方法:点估计§7.4总体指标的估计三、抽样估计方法:区间估计§7.4总体指标的估计大家猜一猜我这个月在淘宝购物花了多少钱?1-20000元500-5000元提高准确度区间估计:区间上限区间下限信心水平三、抽样估计方法:区间估计§7.4总体指标的估计思考:这个游戏的难度在于什么?你们不知道我的行为习惯,一般什么物品会在淘宝网购买。这就是我们为什么要抽样的原因——通过抽样,我们可以获得样本的有关信息,在此基础上估计总体参数。三、抽样估计方法:区间估计§7.4总体指标的估计三、抽样估计方法:区间估计§7.4总体指标的估计三、抽样估计方法:区间估计这是样本标准差还是总体标准差总体标准差§7.4总体指标的估计三、抽样估计方法:区间估计区间估计§7.4总体指标的估计三、抽样估计方法:区间估计根据我们刚才的游戏,我们需要准备:一个信心程度样本的信息想办法把区间的上限和下限计算出来如果区间的长度没有约束的话,我们可以构造的区间有无数个猜钱小游戏附加条件:例如,正负50块都算你对§7.4总体指标的估计三、抽样估计方法:区间估计这种形式在我们生活中非常常见:§7.4总体指标的估计三、抽样估计方法:区间估计§7.4总体指标的估计三、抽样估计方法:区间估计§7.4总体指标的估计

比如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的估计为1000条.

若我们能给出一个区间,在此区间内我们合理地相信N的真值位于其中.这样对鱼数的估计就有把握多了.

实际上,N的真值可能大于1000条,也可能小于1000条.三、抽样估计方法:区间估计§7.4总体指标的估计90%可能性包含鱼数的真实值[

]也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.这里所说的“可靠程度”是用概率来度量的,称为置信度或置信水平.9951050三、抽样估计方法:区间估计§7.4总体指标的估计置信水平的大小是根据实际需要选定的.例如,通常可取置信水平=0.95或0.9等.根据一个实际样本,由给定的置信水平,我们求出一个尽可能小的区间,使,称区间为的置信水平为的置信区间.三、抽样估计方法:区间估计§7.4总体指标的估计

可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.1.要求以很大的可能被包含在区间内,就是说,概率要尽可能大.即要求估计尽量可靠.2.估计的精度要尽可能的高.如要求区间长度

尽可能短,或能体现该要求的其它准则.三、抽样估计方法:区间估计§7.4总体指标的估计三、抽样估计方法:区间估计用公式表示总体平均数的估计区间如下:,有F(t)的可信程度。总体成数的区间估计如下:,有F(t)的可信程度。这里,F(t)是t的正态分布函数,t是概率度,二者是一一对应关系,其对应关系可查“正态分布概率表”。§7.4总体指标的估计三、抽样估计方法:区间估计正态分布概率表(常用的几个)§7.4总体指标的估计表7-5(P158)tF(t)tF(t)1.00.68271.960.951.50.86642.00.95451.6450.90003.00.9973t越大,概率保证程度越高,即总体指标在某一区间内的可信程度也越高。,为估计值误差的范围,称作极限误差。所谓极限误差又称为允许误差,是样本指标与总体指标之间抽样误差的可能范围,记作。三、抽样估计方法:区间估计§7.4总体指标的估计1.反映样本指标与总体指标之间的抽样误差的可能范围的指标是(

)A、抽样平均误差B、抽样误差系数C、概率度D、抽样极限误差单选题答案:D三、抽样估计方法:区间估计§7.4总体指标的估计2.在一定的抽样平均误差条件下(

)A、扩大极限误差范围,可以提高推断的的可靠程度B、扩大极限误差范围会降低推断的可靠程度C、缩小极限误差范围可以提高推断的可靠程度D、缩小极限误差范围不改变推断的可靠程度单选题答案:A三、抽样估计方法:区间估计第二,搜集总体数量标志方差的经验数据或计算样本数量标志方差来代替;第一,抽取样本后,用简单或加权算术平均数的方法计算样本平均数;区间估计小结:(1)平均数的区间估计。§7.4总体指标的估计三、抽样估计方法:区间估计第五,确定总体平均数的置信区间。第四,根据概率F(t)确定t,计算平均数的极限误差;第三,计算抽样平均误差:(重复抽样)(不重复抽样)§7.4总体指标的估计三、抽样估计方法:区间估计第一,样本抽取以后计算样本成数;(2)总体成数的区间估计。第二,用样本是非标志方差p(1-p)或经验数据替代总体是非标志方差P(1-P);§7.4总体指标的估计三、抽样估计方法:区间估计第五,确定总体成数P的置信区间。第四,根据概率F(t)确定t,计算成数的极限误差;第三,计算抽样成数误差:(重复抽样)(不重复抽样)§7.4总体指标的估计三、抽样估计方法:区间估计§7.4总体指标的估计P159例7.8

某高校进行一次英语测试,为了了解考试情况,随机抽取1%的学生进行调查,所得资料如表7-6.考试成绩60分以下60-70分70-80分80-90分90-100分学生人数102022408表7-6要求,试以95.45%的可靠性估计:(1)该校学生英语考试的平均成绩;(2)成绩在80分以上的学生所占比重。三、抽样估计方法:区间估计总体方差计算公式:样本方差计算公式:

三、抽样估计方法:区间估计74.314-78.886§7.4总体指标的估计练习:某专业大学生的体重服从标准差为5.4kg的正态分布。随机抽取36名,测得他们的平均体重为65kg。在95%的置信度下,对总体平均体重进行估计的抽样平均误差和抽样极限误差为多少?并求其置信区间。(采用重复抽样)【解】:抽样平均误差:抽样极限误差:总体平均体重的置信区间:(65-1.764,65+1.764)三、抽样估计方法:区间估计§7.4总体指标的估计

某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。要求:(1)计算抽样平均误差;(2)若以概率95.45%的可靠性进行估计,则该农场10000亩小麦的平均亩产量的可能范围为多少?(当F(t)=95.45%,t=2)练习~(计算结果保留两位小数)三、抽样估计方法:区间估计

某电子产品使用寿命在3000小时以下为不合格品。现在用简单随机抽样方法从5000各产品中抽取100个对其使用寿命进行调查。结果如下:使用寿命(小时)产品数量(个)fxxfx-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论