第5章 抽样分布与参数估计幻灯片_第1页
第5章 抽样分布与参数估计幻灯片_第2页
第5章 抽样分布与参数估计幻灯片_第3页
第5章 抽样分布与参数估计幻灯片_第4页
第5章 抽样分布与参数估计幻灯片_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章 抽样分布与参数估计,5-2,第五章 抽样分布与参数估计,第一节 抽样的基本概念与数学原理 第二节 抽样分布 第三节 参数估计 第四节 样本容量的确定 第五节 EXCEL在参数估计中的应用,5-3,第一节 抽样的基本概念与数学原理,一、有关抽样的基本概念 二、大数定理与中心极限定理,5-4,一、有关抽样的基本概念,(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。 一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。 2.样本个数。样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。,5-5,(二)总体参数与样本统计量 1.总体参数。总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。 常见的总体参数有:总体的平均数指标,总体成数(比例)指标,总体分布的方差、标准差等等。它们都是反映总体分布特征的重要指标。 2.样本统计量。样本统计量是样本的一个函数。它们是随机变量。我们利用统计量来估计和推断总体的有关参数。 常见的样本统计量有:样本平均数,样本比例,样本的方差、标准差。,5-6,(三)概率抽样及其组织形式 所谓概率抽样,就是要求对总体的每一次观察(每一次抽取)都是一次随机试验,并且有和总体相同的分布。按这样的要求对总体观测(抽取)n次,可得到容量为n的样本。,5-7,显然,(1)和(2)的抽取行为都不是随机试验。因而不属于概率抽样。只有(3)的抽取行为是随机试验。总体的分布可用表5-1的分布列来描述,而(3)的随机试验中所观测的随机变量也有与表5-1有相同的分布。所以,(3)的抽取行为是概率抽样。,5-8,(四)放回抽样与不放回抽样 1.放回抽样。 放回抽样的具体做法是:从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮单位的抽取。 放回抽样的特点是: 一,n个单位的样本是由n次试验的结果构成的。 二,每次试验是独立的,即其试验的结果与前次、后次的结果无关。 三,每次试验是在相同条件下进行的,每个单位在多次试验中选中的机会(概率)是相同的。 在放回抽样中,样本可能的个数是 ,N为总体单位数,n为样本容量。,5-9,不放回抽样的具体做法是:每次从总体抽取一个单位,记录其标志值后不放回原总体,不参加下一轮抽样。下一次继续从总体中余下的单位中抽取。 不放回抽样的特点是: 一,n个单位的样本由 n 次试验结果构成,但由于每次抽出不放回,所以实质上相当于从总体中同时抽取n个样本单位。 二,每次试验结果不是独立的,上次中选情况影响下次抽选结果。 三,每个单位在多次(轮)试验中中选的机会是不等的。 不放回抽样,如果考虑顺序,其样本可能个数为 如果不考虑顺序,其样本可能个数为,5-10,2.不放回抽样。,5-11,(五)抽样分布 从总体中可以随机地抽取许多样本,由每一个样本都可以计算样本统计量的观测值,所有可能的样本观测值及其所对应的概率便是所谓的抽样分布。因此,抽样分布也可以称为样本统计量的概率分布。 抽样分布可能是精确地服从某种已知分布(所谓已知分布,例如我们在第四章介绍过的各种常见分布),也可能是以某种已知分布为极限分布。在实际应用中,后者更为多见。,5-12,5-13,5-14,表5-3 10人中有放回抽二人的全部可能样本,5-15,表5-4 任职年限样本均值分布数列,5-16,5-17,二、大数定理与中心极限定理,5-19,大数定理表明:尽管个别现象受偶然因素影响,有各自不同的表现。但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规律。,5-20,5-21,从正态分布的再生定理可以看出:只要总体变量服从正态分布,则从中抽取的样本,不管 n 是多少,样本平均数都服从正态分布。 但是在客观实际中,总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题,需要由中心极限定理来解决。,5-22,5-23,5-24,第二节 抽样分布,一、样本平均数的抽样分布 二、样本比率的抽样分布,5-25,一、样本平均数的抽样分布,(一)样本平均数的期望值与方差,5-26,5-27,5-28,5-29,(二)样本平均数的分布规律,5-30,5-31,5-32,二、样本比率的抽样分布,(一)样本比率的期望值与方差,5-33,5-34,5-35,5-36,(二)样本比率的分布规律,5-37,表5-5 用正态分布来近似时对样本量的要求,5-38,(三)样本方差的抽样分布,5-39,5-40,第三节 参数估计,一、参数估计概述 二、总体均值的估计 三、总体比率的估计 四、总体方差的估计,5-41,一、参数估计概述,(一)参数估计的定义与种类 所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函数)。例如,估计总体均值,估计总体比率和总体方差等等。 参数估计有两种基本形式:点估计和区间估计。前者是用一个数值作为未知参数的估计值,后者则是给出具体的上限和下限,把 包括在这个区间内。下面分别介绍点估计与区间估计的有关概念。,5-42,(二)点估计 点估计,主要有矩估计法和最大似然估计法。 矩估计法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量; 最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。,5-43,(三)估计量的优良标准,2. 有效性。又称最小方差性。,5-44,4. 充分性。估计量包含了样本中关于的全部信息。,5-45,(四)区间估计与估计的精度和可靠性,5-46,5-47,5-48,二、总体均值的估计,5-49,5-50,5-51,5-52,5-53,5-54,5-56,(二)总体方差2未知的情形,5-57,2. 区间估计,5-58,5-59,5-61,【例5-8】在例5-7中,若总体方差未知,但通过抽取的6个样本测得的样本方差为0.0025,试在0.95的置信度下,求该产品直径的均值置信区间。,5-62,三、总体比率的估计,5-63,(二)区间估计,由于总体的分布是0-1分布,只有在大样本的情况下,才服从正态分布。总体比率可以看成是一种特殊的平均数,类似于总体均值的区间估计,总体比率的区间估计是:,5-64,【例5-9】在某市区随机调查了300个居民户,其中6户拥有等离子电视机。试求该区(按户计算的)等离子电视机拥有率的0.95置信区间。,解:本例总体单位数N很大,故采用放回抽样的有关公式计算。n=300,p=0.02,n P=65,可以认为户数n充分大,=0.05, 。,5-65,四、总体方差的估计,5-66,(二)区间估计,5-67,【例5-10】某公司生产一种健康食品,对每罐食品的重量有一定规定,不允许有过大的差异。设每罐食品的重量服从正态分布。现从生产线上抽查了10个样本,求得其样本方差为9.2,试对总体方差进行置信度为0.90的区间估计。 解:,,,置信度为0.90的置信区间为:,=,5-68,第四节 样本容量的确定,一、问题的提出 二、估计总体均值时样本容量的确定 三、估计总体比例时样本容量的确定 四、使用上述公式应注意的问题,5-69,由前面的论述,我们已知参数估计中的精度要求与可靠性要求常常是一对矛盾,但是,通过增加样本容量n有可能降低样本平均数的标准差,从而实现既保证一定的估计精度,又具有较高的置信度的目的。这时,需要考虑在给定的置信度与极限误差的前提下,样本容量n究竟取多大合适?这就是所谓样本容量的确定问题。,一、问题的提出,5-70,二、估计总体均值时样本容量的确定,5-71,5-72,5-73,三、估计总体比率时样本容量的确定,5-74,四、使用上述公式应注意的问题,1计算样本容量时,总体的方差与成数常常是未知的,这时可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;三是比率方差在完全缺乏资料的情况下,就用比率方差的最大可能值0.25代替。 2.如果进行一次抽样调查,需要同时估计总体均值与比率,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足两方面的需要。 3.上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:n=56.03,那么,样本容量取57,而不是56。,5-75,5-76,5-77,5-78,5-79,第五节 Excel在参数估计中的应用,【例5-13】用Excel完成本章思考与练习计算题的第1题。 解:操作步骤如下。 1构造工作表。如图5-3所示,A、B列为原始输入数据,A2:A16存放的是关于最大飞行速度的数据,图中未完全显示出来。C、D列为计算结果,分别在C2、D2单元格存放置信下限和上限。 2定义变量名。将A列命名为“x”,将B2单元格命名为“置信水平”。,5-80,3计算置信上、下限。 分别在C2、D2中输入如下的公式: =AVERAGE(x)-TINV(1-置信水平, COUNT(x)-1) *STDEV(x)/SQRT(COUNT(x) =AVERAGE(x)+TINV(1-置信水平, COUNT(x)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论