




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 抽样与参数估计 学习目标 知识目标: 理解抽样与估计的基本原理;掌握抽样推断、抽样分布、统计量和参数估计的基本概念和计算方法。 能力目标: 能够根据统计研究目的和统计对象的特点组织抽样调查,计算样本指标(样本均值和样本方差),并依据样本对总体的数量特征(总体均值和总体比例)作出估计。 参数估计是统计推断的一种重要形式之一,包括参数的点估计和区间估计两类。在本章中我们介绍统计推断的基本原理,抽样和抽样分布的基本概念,参数的点估计与几种重要的区间估计方法,参数估计量的优良性标准也在本章作简要叙述。第一节 抽样与抽样分布 关键词:总体和样本;抽样及抽样推断;参数和统计量;抽样分布一、抽样推断的基本概念 (一)总体和样本抽样推断是从统计总体中抽取部分单位组成样本进行调查的。统计总体,简称为总体,它是指所要研究的客观现象的全体,组成总体的每一个元素称为个体。例如我们要研究某市居民的家庭收入水平,那么该市所有居民的家庭收入便构成研究总体,而每一户居民的家庭收入就是个体。一般来说,我们所研究的总体,即研究对象的某项数量指标,是一个随机变量,它的取值在客观上有一定的分布。实际上,我们对总体的研究,就是对相应的随机变量的分布的研究。因此,今后将不区分总体和相应的随机变量。为了推断总体的某些数量特征,我们一般是从总体中抽取一部分个体进行观察,即随机抽样。随机抽样就是按照机会均等的原则(即随机原则)从总体中抽取一部分个体的过程。假如我们抽取了个个体,且这个个体的某一指标为我们称这个个体的指标为一个子样或样本,并且一般称为简单随机样本(即子样的每个分量都机会均等的来自同一总体,各个分量之间是相互独立的),称作子样的容量。在一次抽样之后,观察到子样的一组确定的值,称为容量为的子样的观察值(或数据)。抽样推断就是按随机原则从总体中抽取一部分个体,即一个样本,进行观察,并依据所获得的数据,对总体的数量特征作出具有一定可靠程度的估计和推算,以达到对总体认识的一种统计方法。(二)重复抽样和不重复抽样如果说对于一个问题,总体是唯一确定的,那么,子样就完全不是这样。一个总体可能抽取很多个子样。全部子样的可能数目,既和子样容量的大小有关,也和子样的抽取方法有关。抽样方法有重复抽样和不重复抽样两种。重复抽样又称为有放回抽样或回置抽样。它是这样来抽取的,从总体个个体中随机抽取一个容量为的子样。每次从总体中抽取一个个体并视为一次试验。连续进行次试验构成一个子样。每次抽出一个个体,把数据记录后,又重新放回总体中参加下一次的抽选。因此重复抽样的子样是由次相互独立的试验构成的,也就是一个简单随机样本。一般来说,从总体个个体中,随机重复抽取容量为的子样,总共可以抽取个子样。不重复抽样又称为无放回抽样或不回置抽样。它是从总体个个体中抽取一个容量为的子样,连续次抽取构成一个子样。但每次抽出一个个体记录数据后,不再放回总体参加下一次的抽选。因此连续次抽选的结果不是相互独立的。一般来说,从总体个个体中,随机不重复抽取容量为的一个子样,总共可以抽取个子样是选排列的种数,。不重复抽样比重复抽样的子样可能数目要少得多。(三)参数和统计量说明总体数量特征的指标称为总体参数,简称为参数。譬如,总体均值和总体方差等。应当知道,当总体确定之后,总体参数是唯一确定的。在概率论的问题中,概率分布通常总是已知的,或者假设为已知,也就是说,总体参数是已知的,而一切计算与推理就是在这已知的基础上进行的。然而,在实际问题中,情况往往并非如此。总体的分布是什么概型可能完全不知道,或者由于现象的某些事实而知道其概型,但不知其分布函数中所含的参数。那么怎样才能知道一个随机变量的分布或其参数呢?这正是统计推断所要解决的问题之一。统计量是子样的一个函数,如果子样容量为,它就是个随机变量的函数,并且这个函数是不依赖于任何未知参数的随机变量。因为子样是随机的,随机变量的函数仍然是随机变量,因此统计量是随机变量。例如,是一个来自总体的容量为的子样,那么,样本均值就是一个统计量,它是子样的一个函数,且是不依赖于任何未知参数的随机变量。但当未知时,就不是统计量。必须指出的是,尽管一个统计量不依赖任何未知参数,但是它的分布可能是依赖于未知参数的。常用的统计量还有:样本方差:样本标准差:样本阶(原点)矩: 以及样本阶中心矩: 等。二、常用的抽样分布统计量的分布称为抽样分布。在运用统计量进行统计推断时,需要知道它的分布。当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说比较困难。下面给出来自正态总体的几个常用的抽样分布。(一)分布设()是来自总体的子样,则统计量服从自由度为的分布,记为。分布的密度函数为:这里,自由度是指子样中独立变量的个数。(二)正态总体的子样均值与子样方差的分布设是正态总体的一个子样,其子样均值与子样方差分别为 和 则 (1); (2)与相互独立; (3)服从自由度为的分布。(三)分布设(正态总体的一个子样,与分别为子样均值和子样方差,则是服从自由度为的分布。分布的密度函数为设为来自正态总体的子样,(为来自正态总体的子样,并且这两个子样相互独立。则统计量服从自由度的分布,其中与分别为这两个子样的子样均值,与分别为这两个子样的子样方差,且注意,这里的两个正态总体的方差相等。(四)分布设且相互独立,则统计量服从自由度为(的分布,记为。分布的密度函数为以上常用的抽样分布对于统计推断是至关重要的。至于这些结论的证明,限于篇幅,我们在这里从略不证,有兴趣的读者可以参考有关资料。三、关于抽样组织形式在统计推断中,为了保证样本数据对总体参数的代表性,主要采用概率抽样。概率抽样有以下几种形式。1简单随机抽样简单随机抽样又称纯随机抽样,它是按随机原则直接从总体中抽取个个体作为样本。在有抽样框的条件下,可用抽签的方式。更经常的是利用随机数表来抽取个个体。2分层抽样又称类型抽样。首先按照主要标志将总体所有个体分为若干“层”,然后在每一层内进行抽样。把总体中标志值比较接近的个体归为一层,使各层内个体的分布比较均匀,而且保证各层都有中选的机会,因此具有较好的抽样效果。3整群抽样整群抽样是将总体所有个体分为若干群,然后以群为单位从中随机抽取一些群,抽中的群的所有个体构成一个子样。4等距抽样又称系统抽样。它是事先将总体所有个体按某一标志排列,然后依固定顺序和间隔来抽取子样。这一方法比较常用,有时还可以与分层抽样和整群抽样结合,形成多阶段抽样等。第二节 参数估计关键词:点估计;抽样平均误差;抽样极限误差;区间估计;置信区间;置信度和显著性水平;统计量;统计量一、点估计当总体的分布函数的形式为已知,但它的一个或多个参数为未知时,借助于总体的一个子样对总体某一未知参数的数值点的估计,称为参数的点估计。点估计问题的一般提法是,设总体的分布函数的形式为已知,是要估计的参数,是的一个子样,是相应的子样的一组观察值。点估计问题就是要构造一个适当的统计量,用它的一组观察值来估计未知参数。我们称为的估计量,称为的估计值。估计量和估计值一般统称为估计,并简记为。但必须注意,对于子样的不同观察值,估计值是不相同的。点估计的方法有矩估计法、顺序统计量法、极大似然法、最小二乘法等。下面主要介绍两种常用的构造估计量的方法:矩估计法和极大似然估计法。(一)矩估计法由概率论的大数定律我们知道,在许多分布中总体的参数都是矩的函数,且子样矩依概率收敛于总体矩。因此人们很自然地会想到用子样矩来代替总体矩,从而得到总体分布中参数的一种估计。设总体具有已知类型的概率函数(或者),(是个未知参数。是来自总体的一个子样,若总体的前阶矩存在,并且是的函数。子样的阶矩为。我们令得到含个未知参数的个方程式。解这个联立方程组,就可以得到的一组解:用上式中的解去估计参数这就是矩估计法。例6.1 设总体服从区间上的均匀分布,是总体的一个子样,试求未知参数的矩估计量。解: 令即解上述联立方程组,得到: 例6.2 设总体的均值和方差都存在,是的一个子样。试求:和的矩估计量。 解: 令 解上述方程组,得和的矩估计量分别为 (二)极大似然估计极大似然估计是利用总体的分布密度或概率分布的表达式及其子样所提供的信息来求未知参数的估计量,它是建立在极大似然原理基础上的一种统计方法。极大似然估计的直观想法可用下面例子来说明。从甲箱中抽得白球的概率为1100,从乙箱中抽得白球的概率为99100,今随机抽取一箱,再从抽取的一箱中任抽取一球,结果抽得白球。这一白球从乙箱抽取的概率比从甲箱中抽出的概率大得多。由极大似然原理,既然在一次抽取中就抽到白球,自然可以认为这是从概率大的箱子中抽出的。如果要作一推断的话,其结论当然应该是,有极大的把握认为白球是从乙箱中抽取的。把这种考虑问题的方法一般化,就得到极大似然原理。下面我们对连续型与离散型总体两种情况来阐述极大似然估计法。设总体的概率函数,(为其子样。子样(的联合概率函数在取已知观察值时的值是的函数。我们表示为,称其为子样的似然函数。即若总体为离散型,其分布律,则子样取到一组观察值的似然函数为这就是对于一组观察值的概率。所以我们只要寻找这样的一组观察值的函数,以代使成立。满足上式的,称为参数的极大似然估计值,其相应的统计量称为参数的极大似然估计量。若总体为连续型,表示密度函数。于是子样落入点的邻域内的概率为,同样是的函数。既然在一次抽样中出现,当然可以认为子样落在点邻域内的概率达到最大,所以我们只要找出使达到最大的的值。由于是不依赖于的增量,因此只须求出使得达到极大的,便可得到极大似然估计。与离散型的情形一样,以代使成立。这里称为子样的似然函数。称为的极大似然估计值,称为的极大似然估计量。在许多情形,和关于可微,这时常可以从方程解得。又因与在同一处取得极值,的极大似然估计往往从方程求得,也是很方便的。例6.3设,是取自总体的一个子样,试求参数的极大似然估计量。解:设是子样的一组相应的取值。总体的分布律为那么似然函数为而取对数后,有令从而得的极大似然估计值为的极大似然估计量为 例6.4 设是取自正态总体的一个子样,其中、是未知参数。求与的极大似然估计。解:正态分布的密度函数是似然函数为两边取对数分别求关于和的偏导数,得似然方程组解方程组得 (三)估计量的优良性标准前面介绍了总体参数的两种常见的估计方法:矩估计法和极大似然估计。对于同一参数,用不同方法估计,可能得到不同的估计量。一般而言,任何统计量都可以作为未知参数的估计量。但究竟采用哪一种为好呢?这就涉及到用什么标准来评价估计量的问题。对于一个好的估计量通常要求满足以下几个常用标准。1一致性设为参数的估计量,若对任意的,当时,依概率收敛于,则称为的一致估计量。样本均值作为总体期望的一个估计量就满足一致性标准的要求。一致性标准的要求是从极限性质来说的,因此只有对于样本容量较大时才起作用。2无偏性若估计量的数学期望存在,且对任意的有则称是的无偏估计,否则称为有偏的。 例65 证明子样均值是总体均值的一个无偏估计,但子样方差不是总体方差的无偏估计。解:因为子样是总体独立同分布的个随机变量,从而有相同的数学期望和方差。故则 所以,子样均值是总体均值的一个无偏估计量。又因为 由于,所以不是的无偏估计量。但所以通常用作为总体方差的无偏估计量。 3有效性 设与都是的无偏估计量,若有则称较有效。 一般来说,一个未知参数可以有不同的无偏估计量。如果和是未知参数的两个无偏估计量。如果在子样容量相同的情况下,的观察值较更密集在真值的附近,即的方差较小,我们就认为比有效。 (四)抽样误差 我们已经知道,抽样推断的目的是从局部推断整体。拿点估计来说,就是根据子样的估计量对总体相应参数作出估计。简单地说,也就是用子样估计值代替总体相应参数。可以断言,这二者之间必然存在着差距,这个差距就是误差。抽样误差就是抽样估计值与被估计的总体未知参数之差。要指出的是,我们在这里所讨论的抽样误差不是指那种由人为因素所造成的所谓登记性误差,而是指随机抽样本身所固有的一种代表性误差。 1因为总体参数是未知的,所以这种误差在每一次实际的抽样中是不知道的; 2这种误差是不可避免的,但可以用大数定律的数学公式确定它的界限,并通过抽样设计加以控制; 3这种误差是一随机变量,它不是固定的一个数,而是随着样本而可大可小的变量,现以子样均值为例,当用子样均值去估计总体均值的时候,即为,但是,由上面已经知道,这个误差它是一个随机变量,不是固定的一个数。很自然就会引出抽样平均误差这一指标,以反映抽样误差的一般水平。又因为子样均值和子样比例分别是总体体均值和总体比例的无偏估计,所以可将所有子样的抽样误差用求标准差的方法来处理。抽样平均误差就是子样均值(或子样比例)的标准差,用以反映子样均值(或子样比例)与总体均值(或总体比例)的平均误差程度。子样均值的平均误差记为。子样比例的平均误差记为。可以证明,在重复抽样条件下,子样均值的平均误差为:子样比例的平均误差为:其中表示总体的标准差,为总体比例,为子样容量。 抽样平均误差,并不等同于子样均值与总体均值,或子样比例与总体比例的实际误差,它只是衡量可能误差范围的一种尺度。我们无法计算,也不必要计算实际误差,我们只能把抽样误差控制在一定的范围内,这就是下面要给出的抽样极限误差。抽样极限误差是指抽样估计量和总体参数之间抽样误差的可能范围,记为 或,分别表示子样均值的极限误差或子样比例的极限误差。即或二、区间估计如前所述,点估计是用一个数值(即一个点)去估计未知参数。区间估计则是估计未知参数所在的一个范围 ,即一个区间。这样的区间估计同时涉及到估计的可靠性和估计的精确性两个方面的问题。 (一)置信区间与估计的精确性设总体的密度函数为,为未知参数。对于给定的,若由子样所确定的两个统计量和满足则称随机区间是的置信度为的置信区间,称为显著性水平。随机区间可以表示为与其等价的形式。其中为待估计的未知参数,为相应的估计量。称为估计的极限误差,它是概率度与抽样平均误差之积。极限误差的大小,就是反映估计的精确性的,同时它又是与估计的置信度相联系的。当我们要求以较高的可靠性(即置信度)进行区间估计的时候,概率度就大一些。概率度大,对应的极限误差就大(对于一次抽样来说,抽样平均误差是确定不变的),极限误差大,那么估计的精确性就差。反之,当以较低的可靠性作区间估计的时候,概率度就小一些。概率度小,对应的极限误差也就小,极限误差越小,那么估计的精确性就越好。所以置信区间一方面是给出了估计值的一个区间范围,另一方面它反映了区间估计的精确性。(二)置信区间与估计的可靠性置信区间是一随机区间,一般而言,这种估计只能具有一定的可靠性,置信度就是反映估计的可靠性的。当给定置信度为时,其含意是指在重复取样下,将得到许多不同的区间,根据贝努利大数定律,这些区间中大约有的区间包含未知参数。对于一次抽样所得到的一个区间,决不是说“不等式成立的概率为”。区间估计的可靠性和估计的精确性是一对矛盾,一般来说,作区间估计,我们不可能既要求有较高的可靠性,同时又要求有较高的精确性。只能针对具体的研究目的,在这两者之间选择其一。 三、单个总体均值的区间估计 (一)正态总体,已知时,总体均值的区间估计当,由第一节已知,子样均值,则统计量 对于给定的显著性水平,令即有从而有即在给定显著性水平下,总体均值在的置信水平下的置信区间为:例6.6 某种零件的厚度服从正态分布,从该批产品中随机抽取9件,测得平均长度为23.4。已知总体的标准差0.15,试估计该批零件厚度的区间范围,给定置信水平为95。解:已知总体,。总体均值的置信区间为:即为 (。我们可以95的概率保证程度估计该批零件的平均厚度在之间。当总体为非正态总体时,可以证明,当子样容量足够大时,子样均值近似地服从期望为,方差为的正态分布。经验上一般规定大样本()时,就认为子样容量已足够大了。例6.7 某轴承内环零件的高度服从正态分布。现从中抽取20只内环,测得其平均高度,试求内环零件平均高度的置信度为95的置信区间。解:已知(查正态表。且已知子样均值是总体均值的点估计。由此构造一个子样函数在已知总体方差时,其分布不含有任何未知参数。故对于给定的置信度,使得通过不等式变形,其等价形式为或于是得到置信度为的置信区间对于子样观察值和,代入得到置信区间(二)未知时总体均值的区间估计 当总体服从正态分布,但总体方差未知时,要用方差的无偏估计代替总体方差,这时我们构造的子样函数为它服从自由度为的分布不依赖任何未知参数。对于给定的置信度,我们有这里可查自由度为的分布表得到。经过不等式的等价变换,得到的置信度为的置信区间 例6.8 某灯泡厂生产一种新型灯泡,为了了解灯泡的使用寿命,在生产线上随机抽取9只灯泡进行测试,得到下列数据(小时):5100,5100,5400,5260,5400,5100,5320,5180,4940。若灯泡的使用寿命服从正态分布,现以95的可靠性估计该批新型灯泡平均使用寿命的区间范围。解:这是一个方差未知的正态总体均值的区间估计问题。现已知子样观察值及(查分布表),经计算得:,所以该批灯泡平均使用寿命置信度为95的置信区间是(5079,5321)。 四、单个总体比例的区间估计总体比例也是常见的参数之一,它是指总体中具有某种特征的个体占总体全部个体的比例,记为。实践中研究这样的问题是很多的,例如,一批种子的发芽率;全部产品的合格率;某地区义务教育阶段适龄儿童的入学率;全部职工中女职工所占的比例等。子样中具有某种特征的个体占子样全部个体的比例称为子样比例,记为。可以证明,在大样本的情况下,若则可以把二项分布问题变换为正态分布问题近似地去求解。因而有即子样比例服从期望值为,方差为的正态分布。因而,可以用统计量来构造总体比例的置信区间,即在估计总体比例时,由于未知,那么在上式中就用子样比例代替。因而在给定的置信水平下,总体比例的置信区间为例6.9 某地区调查下岗职工中女性的比例,随机抽取了36个下岗职工,其中20人为女性。现以95的置信度估计该地区全部下岗职工中女性比例的区间范围。解:首先求下岗职工中女性的子样比例 再求给定置信度,查正态分布表,。因而置信区间为即可以95的可靠性估计该地区全部下岗职工中女职工所占的比例在之间。 五、两个总体均值之差的区间估计在实际中,人们经常需要比较两个总体均值的问题。例如,研究社会发展时,要比较两个地区居民的人均年收入;某化工厂要比较两种催化剂对化学生产过程的得率的影响;兵器厂要比较两种型号步枪子弹的枪口速度等等。这通常要对两个总体均值之差作区间估计。(一)两个总体的方差、已知时的估计这里包括两种情形,一是两个总体均服从正态分布,它们的方差、已知;二是两个总体的分布未知,但来自两个总体的两个子样为大样本,且它们的方差、已知。这时可以证明:或即得的一个置信度为的置信区间 例6.10 一家银行的负责人要了解储户存入两家银行的储蓄存款,从两家银行的储户中各任抽25户,计算得到子样均值:元,元。设两个总体均服从正态分布,且已知它们的方差分别为和。试以95的置信度,求的置信区间。如果提高估计的置信度为99,此时估计区间将怎样变化? 解:由题意可知:,从而的置信度为95的置信区间是:即,查正态分布表,。如果置信度提高到99,此时查表,那么置信区间为。比较这两个区间,我们可以看到置信度越高的,其估计区间越长,估计区间越长,其实质就是允许误差越大,那么估计的精确性越差。这正是我们在前面“置信区间与估计的精确性”的一段论述中所谈到的。(二)两个总体方差、未知时的估计已知,但未知,此时,由第六章第一节抽样与抽样分布知,从而可得置信度为的置信区间是其中 例6.11 某军工厂为比较两种型号步枪子弹的枪口速度,随机抽取型步枪子弹10发,得到枪口速度的均值为,标准差为。随机抽取型步枪子弹20发,得到枪口速度的均值,标准差。设两总体近似服从正态分布,且它们的方差相等。试以95的置信度估计两总体均值之差的区间范围。解:由题意知,两总体服从正态分布,且它们的方差相等,但方差未知。故适用两总体方差未知时两总体均值之差的区间估计。已知查表故置信度为95的两总体均值之差的区间范围是即 五、两个总体比例之差的区间估计设两个总体比例分别为和,为了估计两个总体比例之差,于是分别从两个总体中各自随机抽取容量为和两个子样,子样比例分别为和。可以证明,当两个子样均为大样本,且时,子样比例之差的抽样分布近似服从正态分布,并且从而的置信度为置信区间是:但因总体比例与均未知,在上式中要分别用子样比例和代替,因此,的置信度为的置信区间为例6.12 在某个节目的电视收视率的问卷调查中,城市随机调查了500人,有36的人收看了该节目,在乡村调查了400人,有30的人收看了该节目。现以95的可靠性估计城市与乡村收视率差别的区间范围。解:由题意知, , , 又,查表,故得收视率差别的区间范围是 即某个节目城市与乡村的电视收视率差别从零到12左右,这种估计大致有95的可信度,还是比较符合实际情况的。第三节 样本容量的确定关键词:样本容量;重复抽样;不重复抽样一、确定样本容量应考虑的主要因素在前面的讨论中,我们都是假定样本容量是已知的,但是在实际问题中,往往需要设计调查方案,确定样本容量。如果选得过大,会增加调查费用;如果选得过小,会使估计的精确性降低,误差增大。确定适当的样本容量是抽样估计的一个重要问题。一般来说确定样本容量,应当考虑以下几个因素:1对某项估计要求什么样的精确度,即我们希望估计值与总体参数之间的允许误差控制在什么样的范围以内。换句话说,我们想构造多宽的置信区间。在其它条件一定的情况下,如果要求的置信区间较宽,样本容量可以小一些,反之则需要较大的样本容量。 2对于我们要求的置信区间来说,想要多大的置信度,也就是说,估计总体参数包含在置信区间内要求有多大的可靠性。一般来说,在其它条件一定的情况下,如果要求的置信度较大,较大的样本容量。反之样本容量可小一些。3对于该项抽样估计所能承担的费用。二、估计总体均值时,样本容量的确定 (一)重复抽样条件下样本容量的确定作总体均值的区间估计时,或在大样本的情况下,样本均值的抽样分布服从正态分布。因此总体均值的置信区间由下式确定为这一公式表示在置信度为时,总体参数与样本均值的绝对离差不超过,称之为抽样极限误差(又称允许误差),一般表示为。其中是相应于置信度在正态分布下的置信系数,又称为概率度。它是由置信度和抽样分布所决定的一个值,在概率分布表上可以查到,所以通常又称临界值。是总体变量的标准差。由上式得到:这一公式指出样本容量取决于置信度,即相应的,还取决于总体方差和估计时的抽样允许误差。样本容量与这三者有以下关系:1置信度与样本容量成正比,当和保持不变时,置信度愈高,则样本容量愈大;2总体方差与样本容量成正比,总体变量差异愈大,样本容量也愈大;3抽样允许误差与样本容量成反比,允许误差愈大,样本容量愈小。或者说,估计的精确度要求愈低,必要的样本容量就越少。例6.13 一家广告公司想要估计批发类商店在一年里所开支的平均广告费用,根据以往的资料,总体方差约为1500000元。若给定置信度为95,允许误差控制在500元的范围以内,这家广告公司要设计多大容量的样本?解:已知这家广告公司应设计抽选23个批发类商店作样本,进行调查。(二)有限总体不重复抽样条件下的样本容量在实际抽样问题中,总体一般是有限的,当采用不重复抽样时,总体均值的置信区间为当抽样比时,上式近似为因此允许误差为于是得到三、估计总体比例时,样本容量的确定 (一)重复抽样条件下的样本容量作总体比例的区间估计时,总体比例的置信区间为于是允许误差为由此得到在作总体比例估计时,有时使用相对误差的概念,估计的相对误差记为,则允许相对误差。那么,样本容量为例6.14 某市作一项人口出生率的社会调查,根据以往的资料,该市的人口出生率约为12,现要求相对误差不超过10,置信水平为95,在重复抽样条件下,应设计多大容量的样本?解:题目给出的是允许相对误差,所以应设计的样本容量为31630人。 (二)有限总体不重复抽样条件下的样本容量当有限总体不重复抽样时,由同样的道理可以得到允许误差为于是有(抽样比例。第四节EXCEL抽样与估计中的应用关键词:AVERAGE()函数;COUNT()函数;STDEV()函数;SQRT()函数;TINV()函数用Excel的函数工具以及自己输入公式等组合方式,可以进行抽样与估计分析计算。下面我们举例说明用Excel求置信区间的具体操作步骤和过程。表6.1 总体均值置信区间的计算表例6.15某车间生产了一批零件,从这批零件中随机抽取12个,测得其长度(单位:mm)数据如附表6.1中的A2:A13。假定零件长度遵从正态分布,试以95%的置信水平估计这批零件平均长度的置信区间。首先,输入用于区间估计的Excel工作表,然后在表格中输入下列内容:A列输入样本数据,B列输入变量名称,D列存放变量值。具体操作是: D2输入“COUNT(A2:A13)”,得到数字12;D3输入“AVERAGE(A2:A13)”得到11.07167;D4输入“=STDEV(A2:A13)”得到0.274352;D5输入“=D4/SQRT(12)”得到0.079199;D6输入0.95;D7输入“D2-1”得到11;D8输入“=TINV(1D6,D7)”得到2.20985;D9输入“=D8*D5”得到0.174316;D10输入“=D3D9”得到10.89735;D11输入“=D3D9”得到11.24599。由以上结果,我们有95%的把握认为该车间生产的这批零件的平均长度在10.8973511.24599之间。本章小结本章阐述了抽样与估计的基本理论与方法,其主要内容包括抽样及抽样分布原理、参数估计理论与方法及样本容量的确定。抽样推断就是按随机原则从总体中抽取一部分个体组成样本进行观察,并依据所获得的数据,对总体的数量特征作出具有一定可靠程度的估计和推算,以达到对总体认识的一种统计方法在抽样推断中,我们称根据总体数据计算的总体指标(总体均值和总体成数)为参数,根据样本数据计算的样本指标(样本均值和样本成数)为统计量。统计量的分布称为抽样分布,常用的抽样分布主要有正态分布、分布、分布、分布等。参数估计包括点估计和区间估计样本容量的计算主要有重复抽样下样本容量的计算和有限总体不重复抽样下的样本容量计算两种情况。同步训练一、 单项选择题1、在估计总体参数时,构造一个置信区间,其置信水平为(.下面哪一种说法最准确( )A.落在该区间的概率为95%; B.不落在该区间的风险为5%;C.有95%的随机区间会包括; D.这一估计的误差不超过5%2、置信水平表示是区间估计的( )A.精确性; B.准确性; C.显著性; D.可靠性3、设一正态总体,抽取容量为的随机样本,其样本均值的抽样平均误差是( )A.10; B.; C.2.9; D.3.84、估计量的抽样平均误差大小反映了估计的( )A.精确性; B.准确性; C.显著性; D.可靠性5、在参数估计中利用分布构造置信区间的条件是( )A.正态总体,且方差已知; B.正态总体,且方差未知;C.总体不一定为正态分布,但是大样本;D.总体不一定为正态分布,但方差已知二、 填空题1、在正态分布条件下,所谓原则是指:总体均值左右1范围内的概率是( ),范围内的概率是( ),范围内的概率是( )。当置信水平为90%时,双侧检验的临界值为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高考生物试题分类汇编基因工程(解析版)
- 蒜黄的种植课件
- 常平中学三校联考试卷及答案
- 向量加减法题目及答案
- 2025年高考化学试题分类汇编:有机合成与推断题(原卷版)
- 衔接选词填空题目及答案
- 2025汽车租赁合同样本
- 2024译林版八年级英语上册Unit4 Hands-on fun 动手实践(话题阅读)含答案
- 2024译林版八年级英语上册Unit3 单元测试卷及答案(含三套题)
- 2025-2026学年人教版七年级地理下学期 第七章 我们生活的大洲-亚洲 单元练习(含答案)
- 病历书写基本规范-课件
- 华住酒店集团讲义
- 送货不达应急预案
- 牙体牙髓病治疗常用器械及其使用-课件
- 机动车维修竣工出厂合格证样式
- 广东省地质灾害危险性评估报告
- GB/T 32486-2016舞台LED灯具通用技术要求
- 锚杆工程隐蔽验收记录
- 整套教学课件《现代心理与教育统计学》研究生
- 油漆安全技术说明书(MSDS)
- RBA(原EICC)ERT应急准备与响应培训课件
评论
0/150
提交评论