05 抽样估计.doc_第1页
05 抽样估计.doc_第2页
05 抽样估计.doc_第3页
05 抽样估计.doc_第4页
05 抽样估计.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章抽样估计第一节抽样估计的理论基础抽样估计的基本内容就是研究如何根据总体的部分数据信息(构造样本指标也称统计量)去估计未知总体指标(也称参数)的理论和方法。学习步骤:抽样估计的理论基础大数定律和中心极限定理掌握抽样分布的有关概念及基本原理抽样估计的理论和方法。一、大数定律大量的独立重复测量值的算术平均值具有稳定性。对于这种稳定性的研究构成了大数定律的基本内容。两个重要的大数定律:贝努里大数定理、辛钦大数定律设事件A在一次试验中发生的概率为p,在n次独立重复试验中,事件A发生了m次,那么对任意给定的正数,有其等价形式是贝努里大数定理说明:事件发生的频率m/n,依概率收敛于事件发生的概率p,这个定理用严格的数学形式表达了频率的稳定性,也就是说,当n很大时,事件发生的频率与概率有较大偏差的可能性很小。因此,当n很大时,可用事件发生的频率m/n近似地代替事件发生的概率p,即pm/n,这种方法称为抽样估计,它是数理统计的主要研究课题。(二)辛钦大数定律设随机变量X1,X2,Xn相互独立,服从同一分布,且(E(Xk),k1,2,),则对任意正数,恒有:辛钦大数定律为我们用测量数据的算术平均数代替其真值的方法提供了理论依据。假定要测量某一物理量,在不变条件下测量n次,得到的结果X1,X2,Xn是不完全相同的,它们可以看作n个独立随机变量X1,X2,Xn(它们服从同一分布且数学期望均为)。按照辛钦大数定律,当n很大时,我们取n次测量结果的算术平均数作为真值的近似值,这时出现较大偏差的可能性很小。一般说来,测定的次数越多,近似程度越好。二、中心极限定理当处理大样本问题时,将它作为一个非常重要的工具。下面介绍两个常用的中心极限定理。定理1:林德贝格勒维中心极限定理,也称为独立同分布中心极限定理。定理2:德莫佛拉普拉斯中心极限定理。它表明:二项分布的极限分布是正态分布,因此,当n充分大时,若随机变量XnB(n,p),则近似地有XnN(np,np(1p),于是我们可以利用正态分布近似地计算二项分布的概率。同时,这个定理还给离散型随机变量与连续型随机变量之间的转换提供了一种有效途径。【例51】在一家保险公司里有10000人参加人寿保险,每人每年交保费12元,假定一年内一个意外死亡的概率为0.006,死亡时其家属可向保险公司索赔1000元,计算:保险公司亏本的概率有多大?保险公司一年利润不低于40000元的概率有多大?解:以X表示10000个参加保险的人中一年内意外死亡的人数,则XB(10000,0.006)。因此,P1000X120000表示保险公司亏本的概率,P1200001000X400000表示保险公司一年的利润不低于40000元的概率,由于n10000比较大,所以根据定理2得:(1)P1000X120000PX120P(X100000.006)/(100000.0060.994)1/2(12060)/(59.64)1/21(7.7693)0(2)P1200001000x40000P(X100000.006)/(100000.0060.994)1/2(8060)/(59.64)1/2(2.5898)0.9952 第二节抽样方法与抽样分布一、抽样方法(一)重复抽样和不重复抽样(识记二者概念。重点)对于无限总体而言,抽样总是可以认为是重复抽样(即重置抽样或放回抽样),因此,它没有重复抽样和不重复抽样的区别。然而,对于有限总体而言,重复抽样与不重复抽样是不一样的。下面我们只对有限总体的重复抽样和不重复抽样进行分别介绍。1.重复抽样首先,我们假设有限总体中所包含的个体数为N,重复抽样可以认为是有限总体条件下的简单随机抽样。其特点是:如果我们做了n次独立试验(也就是抽取n个个体的样本),那么总样本个数(即所能获得的全部样本数)是Nn而样本容量为n,每个样本被抽到的概率都为1/Nn。2.不重复抽样不重复抽样(即不重置抽样或不放回抽样)是指每次从有限总体中随机抽取一个个体,登记结果后不放回原总体,下一个个体继续从总体中余下的个体中随机抽取。其特点是:第一,n个个体的样本是由n次抽取的结果组成。第二,每次抽取的结果不是独立的。第三,虽然在同次试验中每个个体被抽中的概率是相同的,但在不同次试验中每个个体被抽中的概率是不相同的。(二)其他抽样方法简单随机抽样、类型抽样、等距抽样、整群抽样。二、抽样分布(一)抽样分布的概念(识记。重点)对于给定的总体和抽样方式以及样本容量,样本指标取值的概率分布就称为抽样分布。【例52】对于由6、7、8三个数组成的总体,若给定样本容量为2,并采用有放回的简单随机抽样方式,则样本均值这一统计量共有5个不同的取值,且这5个不同取值出现的概率不同。列出此样本均值的概率分布,如表51所示。表51 样本均值的概率分布样本均值66.577.58概率1/92/93/92/91/9样本统计量的精确分布通常也称为正态总体小样本分布;样本统计量的极限分布称为任意总体大样本分布。在使用样本统计量的极限分布时,通常都要求样本容量至少在50以上。(二)常用的抽样分布样本均值、样本比例和样本方差(领会)。1.样本均值的抽样分布不论所考察总体的概率分布如何,只要样本容量n足够大,其样本均值的概率分布趋近于以总体均值为期望,以为标准误差的正态分布,即有:在实践中,总体的方差2总是未知的,通常需要用其估计量即样本方差S2来代替。由于修正的无偏样本方差是总体方差的无偏估计,所以实际应用中,通常都用无偏样本方差S2来代替总体方差。在小样本的情况下,记用s替换后的随机变量为t,对于抽自正态总体的简单随机样本,就有:2.样本比例的抽样分布样本比例是总体比例的估计量,只能给出大样本条件下样本比例的抽样分布。将样本比例作为一个数学期望为0、方差为1的标准正态变量,记此标准化变量为Z,则有:3.样本方差的抽样分布主要是在正态分布总体中应用。第三节点估计一、总体参数与其估计量在统计中需要使用一定的方法根据样本数据来推断总体的指标数值,总体指标又称为参数。根据样本来推断总体指标数值就称为抽样估计。它是推断统计学的主要内容之一。估计量、估计值(识记):用来估计总体指标数值的统计量又称为该总体指标的估计量,该估计量的数值就称为该总体指标的估计值。总体指标的估计量是一个随机变量,其数值随着所抽取的样本不同而不同,总体指标的估计值就是其估计量在某个给定样本上的取值。二、构造估计量的方法矩法估计(领会)所谓矩法估计,是指用样本矩作为总体同一矩的估计量或者用样本矩的函数作为总体相应矩的函数的估计量。也就是说,若总体指标是所考察的随机变量的某阶矩,则可用样本观测值的同阶矩作为其估计量;若总体指标虽不是所考察随机变量的某阶矩,但却是某些矩的函数,则也可用样本相应的这些矩来构造成同样的函数作为其估计量。总体指标的估计量通常用代表该总体指标的字母戴一个尖帽表示。三、判断估计量优劣的标准(领会) 常用的标准主要有一致性、无偏性、有效性、充分性和稳健性等。(一)一致性对于总体指标,若其估计量的取值随着样本容量的增大越来越接近于总体指标的真值,则该估计量就称为总体指标的一致估计量,或称为相合估计量。一致性是对估计量的最基本的要求。可以证明,由矩法估计所构造出来的估计量都是所要估计的总体指标的一致估计量,即都具有相合性。如样本均值是总体均值的一致估计量,样本比例p是总体比例P的一致统计量,样本方差S2也是总体方差2的一致估计量。(二)无偏性虽然用样本指标去估计总体指标必然存在着估计误差,但是却不应该存在系统性的偏差,即不应该存在一贯偏大或偏小的偏差。因此,有无系统性偏差存在就可以作为判断估计量优劣的又一个标准。对于总体指标若其估计量取值的数学期望等于总体指标的真值,即E(),或估计误差()的数学期望为0,即E()0,则该估计量就称为总体指标的无偏估计量。若E()B,且B不为0,则就是总体指标的有偏估计量,即B为估计偏差。同样也可以证明,样本均值是总体均值的无偏估计量,而常规的样本方差s2并不是总体方差2的无偏估计量。修正的无偏样本方差的数学期望正好等于被估计的总体方差2。以上结论由【例53】验证。修正的无偏样本方差与常规样本方差相比,只是分母少1。对于小样本来说,常规样本方差和无偏样本方差的值会有一定的差距,估计总体方差时应采用无偏样本方差作为其估计量。而对于大样本来说,常规样本方差和无偏样本方差的值则相差无几,估计总体方差2时,用哪一个作估计量都可以。(三)有效性用样本指标来估计总体指标,显然估计误差越小越好,根据这一直观想法可得出判断估计量优劣的第三个标准。对于任一总体指标,若存在两个无偏估计量1和2,其中估计量1的估计误差平均来说小于估计量2的估计误差,则称估计量1比2有效。两个无偏估计量比较,方差较小者较为有效。两个估计量的方差之比: 称为二者的相对效率。若比率1,则称估计量1比2有效。对于一个总体指标来说,若在其所有无偏估计量中能够找到一个估计量,其方差最小,则该估计量就称为该总体指标的最佳估计量。可以证明,样本均值就是该总体指标均值的最佳无偏估计量。有效性标准是对估计量的方差进行比较,这只能用于无偏估计量的比较判断,而不适用于有偏估计量之间或有偏估计量与无偏估计量之间的比较判断。为了给出适用于所有估计量之间比较判断的指标,可对有效性标准进行适当的修改,即可将判断估计量是否优良的指标改为估计量的均方误差,在待估总体指标的所有估计量中,均方误差最小的估计量可认为是最好的估计量,该标准可称为均方误差最小标准。对于两个估计,若两个均为无偏估计量,则其方差最小者也就是均方误差最小者,故方差最小者较好;若其中一个是无偏估计量,另一个是有偏估计量,或者两个均为有偏估计量,则均方误差最小者较好,所以均方误差最小标准也是无偏性标准和有效性标准的综合。(四)充分性在进行总体指标的估计时,应充分利用样本资料提供的信息,以免造成浪费。根据这一思想,可给出判断估计量优劣的第四个标准。对于总体指标,若其估计量提取了样本中包含的有关总体指标的全部信息,则估计量就称为总体指标的充分估计量。判断样本指标是否为某个总体指标的充分估计量,一般比较麻烦,不过在多数情况下,常用的总体指标的估计量均是充分的。如在正态分布总体下,样本均值是总体均值的充分估计量,样本方差s2同样也是总体方差2的充分估计量。(五)稳健性在样本数据的采集和整理过程中,难免会发生一些差错,造成样本数据的污染。显然,用来估计总体指标的样本指标抗污染能力的强弱,也是衡量该估计量优劣的一个标准。如果用来估计总体指标的样本估计量对样本数据的污染不敏感,也就是说,估计量的数值不受被污染数据的干扰或受其干扰不大,那么该估计量就是总体指标的一个稳健统计量。样本均值的抗污染能力很差,也就是说它不是一个稳健估计量。样本中位数是总体均值的一个稳健估计量。一般来说,考虑到稳健性,往往会损失一定的有效性,因此,估计量的选择需要根据样本数据的特点在有效性和稳健性二者之间进行折中。例如,在估计总体均值时,考虑到样本均值有效性很高,但稳健性却较低,而样本中位数稳健性很高,但有效性却较低。所以,可以将样本均值和中位数的计算方法综合折中构造一种兼具二者特点的新估计量,这类估计量主要有切尾均值等。所谓切尾均值就是将样本数据按大小顺序排列以后,切掉序列两端的部分数据,只用序列中间的部分数据计算出的均值。实践中常用的一种切尾均值是中均值,即将样本数据排序序列两端各25%的数据切掉,只用中间一半数据计算的均值。现实中,在人们的主观判断起主要作用的场合,切尾均值的使用十分普遍,如在歌手的唱歌比赛中,对歌手的评分就常采用评委打分的切尾均值。上述各个标准均是优良的估计量所应该具备的性质。但是,正如我们已经看到的,一个估计量往往很难同时具备所有这些优良性质,这就需要我们根据研究的目的和样本数据的特点性质进行权衡选择或者进行折中选择。【多选题】下列关于稳健性的说法正确的有()。A.由矩法估计所构造出来的估计量都是所要估计的总体指标的一致估计量B.样本均值是总体均值的一个稳健估计量C.常用的总体指标的估计量均是充分的D.两个无偏估计量比较,方差较大者较为有效E.对于小样本来说,估计总体方差时应采用无偏样本方差作为其估计量正确答案ACE答案解析选项B,样本中位数是总体均值的一个稳健估计量,样本均值不是总体均值的一个稳健估计量。选项D,两个无偏估计量比较,方差较小者较为有效。四、估计量的标准误样本估计值与总体指标真值之间总是存在着或大或小的抽样估计误差。估计误差愈大,抽样估计的精确程度就愈低。因此,有必要对抽样估计误差及其影响因素加以研究,以便把它控制到一个较小的范围之内,确保抽样估计的精度,减少决策的失误。(一)标准误的概念(识记)衡量抽样估计误差不能用抽样误差的直接平均,而应该采用将其平方后再平均的方法,即用样本估计量的方差或标准差。实践中一般均采用样本估计量的标准差作为衡量抽样估计误差的指标。样本估计量的标准差通常称为该估计量的标准误差,简称标准误。设所要估计的总体指标为,其估计量为,则此估计量的标准误就定义为:【例54】在【例52】由6、7、8组成的总体中,总体均值为7,总体方差22/3。抽取容量为2的简单随机样本,全部9个可能样本的均值已在表52的第2列中列出,由此可计算出样本均值无的方差和标准误分别为:2D()EE()2E()2(67)21/9(6.57)2(77)23/9(7.57)22/9(87)21/91/3意义(领会):标准误是衡量一个估计量抽样估计误差大小的尺度。在抽样估计中,由于待估计的总体指标是未知的,所以,抽样估计误差的具体数值是不可知的,而标准误则给出了抽样估计误差的一般数值,可用于估计实际抽样估计误差的大小。(二)标准误的计算(领会)根据定义公式直接计算样本指标的标准误是不可能的。因此,标准误只能通过它与其他指标的关系用间接的方式求出。1.样本均值的标准误样本均值是总体均值的无偏估计量,所以其标准误可由其方差导出。不过,在不同的抽样方式之下,样本均值的方差是不相同的,因而其标准误也就不相同。(1)若所得样本是采用有放回简单随机抽样方式抽取有放回简单随机抽样所得的样本就是由若干个相互独立且与总体被观测变量分布完全相同的随机变量x1,x2,xn所组成的一个集合。样本均值的标准误公式为:例如,在例54中的6、7、8所组成的总体中,已知22/3,故对于容量为2的有放回简单随机样本,其样本均值的标准误为:(2/3/2)3/3可见,用该公式计算的结果与用样本均值标准误定义公式计算结果相同。(2)若所得样本是采用不放回简单随机抽样方式抽取则样本的各次抽取不独立,从而使样本观测变量x1,x2,xn相互也不独立,前面的观测结果对后面的观测结果有影响,所以,样本均值的方差不能像有放回抽样方式下样本均值的方差那样很容易地导出。不放回抽样下样本均值的方差为:例如,在上述6、7、8所组成的总体中,有N3,22/3,若采用不放回简单随机抽样方式,则对于容量为n2的样本来说,其样本均值的标准误为:2/3/2(32)/(31)6/6实践中,总体容量N一般都很大,为了计算简单,常将不放回抽样下样本均值标准误的计算公式近似地写为:其中,n/N称为抽样比,表示总体中抽出的个体数占全部个体数的比重。有放回抽样和不放回抽样各自样本均值的方差的比较:(1)不放回抽样下样本均值的方差公式中比有放回抽样下样本均值的方差公式中多了一个因子(Nn)/(N1),由于该因子小于1,即(Nn)/(N1)1,所以,不放回抽样下样本均值的标准误比放回抽样下样本均值的标准误小。因此,实践中一般只采用不放回抽样的方式抽取样本,而很少采用有放回的抽样方式。(2)当总体为无限总体时,不放回抽样下样本均值的标准误公式就简化为与有放回抽样下样本均值的标准误公式相同,故因子(Nn)/(N1)通常称为有限总体校正因子。不过当总体容量N较大而抽样比n/N很小时,有限总体校正因子(Nn)/(Nl)或(1n/N)通常可忽略不计。因此,实践中一般只使用有放回抽样的公式来计算其标准误。由样本均值的标准误公式可以看出:要计算出样本均值标准误的数值,必须已知总体方差2的数值,但实践中,总体方差2一般都是未知,需用其样本方差s2来代替计算,故可得有放回抽样和不放回抽样下样本均值标准误的估计量公式分别为:有放回抽样: 不有放回抽样: 【例55】某工厂收到供货方发来的一批电子元件共1000件,随机抽取了10件进行检验,测得各电子元件的使用寿命分别为1256、1307、1180、1450、1225、1198、1365、1420、1295、1304小时,试估计该批电子元件的平均使用寿命及其标准误。解:由样本观测数据可计算出样本均值和样本方差分别为:(125613071304)/1013000/101300(小时)所以该批电子元件平均使用寿命的估计值为:1300(小时)而样本均值的标准误,若按放回抽样计算,则其估计值为:若按不放回抽样计算,则其估计值为:可见,按放回抽样公式计算的标准误与按不放回抽样公式计算的标准误二者相比,数值相差很小,故为了计算简便可只使用有放回抽样的公式。2.样本比例的标准误总体比例P,即总体中具有某种特征的个体数与全部个体数的比例,是一个常用的总体指标。由于总体P是两点分布总体的均值,其估计量是样本比例p,所以,估计量样本比例p的标准误公式可仿照上述总体均值估计量即样本均值的标准误公式给出。在两点分布总体中,所考察随机变量的均值为总体比例P,方差则为2P(1P)。将此方差的表达式代入上述样本均值的标准误公式,即可得到作为总体比例估计量的样本比例P的标准误公式:有放回抽样: 不放回抽样: 样本比例的标准误的估计公式: 有放回抽样: 不放回抽样: 【例56】某城市居民家庭大约有20万户,为了解居民家庭生活状况,随机抽取了300户进行调查,其中有75户和上年相比由于物价上涨过快而使生活的绝对水平下降了。试估计该市全部居民家庭中,由于物价上涨而导致生活绝对水平下降的家庭所占的比重及其标准误。解:由样本资料可计算出样本中生活绝对水平下降的家庭所占比例,即总体比例的估计值为:n1/n75/30025%有放回抽样:不放回抽样:二者计算结果相同,在总体容量较大且抽样比较小的情形下,完全可用有放回抽样的标准误公式代替不放回抽样的标准误公式进行计算。(三)影响标准误的因素(领会)估计量的标准误是样本指标用于估计总体指标所产生的抽样估计误差,影响估计量标准误的因素也就是影响抽样估计误差的因素。显然,分析影响估计量标准误的因素,对于改进抽样方法和估计方法,以便控制抽样估计误差,具有十分重要的意义。影响估计量的标准误数值大小的因素主要有以下三个方面:(1)总体中各个体之间的差异程度。对于所考察的变量来说,总体中各个体在该变量的取值之间的差异程度越大,即2越大,总体指标估计量的标准误的数值也就越大,抽样估计误差也就越大。反之,若2较小,则估计量的标准误差也就越小。(2)样本容量的大小。样本容量越大,总体指标估计量的标准误就越小,抽样估计误差也就越小;反之,样本容量越小,抽样估计误差及其标准误也就越大。(3)抽样的方式与方法。比较不同的抽样方式下各总体指标估计量的标准误的计算公式可以看出:抽取样本的方式与方法也是影响估计量的标准误的重要因素。抽样方式方法不同,总体指标估计量的标准误就会不同,抽样估计误差的大小也就不同。由总体指标估计量的标准误的意义及上述因素分析可知:要提高抽样估计的精确程度,就必须设法降低抽样误差及其标准误,而要降低抽样误差和标准误,就必须根据其影响因素采取相应的措施。如事先将总体分类以减少总体内部的差异程度,或者采用更好的抽样方式以及增加样本容量等。第四节区间估计一、区间估计的概念(识记)为了给出样本估计值精度的估计(点估计做不到),就需要对未知总体指标进行区间估计。定义(识记):所谓区间估计,就是在事先给定的概率保证程度下,根据样本估计量的概率分布,确定出可能包含未知总体参数的某个区间,作为对未知总体参数的估计。记待估计的未知总体指标为,样本估计量为,事先给定的概率为1,若根据样本估计量的概率分布可计算出一个区间,使得该区间包含未知总体参数的概率等于事先给定的概率1,即有等式: 成立,则该区间就称为未知总体参数的置信区间,其中分别称为置信下限和置信上限;而概率1就称为置信概率或置信度,它表明了使用此区间估计的可靠程度或把握程度,其中称为该区间估计的风险。在实践中,常取0.05或0.01。对于置信区间的含义,可以从两方面来理解。一方面,对于反复多次的抽样来说,每次抽样都可得到一个样本,都可计算出未知总体参数的一个置信区间,在这许多置信区间中,有些包含未知的总体参数,而有些则不包含未知总体参数,其中包含未知总体参数的区间所占比例为1,而不包含未知总体参数的区间所占比例为。另一方面,对某一次抽样来说,只有一个样本,只能计算出未知总体参数的一个置信区间,该区间或者包含未知总体参数,或者不包含未知总体参数。其中该区间包含的可能性也称把握程度或称可靠程度为1,而该区间不包含的可能性则为。区间估计既给出了抽样估计的可靠程度,又给出其精度。其中置信概率是可靠程度的度量,而置信区间的长度则表达了估计的精确程度。置信概率越大,估计的可靠程度越高;置信区间的长度越短,估计的精度则越高。很显然,区间估计的可靠程度和精确程度是相互矛盾的,要提高可靠程度就要增大置信概率,从而就要增加置信区间的长度使估计的精度降低;反之要提高估计的精度就要缩短置信区间的长度,从而就要减小置信概率使估计的可靠程度降低。因此,在实践中,应根据所研究总体的特点在二者之间进行权衡,适当地确定置信概率,即使估计的可靠程度符合要求,又不至于使估计的精度太低。下面学习常用的总体指标置信区间的计算方法。二、总体均值的区间估计(领会)(一)大样本情形下总体均值的区间估计大样本情形下,样本均值的概率分布可看作是正态分布。概率保证为1。总体均值的置信区间为:用样本均值估计总值均值所产生的抽样估计误差,记为:称为抽样估计的极限误差或误差限。【例57】某市为了了解在该市打工的民工生活状况,从中随机抽取了100个民工进行调查,得到样本民工月平均工资为630元,标准差为80元,试在95%的概率保证下,对该市民工的月平均工资进行区间估计。解:由于n100,630元,s80元,故用样本均值作为总体均值的估计量,其标准误的估计值为:由于该样本是大样本,样本均值的概率分布可看作正态分布,在置信概率195%的条件下,查标准正态分布概率表得上侧分位数z/2z0.0251.96。由此得估计的误差限为:故可得出该市农民工月平均工资的置信区间为:(63015.68)元(63015.68)元即有:614.32元645.68元这表明在95%的概率保证下,可以认为该市农民工的月平均工资在614.32元至645.68元之间。(二)小样本情形下,正态总体均值的区间估计只讨论正态总体小样本均值的区间估计。对于来自正态总体的一个小样本,在给定的置信概率1之下,总体均值的置信区间为:用样本均值估计总值均值所产生的抽样估计误差,记为:【例58】在【例55】所述某工厂收到供货方发来的一批电子元件的例子中,样本容量n10,电子元件使用寿命的样本均值1300小时,样本标准差s90.42小时,电子元件使用寿命的概率分布可看作正态分布,试在95%的置信概率下,对该批电子元件的平均使用寿命进行区间估计。解:由于该样本是小样本,故需要使用t分布进行区间估计。在给定置信概率10.95的条件下,查t分布表得自由度为n1的t分布上侧分位数t/2t0.0252.26,于是用样本均值估计总体均值的估计误差的误差限为:该批电子元件平均使用寿命的置信区间为:(130064.62)小时(130064.62)小时即有:1235.38小时1364.62小时计算结果表明:在95%的可靠程度下,可以认为该批电子元件的平均使用寿命在1235.38小时到1364.62小时之间。三、总体比例的区间估计(领会)总体比例P的置信区间为:用样本比例p估计总体比例P的抽样估计误差限可写为:【例59】在【例56】某城市居民家庭生活状况抽样调查中,共随机抽取300户,其中有75户和去年相比由于物价上涨过快而使生活水平下降了,试在95%的概率下对该市居民家庭中由于物价上涨过快而使生活水平下降的家庭所占比例进行区间估计。解:在该例中,n300,p75/3000.2525%,在95%的置信概率下,查标准正态分布概率表得z/21.96。若采用类似于均值置信区间的计算方法,可先计算出用样本比例p估计总比例P的抽样估计误差的误差限为:由此得该市由于物价上涨而使生活水平下降的居民家庭所占比例P的置信区间为:25%4.9%P25%4.9%,即:20.1%P29.9%四、总体方差的区间估计总体方差2的置信区间为:【例510】在【例55】某工厂收到供货方发来的一批电子元件的例子中,共抽取了10件电子元件进行检验,使用样本的方差为S28175.56(小时),试在95%的置信概率下区间估计。对该批电子元件使用寿命的方差和标准差进行解:电子元件的使用寿命可看作服从正态分布,则(n1)S2/2服从自由度为(n1)9的x2分布。在95%的置信概率下,查x2分布表,得(1/2)和/2的分位数分别为和,将S28175.56和这两个分位数值代入上述正态总体方差置信区间的公式,可得该批电子元件使用寿命的方差的置信区间为:即有:3868.56(小时)2227251.87(小时)2两边开平方,就可得出该批电子元件使用寿命的标准差的置信区间为:62.20小时165.08小时五、单侧置信区间(识记)识记:以上所给出的总体指标的置信区间都是既有置信下限又有置信上限,通常称为双侧置信区间。所谓单侧置信区间,是指根据问题的性质将待估总体指标的上置信限或下置信限指定在其上界或下界值上,并根据给定的置信概率求出另一置信限而得到的置信区间。对于给定的置信率1,若有:或有:则称区间为总体指标的单侧置信区间,其中估计值称为单侧置信下限,而估计值称为单侧置信上限。【例511】在【例56】某城市居民家庭生活状况抽样调查的例子中,共抽取了300户,其中由于物价上涨过快使生活水平下降的家庭所占比重为25%,试在95%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论