版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节抽样分布第二节点估计与估计量的评价标准第三节区间估计主要内容第六章参数估计第一节抽样分布总体与个体:试验全部可能的观测值叫总体;试验的每一个观测值叫个体。样本容量与样本个数:样本中包含的单位数叫样本容量;从一个总体中可能抽取多少个样本叫样本个数。总体容量:总体中所包含的个体数。有限总体和无限总体:总体容量可数的称有限总体,不可数的称无限总体。回置抽样(重复抽样)和无回置抽样(不重复抽样)一、抽样的基本概念对一个总体而言,个体的取值是按一定规律分布的。一个总体就是一个具有确定概率分布的随机变量X。一般来说,总体的分布是未知的,或分布形式中含有未知参数。在统计学中,人们总是通过从总体中抽取一部分个体,根据获得的样本数据对总体分布进行推断,而被抽出的部分个体叫做总体的一个样本。从总体中抽取有限个个体对总体进行观察的过程叫做抽样。第一节抽样分布二、随机样本在相同的条件下我们对总体进行次重复的、独立的观察,将n次观察结果按试验的次序记为,由于是对随机变量观察的结果,且每次观察是在相同的条件下独立进行的,故可以认为它们相互独立,且都是与总体具有相同分布的随机变量。这样得到的随机变量称为来自总体的一个简单随机样本,称为这个样本的容量。当n次观察结束后,我们就得到一组实数,它们依此是随机变量的观察值,称为样本值。
对于有限总体采用回置抽样可得到简单随机样本,无限总体无回置抽样得到的也是简单随机样本。第一节抽样分布第一节
抽样分布
三、统计量
设是来自总体X的一个样本,
不含有任何未知参数的样本的函数,称为统计量。显然,统计量为随机变量。
设总体X~N(μ,ο2),其中,μ未知,ο2已知,设,X1,
X2,…,
Xn为来自X的一个样本,则:以下那个是统计量?(1)X1-X2第一节
抽样分布
几个常用统计量:样本矩(样本均值;样本方差;原点矩,中心矩等)第一节
抽样分布
最常用的统计量是所谓的样本矩。设nXXX,,,21L是来自总体X的一个样本,nxxx,,,21L是这一样本的观测值,称统计量
å==niiXnX11
为样本均值;称统计量
å=--=niiXXnS122)(11
为样本方差,称统计量å=--==niiXXnSS122)(11为样本标准差;统计量
称为样本的k阶原点矩;统计量称为样本k的阶中心矩。
这些统计量的观测值分别为å==niixnx11,å=--=niixxns122)(11,å=--=niixxns12)(11,
å==nikikxna11(L,2,1=k),å=-=nikikxxnb1)(1(L,3,2=k)。第一节
抽样分布
四、几个常用的抽样分布
抽样分布的定义:统计量的分布称为抽样分布。
来自正态总体的几个常用统计量的分布,已有一些重要的结果(人们已经获得这些统计量的具体的分布密度函数)。下面介绍来自正态总体的几个常用统计量的分布。
第一节
抽样分布
(一)分布
设是来自总体的样本,则称统计量
为服从自由度为的分布,记为
第一节
抽样分布
第一节
抽样分布
第一节
抽样分布
例:查表找当n充分大时(n>30),近似有:第一节
抽样分布
23.209,3.94,10.645,4.865(二)t分布
设,,且设与独立,则称统计量
为服从自由度为的分布,记为。
可以证明,当充分大时,分布趋向于标准正态分布。t(n)分布的概率密度函数为第一节
抽样分布
t(x;n)n=4n=10n=1t(n)分布的密度函数曲线第一节
抽样分布
t分布的性质:1、t—分布的与标准正态分布相似,是以t=0对称的钟形分布。t—分布的方差大于1,比标准正态分布的方差大,所以从分布曲线看,t—分布的曲线较标准正态分布平缓。
t1-α(n)=-tα(n)2、n→时,t—分布成为正态分布。3、对于给定的任意正数α,且0<α<1,称满足条件:
P{t>tα(n)}=
的数tα(n)为t(n)分布的上α分为点。例:查表求:t0.05(8),t0.95(8),第一节
抽样分布
(三)F分布
设,且设独立,则称随机变量
为服从自由度为的分布,记。由F
分布的定义及推论有第一节
抽样分布
F(n1,n2)分布的概率密度函数为分布图为:第二节
抽样分布
由F
分布的定义有对于给定的数α,且0<α<1,称满足等式:
P{F>tα(n1,n2)}=例:F0.05(5,10)=F0.95(5,10)=第一节
抽样分布
(四)基于正态总体样本的均值与方差的分布
1、一个正态总体样本均值与方差的分布设来自正态总体的样本,分别为样本的均值和方差。则注意:第一节
抽样分布
2、两个正态总体样本均值差与方差比的分布注意:如两样本来自于同一总体,有:均值差的分布第一节
抽样分布
方差比的分布:第一节
抽样分布
3、样本比例的抽样分布
基本概念:
总体比例:也叫总体成数,是总体中具有某种特征的单位在总体中所占的比例,记作P。
由0-1分布可知,总体比例服从(0-1)分布,故:
E(X)=P,D(X)=P(1-P)
样本比例:也叫样本成数,是样本中具有某种特征的单位在样本中所占的比例,记作p。
当样本容量足够大(np≥5,n(1-p)≥5),样本的比例近似服从正态分布。第一节
抽样分布
可以证明,重复抽样情况下,样本比例分布的数学期望和方差为:1、重置复抽样下样本比例的抽样分布第二节
抽样分布
2、无重置抽样下样本比例的抽样分布
可以证明,不重复抽样情况下,样本比例分布的数学期望和方差为:第一节
抽样分布
在许多实际问题中遇到的随机变量(总体)往往是分布类型大体知道,但确切的形式并不知道。即总体分布已知,其中含有一个或多个未知参数。若能确定这些参数值,则总体分布完全确定。我们根据样本来估计这些参数,也就是从总体中取出一个样本,构造适当的样本函数,即统计量,对未知函数作出估计和检验。统计推断问题分为两类:一是估计问题:包括参数估计和非参数估计;二是假设检验问题:包括参数检验和非参数检验。只研究参数估计和检验问题。第二节点估计与估计量的评价标准
用估计量的值作为参数的估计值,这种做法称为点估计。有时要求估计参数在一个多大的范围内,并指出该参数以多大的概率(信度)被置于此范围内,这是参数的区间估计问题。
对于一个被估参数,可以构造不同的统计量作为它的估计量。这些估计量哪个好,哪个差,这是估计量的评选问题。第二节点估计与估计量的评价标准
设总体X的分布函数为,其中为总体的待估参数,是从总体X中随机抽取的一个样本,若由样本构造统计量作为参数的估计,则称为的点估计量,简称点估计。设是样本的一个观察值,代入统计量中,得到一个确定的值称为参数点估计值。第二节点估计与估计量的评价标准一、点估计
两种常用的点估计方法:矩估计法和极大似然估计法。假若总体的未知参数有r个,即这时需要构造r个不同的统计量,分别作为的点估计量,即第二节点估计与估计量的评价标准
用样本矩作为相应总体矩的估计量。用样本矩作为总体矩的估计,有的函数,记为:假设总体X的r阶原点矩存在,记:是则总体的k阶原点矩第二节点估计与估计量的评价标准(一)矩估计法总体X的分布函数为它确定了含有r个未知数的r个方程(*)由方程(*)解得其中第二节点估计与估计量的评价标准分别称为的矩估计量。例1:为总体的一个样本,总体均值方差未知,求其矩估计量。解:假设总体矩存在,分别是一阶矩二阶矩第二节点估计与估计量的评价标准由上两式得:不论总体X服从什么分布,其数学期望和方差的矩估计量分别为样本均值和二阶样本矩即:第二节点估计与估计量的评价标准例2:设总体X在上服从均匀分布,其密度函数为其中,求及的矩估计量。由均匀分布的性质知:由矩估计法得方程组解第二节点估计与估计量的评价标准解方程组得:
注意:通过矩估计量的求解过程直接得到的是参数的矩估计量而非参数矩估计值,要求参数的矩估计量中的样本用其观测值代替即可。第二节点估计与估计量的评价标准第二节点估计与估计量的评价标准使用什么样的统计量去估计?可以用样本均值;也可以用样本中位数;还可以用别的统计量。问题:第二节点估计与估计量的评价标准我们知道,服从正态分布由大数定律,
自然想到把样本的平均值作为总体平均的一个估计.类似地,用样本的方差.用样本的均值第二节点估计与估计量的评价标准样本均值是否是的一个好的估计量?(2)怎样决定一个估计量是否比另一个估计量“好”?样本方差是否是的一个好的估计量?这就需要讨论以下几个问题:(1)我们希望一个“好的”估计量具有什么特性?(3)如何求得合理的估计量?那么要问:二、估计量的评选标准(一)无偏性定义:是的一个估计量,如果成立,则称是的一个无偏估计量。的估计量是样本的函数,对于不同的观察值,求得的值不同,因此,的取值不一定等于所要估计的参数但从平均意义上讲,应该等于所估计的参数未知参数第二节点估计与估计量的评价标准例1:设是来自总体X的样本,总体的数学期望未知,试问样本均值是否为
的无偏估计量。因为所以,是总体数学期望的无偏估计量。解:第二节点估计与估计量的评价标准设总体的数学期望为,则例2:设是来自总体X的样本,总体的方差未知,用样本的二阶作为总体方差的估计,中心矩是否为无偏估计。解:第二节点估计与估计量的评价标准所以,样本的二阶中心矩不是总体方差的无偏估计。第二节点估计与估计量的评价标准例总体数学期望的无偏估计中,哪一个估计量最有效?解
定义:设都是未知参数的无偏估计若,则称估计量较有效。(二)有效性第二节点估计与估计量的评价标准比较上述估计量的方差,可见最小,所以最有效。第二节点估计与估计量的评价标准(三)一致性定义设为未知参数的估计量,若对任意的正数例:证明样本均值是总体均值的一致估计证明设由大数定理可知:第二节点估计与估计量的评价标准
总结:从统计方法要求来看,我们自然要求一个估计量具有一致性,然而,用一致性来评价估计量好坏时,要求样本容量充分地大,但这一点在实际中往往办不到。无偏性直观、简便,但它不能体现与真值的偏离程度。有效性无论在直观上或理论上都比较合理。所以在使用上,这是用得比较多的一个评价标准。所以,样本均值是总体均值的一致估计。第二节点估计与估计量的评价标准第三节区间估计则称随机区间是θ的置信度为的置信区间,分别称为置信度为的双侧置信区间的置信下限和置信上限。称为置信水平或置信度或置信概率。
定义:设总体X的分布函数F(x,θ)含有一个未知参数θ,对于给定值若有来自X的样本所确定的两个统计量和对于任意第三节区间估计第三节区间估计第三节区间估计确定未知参数θ置信区间的一般步骤(1)构造一个样本(X1,X2,…,Xn)的函数W=W(X1,X2,…,Xn
;θ)它包含待估未知参数θ
,而不含其它未知参数,并且W的分布已知且不依赖于任何未知参数;(2)对于给定的置信度,定出两个常数a,b,使得
(3)若能从得到等价的不等式,其中都是统计量,那么就是θ的一个置信度为的置信区间。
第三节区间估计
1.单个正态总体的情况
(1)均值的置信区间①已知时,则μ的置信度为的置信区间为:
设(X1,X2,…,Xn)为总体的一个样本,分别是样本均值和方差,设给定的置信度为。总结:(1)置信度越大,置信区间越宽,降低了精度。应适当选取。(2)当X非正态总体时,在大样本下仍然可用上述区间作为的置信区间。第三节区间估计
例:某厂生产滚珠,从某天生产的产品中随机抽取6个,测得直径为(单位:mm):
14.6,15.1,14.9,14.8,15.2,15.1并知道滚珠的直径,求平均直径的置信区间。由正态分布表查得使得
解:这是一个正态总体,已知方差,由前面结论即可求出置信区间由样本观察值得置信下限:置信上限:因此,的置信度为0.95的置信区间是
(14.75,15.15)。第三节区间估计其中t分布是对称的,对给定的分布查表得自由度为n-1的t分布的分位数使得由抽样分布可知:②方差未知,均值的区间估计第三节区间估计从而故得参数的置信水平为的置信区间为
例假设初生婴儿的体重服从正态分布,随机抽取12名初生男婴,测得其体重为(单位:g):第三节区间估计25203000300030003160356033202880260034002540试以95%的置信度求初生男婴的平均体重的区间估计。由样本观察值得
解:这是一个正态总体,方差未知,求总体均值的区间估计问题,由上面结论可求出查分布表得因为第三节区间估计因而得到初生男婴平均体重的95%置信区间为(2820,3300)第三节区间估计
前面讨论的总体均值的置信区间,其置信限都是双侧的,在有些实际问题中,例如某元件的使用寿命,平均寿命长没有问题,太短就不行在这种情况下,可将置信上限取为,而只考虑置信下限。在相反的情况下,只考虑置信上限这两种估计方法称为单侧置信限的估计法。注意:第三节区间估计例:对某型号飞机的最大飞行速度进行了15次试验,测得样本的平均最大飞行速度样本方差根据长期经验可以认为最大飞行速度服从正态分布,试求在95%的把握下,飞机的平均最大飞行速度不低于多少?解:依题意有:即:在95%的把握下,飞机的最大平均飞行速度不低于421.1米/秒。
设正态总体是总体X的一个样本,未知时,求的置信区间。的无偏估计,由分布表查得又此分布完全确定,与未知参数无关,对给定的,使得和(2)方差的置信区间即故得的置信区间为:第三节区间估计从而,的置信区间为
例:为确定某种溶液中甲醛浓度,取样得4个独立测定值的平均值,样本标准差,并设被测总体近似服从正态分布,求总体方差的95%置信区间,及总体标准差的置信区间。第三节区间估计因为由分布表查得所以从而得的95%置信区间为(0.00029,0.0125)的置信区间为解:又已知第三节区间估计
和分别为两个样本的均值和方差,下面求的置信区间。(1)方差已知时,求的区间估计因为2、两个正态总体均值差的估计和设有两个正态总体X和Y,且及是分别从总体X和总体Y中抽取的两个独立样本两个样本相互独立,故有从而 对于给定的,由正态分布表查得使得第三节区间估计即从而得到的置信区间第三节区间估计(2)若未知时,求的区间估计设由抽样分布知:第三节区间估计对于给定的,由t分布表查得,使得于是可得:把T统计量代入,并解不等式第三节区间估计从而得的置信区间为第三节区间估计例:为提高某一化学生产过程的得率,拟采用一种新的催化剂。为此,先进行试验。设采用原来的催化剂进行了n1=8次试验,得到得率的平均值和方差分别;又采用新的催化剂进行了n2=8次试验,得到得率的均值和样本方差分别为。假设两总体都服从正态分布,方差相等,两样本独立。试求两总体均值差的置信度为0.95的置信区间。
第三节区间估计解:由题意,可得,则置信度为0.95的置信区间为即(-4.15,0.11)
注:由于所得置信区间包含零,在实际中可以认为采用这两种催化剂所得率的均值没有显著差别。第三节区间估计下面求正态总体的方差之比的区间估计。3、两个正态总体方差比的置信区间设两个正态总体X和Y,和是分别从总体X和总体Y中抽取的两个独立样本及分别为两个样本的均值和方差。由抽样分布知第三节区间估计又两个样本相互独立,由F分布的定义有对于给定的,由F分布表查得使得第三节区间估计即所以的置信区间为第三节区间估计第三节区间估计例:为研究男女学生在生活费支出(单位:元)上的差异,在某大学抽取25名男学生和25名女学生,得到下面的结果:试以90%的置信水平估计男女学生生活费支出方差比的置信区间。4、总体比率的区间估计由样本比率的抽样分布可以知,当样本容量n
足够大时(一般指不小于30,且都大于5),样本比率P的抽样分布近似正态分布。设总体比率为P
,则有:对于置信度,P的置信区间为(1)一个总体比例的区间估计第三节区间估计例:设从一大批产品中抽取100个样品,得一级品60个,求这批产品一级品率P的置信度为0.95的置信区间。解:依题意:有p=60/100=0.6。因为可以认为这是一个大样本。P的置信度为0.95的置信区间即产品一级品率P的置信度为0.95的置信区间为0.504~0.696。第三节区间估计若我们关心的是一级品率的应不低于多少?则:求P的置信度为95%的置信下限即有95%的把握认为一级品率不低于51.9%。第三节区间估计(2)两个总体比例之差的区间估计两个样本比例之差的抽样分布服从正态分布,因此:P1-P2在置信度为1-α的置信区间为:第三节区间估计(1)估计总体均值时样本容量的确定(2)估计总体比率时样本容量的确定样本容量确定的原则在保证抽样推断能达到预期的可靠程度和精确程度的要求下,确定一个恰当的抽取样本单位的数目。5、样本容量的确定第三节区间估计根据此式,推导出估计总体均值时样本容量n为:样本容量n与总体方差
2、允许误差△、可靠性系数Z或t之间的关系为与总体方差成正比;与允许误差成反比与可靠性系数成正比第三节区间估计(1)估计总体均值时样本容量的确定
对于正态总体和大样本非正态总体,置信区间是:
例:拥有工商管理学士学位的大学毕业生年薪标准差为2000元,假定想要估计年薪95%的置信区间,希望估计误差为400元,应抽取多大的样本量?(α=0.05)解:已知
=2000,E=400,即应抽取97人作为样本。第三节区间估计(2)估计总体比率时样本容量的确定根据比率区间估计公式可得样本容量n为
注意:
△的取值一般小于0.1;P未知时,可取最大值0.5。其中:第三节区间估计注意:(1)当计算结果是小数时,一律向上取整;(2)同一资料确定平均数、成数样本容量时,计算结果一般不同,取样本容量大的数为最终结果。(3)如果历史资料中,方差有多个,取最大的;如成数估计中,方差未知,取0.25。补充:抽样组织方式
一、抽样框概念:又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。抽样框标准:完整而不重复。
例:常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。在没有现成的名单的情况下,可由调查人员自己编制。
注意:在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。
例:
1936年《文学文摘》的民意测量:从电话薄和车牌登记名单中选择1000万人,最后收到200万人预测出43%的罗斯福支持率(实际是61%)思考:抽样框是什么?为什么预测不准?抽样框选择的不合理—只选择了不成比例的富人样本,而排除了穷人。成功的对比:盖洛普的配额抽样补充:抽样组织方式
补充:抽样组织方式
二、抽样的程序界定总体--掌握总体的结构及各方面情况;制定抽样框--对名单进行统一编号,多阶段抽样需要分别建立不同的抽样框。决定抽样方案--抽样方法/抽样规模/主要目标量的精确程度;实际抽取样本评估样本质量--对样本的质、代表性、偏差进行初步检验和衡量。即用样本中某些重要指标与总体中的指标进行比较,结果越接近越好。补充:抽样组织方式
三、抽样组织方式
概率抽样非概率抽样简单随机抽样偶遇抽样等距抽样判断抽样分层抽样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 橡胶炼胶工诚信品质知识考核试卷含答案
- 扩印洗印设备装配调试工岗前岗位水平考核试卷含答案
- 露天采矿工岗前客户关系管理考核试卷含答案
- 塔吊司机安全生产能力模拟考核试卷含答案
- 2026年新科教版初中九年级科学下册第三单元宇宙天体知识练习卷含答案
- 稀土后处理工操作能力强化考核试卷含答案
- 2026年新科教版初中八年级历史上册第一单元两次鸦片战争影响卷含答案
- 甲醇合成操作工班组安全能力考核试卷含答案
- 康乐服务员岗前安全宣教考核试卷含答案
- 人才测评师改进水平考核试卷含答案
- 离心泵的结构和工作原理
- 2023年广州市黄埔区中医院护士招聘考试历年高频考点试题含答案解析
- 第四章基层疾病预防控制与妇幼保健职能演示文稿
- D500-D505 2016年合订本防雷与接地图集
- 高考乡土散文的阅读技巧
- 电力建设施工质量验收及评价规程强制性条文部分
- 第六章光化学制氢转换技术
- JJG 1105-2015氨气检测仪
- GB/T 4295-2019碳化钨粉
- 西部钻探套管开窗侧钻工艺技术课件
- 徐汇滨江规划和出让情况专题培训课件
评论
0/150
提交评论