




已阅读5页,还剩88页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,第一节抽样分布第二节点估计与估计量的评价标准第三节区间估计,主要内容,第六章参数估计,第一节抽样分布,总体与个体:试验全部可能的观测值叫总体;试验的每一个观测值叫个体。样本容量与样本个数:样本中包含的单位数叫样本容量;从一个总体中可能抽取多少个样本叫样本个数。总体容量:总体中所包含的个体数。有限总体和无限总体:总体容量可数的称有限总体,不可数的称无限总体。回置抽样(重复抽样)和无回置抽样(不重复抽样),一、抽样的基本概念,对一个总体而言,个体的取值是按一定规律分布的。一个总体就是一个具有确定概率分布的随机变量X。一般来说,总体的分布是未知的,或分布形式中含有未知参数。在统计学中,人们总是通过从总体中抽取一部分个体,根据获得的样本数据对总体分布进行推断,而被抽出的部分个体叫做总体的一个样本。从总体中抽取有限个个体对总体进行观察的过程叫做抽样。,第一节抽样分布,二、随机样本,在相同的条件下我们对总体进行次重复的、独立的观察,将n次观察结果按试验的次序记为,由于是对随机变量观察的结果,且每次观察是在相同的条件下独立进行的,故可以认为它们相互独立,且都是与总体具有相同分布的随机变量。这样得到的随机变量称为来自总体的一个简单随机样本,称为这个样本的容量。当n次观察结束后,我们就得到一组实数,它们依此是随机变量的观察值,称为样本值。,对于有限总体采用回置抽样可得到简单随机样本,无限总体无回置抽样得到的也是简单随机样本。,第一节抽样分布,第一节抽样分布,三、统计量设是来自总体X的一个样本,,不含有任何未知参数的样本的函数,称为统计量。显然,统计量为随机变量。,设总体XN(,2),其中,未知,2已知,设,X1,X2,Xn为来自X的一个样本,则:以下那个是统计量?(1)X1-X2,第一节抽样分布,几个常用统计量:样本矩(样本均值;样本方差;原点矩,中心矩等),第一节抽样分布,最常用的统计量是所谓的,样本矩,。设,是来自总体,X,的一,个样本,,是这一样本的观测值,称统计量,为样本均值;称统计量,称为样本的k阶原点矩;统计量,称为样本k的阶中心矩。,这些统计量的观测值分别为,,,,,,,(,),,(,)。,第一节抽样分布,四、几个常用的抽样分布,抽样分布的定义:统计量的分布称为抽样分布。来自正态总体的几个常用统计量的分布,已有一些重要的结果(人们已经获得这些统计量的具体的分布密度函数)。下面介绍来自正态总体的几个常用统计量的分布。,第一节抽样分布,(一)分布,设是来自总体的样本,则称统计量为服从自由度为的分布,记为,第一节抽样分布,第一节抽样分布,第一节抽样分布,当n充分大时(n30),近似有:,第一节抽样分布,23.209,3.94,10.645,4.865,(二)t分布,设,且设与独立,则称统计量为服从自由度为的分布,记为。可以证明,当充分大时,分布趋向于标准正态分布。,t(n)分布的概率密度函数为,第一节抽样分布,第一节抽样分布,t分布的性质:1、t分布的与标准正态分布相似,是以t=0对称的钟形分布。t分布的方差大于1,比标准正态分布的方差大,所以从分布曲线看,t分布的曲线较标准正态分布平缓。t1-(n)=-t(n)2、n时,t分布成为正态分布。3、对于给定的任意正数,且0t(n)=,的数t(n)为t(n)分布的上分为点。,例:查表求:t0.05(8),t0.95(8),,第一节抽样分布,(三)F分布,设,且设独立,则称随机变量为服从自由度为的分布,记。,由F分布的定义及推论有,第一节抽样分布,第二节抽样分布,由F分布的定义有,对于给定的数,且0t(n1,n2)=,例:F0.05(5,10)=F0.95(5,10)=,第一节抽样分布,(四)基于正态总体样本的均值与方差的分布1、一个正态总体样本均值与方差的分布,设来自正态总体的样本,分别为样本的均值和方差。则,注意:,第一节抽样分布,2、两个正态总体样本均值差与方差比的分布,注意:如两样本来自于同一总体,有:,均值差的分布,第一节抽样分布,方差比的分布:,第一节抽样分布,3、样本比例的抽样分布基本概念:总体比例:也叫总体成数,是总体中具有某种特征的单位在总体中所占的比例,记作P。由0-1分布可知,总体比例服从(0-1)分布,故:E(X)=P,D(X)=P(1-P)样本比例:也叫样本成数,是样本中具有某种特征的单位在样本中所占的比例,记作p。当样本容量足够大(np5,n(1-p)5),样本的比例近似服从正态分布。,第一节抽样分布,可以证明,重复抽样情况下,样本比例分布的数学期望和方差为:,1、重置复抽样下样本比例的抽样分布,第二节抽样分布,2、无重置抽样下样本比例的抽样分布,可以证明,不重复抽样情况下,样本比例分布的数学期望和方差为:,第一节抽样分布,在许多实际问题中遇到的随机变量(总体)往往是分布类型大体知道,但确切的形式并不知道。即总体分布已知,其中含有一个或多个未知参数。若能确定这些参数值,则总体分布完全确定。我们根据样本来估计这些参数,也就是从总体中取出一个样本,构造适当的样本函数,即统计量,对未知函数作出估计和检验。统计推断问题分为两类:一是估计问题:包括参数估计和非参数估计;二是假设检验问题:包括参数检验和非参数检验。只研究参数估计和检验问题。,第二节点估计与估计量的评价标准,用估计量的值作为参数的估计值,这种做法称为点估计。有时要求估计参数在一个多大的范围内,并指出该参数以多大的概率(信度)被置于此范围内,这是参数的区间估计问题。,对于一个被估参数,可以构造不同的统计量作为它的估计量。这些估计量哪个好,哪个差,这是估计量的评选问题。,第二节点估计与估计量的评价标准,第二节点估计与估计量的评价标准,一、点估计,两种常用的点估计方法:矩估计法和极大似然估计法。,第二节点估计与估计量的评价标准,用样本矩作为相应总体矩的估计量。,用样本矩作为总体矩的估计,有,第二节点估计与估计量的评价标准,(一)矩估计法,总体X的分布函数为,(*),第二节点估计与估计量的评价标准,解:假设总体矩存在,分别是,一阶矩,二阶矩,第二节点估计与估计量的评价标准,由上两式得:,不论总体X服从什么分布,其数学期望和方差的矩估计量分别为样本均值和二阶样本矩,即:,第二节点估计与估计量的评价标准,其密度函数为,由均匀分布的性质知:,由矩估计法得方程组,解,第二节点估计与估计量的评价标准,解方程组得:,注意:通过矩估计量的求解过程直接得到的是参数的矩估计量而非参数矩估计值,要求参数的矩估计量中的样本用其观测值代替即可。,第二节点估计与估计量的评价标准,第二节点估计与估计量的评价标准,使用什么样的统计量去估计?,可以用样本均值;,也可以用样本中位数;,还可以用别的统计量。,问题:,第二节点估计与估计量的评价标准,我们知道,服从正态分布,由大数定律,自然想到把样本的平均值作为总体平均的一个估计.,类似地,用样本的方差.,用样本的均值,第二节点估计与估计量的评价标准,样本均值是否是的一个好的估计量?,(2)怎样决定一个估计量是否比另一个估计量“好”?,样本方差是否是的一个好的估计量?,这就需要讨论以下几个问题:,(1)我们希望一个“好的”估计量具有什么特性?,(3)如何求得合理的估计量?,那么要问:,二、估计量的评选标准,(一)无偏性,第二节点估计与估计量的评价标准,因为,所以,是总体数学期望的无偏估计量。,解:,第二节点估计与估计量的评价标准,设总体的数学期望为,则,解:,第二节点估计与估计量的评价标准,所以,样本的二阶中心矩不是总体方差的无偏估计。,第二节点估计与估计量的评价标准,中,哪一个估计量最有效?,解,(二)有效性,第二节点估计与估计量的评价标准,比较上述估计量的方差,可见,第二节点估计与估计量的评价标准,(三)一致性,的估计量,若对任意的正数,证明设,由大数定理可知:,第二节点估计与估计量的评价标准,总结:从统计方法要求来看,我们自然要求一个估计量具有一致性,然而,用一致性来评价估计量好坏时,要求样本容量充分地大,但这一点在实际中往往办不到。无偏性直观、简便,但它不能体现与真值的偏离程度。有效性无论在直观上或理论上都比较合理。所以在使用上,这是用得比较多的一个评价标准。,所以,样本均值是总体均值的一致估计。,第二节点估计与估计量的评价标准,第三节区间估计,则称随机区间是的置信度为的置信区间,分别称为置信度为的双侧置信区间的置信下限和置信上限。称为置信水平或置信度或置信概率。,第三节区间估计,第三节区间估计,第三节区间估计,确定未知参数置信区间的一般步骤,(1)构造一个样本(X1,X2,Xn)的函数=(X1,X2,Xn;)它包含待估未知参数,而不含其它未知参数,并且的分布已知且不依赖于任何未知参数;(2)对于给定的置信度,定出两个常数a,b,使得,(3)若能从得到等价的不等式,其中都是统计量,那么就是的一个置信度为的置信区间。,第三节区间估计,1.单个正态总体的情况,(1)均值的置信区间已知时,则的置信度为的置信区间为:,设(X1,X2,Xn)为总体的一个样本,分别是样本均值和方差,设给定的置信度为。,总结:(1)置信度越大,置信区间越宽,降低了精度。应适当选取。(2)当X非正态总体时,在大样本下仍然可用上述区间作为的置信区间。,第三节区间估计,例:某厂生产滚珠,从某天生产的产品中随机抽取6个,测得直径为(单位:mm):14.6,15.1,14.9,14.8,15.2,15.1并知道滚珠的直径,求平均直径的置信区间。,由正态分布表查得,使得,解:这是一个正态总体,已知方差,由前面结论即可求出置信区间,由样本观察值得,置信下限:,置信上限:,因此,的置信度为0.95的置信区间是(14.75,15.15)。,第三节区间估计,其中,t分布是对称的,对给定的分布查表得自由度为n-1的t分布的分位数,使得,由抽样分布可知:,方差未知,均值的区间估计,第三节区间估计,从而,故得参数的置信水平为的置信区间为,例假设初生婴儿的体重服从正态分布,随机抽取12名初生男婴,测得其体重为(单位:g):,第三节区间估计,25203000300030003160356033202880260034002540,试以95%的置信度求初生男婴的平均体重的区间估计。,由样本观察值得,解:这是一个正态总体,方差未知,求总体均值的区间估计问题,由上面结论可求出,查分布表得,因为,第三节区间估计,因而得到初生男婴平均体重的95%置信区间为(2820,3300),第三节区间估计,前面讨论的总体均值的置信区间,其置信限都是双侧的,在有些实际问题中,例如某元件的使用寿命,平均寿命长没有问题,太短就不行在这种情况下,可将置信上限取为,而只考虑置信下限。在相反的情况下,只考虑置信上限这两种估计方法称为单侧置信限的估计法。,注意:,第三节区间估计,例:对某型号飞机的最大飞行速度进行了15次试验,测得样本的平均最大飞行速度样本方差根据长期经验可以认为最大飞行速度服从正态分布,试求在95%的把握下,飞机的平均最大飞行速度不低于多少?,解:依题意,有:,即:在95%的把握下,飞机的最大平均飞行速度不低于421.1米/秒。,,由分布表查得,又,此分布完全确定,与未知参数无关,对给定的,(2)方差的置信区间,即,故得的置信区间为:,第三节区间估计,从而,的置信区间为,例:为确定某种溶液中甲醛浓度,取样得4个独立测定值的平均值,样本标准差,并设被测总体近似服从正态分布,求总体方差的95%置信区间,及总体标准差的置信区间。,第三节区间估计,因为,由分布表查得,所以,解:,又已知,第三节区间估计,和分别为两个样本的均值和方差,下面求的置信区间。,(1)方差已知时,求的区间估计,因为,2、两个正态总体均值差的估计,和,设有两个正态总体X和Y,且及,是分别从总体X和总体Y中抽取的两个独立样本,两个样本相互独立,故有,从而,第三节区间估计,即,从而得到的置信区间,第三节区间估计,(2)若未知时,求的区间估计,设,由抽样分布知:,第三节区间估计,对于给定的,由t分布表查得,,使得,第三节区间估计,从而得的置信区间为,第三节区间估计,例:为提高某一化学生产过程的得率,拟采用一种新的催化剂。为此,先进行试验。设采用原来的催化剂进行了n1=8次试验,得到得率的平均值和方差分别;又采用新的催化剂进行了n2=8次试验,得到得率的均值和样本方差分别为。假设两总体都服从正态分布,方差相等,两样本独立。试求两总体均值差的置信度为0.95的置信区间。,第三节区间估计,解:由题意,可得,则置信度为0.95的置信区间为即(-4.15,0.11),注:由于所得置信区间包含零,在实际中可以认为采用这两种催化剂所得率的均值没有显著差别。,第三节区间估计,下面求正态总体的方差之比的区间估计。,3、两个正态总体方差比的置信区间,设两个正态总体X和Y,,和,是分别从总体X和总体Y中抽取的两个独立样本,由抽样分布知,第三节区间估计,又两个样本相互独立,由F分布的定义有,对于给定的,由F分布表查得,使得,第三节区间估计,即,所以的置信区间为,第三节区间估计,第三节区间估计,例:为研究男女学生在生活费支出(单位:元)上的差异,在某大学抽取25名男学生和25名女学生,得到下面的结果:,试以90%的置信水平估计男女学生生活费支出方差比的置信区间。,4、总体比率的区间估计,由样本比率的抽样分布可以知,当样本容量n足够大时(一般指不小于30,且都大于5),样本比率P的抽样分布近似正态分布。设总体比率为P,则有:,对于置信度,P的置信区间为,(1)一个总体比例的区间估计,第三节区间估计,例:设从一大批产品中抽取100个样品,得一级品60个,求这批产品一级品率P的置信度为0.95的置信区间。解:依题意:有p=60/100=0.6。因为,可以认为这是一个大样本。,P的置信度为0.95的置信区间,即产品一级品率P的置信度为0.95的置信区间为0.5040.696。,第三节区间估计,若我们关心的是一级品率的应不低于多少?则:求P的置信度为95%的置信下限,即有95%的把握认为一级品率不低于51.9%。,第三节区间估计,(2)两个总体比例之差的区间估计两个样本比例之差的抽样分布服从正态分布,因此:,P1-P2在置信度为1-的置信区间为:,第三节区间估计,(1)估计总体均值时样本容量的确定(2)估计总体比率时样本容量的确定样本容量确定的原则在保证抽样推断能达到预期的可靠程度和精确程度的要求下,确定一个恰当的抽取样本单位的数目。,5、样本容量的确定,第三节区间估计,根据此式,推导出估计总体均值时样本容量n为:样本容量n与总体方差2、允许误差、可靠性系数Z或t之间的关系为与总体方差成正比;与允许误差成反比与可靠性系数成正比,第三节区间估计,(1)估计总体均值时样本容量的确定对于正态总体和大样本非正态总体,置信区间是:,例:拥有工商管理学士学位的大学毕业生年薪标准差为2000元,假定想要估计年薪95%的置信区间,希望估计误差为400元,应抽取多大的样本量?(=0.05),解:已知=2000,E=400,,即应抽取97人作为样本。,第三节区间估计,(2)估计总体比率时样本容量的确定,根据比率区间估计公式可得样本容量n为,注意:的取值一般小于0.1;P未知时,可取最大值0.5。,其中:,第三节区间估计,注意:(1)当计算结果是小数时,一律向上取整;(2)同一资料确定平均数、成数样本容量时,计算结果一般不同,取样本容量大的数为最终结果。(3)如果历史资料中,方差有多个,取最大的;如成数估计中,方差未知,取0.25。,补充:抽样组织方式,一、抽样框概念:又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。抽样框标准:完整而不重复。例:常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册。在没有现成的名单的情况下,可由调查人员自己编制。,注意:在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。例:1936年文学文摘的民意测量:从电话薄和车牌登记名单中选择1000万人,最后收到200万人预测出43%的罗斯福支持率(实际是61%)思考:抽样框是什么?为什么预测不准?抽样框选择的不合理只选择了不成比例的富人样本,而排除了穷人。成功的对比:盖洛普的配额抽样,补充:抽样组织方式,补充:抽样组织方式,二、抽样的程序界定总体掌握总体的结构及各方面情况;制定抽样框对名单进行统一编号,多阶段抽样需要分别建立不同的抽样框。决定抽样方案抽样方法抽样规模主要目标量的精确程度;实际抽取样本评估样本质量对样本的质、代表性、偏差进行初步检验和衡量。即用样本中某些重要指标与总体中的指标进行比较,结果越接近越好。,补充:抽样组织方式,三、抽样组织方式,概率抽样非概率抽样简单随机抽样偶遇抽样等距抽样判断抽样分层抽样定额抽样整群抽样雪球抽样多阶段抽样,补充:抽样组织方式,非概率抽样1、偶遇抽样:又称为便利抽样,是指研究者根据实际情况,为方便开展工作,选择偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。例如在广场选择对来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国聚对苯二甲酸丁二酯项目创业投资方案
- 中国柳氮磺吡啶项目创业计划书
- 中国碲化镉项目投资计划书
- 2025年中国脱模油项目投资计划书
- 中国椰壳活性炭项目创业计划书
- 中国藤黄酸项目投资计划书
- 中国可控温加热管行业市场规模及投资前景预测分析报告
- 202514煤仓煤堆温度及气体监测系统方案
- 临汾市人民医院胆道疾病患者教育考核
- 鹤岗市中医院血小板减少症病因诊断考核
- GB/T 42513.8-2025镍合金化学分析方法第8部分:铌含量的测定电感耦合等离子体原子发射光谱法
- 水泵工安全培训
- 二十四山年月日时吉凶定局
- 全自动洗车机规格书
- 二十国集团落实2030年可持续发展议程行动计划(中英对照)
- 主动性不够整改措施3篇
- 新教材人教版高中物理选择性必修第三册全册教学课件
- 功能基因组学.ppt-PPT课件
- 机械优化设计完整版PPT课件.ppt
- 建设美丽宜居乡村PPT模板
- 维修电工技师、高级技师论文
评论
0/150
提交评论