总体均数的估计ppt课件_第1页
总体均数的估计ppt课件_第2页
总体均数的估计ppt课件_第3页
总体均数的估计ppt课件_第4页
总体均数的估计ppt课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 总体均数的估计,均数的抽样误差与标准误 t分布 总体均数的估计,1,为什么进行抽样?,2,3,抽样误差,概念:由个体变异引起的,抽样造成的样本统计量与总体参数之间的差异称为抽样误差(sampling error) 。,4,均数的抽样误差,均数的抽样误差:抽样引起的样本均数与总体均数的差异称为均数的抽样误差。,5,模拟试验1,从均数为4.5,标准差为0.2的正态总体中作随机抽样。当样本量为20时,随机抽取100个样本,其样本均数、标准差及其总体均数的95%置信区间见表6.1 。 可见:各样本均数未必等于总体均数;样本均数之间存在差异,6,样本均数的频数分布见表6.2 可见: 样本均数的分

2、布很有规律,围绕着总体均数4.5,中间多、两边少,左右对称。,7,模拟试验1,从均数为4.5,标准差为0.2的正态总体中作随机抽样,规定样本含量分别为5、10、20、50,每种样本含量均重复抽取1000次,结果可得到4个不同样本含量的样本均数的抽样分布图 如图6.1。 可见:得到的样本均数的分布仍然近似服从正态分布。,8,数理统计的中心极限定理,从正态分布N(,2)中,以固定n抽取样本,样本均数的分布仍服从正态分布。,9,模拟试验2,从非正态总体中抽样,观察其样本均数的抽样分布。非正态总体的分布如图6.2所示。 规定样本含量分别为5、10、20、50,每种样本含量均重复抽取1000次,结果也可

3、得到4个不同样本含量的样本均数的抽样分布图(图6.3)。,10,数理统计的中心极限定理,即使是从偏态分布总体抽样,只要n足够大,样本均数的分布也近似正态分布。,11,数理统计的中心极限定理,样本均数的总体均数仍为,样本均数的标准差为 。,12,标准误(standard error),样本均数的标准差称标准误,是说明均数抽样误差大小的指标, 大,抽样误差大;反之, 小,抽样误差小 。,13,标准误,标准误 的计算: 标准误 的估计值,14,影响标准误大小的因素,的大小与成正比 与样本含量n的平方根成反比,15,抽样误差越小,表明样本均数与总体均数越接近,即用样本均数估计总体均数的可靠性越大;反之

4、,抽样误差越大,则用样本均数估计总体均数的可靠性越小。,16,P74 例6.1,6.2,17,t分布,t分布的由来 t分布的特征 t分布曲线下的面积,18,t分布的由来,变量变换,总体,样本均数,中心极限定理,标准正态分布,变量变换,未知,19,t分布,英国 W.S.Gosset 于1908年以“student”笔名发表论文,证明它服从自由度为n-1的t分布,20,如果抽取例数n=5的样本1000个,每个样本又都可以按下式计算出一个t值,可将1000个t值编制成频数表,作出直方图,则可得到一条光滑的曲线。 (式6.3 ),21,同理,如果抽取例数n=15时,仍能得到一条t分布曲线,因此,当n变

5、化时,就可以得到不同的t分布曲线,如图6.4:,22,图6.4自由度分别为1、5、的t分布,23,t分布的特征,t分布是一簇曲线。 t分布以0为中心,左右对称。 其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当=时,t分布即为u分布。,24,t分布曲线下面积规律,t分布曲线下总面积仍为1或100% t分布曲线下面积以0为中心左右对称。,25,t分布曲线下面积规律,由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化,如P439附表3 。,26,附表2,t分布

6、表的特点,附表2的横标目为自由度,纵标目为概率P。一侧尾部面积称为单尾概率,两侧尾部面积之和称为双尾概率表中数字表示 和 确定时,对应的t界值,记作t, 。,27,附表2,t分布表的特点,单尾概率对应的t界值用t, 表示 双尾概率对应的t界值用t/2, 表示,28,当30时,单侧概率P 0.05时 单侧t, 1.697 当30时,双侧概率P 0.05时 双侧t/2, 2.042,example,29,example,单侧: P( t-t0.05,301.697 )=0.05 P(tt0.05,30 1.697 )=0.05 双侧: P(t-t0.05/2,30)+P(tt0.05/2,30 )

7、=0.05,30,其通式为 单侧:P( t-t, )=或P(tt,)= 双侧:P(t-t/2,)+P(tt/2, )= 图中非阴影部分面积的概率为, P(-t/2,tt/2,)=1-,31,附表2,t分布表的特点,附表2只列出正值,若计算的t值为负值时,可用其绝对值查表 。,32,总体均数的估计,33,34,统计分析,统计描述,统计推断,参数估计,假设检验,35,参数估计,用样本指标估计总体指标称为参数估计,是统计推断的一个重要方面。,36,总体均数估计的两种方法,点估计 区间估计,37,点估计,是直接用样本统计量直接作为总体参数的估计值.,38,点估计的缺点,没有考虑抽样误差,无法评价估计值

8、与真实值之间的差距,39,总体均数估计的两种方法,点估计 区间估计,40,区间估计,概念:即按预先给定的概率估计参数所在的范围。 该范围亦称可信区间(confidence interval, CI) 。,41,区间估计,结合样本均数和标准误可以确定一个具有较大可信度的包含总体均数的区间,该区间称为总体均数的1-可信区间。 一般取0.05或0.01,42,可信区间的计算,43,总体标准差未知时,正态总体N(,2)的样本均数 的t变换结果服从t分布:,44,若“砍去”t分布双侧尾部面积0.055,则有95的t值满足,45,或,移项:,46,可信区间的计算,未知,且n小 未知,但n足够大 已知,47,可信区间的涵义,P80,48,表6.1 从正态总体N(4.5,0.22)抽到的100份随机样本的计算结果(n100),49,可信区间两要素,准确度:反映在可信度(1-)的大小上,即可信区间包含总体均数的可能性大小,从准确度的角度看,愈接近1愈好,如可信度99%比95%好。 精密度:反映在可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论