卫生统计学:第5章 参数估计_第1页
卫生统计学:第5章 参数估计_第2页
卫生统计学:第5章 参数估计_第3页
卫生统计学:第5章 参数估计_第4页
卫生统计学:第5章 参数估计_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 1 统计推断:用样本信息推断总体特征,包括参数统计推断:用样本信息推断总体特征,包括参数 估计和假设检验。估计和假设检验。 2 图示:总体与样本图示:总体与样本 1 x 1 x 3 x 1 x 2 x 5 x 4 x 3 抽样试验(抽样试验(n n=5=5) 4 抽样试验(抽样试验(n n=10=10) 5 抽样试验(抽样试验(n n=30=30) 6 10001000份样本抽样计算结果份样本抽样计算结果 总体的总体的 均数均数 总体标总体标 准差准差s s 均数的均数的 均数均数 均数标准差均数标准差 n n=5=55.005.000.500.504.994.990.22120.22120

2、.22360.2236 n n=10=105.005.000.500.505.005.000.15800.15800.15810.1581 n n=30=305.005.000.500.505.005.000.09200.09200.09130.0913 ns nS 7 3 3个抽样实验结果图示个抽样实验结果图示 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 0 50 100 150 200 250 300 350 400 4

3、50 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 2212. 0; 5 X Sn 0920. 0;30 X Sn 1580. 0;10 X Sn 8 各样本均数未必等于总体均数;各样本均数未必等于总体均数; 各样本均数间存在差异;各样本均数间存在差异; 样本均数的分布为中间多,两边少,

4、左右基本样本均数的分布为中间多,两边少,左右基本 对称。对称。 样本均数的变异范围较之原变量的变异范围大样本均数的变异范围较之原变量的变异范围大 大缩小。大缩小。 样本均数的抽样分布特点样本均数的抽样分布特点? 9 0 30 X M I D PO I N T 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2

5、. 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0 原始数据原始数据 同理,在非正态分布总体中也可进行类似的抽同理,在非正态分布总体中也可进行类似的抽 样研究。样研究。 结果如何呢?结果如何呢? 10 PER C EN T 0 30 M M M I D PO I N T 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8

6、0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0 n = 5n = 5 11 N =10 PER C EN T 0 30 M M M I D PO

7、 I N T 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8

8、 4 . 9 5 . 0 n = 10 n = 10 12 PER C EN T 0 30 M M M I D PO I N T 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3

9、 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0 n =30 13 N =50 0 30 M M M I D PO I N T 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 .

10、1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0 n =50 14 中心极限定理:中心极限定理: (1 1)从正态总体中作随机抽样,则样本均数服从)从正态总体中作随机抽样,则样本均数服从 正态分布;从偏态总体中作随机抽样,样本含量正态分布;从偏态总体中作随机抽样,样本含量n n 足够大(足够大(n n5050)则样本均数近似服从正态分布。)则样本均数近似服从正态分布。 x s s (2 2)从总体均数为)从总体均数

11、为,标准差为,标准差为的正态总体中抽的正态总体中抽 取例数为取例数为n n的样本,样本均数的总体均数为的样本,样本均数的总体均数为,标,标 准差为准差为 。 15 16 一、均数的抽样误差与标准误一、均数的抽样误差与标准误 1.1.抽样误差:抽样误差:由于抽样造成的样本均数与总体均由于抽样造成的样本均数与总体均 数以及样本均数与样本均数之间的差异。数以及样本均数与样本均数之间的差异。 抽样误差是不可避免的,但可以控制。抽样误差是不可避免的,但可以控制。 2.2.标准误标准误(Standard error,SE):标准误为样本均标准误为样本均 数的标准差,用数的标准差,用 表示,表示,是说明样本

12、均数抽样是说明样本均数抽样 误差的大小的指标,描述样本均数的离散程度,误差的大小的指标,描述样本均数的离散程度, 反映用样本均数估计或推断总体均数的可靠性。反映用样本均数估计或推断总体均数的可靠性。 x s 17 3.均数标准误的计算均数标准误的计算 n x s s s s n S S x 均数的标准误与标准差成正比,与样本例数的平均数的标准误与标准差成正比,与样本例数的平 方根成反比。方根成反比。 若标准差固定不变时,可增加若标准差固定不变时,可增加n而缩小抽样误差。而缩小抽样误差。 18 4.均数标准误的应用均数标准误的应用 (1 1)表示均数抽样误差大小,描述()表示均数抽样误差大小,描

13、述(n n相同)相同) 样本均数的离散程度,反映用样本均数估计或样本均数的离散程度,反映用样本均数估计或 推断总体均数的可靠性;推断总体均数的可靠性; (2 2)用于估计总体均数的可信区间;)用于估计总体均数的可信区间; (3 3)用于进行均数的假设检验。)用于进行均数的假设检验。 19 标准差与标准误有何区别与联系?标准差与标准误有何区别与联系? 想一想想一想 20 二、二、t 分布的概念分布的概念 21 2 若若 样样 本本 均均 数数X服服 从从 总总 体体 均均数数 为为 、 总总 体体 标标 准准 差差 为为 X s 的的 正正 态态 分分 布布 2 (, ) X Ns ,则则 通通

14、 过过 同同 样样方方 式式的的 u 变变换换 ( X X s )也也 可可 将将其其 转转换换 为为 标标 准准 正正 态态 分分 布布 N(0, 1 2 ), 即即 u 分分 布布 。 22 , 1 X XX tn SSn 式中式中 为自由度为自由度(degree of freedom, df ) 3实际工作中,由于实际工作中,由于 未知,用未知,用 代替,代替, 则则 不再服从标准正态分布,而不再服从标准正态分布,而 服从服从t t 分布。分布。 X s X S () / X XS 23 )1 , 0(),( 2 NuNX x x u x s s s s nS x S x t x / )

15、1 , 0(),( 2 NuNX x u s s s s 24 4. t 分布曲线的特征:分布曲线的特征: (1 1)t 分布是一簇曲线。它受自由度的影响,自由度分布是一簇曲线。它受自由度的影响,自由度 不同曲线形状不同。不同曲线形状不同。 (2 2)是是t 分布曲线的参数:分布曲线的参数: n n越小,越小,越小,曲线越平缓越小,曲线越平缓 n n越大,越大,越大,曲线越陡峭越大,曲线越陡峭 nn,曲线近似于标准正态分布曲线。,曲线近似于标准正态分布曲线。 (3 3)以)以0为中心,左右对称呈钟形。为中心,左右对称呈钟形。 (4 4)标准正态分布是)标准正态分布是t 分布的特例。分布的特例。

16、 25 5.1 26 3t界界值值表表:详详见见附附表表2,可可反反映映t分分布布曲曲下下的的面面积积。 单单侧侧概概率率或或单单尾尾概概率率:用用, t 表表示示; 双双侧侧概概率率或或双双尾尾概概率率:用用 t界值表:界值表:p410 表表 2可反映可反映t分布曲线下分布曲线下 的面积。的面积。 单侧概率或单尾概率:用单侧概率或单尾概率:用 表示;表示; 双侧概率或双尾概率:用双侧概率或双尾概率:用 表示。表示。 表表示示; 双双侧侧概概率率或或双双尾尾概概率率:用用/2, t 表表示示。 ,2/ , t t 27 -tt0 表表 2 28 三、总体均数的估计三、总体均数的估计 参数估计参

17、数估计:用样本统计量估计总体参数。包括点估:用样本统计量估计总体参数。包括点估 计和区间估计。计和区间估计。 (1 1)点估计)点估计(Point Estimation):直接用样本指标作:直接用样本指标作 为总体参数的估计;为总体参数的估计; (2 2)区间估计)区间估计(Interval Estimation) :用预先给定:用预先给定 的概率(可信度、把握度的概率(可信度、把握度1-1-)估计总体参数所在)估计总体参数所在 的范围。此范围称为置信区间(可信区间):的范围。此范围称为置信区间(可信区间): Confidence Interval, CI 29 1点估计点估计(point e

18、stimation) 用相应样本统计量直接作为其总体参数的估计值。用相应样本统计量直接作为其总体参数的估计值。 、S估计估计 s s 代替代替,用,用代替代替如用如用sx 其方法虽简单,但未考虑抽样误差的大小。其方法虽简单,但未考虑抽样误差的大小。 30 按预先给定的概率按预先给定的概率(1 )所确定的包含所确定的包含 未知总体参数的一个范围。未知总体参数的一个范围。 总体均数的区间估计:总体均数的区间估计:按预先给定的按预先给定的 概率概率(1 )所确定的包含未知总体均数的一所确定的包含未知总体均数的一 个范围。个范围。 如给定如给定 =0.05,该范围称为参数的该范围称为参数的95%可信区

19、可信区 间或置信区间;间或置信区间; 如给定如给定 =0.01,该范围称为参数的该范围称为参数的99%可信区可信区 间或置信区间。间或置信区间。 2区间估计区间估计(interval estimation): 31 总体均数置信区间的计算需考虑:总体均数置信区间的计算需考虑: (1)总体标准差)总体标准差s s是否已知,是否已知, (2)样本含量)样本含量n的大小的大小 通常有两类方法:通常有两类方法: (1) t分布法分布法 (2)u分布法分布法 总体均数置信区间的计算总体均数置信区间的计算 32 总体均数置信区间的计算总体均数置信区间的计算 (1)t分布法分布法 当总体标准差当总体标准差未

20、知时未知时 )即即( xx x stxstx stx ,2/,2/ ,2/ , 总体均数的双侧(总体均数的双侧(1-)置信区间)置信区间 总体均数的单侧(总体均数的单侧(1-)置信区间)置信区间 xx stxstx ,2/,2/ 33 5-1 34 Lgstx Lgstx t x x /)02.133,98.116( 27 15 779. 2125 /)94.130,06.119( 27 15 056. 2125 .779. 201. 0 ,056. 2t0.0526,1-n 9-9 27,n 26,2/01. 0 26,2/05. 0 262/01. 0 0.05/2,26 , 时时, 时时,双双侧侧 ,查查附附表表本本例例 2 35 (2)正态分布近似法)正态分布近似法 当当已知已知 或或 未知,但未知,但 N50 时时 )即(即( xx x zxzx zx s ss s s s 2/2/ 2/ , 总体均数的双侧(总体均数的双侧(1-)置信区间)置信区间 )即(即( xx x szxszx szx 2/2/ 2/ , 36 总体均数的单侧(总体均数的单侧(1-)置信区间)置信区间 xx zxzxs

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论