可信区间ppt课件_第1页
可信区间ppt课件_第2页
可信区间ppt课件_第3页
可信区间ppt课件_第4页
可信区间ppt课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

柏建岭柏建岭 南京医科大学公共卫生学院南京医科大学公共卫生学院 流行病与卫生统计学系流行病与卫生统计学系 Medical statistics 医学统计学 参数估计 Parameter Estimation * 柏建岭讲稿 2 主要内容 l 点估计 l 区间估计 l 两个要素 l 均数可信区间的构建 l 正确理解可信区间的涵义 * 柏建岭讲稿 3 统计推断的内容 l参数估计 (parameter estimation) l假设检验 (hypothesis test) * 柏建岭讲稿 4 参数估计 由样本统计量估计总体参数 点估计 (point estimation) 区间估计 (interval estimation) * 柏建岭讲稿 5 参数估计之一:点估计 用样本统计量作为总体参数的估计 例如 : 用样本均数作为总体均数的一个估计 * 柏建岭讲稿 6 点估计的缺陷 =?cm, s =?cm x1,x2,x3,x4 N =143.37 s = 5.23 x1,x2,x3x10 =144.07 s = 4.72 x1,x2,x3x10 =142.72 s = 9.2473 x1,x2,x3x10 样本含量 n=10 * 柏建岭讲稿 7 点估计 直接用样本统计量作为总体参数的估计值 方法简单,但未考虑抽样误差的大小 在实际问题中,总体参数往往是未知的,但它们是固 定的值,并不是随机变量值。而样本统计量随样本的 不同而不同,属随机的。 * 柏建岭讲稿 8 区间估计 按一定的概率或可信度 (1- )用一个区间估计总体 参数所在范围,这个范围称作可信度为 1- 的可 信区间 (confidence interval, CI),又称置信区间 。 这种估计方法称为区间估计。 * 柏建岭讲稿 9 可信区间的两个要素 可信度 (1-), 可靠性 一般取 90% , 95% 。 可人为控制。 精确性 是指区间的大小 (或长短 ) 兼顾可靠性、精确性 * 柏建岭讲稿 10 均数的可信区间 基础:抽样误差理论 从正态分布总体中随机抽取一个样本,则 t值接近于 0的可能性较大,远离 0的可能性较小, 出现太大的 t值和太小的 t值的可能性更小,根据 t 分布的性质, * 柏建岭讲稿 11 均数的可信区间 总体均数的 (1- )可信区间定义为: * 柏建岭讲稿 12 影响可信区间大小的因素 可信度 可信度越大,区间越宽 个体变异 变异越大,区间越宽 样本含量 样本含量越大,区间越窄 * 柏建岭讲稿 13 当样本含量较大时,例如 n 100, t分布近似标准 正态分布,此时可用标准正态分布代替 t分布,作 为可信区间的近似计算。相应的 100(1-)% 可信区 间为: * 柏建岭讲稿 14 例 4.1 随机抽取 12名口腔癌患者,检测其发锌含 量,得均数为 253.05g/g,标准误为 27.18g/g,求发锌含量总体均数 95% 的可 信区间。 * 柏建岭讲稿 15 -t t0 自由度 概 率, P 单侧 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 2 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599 3 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924 4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 6 0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959 7 0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408 8 0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041 9 0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 10 0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587 11 0.697 0.876 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437 12 0.695 0.873 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318 13 0.694 0.870 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221 14 0.692 0.868 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140 15 0.691 0.866 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073 附表 2 t 界值表 * 柏建岭讲稿 16 本例自由度 =12-1=11,经查表得 t0.05,11=2.201,则 即口腔癌患者发锌含量总体均数的 95% 可信区间为: 193.23 321.87(g/g)。用该区间估计口腔癌患者发锌含量 总体均数的可信度为 95% 。 例 4.1 * 柏建岭讲稿 17 例 4.2 某地 120名 12岁男孩身高均数为 142.67cm, 标准误为 0.5477cm,计算该地 12岁男孩身 高总体均数 90% 的可信区间。 * 柏建岭讲稿 18 -t t0 自由度 概 率, P 单侧 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 2 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599 3 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924 4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 6 0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959 7 0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408 8 0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041 9 0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 10 0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587 11 0.697 0.876 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437 12 0.695 0.873 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318 13 0.694 0.870 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221 14 0.692 0.868 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140 15 0.691 0.866 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073 1.6449 1.9600 2.5758 附表 2 t 界值表 * 柏建岭讲稿 19 例 4.2 n=120100,标准正态分布代替 t分布, u0.10=1.64 即该地 12岁男孩平均身高的 90可信区间为: 141.77143.57(cm),可认为该地 12岁男孩平均身高在 141.77143.57(cm)之间。 * 柏建岭讲稿 20 均数之差可信区间的计算 正常组 肝炎组 2=? 均 数 : 235.21ug/dL 标准差 :14.39ug/dL 1=? 均 数 :271.89ug/dL 标准差 :10.38ug/dL 1- 2 ? * 柏建岭讲稿 21 与均数之差有关的抽样分布 “均数之差 ”与 “均数之差的标准误 ”之比, 服从自由度 = n1+n2 -2的 t 分布。 样本含量较大时,服从 标准正态分布 。 * 柏建岭讲稿 22 合并方差与均数之差的标准误 合并方差 (方差的加权平均 ) 均数之差的标准误 * 柏建岭讲稿 23 计算 * 柏建岭讲稿 24 正确理解可信区间的涵义 可信区间一旦形成,它要么包含总体参数,要么不包含总 体参数,二者必居其一,无概率可言。所谓 95的可信度 是针对可信区间的构建方法而言的。 以均数的可信区间为例,其涵义是:如果重复 100次抽样 ,每次样本含量均为 n,每个样本均按 构建可 信区间,则在此 100个可信区间内,理论上有 95个包含总 体均数,而有 5个不包含总体均数。 * 柏建岭讲稿 25 95%可信区间的含义 -2 -1 0 1 2 按这种方法 构建的可信区 间,理论上平 均每 100次,有 95次可以估计 到总体参数。 * 柏建岭讲稿 26 正确理解可信区间的涵义 在区间估计中,总体参数虽未知,但却是 固定的值( 且只有一个), 而不是随机变 量值 。 * 柏建岭讲稿 27 下列说法正确吗? 算得某 95% 的可信区间,则: 总体参数有 95% 的可能落在该区间。 有 95% 的总体参数在该区间内。 该区间包含 95% 的总体参数。 该区间有 95% 的可能包含总体参数。 该区间包含总体参数,可信度为 95% 。 * 柏建岭讲稿 28 可信区间与参考值范围的区别 可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多 甚至无限 。 95% 的可信区间中的 95% 是 可信度 ,即所求可信区间包含 总体参数的可信程度为 95% 95% 的参考值范围中的 95% 是一个 比例 ,即所求参考值范 围包含了 95% 的正常人。 * 柏建岭讲稿 29 标准差与标准误的联系 都是变异指标。 当 n不变时,标准差 ,标准误 * 柏建岭讲稿 30 标准差与标准误的区别 标准差描述原始数据的 离散程度 ; 标准误反映均数的 抽样误差 大小。 * 柏建岭讲稿 31 标准差与标准误的区别 标准差衡量样本均数对原始数据的 代表性 ,标准 差越小,样本均数对原始数据的代表性越好; 标准误衡量样本均数估计总体均数的 精确性 ,标 准误越小,样本均数估计总体均数精度越高。 * 柏建岭讲稿

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论