参数估计[稻谷文苑]_第1页
参数估计[稻谷文苑]_第2页
参数估计[稻谷文苑]_第3页
参数估计[稻谷文苑]_第4页
参数估计[稻谷文苑]_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学医学统计学 1优质荟萃 参数估计参数估计 n抽样分布与标准误 nZ分布与t分布 n总体参数估计 2优质荟萃 抽样分布抽样分布 n卡方分布 n t 分布 n F 分布 3优质荟萃 总体与样本总体与样本 n总体总体(population):根据研究目的确定的同质观察单位 的全体 n样本样本(sample):从总体中随机抽取部分观察单位,其 实测值的集合 n为何要进行抽样研究? n对无限总体来讲是唯一可行的方法 n对有限总体的也可节省人力和材料,增加研究工作 的可行性 4优质荟萃 参数与统计量参数与统计量 n参数参数(parameter): 描述总体特征的统计指标 n如: (总体均数)、(

2、总体标准差) n统计量统计量(statistic): 由样本数据计算得到的统计指标量 n如: (样本均数)、S (样本标准差) X 5优质荟萃 抽样研究的目的抽样研究的目的 n抽样研究是期望通过样本提供的信息来 推断总体特征,即统计推断(statistical interference);其主要内容: n参数估计参数估计:用样本均数、样本率推断总体均数、 总体率 n假设检验假设检验:用推理的方法来判断某个(某几个) 样本是否来源于预先假设的总体 6优质荟萃 均数的抽样误差均数的抽样误差 n概念概念:样本均数与总体均数之间的差异( -)或样 本均数之间的差异都是由于抽样引起的,称为均数的 抽样误

3、差。对于抽样研究,抽样误差不可避免 n产生原因产生原因: n个体差异即变异 n样本只是部分研究对象 n控制方法控制方法: n改进抽样方法 n增加样本量 X 7优质荟萃 均数的抽样误差均数的抽样误差 n影响均数的抽样误差大小的因素有两个: n总体内各个个体间的变异程度 n样本的含量n的大小 与样本量的关系与样本量的关系:S S 一定,一定,nn,标准误,标准误 8优质荟萃 抽样误差抽样误差 X1 同同 一一 总总 体体 中中 抽抽 样样 X2 Xi 9优质荟萃 X 1 S1 X 2 S2 X I Si X n Sn 均数的均数的抽样误差抽样误差 X 10优质荟萃 The sample mean

4、has a sampling distribution Sampling batches of Scottish soldiers and taking chest measurements. Pop mean = 39.8 in, Pop sd = 2.05 in 1 2 3 4 5 6 7 8 9 10 12 11 34363840424446 (a) 12 samples of size n = 6 Sample number Chest measurement (in.) From Chance Encounters by C.J. Wild and G.A.F. Seber, Joh

5、n Wiley ; 表中的数字:相应的表中的数字:相应的 | |t t | | 界值。界值。 t- t 33优质荟萃 单尾概率与双尾概率单尾概率与双尾概率 n单尾概率单尾概率:一侧尾部面积 n双尾概率双尾概率:两侧尾部面积之和 n单侧单侧t t0.05,20 0.05,20=1.725 =1.725 表示=20时,t1.725的概率或t-1.725的概率分别 为0.05,记作P(t-1.725)=0.05或P(t1.725)=0.05 n双侧双侧t t0.05,20 0.05,20=2.086 =2.086 表示=20时,绝对值2.086的t值占曲线下面积的5, 也就是说出现绝对值比2.086

6、大的可能性小于0.05 34优质荟萃 单尾概率与双尾概率单尾概率与双尾概率 更一般的表示法:更一般的表示法: n单侧:P(t-t, )= 或 P(t t, )= n双侧:P(t- t/2, ) P(tt/2, )= n反之,P(t,/2 t t2 则 P1 50) 总体均数的估计总体均数的估计 服从标准正态分布(Z分布) n X z / 95. 096. 1 / 96. 1 n X P 95. 096. 196. 1 n X n XP )96.1 ,96.1( XX XX),( 2/2/XX zXzX 一般情况一般情况 其中 为标准正态分布的双侧界值 可信区间:可信区间: 2/ z 47优质荟

7、萃 v 5v 1v ( )f t 标准正态 分布 可信区间的计算可信区间的计算 n(二) 未知,或样本数量大(n50) 总体均数的估计总体均数的估计 通常未知,这时可以用其估计量S 代替, 但 已不再服从标准正态分 布,而是服从著名的 t 分布 )/()(nSX 48优质荟萃 可信区间的计算可信区间的计算 n(二) 未知,或样本数量大(n50) 总体均数的估计总体均数的估计 计算原理与前相同,仅仅是两侧概率的界值有些差别 1) / ( )(2/)(2/ t nS X tP /2,/2, (.) 1 XX PXX t St S 可信区间:可信区间: ). .( )(2/)(2/ XX StXSt

8、X , /2,t 为自由度为 ,可信度为- 的t临界值(双尾) 49优质荟萃 可信区间的计算可信区间的计算 n(二) 未知,或样本数量大(n50) 总体均数的估计总体均数的估计 注意注意:在小样本情况下,应用这一公式的条件是原始变 量服从正态分布。在大样本情况下(如n100),也可以 用 替换 近似计算 2/ z 2/ t 可信区间:可信区间:). .( )(2/)(2/ XX StXStX , /2,t 为自由度为 ,可信度为- 的t临界值(双尾) 50优质荟萃 Finding the Critical Value, Z nConsider a 95% confidence interval

9、: Z= -1.96Z= 1.96 0.951 0.025 2 0.025 2 Point Estimate Lower Confidence Limit Upper Confidence Limit Z units: X units: Point Estimate 0 1.96Z 51优质荟萃 Common Levels of Confidence nCommonly used confidence levels are 90%, 95%, and 99% Confidence Level Confidence Coefficient, Z value 1.28 1.645 1.96 2.3

10、3 2.58 3.08 3.27 0.80 0.90 0.95 0.98 0.99 0.998 0.999 80% 90% 95% 98% 99% 99.8% 99.9% 1 52优质荟萃 x Intervals and Level of Confidence Confidence Intervals Intervals extend from to (1-)x100% of intervals constructed contain ; ()x100% do not. Sampling Distribution of the Mean n ZX n ZX x x1 x2 /2/2 1 xi

11、x6 53优质荟萃 n例 对某人群随机抽取20人,用某批号的结 核菌素作皮试,平均侵润直径为10.9mm, 标准差为3.86mm。问这批结核菌素在人群 中使用时,皮试的平均侵润直径的95及99 置信区间是多少? n本例n=20,则=19,=0.05(双侧),查附 表2,t0.05,19=2.093,按式计算 3.863.86 10.92.093, 10.92.093 2020 9.1, 12.7 9595置信区间置信区间 同理,99置信区间 (8.5,13.4) 54优质荟萃 n本例该人群皮试的平均侵润直径虽不能确切地知道其数值, 但有95的可能性在9.112.7mm这个区间,有99的 可能性

12、在8.513.4mm这个区间 n换句话说,作出平均侵润直径在9.112.7mm的结论, 说对的概率是95,说错的概率是5;作出平均侵润直 径在8.513.4mm的结论,说对的概率是99,说错的 概率是1 n在作区间估计时,每次的结论的正确与否是偶然的。既然 说对的把握大到95或99之多。我们就相信这一结论, 但并不是说总体均数所在的这一区间是绝对正确的 意意 义义 55优质荟萃 n某卫生防疫站为了解某厂所生产的同一批罐装 午餐肉中亚硝酸盐的含量,随机抽取了该批罐 装午餐肉10听,测得亚硝酸盐含量的样本均数 为17.6mg/kg,标准差为1.64mg/kg n试估计该批罐装午餐肉中亚硝酸盐含量的

13、95 CI ? 习习 题题 56优质荟萃 XX SXSX96.1,96.1 XX SXSX58. 2,58. 2 区间估计区间估计 1. 1. 当当n n足够大时足够大时, n总体均数的95%95%的置信区间: n总体均数的99%99%的置信区间的置信区间: 总体均数的估计总体均数的估计 57优质荟萃 例:求140名正常人的空腹血糖的95%与99%的区间 (88.55-1.961.096, 88.55+1.961.096) 即: (86.40 , 90.70) (88.552.581.096, 88.552.581.096) 即: (85.72 , 91.38) 可信区间的计算可信区间的计算

14、总体均数的估计总体均数的估计 58优质荟萃 区间估计区间估计 2. 当当 n 较小且总体方差未知较小且总体方差未知时时, , 总体均数的置信区间: n例2 测得25名1岁婴儿血红蛋白均数为 123.7g/L,标准差为11.9g/L。计算1岁婴儿 血红蛋白均数的95%可信区间? XX StXStX ,2/,2/ , 25/9 .11064. 27 .123,25/9 .11064. 27 .123 05. 0,24125 查表查表064. 2 24, 2/05. 0 t 总体均数的估计总体均数的估计 59优质荟萃 置信区间的含义置信区间的含义 n从总体中作随机抽样,每个样本可以算得一个 置信区间

15、,如95置信区间,意味着做100次 抽样,算得100个置信区间,平均有95个置信 区间包括总体均数(估计正确),只有5个置 信区间不包括总体均数(估计错误) n5是小概率事件,实际发生的可能性小,因 此,在实际应用中就认为总体均数在算得的置 信区间内。这种估计方法会冒5的风险 60优质荟萃 置信区间的两个要素置信区间的两个要素 n准确度准确度 反映在可信度(1-)的大小上,即可信区间包 含总体均数的可能性大小,从准确度的角度 看,愈接近1愈好,如可信度99%比95%好 n精密度精密度 反映在可信区间的长度上,即长度愈小愈好 61优质荟萃 三、模拟实验三、模拟实验 模拟抽样成年男子红细胞数。设定

16、模拟抽样成年男子红细胞数。设定: : 产生产生100100个随机样本,分别计算其个随机样本,分别计算其95%95%的可信区间,的可信区间, 结果用图示的方法表示。从图可以看出:绝大多数结果用图示的方法表示。从图可以看出:绝大多数 置信区间包含总体参数置信区间包含总体参数 ,只有,只有6 6个置信区间个置信区间 没有包含总体参数(用星号标记)。没有包含总体参数(用星号标记)。 14039.075.4n, 754. 62优质荟萃 图图4-2 4-2 模拟抽样成年男子红细胞数模拟抽样成年男子红细胞数100100次的次的95%95%可信区间示意图可信区间示意图 )14039.075.4(n, * *

17、* * * * 63优质荟萃 置信区间置信区间 概念概念:估计可能包含未知总体估计可能包含未知总体 参数的一个范围,范围内包括参数的一个范围,范围内包括 总体参数的置信程度为总体参数的置信程度为(1-1-) (95%95%,99% 99% 指可信度)指可信度) 范畴范畴:统计推断:统计推断 用途用途:估计未知总体参数所在:估计未知总体参数所在 范围范围 计算公式:计算公式: 正态分布,正态分布,未知:未知: 非正态分布,但非正态分布,但n30,n30,有有 或或 参考值范围参考值范围 概念概念:个体值的波动范围,即:个体值的波动范围,即 按事先给定的范围按事先给定的范围绝大多数正绝大多数正 常

18、人的某指标范围常人的某指标范围(1-1-)所确所确 定的定的“正常人正常人”解剖、生理、解剖、生理、 生化指标的波动范围生化指标的波动范围 (95%95%,99%, 99%, 指绝大多数正常人)指绝大多数正常人) 范畴范畴:统计描述:统计描述 用途用途:供判断观察个体的某项:供判断观察个体的某项 指标是否指标是否“正常正常”时参考时参考 计算公式计算公式: 正态分布:正态分布: 偏峰分布偏峰分布:(:(P P100 100/2 , P P100(1-100(1-/2) ) ) 置信区间与参考值范围的区别置信区间与参考值范围的区别 X StX ,2/ X zX 2/ X SzX 2/ SzX 2/ 64优质荟萃 正常值范围正常值范围 概念:概念:绝大多数正常绝大多数正常 人的某指标范围(人的某指标范围(95%95%, 99%, 99%, 指绝大多数正常指绝大多数正常 人)人) 计算公式:计算公式: 用途:判断观察对象用途:判断观察对象 的某项指标是否正常的某项指标是否正常 可信区间可信区间 概念:概念:总体均数所在的总体均数所在的 数值数值 范围(范围(95%95%,99% 99% 指可指可 信度)信度) 计算公式:计算公式: 用途:估计总体均数用途:估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论