医学]研究生统计课件4——参数估计与假设检验AAA.ppt_第1页
医学]研究生统计课件4——参数估计与假设检验AAA.ppt_第2页
医学]研究生统计课件4——参数估计与假设检验AAA.ppt_第3页
医学]研究生统计课件4——参数估计与假设检验AAA.ppt_第4页
医学]研究生统计课件4——参数估计与假设检验AAA.ppt_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计与假设检验 武汉大学公共卫生学院 李十月 第一部分 参数估计 第一节 均数的抽样误差与标准误 一、均数的抽样误差 在医学研究中,绝大多数情况是由样本 信息研究总体。由于个体存在差异,因此通过 样本推论总体时会存在一定的误差,如样本均 数 往往不等于总体均数 ,这种由抽样造成的 样本均数与总体均数的差异称为抽样误差。对 于抽样研究,抽样误差不可避免。 样本均数 样本n1 样本n2 样本nk 各样本均数不相同,为什么? 总体 假定某年某地所有13岁女学生身高服从 N(155.4,5.32),在该总体中作100次随 机抽样,ni = 30 153.6 153.1 157.7 从正态总体N(155.4,5.32)抽样得到的100个样本均数的频数分布 组组段(cm)频频数频频率() 152.611.0 153.244.0 153.844.0 154.42222.0 155.02525.0 155.62121.0 156.21717.0 156.833.0 157.422.0 158.0158.611.0 合计计100100.0 二、抽样误差的分布 理论论上可以证证明:若从正态总态总 体 中 ,反复多次随机抽取样样本含量固定为为n 的样样本,那 么这这些样样本均数 也服从正态态分布,即 的总总体均 数仍为为 ,样样本均数的标标准差为为 。 抽样分布 抽样分布示意图 中心极限定理: 当样本含量很大的情况下,无论原始测量变量服 从什么分布, 的抽样分布均近似正态。 抽样分布 抽样分布示意图 三、标准误(Standard Error) 样本均数的标准差称为标准误。样本均数的 变异越小说明估计越精确,因此可以用标准误表示 抽样误差的大小: 实际中总体标准差 往往未知,故只能求得 样本均数标准误的估计值 : 例4.1 在某地随机抽查成年男子140人,计 算得红细胞均数4.771012/L,标准差0.38 1012/L ,试计算均数的标准误。 标准误的用途: 标准误是抽样分布的重要特征之一,可用于衡量 抽样误差的大小,更重要的是可以用于参数的区间估 计和对不同组之间的参数进行比较。 标准差与标准误的区别与联系 意义 标准差:描述个体值间的变异,标准差较 小,表示观察值围绕均数的波动较小。 说明样本均数的代表性。 标准误:描述统计量的抽样误差,标准误 较小,表示样本统计量与参数较接近。 说明样本均数的可靠性。 标准差:表示变量值离散程度的大小, 结合均数估计参考值范围。 随样本含量的增多,逐渐趋于稳定。 标准误:表示抽样误差的大小, 估计参数的可信区间。 随样本含量的增多逐渐减小。 标准差与标准误的区别与联系 区别 标准差与标准误的区别与联系 联系 (1)标准差与标准误都是变异指标,说明 个体值之间的差异时用标准差,说明统计 量之间的差异时用标准误。 (2)当样本含量不变时,标准差越大,标 准误亦越大。 总体均数的点估计(point estimation)与区间估计( interval estimation) 参数的估计 点估计:由样本统计量 直接估计 总体参数 区间估计:在一定可信度 (Confidence level) 下 ,同时考虑抽样误差 第二节 总体均数的可信区间估计 按预先给定的概率(1), 确定一个包含未知总体参数的范 围。这一范围称为参数的可信区间或置信区间(confidence interval,CI) (1)称为可信度或置信度(confidence level),常取95。 置信区间通常两个数值即置信限(confidence limit,CL)构成, 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U), 一、置信区间的有关概念 样本统计量样本统计量 ( (点估计点估计) ) 置信区间置信区间 置信下限置信下限置信上限置信上限 置信区间与置信水平 样本均值的抽样分布样本均值的抽样分布 (1 - (1 - ) % ) % 区间包含了区间包含了 % % 的区间未包含的区间未包含 1 1 / / 2 2 / / 2 2 区间估计的图示 x x 95% 95% 的样本的样本 -1.96-1.96 x x +1.96+1.96 x x 99% 99% 的样本的样本 - 2.58- 2.58 x x +2.58+2.58 x x 90%90%的样本的样本 -1.65 -1.65 x x +1.65+1.65 x x 评价估计量的标准无偏性 无偏性:估计量抽样分布的数学期望等于 被估计的总体参数 P P( ( ) ) B B A A 无偏无偏有偏有偏 评价估计量的标准有效性 有效性有效性:对同一总体参数的两个无偏点估计对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效 A A B B 的抽样分布的抽样分布 的抽样分布的抽样分布 P P( ( ) ) 评价估计量的标准一致性 一致性:随着样本容量的增大,估计量 的值越来越接近被估计的总体参数 A A B B 较小的样本容量较小的样本容量 较大的样本容量较大的样本容量 P P( ( ) ) 一个总体参数的区间估计 总总体参数符号表示样样本统计统计 量 均值值 比率 方差 模拟实验 模拟抽样成年男子红细胞数。设定: 产生100个随机样本,分别计算其95%的可信区间 ,结果用图示的方法表示。从图可以看出:绝大多数 可信区间包含总体参数 ,只有6个可信区间没 有包含总体参数(用星号标记)。 图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图 * * * * * 二、总体均数置信区间的计算 未知,且 n较小,按t分布 已知,或未知但n足够大,按U分布 1. 单一总体均数的置信区间 2. 两总体均数的置信区间 (一)单一总体均数的置信区间 例4-2 Z0.05/2=1.96 Z0.05=1.645 Z0.05/2=1.96 Z0.05=1.645 三、可信区间估计的优劣 一是可信度1(准确度),愈接近1愈好 ,如99%的可信度比95%的可信度要好; 二是区间的宽度(精密度),区间愈窄愈 好。当样本含量为定值时,上述两者互相矛 盾。 在可信度确定的情况下,增加样本含量可 减小区间宽度。 四、总体均数可信区间与参考值范围的区别 第三节 率的抽样误差与可信区间 一、率的抽样误差与标准误 二、总体率的可信区间 一、 率的抽样误差与标准误 样本率(p)和总体率()的差异称为率的抽 样误差(sampling error of rate) ,用率的标 准误(standard error of rate)度量。 如果总体率未知,用 样本率p估计 标准误的计算 二、 总体率的可信区间 1. 正态分布法;2 . 查表法 2. 查表法 n50,且P接近0或1的资料时采用。 例4-6某新药的毒理研究中,用20只小白鼠作急 性毒性实验,死亡3只,估计该药急性致死率的 95%可信区间。 从附表7(根据二项分布原理制成)查得,在 n=20与X=3纵列交叉处的数值为338,即该药 急性致死率的95%可信区间为3%38%。 第二部分 假设检验 (Hypothesis Testing) 第一节 假设检验的基本思想 小概率与反证法 一、小概率事件与假设检验 检验目的: 未知,只能比较样本均数 与0,( 0)0有 两种可能: 1. 与0相等,差异由抽样引起; 2. 与0本身不相等。 反证法思想: 事先做出某种假设,如果证据不支持, 则否定这一假设。如前例:假设体育生心率与 一般学生一致(来自于同一个总体),然后求 证现在的差异是由于抽样误差引起的,还是本质 的差异。 小概率事件: 如果两个样本来自于同一总体,则出现 的统计量(如均数)差异不会很大,如果出现 的差异太大,大到同一总体抽样的两个样本间 出现如此大差异的概率小于0.05或0.01,则我 们说这一差异不是由于抽样误差引起的,而是 本质的差异,所以他们不是来自于同一个总体 ,因而否定无效假设H0(原始假设),接受备 选假设H1,表明两者间的差异有统计学意义。 参数: , 统计量: 同质 变异 误差 变量 频率 概率 样本 总体 样本a 总体1 样本1 样本b 样本2 总体2 随机抽取足够量的样本 样本a 样本1 样本b 样本2 样本1和样本2是来自于同一个总体吗? 样本1、2与样本a、b是来自于同一个总体吗? 样本a和样本b是来自于同一个总体吗? 如何证明它们是来自于同一个总体?来自于同一个总体 或不来自于同一个总体,在实际中又有何应用意义? 假设检验的思想解释: 如果二个或多个样本来自同一个总体,那么样本之 间(或样本与总体间)的差异不会很大(是个体差异导致的 抽样误差),或者说出现较大差异的可能性(概率)很小( 0.05);由这种差异计算出来的统计量 (如T、F、X2)也不会 太大,如果太大,则其出现的概率也一定较小,如果概率小 到P 0.05,则我们人为认定这是一个小概率事件,如果P 0.05则不是小概率事件。 如果这种样本间差异(以及由此计算出来的统计量 )出现的概率P 0.05,则这种差异被人为认为不是由一个 总体中抽出来的样本间能产生的,因而它们之间的差异是本 质的差异(称为“差异有统计学意义”)。换句话说,这种差 异不是由抽样误差引起的,而是有本质差异,它们不是来自 于同一个总体。 检验假设: 如法官判定一个人是否犯罪,首先是假定他“无 罪”(H0),然后通过侦察寻找证据,如果证据充分 则拒绝 “无罪”的假定(H0),判嫌疑人有罪;否则只 能暂且认为“无罪”的假定(H0)成立。 小概率事件P0.05或P0.01 -1.96 1.96 -1.645 统计量Z对应的概 率很小,如小于等 于0.05,则认为事 件不会发生,此时 拒绝H0,有足够证 据推断差异有统计 学意义。 二、两类错误 I型错误(弃真) :拒绝实际正确的H0, I型错误的 概率记为。(1a)即可信度:重复抽样时,样本区间 包含总体参数()的百分数。假阳性错误。 II型错误(纳伪) : 不拒绝实际不正确的H0, II型错 误的概率记为。(1)即把握度(或检验效能):两 总体确有差别,被检出有差别的能力。假阴性错误。 型错误(type error) 型错误是指拒绝了实际上成立的H0,即“弃 真”的错误。 型错误的概率用表示。 的意义是:如果原假设H0成立,对研究总 体抽样100次,检验结论中平均有100 次拒绝 H0 (犯了型错误) 。 型错误(type error) 型错误是指接受了实际上不成立的H0,即 “存伪”的错误。 型错误的概率用表示。1 称为检验 功 效(power of test) 的意义是:如果原假设H0不成立,对研 究总体抽样100次,检验结论中平均有100 次 不拒绝H0 (犯了型错误)。 1- 的意义是:当两总体确实存在差异时 ,按规定的检验水准发现该 差异的能力。 愈小, 愈大; 愈大, 愈小。同时减小则只有增加样本含量。 新药优越性的研究(希望拒绝H0) 犯类错误意味着对新药的过高评价,即新药的疗效 高于经典药物。为了避免此情况的出现,通常要将取得小 一些。 方差齐性检验时(希望不拒绝H0) 犯类错误意味着更容易获得方差具有齐性的检验结 果,导致下一步检验方法的选择错误,因此要把取得大一 些,从而控制。 注意:拒绝H0时,只可能犯类错误;“接受” H0时, 只可能类犯错误 三、单、双侧检验 H1: 0,双侧,0都有可能 H1: 0,单侧 H1: 0 或,拒绝H0的样本证据不足,就不拒绝H0,暂且认为H0成立 根据统计推断结果,结合相应的专业知识,给出一个专业的结论。 例: 一建立检验假设,确定检验水准 H0:=0, 常锻炼学生的心率与一般学生相等。 H1:,则则不拒绝绝H0 ,差异无统计统计 学意义义(“阴性”结结 果),尚不能认为认为 不同或不等(或拒绝绝H0的证证据尚 不足) 4. 下统计检验结论只能说有、无统计学意义( statistical significance),而不能说明专业上的差异 大小。P值值越小只能说说明:作出拒绝绝H0,接受H1的统统 计计学证证据越充分, 推论时论时 犯错误错误 的机会越小,与专业专业 上 |0 |差异的大小无直接关系。 5. 应应事先确定。选选0.05只是一种习惯习惯 ,而不是绝绝 对对的标标准。 关于假设检验的几个观点 假设检验是结论具有概率性1.对于任何一 次假设检验,不论其结论是拒绝H0,还是接受H0,都有判断 错误的可能,即可能犯两类错误.第一类错误(也称型错 误)是指拒绝了实际上成立的H0,其概率大小用a表示.假 设检验时,研究者可根据研究的目的来确定值的大小,如 规定=0.05(即犯第一类错误的概率为0.05),当拒绝H0时 ,则理论上100次抽样检验中平均有5次发生这样的错误. 第二类错误(也称型错误)是指接受了实际不成立的H0, 其概率大小用来表示,值的大小一般很难确切估计,只 有与特定的H1结合起来才有意义.通常把1-称为检验效 能(也称把握度),它的意义是:当两总体确有差别时,按规 定的检验水准.能够发现该差别的能力. 假设检验一般

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论