医学]研究生统计课件4——参数估计与假设检验AAA.ppt

上传人：j*** IP属地：四川上传时间：2019-01-16 格式：PPT 页数：62 大小：1.13MB 积分：15 举报 版权申诉

已阅读5页，还剩57页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

参数估计与假设检验武汉大学公共卫生学院李十月第一部分参数估计第一节均数的抽样误差与标准误一、均数的抽样误差在医学研究中，绝大多数情况是由样本信息研究总体。由于个体存在差异，因此通过样本推论总体时会存在一定的误差，如样本均数往往不等于总体均数，这种由抽样造成的样本均数与总体均数的差异称为抽样误差。对于抽样研究，抽样误差不可避免。样本均数样本n1 样本n2 样本nk 各样本均数不相同，为什么？总体假定某年某地所有13岁女学生身高服从 N（155.4，5.32），在该总体中作100次随机抽样，ni = 30 153.6 153.1 157.7 从正态总体N（155.4，5.32）抽样得到的100个样本均数的频数分布组组段（cm）频频数频频率（） 152.611.0 153.244.0 153.844.0 154.42222.0 155.02525.0 155.62121.0 156.21717.0 156.833.0 157.422.0 158.0158.611.0 合计计100100.0 二、抽样误差的分布理论论上可以证证明：若从正态总态总体中，反复多次随机抽取样样本含量固定为为n 的样样本，那么这这些样样本均数也服从正态态分布，即的总总体均数仍为为，样样本均数的标标准差为为。抽样分布抽样分布示意图中心极限定理: 当样本含量很大的情况下，无论原始测量变量服从什么分布，的抽样分布均近似正态。抽样分布抽样分布示意图三、标准误（Standard Error）样本均数的标准差称为标准误。样本均数的变异越小说明估计越精确，因此可以用标准误表示抽样误差的大小：实际中总体标准差往往未知，故只能求得样本均数标准误的估计值：例4.1 在某地随机抽查成年男子140人，计算得红细胞均数4.771012/L，标准差0.38 1012/L ，试计算均数的标准误。标准误的用途：标准误是抽样分布的重要特征之一，可用于衡量抽样误差的大小，更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。标准差与标准误的区别与联系意义标准差：描述个体值间的变异，标准差较小，表示观察值围绕均数的波动较小。说明样本均数的代表性。标准误：描述统计量的抽样误差，标准误较小，表示样本统计量与参数较接近。说明样本均数的可靠性。标准差：表示变量值离散程度的大小，结合均数估计参考值范围。随样本含量的增多，逐渐趋于稳定。标准误：表示抽样误差的大小，估计参数的可信区间。随样本含量的增多逐渐减小。标准差与标准误的区别与联系区别标准差与标准误的区别与联系联系（1）标准差与标准误都是变异指标，说明个体值之间的差异时用标准差，说明统计量之间的差异时用标准误。（2）当样本含量不变时，标准差越大，标准误亦越大。总体均数的点估计（point estimation）与区间估计（ interval estimation）参数的估计点估计：由样本统计量直接估计总体参数区间估计：在一定可信度（Confidence level）下，同时考虑抽样误差第二节总体均数的可信区间估计按预先给定的概率(1)，确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI) (1)称为可信度或置信度（confidence level），常取95。置信区间通常两个数值即置信限(confidence limit，CL)构成，较小的称为置信下限（lower limit，L），较大的称为置信上限（upper limit，U），一、置信区间的有关概念样本统计量样本统计量 ( (点估计点估计) ) 置信区间置信区间置信下限置信下限置信上限置信上限置信区间与置信水平样本均值的抽样分布样本均值的抽样分布 (1 - (1 - ) % ) % 区间包含了区间包含了 % % 的区间未包含的区间未包含 1 1 / / 2 2 / / 2 2 区间估计的图示 x x 95% 95% 的样本的样本 -1.96-1.96 x x +1.96+1.96 x x 99% 99% 的样本的样本 - 2.58- 2.58 x x +2.58+2.58 x x 90%90%的样本的样本 -1.65 -1.65 x x +1.65+1.65 x x 评价估计量的标准无偏性无偏性：估计量抽样分布的数学期望等于被估计的总体参数 P P( ( ) ) B B A A 无偏无偏有偏有偏评价估计量的标准有效性有效性有效性：对同一总体参数的两个无偏点估计对同一总体参数的两个无偏点估计量，有更小标准差的估计量更有效量，有更小标准差的估计量更有效 A A B B 的抽样分布的抽样分布的抽样分布的抽样分布 P P( ( ) ) 评价估计量的标准一致性一致性：随着样本容量的增大，估计量的值越来越接近被估计的总体参数 A A B B 较小的样本容量较小的样本容量较大的样本容量较大的样本容量 P P( ( ) ) 一个总体参数的区间估计总总体参数符号表示样样本统计统计量均值值比率方差模拟实验模拟抽样成年男子红细胞数。设定: 产生100个随机样本，分别计算其95%的可信区间，结果用图示的方法表示。从图可以看出：绝大多数可信区间包含总体参数，只有6个可信区间没有包含总体参数（用星号标记）。图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图 * * * * * 二、总体均数置信区间的计算未知，且 n较小，按t分布已知，或未知但n足够大，按U分布 1. 单一总体均数的置信区间 2. 两总体均数的置信区间（一）单一总体均数的置信区间例4-2 Z0.05/2=1.96 Z0.05=1.645 Z0.05/2=1.96 Z0.05=1.645 三、可信区间估计的优劣一是可信度1（准确度），愈接近1愈好，如99%的可信度比95%的可信度要好；二是区间的宽度（精密度），区间愈窄愈好。当样本含量为定值时，上述两者互相矛盾。在可信度确定的情况下，增加样本含量可减小区间宽度。四、总体均数可信区间与参考值范围的区别第三节率的抽样误差与可信区间一、率的抽样误差与标准误二、总体率的可信区间一、率的抽样误差与标准误样本率(p)和总体率()的差异称为率的抽样误差(sampling error of rate) ，用率的标准误（standard error of rate）度量。如果总体率未知，用样本率p估计标准误的计算二、总体率的可信区间 1. 正态分布法；2 . 查表法 2. 查表法 n50，且P接近0或1的资料时采用。例4-6某新药的毒理研究中，用20只小白鼠作急性毒性实验，死亡3只，估计该药急性致死率的 95%可信区间。从附表7（根据二项分布原理制成）查得，在 n=20与X=3纵列交叉处的数值为338，即该药急性致死率的95%可信区间为3%38%。第二部分假设检验（Hypothesis Testing）第一节假设检验的基本思想小概率与反证法一、小概率事件与假设检验检验目的：未知，只能比较样本均数与0，( 0)0有两种可能: 1. 与0相等，差异由抽样引起； 2. 与0本身不相等。反证法思想：事先做出某种假设，如果证据不支持，则否定这一假设。如前例：假设体育生心率与一般学生一致（来自于同一个总体），然后求证现在的差异是由于抽样误差引起的,还是本质的差异。小概率事件：如果两个样本来自于同一总体，则出现的统计量（如均数）差异不会很大，如果出现的差异太大，大到同一总体抽样的两个样本间出现如此大差异的概率小于0.05或0.01，则我们说这一差异不是由于抽样误差引起的，而是本质的差异，所以他们不是来自于同一个总体，因而否定无效假设H0(原始假设），接受备选假设H1，表明两者间的差异有统计学意义。参数： , 统计量：同质变异误差变量频率概率样本总体样本a 总体1 样本1 样本b 样本2 总体2 随机抽取足够量的样本样本a 样本1 样本b 样本2 样本1和样本2是来自于同一个总体吗？样本1、2与样本a、b是来自于同一个总体吗？样本a和样本b是来自于同一个总体吗？如何证明它们是来自于同一个总体？来自于同一个总体或不来自于同一个总体，在实际中又有何应用意义？假设检验的思想解释：如果二个或多个样本来自同一个总体，那么样本之间（或样本与总体间）的差异不会很大（是个体差异导致的抽样误差），或者说出现较大差异的可能性(概率)很小( 0.05)；由这种差异计算出来的统计量 (如T、F、X2)也不会太大，如果太大，则其出现的概率也一定较小，如果概率小到P 0.05，则我们人为认定这是一个小概率事件，如果P 0.05则不是小概率事件。如果这种样本间差异（以及由此计算出来的统计量）出现的概率P 0.05，则这种差异被人为认为不是由一个总体中抽出来的样本间能产生的，因而它们之间的差异是本质的差异（称为“差异有统计学意义”）。换句话说，这种差异不是由抽样误差引起的，而是有本质差异，它们不是来自于同一个总体。检验假设：如法官判定一个人是否犯罪，首先是假定他“无罪”（H0），然后通过侦察寻找证据，如果证据充分则拒绝 “无罪”的假定（H0），判嫌疑人有罪；否则只能暂且认为“无罪”的假定（H0）成立。小概率事件P0.05或P0.01 -1.96 1.96 -1.645 统计量Z对应的概率很小，如小于等于0.05，则认为事件不会发生，此时拒绝H0，有足够证据推断差异有统计学意义。二、两类错误 I型错误（弃真）：拒绝实际正确的H0， I型错误的概率记为。（1a）即可信度:重复抽样时，样本区间包含总体参数（）的百分数。假阳性错误。 II型错误（纳伪） : 不拒绝实际不正确的H0， II型错误的概率记为。（1）即把握度（或检验效能）:两总体确有差别，被检出有差别的能力。假阴性错误。型错误（type error）型错误是指拒绝了实际上成立的H0，即“弃真”的错误。型错误的概率用表示。的意义是：如果原假设H0成立，对研究总体抽样100次，检验结论中平均有100 次拒绝 H0 （犯了型错误）。型错误（type error）型错误是指接受了实际上不成立的H0，即 “存伪”的错误。型错误的概率用表示。1 称为检验功效（power of test）的意义是：如果原假设H0不成立，对研究总体抽样100次，检验结论中平均有100 次不拒绝H0 （犯了型错误）。 1- 的意义是：当两总体确实存在差异时，按规定的检验水准发现该差异的能力。愈小，愈大；愈大，愈小。同时减小则只有增加样本含量。新药优越性的研究（希望拒绝H0）犯类错误意味着对新药的过高评价，即新药的疗效高于经典药物。为了避免此情况的出现，通常要将取得小一些。方差齐性检验时（希望不拒绝H0）犯类错误意味着更容易获得方差具有齐性的检验结果，导致下一步检验方法的选择错误，因此要把取得大一些，从而控制。注意：拒绝H0时，只可能犯类错误；“接受” H0时，只可能类犯错误三、单、双侧检验 H1： 0，双侧，0都有可能 H1： 0，单侧 H1： 0 或，拒绝H0的样本证据不足，就不拒绝H0，暂且认为H0成立根据统计推断结果，结合相应的专业知识，给出一个专业的结论。例：一建立检验假设，确定检验水准 H0：=0, 常锻炼学生的心率与一般学生相等。 H1：，则则不拒绝绝H0 ，差异无统计统计学意义义（“阴性”结结果），尚不能认为认为不同或不等(或拒绝绝H0的证证据尚不足) 4. 下统计检验结论只能说有、无统计学意义（ statistical significance），而不能说明专业上的差异大小。P值值越小只能说说明：作出拒绝绝H0，接受H1的统统计计学证证据越充分，推论时论时犯错误错误的机会越小，与专业专业上 |0 |差异的大小无直接关系。 5. 应应事先确定。选选0.05只是一种习惯习惯，而不是绝绝对对的标标准。关于假设检验的几个观点假设检验是结论具有概率性1.对于任何一次假设检验,不论其结论是拒绝H0,还是接受H0,都有判断错误的可能,即可能犯两类错误.第一类错误(也称型错误)是指拒绝了实际上成立的H0,其概率大小用a表示.假设检验时,研究者可根据研究的目的来确定值的大小,如规定=0.05(即犯第一类错误的概率为0.05),当拒绝H0时 ,则理论上100次抽样检验中平均有5次发生这样的错误. 第二类错误(也称型错误)是指接受了实际不成立的H0, 其概率大小用来表示,值的大小一般很难确切估计,只有与特定的H1结合起来才有意义.通常把1-称为检验效能(也称把握度),它的意义是:当两总体确有差别时,按规定的检验水准.能够发现该差别的能力. 假设检验一般

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

医学]研究生统计课件4——参数估计与假设检验AAA.ppt

文档简介

温馨提示

最新文档

评论

医学]研究生统计课件4——参数估计与假设检验AAA.ppt

文档简介

温馨提示

最新文档

评论

相关文档