第五讲-2参数估计与假设检验._第1页
第五讲-2参数估计与假设检验._第2页
第五讲-2参数估计与假设检验._第3页
第五讲-2参数估计与假设检验._第4页
第五讲-2参数估计与假设检验._第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、均数估计与假设检验均数估计与假设检验姬亚芹姬亚芹 参数估计是指用样本指标值(统计量)推断总体指标参数估计是指用样本指标值(统计量)推断总体指标值(参数)。值(参数)。 点估计和区间估计。点估计和区间估计。 点估计点估计就是用相应样本统计量直接作为其总体参数的就是用相应样本统计量直接作为其总体参数的估计值。如,估计值。如, 区间估计区间估计就是就是按照预先给定的概率(按照预先给定的概率(1-1-)所确定的)所确定的包含未知总体参数的一个范围。该范围称为参数的可包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间信区间或置信区间(confidence interval, CI) 。1、总

2、体均数估计的含义、总体均数估计的含义估计x预先给定的概率预先给定的概率(1)称为称为置信度,置信度,常取常取95%或或99%。置信区间通常由两个数值构成,称可信限置信区间通常由两个数值构成,称可信限(confidence limit, CL) 可信下限可信下限(L)可信上限可信上限(U)(1,2)是参数是参数的置信区间,是一个范围;的置信区间,是一个范围;为显著性为显著性水平,一般为水平,一般为5%;(1-)表明判断总体参数落在置信区间的可信程度,)表明判断总体参数落在置信区间的可信程度,由全部样本指标所确定的所有置信区间中平均有由全部样本指标所确定的所有置信区间中平均有95%的的估计区间包括

3、了总体参数估计区间包括了总体参数,另外有,另外有5%的区间没有包括的区间没有包括总体参数总体参数。什么是置信度?什么是置信度?什么是显著性水平?什么是显著性水平?u在实际工作中,只能根据一次试验结果计在实际工作中,只能根据一次试验结果计算一个可信区间,算一个可信区间,就认为该区间包含了相应就认为该区间包含了相应总体参数,总体参数,该结论犯错误的概率该结论犯错误的概率 。u可信区间一旦形成,它要么包含总体参数,可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。率可言。可信度是事前概率。u正确性正确性:可信度

4、可信度1,即区间包含总体参数,即区间包含总体参数 的理论概率大小,愈接近的理论概率大小,愈接近1愈好。愈好。u精确性精确性:区间的宽度,区间愈窄愈好。区间的宽度,区间愈窄愈好。u当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。 若只顾提高可信度,则可信区间会变宽。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:评价可信区间估计的优劣:2 2、总体均数可信区间的计算、总体均数可信区间的计算2.12.1单一总体均值的区间估计单一总体均值的区间估计(1)总体方差已知或方差未知,)总体方差已知或方差未知,但但n60,按按u分布分布nuxnux2/2/,表示区间以

5、95%(a=0.05)的可靠性包含总体,实际均值不在该区间的可能性为0.05a为风险系数误差限双侧双侧-方差已知方差已知单侧单侧-方差已知方差已知SuuSuuX,X,X,X,X X X X 或或或或双侧双侧-方差未知方差未知nSuxnSux2/2/,单侧单侧-方差未知方差未知nstxnstxvv, 2/, 2/,(2 2)总体方差未知)总体方差未知且样本容量较小且样本容量较小,按,按t t分布分布对于非正态总体,只要样本足够大,对于非正态总体,只要样本足够大,仍可按上式计算置信区间仍可按上式计算置信区间单侧单侧StStX,X,X X 双侧双侧2、总体均数可信区间的计算、总体均数可信区间的计算例

6、:某地抽取正常成年人例:某地抽取正常成年人200名,测得其血清胆固名,测得其血清胆固醇的均数为醇的均数为3.64mmol/L,标准差为标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的估计该地正常成年人血清胆固醇均数的95%可信可信区间。区间。20020. 196. 164. 3 ,20020. 196. 164. 381. 3 ,47. 3N60,可采用正态近似的方法计算2、总体均数可信区间的计算、总体均数可信区间的计算nSuxnSux2/2/,2.2 两总体均数之差的两总体均数之差的1可信区间可信区间 双侧双侧21XX,2/21S)XX(t 21XX,2121S)XX()(t

7、 单侧单侧21XX,2121S)XX()(t 从总体标准差相等,总体均数不等的两个正态总体进行随从总体标准差相等,总体均数不等的两个正态总体进行随机抽样,若两样本的样本含量、均数、标准差分别用机抽样,若两样本的样本含量、均数、标准差分别用 表示,则两总体均数之差的双侧表示,则两总体均数之差的双侧1-可信可信区间为区间为222111XXSnSn、和、自由度v=(n1-1)+(n2-1)=n1+n2-2两均数之差的标准误两均数之差的标准误2、总体均数可信区间的计算、总体均数可信区间的计算3.参考值范围参考值范围 参考值范围指正常值范围。由于存在个体差异,环参考值范围指正常值范围。由于存在个体差异,

8、环境数据并非常在一定范围内波动,故采用环境参考境数据并非常在一定范围内波动,故采用环境参考值范围作为判定正常与异常的参考标准。值范围作为判定正常与异常的参考标准。 通常采用双侧参考值范围制定下侧和上侧值。通常采用双侧参考值范围制定下侧和上侧值。 通常使用的环境参考值范围有通常使用的环境参考值范围有90%90%,95%95%和和99%99%,常,常用的是用的是95%95%。 有两种求参考值的方法。有两种求参考值的方法。3、参考值范围、参考值范围正态分布法正态分布法 进行正态分布检验进行正态分布检验 样本量足够大,通常大于样本量足够大,通常大于100100 双侧,双侧,1-1-a a参考值范围:参

9、考值范围: 单侧,单侧,1-1-a a参考值范围:参考值范围: 或或 通常选择为平均值加减通常选择为平均值加减2 2倍标准差范围为倍标准差范围为参考值范围参考值范围SX2/SXSX摘自,孙振球,医学统计学3、参考值范围、参考值范围 偏态分布法偏态分布法 样本量足够大,通常大于样本量足够大,通常大于100 双侧,双侧,1-a参考值范围:参考值范围: 单侧,单侧,1-a参考值范围:参考值范围: 或或2/1001002/100PP100P100100 P即P2.5-P97.5之间的值3、可信区间与参考值范围的区别、可信区间与参考值范围的区别u可信区间用于估计可信区间用于估计总体参数总体参数,总体参数

10、只,总体参数只 有一个有一个 。u参考值范围用于估计参考值范围用于估计个体值个体值的分布范围,的分布范围, 个体值有很多个体值有很多 。u95%可信区间中的可信区间中的95%是是可信度可信度,即所求可,即所求可 信区间包含总体参数的可信程度为信区间包含总体参数的可信程度为95%。u95%参考值范围中的参考值范围中的95%是一个是一个比例比例,即,即 所求参考值范围包含了所求参考值范围包含了95%的正常值。的正常值。4.假设检验的基本概念假设检验的基本概念4.14.1假设检验假设检验(hypothesis testing)又称显著性检验。通常先对总体的参数或分布又称显著性检验。通常先对总体的参数

11、或分布作出某种假设,然后用适当的方法根据样本对作出某种假设,然后用适当的方法根据样本对总体提供的信息,推断此假设应当被拒绝或接总体提供的信息,推断此假设应当被拒绝或接受。受。4.2无效假设和备择假设无效假设和备择假设(1)无效假设又称零假设,根据检验结果准备予以拒绝)无效假设又称零假设,根据检验结果准备予以拒绝或接受的假设或接受的假设,记为记为H0(null hypothesis););(2)备择假设又称对立假设,与原假设不相容,记为)备择假设又称对立假设,与原假设不相容,记为H1(alternative hypothesis)。)。 如:对总体随机变量如:对总体随机变量X的均值的均值不小于一

12、给定值不小于一给定值0的假的假设的检验公式为:设的检验公式为: H0:0, H1: 2或12。双侧检验较保守和稳妥,一般采用。临界值:作为上述拒绝域界限的给定数。5.假设检验的基本思想假设检验的基本思想反证法反证法 根据研究目的建立假设根据研究目的建立假设H0,先假设,先假设H0是正确是正确的,再分析样本提供的信息是否支持的,再分析样本提供的信息是否支持H0,即在,即在H0成立成立的条件下计算检验统计量,查表获得相应的条件下计算检验统计量,查表获得相应P值。值。如果如果H1成立,成立,P值就小。当值就小。当P小于或等于预先给定的概率小于或等于预先给定的概率0.05,则为小概率事件。小概率事件在

13、一次抽样中发生的可能则为小概率事件。小概率事件在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑原假设可能不成性很小,如果它发生了,则有理由怀疑原假设可能不成立,认为它的对立面成立。所以,查表得到的立,认为它的对立面成立。所以,查表得到的P值小于值小于0.05,则,则H1成立。成立。小概率事件原理小概率事件原理 小概率事件小概率事件(P0.05)在一次抽样中发在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑生的可能性很小,如果它发生了,则有理由怀疑H0的的正确性,认为正确性,认为H1成立。成立。例,例,通过以往大规模调查,已知某地一般新生儿的通过以往大规模调查,已知某地一般新生儿

14、的头围均数为头围均数为34.50cm,标准差为,标准差为1.99cm。为研究某矿。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新区新生儿的发育状况,现从该地某矿区随机抽取新生儿生儿55人,测得其头围均数为人,测得其头围均数为33.89cm,问该矿区新,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是生儿的头围总体均数与一般新生儿头围总体均数是否不同?否不同?6.16.1建立检验假设,确立检验方法建立检验假设,确立检验方法假设样本来自某一特定总体假设样本来自某一特定总体, ,无效假设和备择假设。据无效假设和备择假设。据资料类型,资料类型,确定要使用的检验方法。确定要使用的检验方法。

15、H0:H0:=34.50,H1:=34.50,H1:34.506.6.假设检验的基本步骤假设检验的基本步骤6.26.2单双侧检验的确定单双侧检验的确定根据专业知识和所要解决的问题。通常选择双侧检验。根据专业知识和所要解决的问题。通常选择双侧检验。6.36.3确立检验水准确立检验水准 根据需要,确定根据需要,确定 =0.05或或0.01。此处为此处为0.05.0.05.6.46.4计算检验统计量计算检验统计量根据变量和资料类型、设计方案、统计推断的目的、是否满足特定根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如条件等(如数据的分布类型数据的分布类型)选择相应的检验统计量。)

16、选择相应的检验统计量。计算样本与计算样本与总体的偏离程度总体的偏离程度. . 所有检验统计量都是在所有检验统计量都是在H0H0成立条件下计算来的。成立条件下计算来的。有的检验不需要计算统计量,而直接计算有的检验不需要计算统计量,而直接计算P P值。值。为单样本t检验273. 2)55/99. 1/()50.3489.33(t 6.5 计算与统计量对应的计算与统计量对应的P值,做出推断值,做出推断P值是决策的依据。值是决策的依据。P值的定义:在零假设成立的条件下,出现统计量目前值及更不利值的定义:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。于零假设数值的概率。根据计算得到的

17、统计量,查临界值表即可得到相应的根据计算得到的统计量,查临界值表即可得到相应的P概率值。概率值。本例:本例:V=54,查查t临界值表,得到临界值表,得到0.005P0.01,得到,得到P0.05,根据获得的事后概率根据获得的事后概率P,与事先规定的概率,与事先规定的概率检验水准检验水准 进行比较,进行比较,看其是否为小概率事件而得出结论。看其是否为小概率事件而得出结论。P ,按按 检验水准,拒绝检验水准,拒绝H0,接受,接受H1;P ,按,按 检验水准,不拒绝检验水准,不拒绝H0,无统计学意,无统计学意义义(统计结论统计结论),不拒绝,不拒绝H0不等于接受不等于接受H0。按所取检验水准按所取检

18、验水准0.05, 则拒绝则拒绝H0,接受,接受H1,差异有统计学意义(统,差异有统计学意义(统计结论),可以认为矿区新生儿的头围均数与一般新生儿不同,矿计结论),可以认为矿区新生儿的头围均数与一般新生儿不同,矿区新生儿的头围小于一般新生儿。区新生儿的头围小于一般新生儿。6.6.假设检验的基本步骤假设检验的基本步骤/2,t/2,ttP1 若若 ,不拒绝,不拒绝H0,但不能下但不能下“无差别无差别”或或“相等相等”的的结论,只能下结论,只能下“根据目前试验结果,尚不能认为有差别根据目前试验结果,尚不能认为有差别”的结论。的结论。 P7. I型错误和型错误和II型错误型错误-补充补充 可能发生的两类

19、错误可能发生的两类错误客观实际客观实际假设检验的结果假设检验的结果拒绝拒绝H0不拒绝不拒绝H0H0成立成立I型错误型错误( )推断正确推断正确(1)H0不成立即不成立即H1成立成立推断正确推断正确(1)II型错误型错误( )正常儿头围与矿区儿头围均数正常儿头围与矿区儿头围均数(所拟合的两个正态曲线各按所拟合的两个正态曲线各按100%面积绘制)面积绘制)肝肝 大大 指指 数数正常儿头围正常儿头围H0矿区儿头围矿区儿头围H1第一类错误第一类错误误诊率误诊率 (假阳性率假阳性率)第二类错误第二类错误漏诊率漏诊率 (假阴性率假阴性率) 6.1 7.0 8.456891011 4 大,大, 小;小; 大

20、,大, 小。增加小。增加n可同时缩小可同时缩小 , 。 u 可取单尾亦可取双尾。可取单尾亦可取双尾。uII型错误的概率大小用型错误的概率大小用 表示表示, 只取单尾,只取单尾, 值的大小一般未知,须在知道两总体差值的大小一般未知,须在知道两总体差值值 (如如 12等等)、 及及n 时,才能算出。时,才能算出。u1称称检验效能检验效能(power of a test),过去称把,过去称把握度。为当两总体确有差异,按检验水准握度。为当两总体确有差异,按检验水准 所能发现该差异的能力。所能发现该差异的能力。1只取单尾。只取单尾。u拒绝拒绝H0,只可能犯,只可能犯I型错误,不可能犯型错误,不可能犯II

21、型型错误;不拒绝错误;不拒绝H0,只可能犯,只可能犯II型错误,不型错误,不可能犯可能犯I型错误。型错误。 8、假设检验应注意的问题、假设检验应注意的问题1.要有严密的研究设计要有严密的研究设计组间应均衡,具有可比性,除对比的主要因组间应均衡,具有可比性,除对比的主要因素素(如临床试验用新药和对照药如临床试验用新药和对照药)外,其它可外,其它可能影响结果的因素能影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相同或相近。u配对设计计量资料:配对配对设计计量资料:配对t检验。检验。u完全随机设计两样本计量资料:完全随机设计两样本计

22、量资料:小样本小样本(任一任一ni60)且方差齐且方差齐: 两样本两样本t检验检验 方差不齐方差不齐: 近似近似t 检验检验大样本大样本(所有所有ni60): u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法8、假设检验应注意的问题、假设检验应注意的问题3.正确理解正确理解“significance”一词的含义一词的含义u过去称差别有或无过去称差别有或无“显著性显著性”,易造成易造成两两 样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。u现在称差别有或无现在称差别有或无“统计学意义统计学意义”, 相应推断为:可以认为或还不能认为两相应推断为:可以认为或

23、还不能认为两 个或多个总体参数有差别。个或多个总体参数有差别。8、假设检验应注意的问题、假设检验应注意的问题4.结论不能绝对化结论不能绝对化 u因统计结论具有概率性质,故因统计结论具有概率性质,故“肯定肯定”、 “一定一定”、“必定必定”等词不要使用。等词不要使用。u在报告结论时,最好列出检验统计量的在报告结论时,最好列出检验统计量的 值,尽量写出具体值,尽量写出具体P值,而不简单写成值,而不简单写成 P0.05,以便读者与同类研究进行比,以便读者与同类研究进行比 较。较。8、假设检验应注意的问题、假设检验应注意的问题斜体5.统计统计“有意义有意义”与专业与专业“有意义有意义” u统计统计“有意义有意义”对应统计结论,专业对应统计结论,专业“有有意意 义义”对应专

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论