第四章 t-检验.ppt_第1页
第四章 t-检验.ppt_第2页
第四章 t-检验.ppt_第3页
第四章 t-检验.ppt_第4页
第四章 t-检验.ppt_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 t-检验,百分率资料的假设检验,小样本均数的假设检验,统计假设检验的基本原理,统计假设检验又称为显著性检验,是生物统计学的核心内容,是统计推断的主要组成部分,第一节 统计假设检验的基本原理,统计推断(statistical inference)就是通过样本特征(统计量)来推断相应总体特征(参数)的方法,参数估计(parametric estimate),通过样本统计量估计总体参数的方法, 点估计(point estimate), 区间估计(interval estimate),直接用样本统计量的数值估计出相应总体参数具体值的方法,在一定的概率保证下(一般为95%或99%),根据样本统计

2、量的分布,计算出总体参数出现的数值范围或区间,用该区间来估计总体参数的方法, 参数估计是对总体参数的定量分析,统计假设检验(hypothesis test),根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本观测值和统计量的分布,通过一定的计算,再作出在一定概率意义上应当接受哪种假设的方法,统计假设检验的假设是对总体提出的,最后检验的结论只有两种:要比较的总体参数间要么存在显著差异,要么不存在显著差异, 统计假设检验是对总体参数的定性分析,1. 统计假设检验的意义,以两个平均数之间差异的显著性检验 t-检验为例,现随机挑选10名中国美女和10名韩国美女,请世界选美大赛评

3、委和观众进行评分,试比较哪个国家美女更美?,9.99,9.85,9.99,9.95,9.98,9.97,9.95,9.95,中国美女的平均得分9.98,韩国美女的平均得分9.91,两个国家美女的平均得分并不相等,其差值(表面效应)为:,根据两个样本平均数的差值0.07,是否可以给两个样本所在总体的总体平均数下这样的结论:,中国美女总体的平均得分高于韩国美女总体的平均得分 中国美女比韩国美女漂亮, 如果从经典数学的角度来看,答案应该是肯定, 如果从生物统计学的角度来看,在未经过统计假设检验以前,只能说“不一定”,事实上,仅仅凭借样本平均数之差不等于0就得出其所属的总体平均数不相等是不可靠的,实际

4、上,进行试验研究的目的并不在于了解样本的结果,而是要通过样本了解总体,通过样本来推断总体,从而对总体给出一个全面的结论,在统计学中,一般用样本平均数 、 作为统计假设检验的对象,、,以样本平均数差数的大小来对样本所在的总体平均数1与2是否相同作出统计推断,以样本平均数作为检验对象的依据:, 离均差平方和为最小,说明样本平均数与样本中各个观测值之间相差最小,因此,平均数是一个样本资料的最好代表值, 样本平均数是总体平均数的无偏估计值, 根据中心极限定理,样本平均数服从或逼近正态分布,实际上,每个观测值(数据)都只是试验的表面效应,而表面效应一般由两部分组成:,试验的处理效应,试验的随机误差,样本

5、中每一观测值xi可以被分解成两部分:,处理效应:,用总体平均数表示,误差效应:,用随机误差表示,样本平均数为:,总体平均数,样本平均数的差数也可分解成2部分:,误差平均数,表面 效应,处理效应,抽样误差,2. 统计假设检验的步骤,统计假设检验的基本原理和思路:, 首先根据具体试验目的提出一个假设, 然后在假定该假设成立(或正确)的前提下进行试验,并取得数据,接着对这些资料进行统计分析,获得该假设成立的概率, 最后根据所获得的概率值的大小来判断假设是否成立,如果所得概率较大,就表明我们没有足够的理由来否定所作假设,即必须接受这一假设,如果所得概率较小,就表明这一假设不大可能成立,应予否定,从而接

6、受其对立假设,例4-1:通过以往的大规模调查,已知某地成年黑白花奶牛产奶量为52.3,标准差为5.38,现测得10头黑白花奶牛产奶量分别为53.6,55.3,46.4,57.2,46.0,43.2,48.1,51.1,49.9,44.5; =49.53。试问这批黑白花奶牛是否来自于某地黑白花奶牛总体?,(1)对所研究的总体提出假设,研究某一随机样本所在的总体(用表示)和一已知总体(用0表示)是否为同一总体,也就是研究这一随机样本是否来自于已知总体,假设:,两个总体为同一个总体(即两个总体的总体平均数相等),无效假设(null hypothesis),用H0表示,即H0:=0,无效假设的含义:,

7、无效假设就是假设两总体的平均数相等,即H0:,假设样本平均数,与已知总体平均数,由抽样误差引起的,并不是两总体之间的真实差异,两总体之间的差异是由抽样误差所引起的,为了在无效假设被否定后有可以被接受的假设,因此应在设立无效假设的同时设立一个后备假设,备择假设(alternative hypothesis),用HA表示,即HA:,备择假设的统计学意义:,样本所在总体与已知总体不是同一个总体,即两总体的平均数不等,即:,两总体之间的差异,是真实差异,而不是由抽样误差引起的,统计假设检验中完整的假设是:,两总体之间的差异是真实差异,(2)在假定无效假设成立的前提下,研究样本平均数的抽样分布,计算样本

8、平均数出现的概率,样本平均数与总体平均数间有一个实际存在的差值:,这个差值就是表面效应,可能是抽样误差,也可能是真实差异,因此需要借助概率原理来进行判断,第一种方法:计算差值-2.77出现的概率,在无效假设成立的前提下,样本所在的总体与已知总体为同一个总体,因此样本所在总体的总体平均数和方差已知,即:,由于总体方差已知,根据标准正态分布就可以计算出差值-2.77出现的概率,0.10.11,第二种方法:计算样本平均数的接受区间,根据标准化公式计算样本平均数的接受区间:,接受区间,否定区间,接受区间和否定区间是有一定的概率保证的,保证概率为1-,常用的保证概率为95%和99%;为显著水平,常用的显

9、著水平有0.05和0.01,倘若样本平均数落在接受区间内,就接受H0,反之,倘若样本平均数落在接受区间之外,就否定H0,接受HA,作为0.05显著水平上接受或否定无效假设的两个临界值,作为0.01显著水平上接受或否定无效假设的两个临界值,95%的接受区间为:,99%的接受区间为:,(3)根据“小概率事件实际不可能性原理”接受或否定无效假设,小概率事件实际不可能性原理是指在一次试验中,概率很小的事件是不可能出现的,在统计学中,当样本平均数与总体平均数差值出现的概率小于5%时,就认为这种差异由抽样误差引起的概率较小,而是两总体间的真实性差异,从而否定无效假设,差值-2.77出现的概率为0.10.1

10、1,大于0.05,概率较大 ;说明样本平均数与已知总体的总体平均数之间的差异是抽样误差的概率较大,而不大可能是真实差异,接受无效假设,也就是说这批黑白花奶牛是来自于某地黑白花奶牛总体。,总结:统计假设检验的步骤,(1)提出假设,(2)计算样本平均数抽样分布的t值或u值,(3)查附表,根据小概率原理作出接受或者否定无效假设的推断,并结合专业知识作出合理的、科学的解释,例4-2:1995年,已知某地20岁应征男青年的平均身高为168.5cm。2005年在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问2005年当地20岁应征男青年的身高与1995年的是否相同?

11、,解:,(1)提出假设,H0:= 168.5,HA:168.5,与1995年相比,2005年当地20岁应征男青年的身高没有变化,与1995年相比,2005年当地20岁应征男青年的身高有变化,(2)计算u值,(3)查表,作出推断,u0.05=1.96,u0.01=2.58,|u| = 4.70,2.58 = u0.01,,P0.01,根据“小概率事件原理”可以认为无效假设不成立,因此否定无效假设,接受备择假设,样本不是来自于已知总体,即2005年当地20岁应征男青年的身高有变化,比1995年增高了,在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,用来确定否定或接受无效假

12、设的概率标准称为显著水平,记作,若|u|u0.05,P0.05,,说明表面效应属于试验误差的可能性大,不能否定无效假设,,两个总体平均数间差异不显著,若u0.05|u|u0.01,P0.05,,说明表面效应属于试验误差的概率P在0.01-0.05之间,表面效应属于试验误差的可能性较小,应否定无效假设,接受备择假设,两个总体平均数间差异显著,标记 *,若|u|u0.01,P0.01,,说明表面效应属于试验误差的概率P不超过0.01,表面效应属于试验误差的可能性更小,应否定无效假设,接受备择假设,两个总体平均数间差异极显著,标记 *,课堂练习:太湖猪母猪成年体重为75,现从太湖猪产区随机抽得60个

13、个体,平均成年体重为70.8,S=11.32,问该样本群就成年体重这一性状来看,是否与总体符合?,3. 一尾检验和两尾检验,所研究样本的样本平均数,有可能大于已知总体的总体平均数,也有可能小于已知总体的总体平均数,即计算所得的u值可能会落在标准正态分布左边否定区,也有可能会落在右边否定区,既考虑左边否定区又考虑右边否定区即考虑分布曲线两尾的检验称为两尾检验(two-tailed test),在很多情况下,事先并不知道所抽样本的样本平均数是不是肯定大于总体平均数或肯定小于总体平均数,因此,备择假设HA:0中,有两种可能性存在,既包括0,又包括0, 两尾检验是生物统计学中最常用的方法,应用范围极其

14、广泛,有些时候,试验目的是明确的,即所抽样本的样本平均数只可能大于总体平均数0,或只可能小于总体平均数0,在这种情况下,无效假设否定后的备择假设只有一种情况:要么0 ,要么0,只有一个否定区(一尾)的假设检验称为一尾检验(one-tailed test),两尾检验的假设:H0:=0,HA:0,一尾检验的假设:H0:0,HA:0,在样本容量和显著水平相同的情况下,一尾检验的效率高于两尾检验,一尾检验比两尾检验更容易否定无效假设,若对同一资料进行两尾检验和一尾检验,那么在水平上一尾检验显著,只相当于两尾检验在2水平上显著。所以,同一资料两尾检验与一尾检验所得的结论不一定相同,两尾检验显著,一尾检验

15、一定显著 一尾检验显著,两尾检验未必显著,4. 假设检验的两类错误,在假设检验中,接受或者否定无效假设的依据是 “小概率事件实际不可能性原理”,因此所得出的结论(不论是接受还是否定无效假设)都没有100%的把握,只是在一定的概率范围内认为这种结论是正确的,4.1 第一类错误,如果无效假设H0成立,即H0:=0为真,但:,检验结果发现“差异显著”而否定了它(此时,只有95%的把握,要冒5%下错结论的风险),检验结果发现“差异极显著”而否定了它(此时,只有99%的把握,要冒1%下错结论的风险),这一类错误称为型错误或型错误,型错误的实质就是把非真实差异(抽样误差)错判为真实差异,即:,H0:=0为真,却接受了HA:0,弃真,H0正确被否定,犯型错误的概率不会超过显著水平(5%、1%),4.2 第二类错误,如果无效假设H0不成立,即H0:=0为假,但:,检验结果发现“差异不显著”而接受了它,同时放弃了正确的备择假设,在统计学中所谓的“差异不显著”就是指没有充分的理由去否定无效假设,但也没有充分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论