已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
XueFuzhong,Schoolofpublichealth,ShandongUniversity,假设检验的基本原理与t检验,假设检验的基本原理与t检验,假设检验的基本原理与t检验,假设检验的基本原理,假设检验(hypothesistest)亦称显著性检验(significancetest),是统计推断的两个重要内容之一。假设检验的方法很多,如t检验、u检验、方差分析、检验、秩和检验、;应用时,需根据研究目的、设计方法、资料类型及其分布特征等选用。,二十世纪二、三十年代Neyman和Pearson建立了统计假设检验问题的数学模型。,假设检验的基本原理与t检验,假设检验的基本原理,假设检验的基本原理与t检验,假设检验的基本原理,假设检验的基本原理与t检验,假设检验的基本原理,假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。,问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesistest)。,假设检验的基本原理与t检验,假设检验的基本原理,例根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?,1.建立检验假设确定检验水准一种是无效假设(nullhypothesis),符号为H0;一种是备择假设(alternativehypothesis)符号为H1。,H0:,H1:,假设检验的基本原理与t检验,假设检验的基本原理,假设检验的基本原理与t检验,假设检验的基本原理,检验水准亦称显著性水准(significancelevel),符号为,是判断拒绝或不拒绝的水准,也是允许犯型错误的概率,通常用。必要时,可用0.01或0.10或0.20。,假设检验的基本原理与t检验,假设检验的基本原理,2.选定检验方法和计算统计量根据研究设计的类型和统计推断的目的要求选用不同的检验方法。如完全随机设计中,两样本均数的比较可用t检验,样本含量较大时(n100),可用u检验。不同的统计检验方法,可得到不同的统计量,如t值和u值。各检验方法都有其应用条件。选择时,须根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法,并计算出相应的检验统计量。例如,本例为样本均数与总体均数比较,样本是随机抽取的,变量值为数值变量资料,样本含量较小,且总体标准差未知,因而选用单样本检验。,假设检验的基本原理与t检验,假设检验的基本原理,2.选定检验方法和计算统计量,XN(72,2),假设检验的基本原理与t检验,假设检验的基本原理,2.选定检验方法和计算统计量,假设检验的基本原理与t检验,假设检验的基本原理,2.确定P值,作出结论,假设检验的基本原理与t检验,假设检验的基本原理,P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量t值的概率。,3.确定概率P值作出结论,假设检验的基本原理与t检验,假设检验的基本原理,3.确定概率P值作出结论,当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为按所取检验水准拒绝H0,接受H1,即差异有统计学意义,如例3.3可认为两总体脉搏均数有差别;当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即差异无统计意义,如例3.3尚不能认为两总体脉搏均数有差别。,本例:,结论为按所取检验水准不拒绝H0,即差异无统计意义,尚不能认为两总体脉搏均数有差别。,假设检验的基本原理与t检验,假设检验的基本原理,3.确定概率P值作出结论,当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为按所取检验水准拒绝H0,接受H1,即差异有统计学意义,如例3.3可认为两总体脉搏均数有差别;当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即差异无统计意义,如例3.3尚不能认为两总体脉搏均数有差别。,样本均数与总体均数的比较,小样本t检验法:,目的:推断样本所代表的未知总体均数与已知总体均数0是否相等。,t检验的适用条件:样本来自正态总体或近似正态总体;,若不符合条件可考虑用非参数方法(秩和检验法),假设检验的基本原理与t检验,样本均数与总体均数的比较:,小样本t检验法:,例经产科大量调查得知某市婴儿体重均数为3.30kg,今随机测得35名难产儿平均出生体重为3.42kg,标准差为0.40kg。问该市难产儿出生体重与一般婴儿是否不同?,假设检验的基本原理与t检验,样本均数与总体均数的比较:,小样本t检验法:,假设检验的基本原理与t检验,样本均数与总体均数的比较:,大样本u检验法:,国外统计书籍及统计软件亦称为单样本u检验(onesampleu-test)。样本均数与总体均数比较的u检验适用于:总体标准差已知的情况;样本含量较大时,比如n100时。对于后者,是因为n较大,也较大,则t分布很接近u分布的缘故。,假设检验的基本原理与t检验,样本均数与总体均数的比较:,大样本u检验法:,假设检验的基本原理与t检验,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理与t检验,例题:已知某水样中碳酸钙的真值为20.7mg/L.现用某法重复测定该水样11次,测得碳酸钙的含量分别为20.9920.4120.1020.0020.9122.6020.9920.4120.0023.0022.00。问用该法测得的碳酸钙含量的均知与真值差异有无统计学意义?,dataa;inputx;y=x-20.7;cards;20.9920.4120.1020.0020.9122.6020.9920.4120.0023.0022.00run;procunivariatedata=anormal;vary;run;,SAScode,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理与t检验,SASoutput,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理与t检验,SASoutput,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理与t检验,SASoutput,配对t检验:,所谓配对样本(pairedsample)是指两个样本中的观察对象由于存在某种联系或具有某些相近的重要特征而结成对子(matching),每对中的两个个体随机分配接受两种不同的处理。,医学研究中常见的配对样本:配成对子的两个个体分别给予两种不同的处理(如把同窝、同性别和体重相近的动物配成一对;把同性别、同病情和年龄相近的病人配成一对等);同一个体同时分别接受两种不同处理(如同一动物的左右两侧神经、同一份标本分成两部分);同一个体自身前后的比较(如高血压患者治疗前后的舒张压比较、肝炎患者治疗前后的转氨酶比较等)。,假设检验的基本原理与t检验,配对t检验:,对于配对样本数据,应该首先计算出各对差值的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值的总体均数应该为0,故可将配对样本资料的假设检验视为样本均数与总体均数=0的比较,所用方法为配对t检验(pairedt-test),适用条件:要求差值的总体分布为正态分布,即差数来自正态分布总体。,不符合条件时,可考虑用非参数检验(配对符号秩和检验法),假设检验的基本原理与t检验,配对t检验:,例4.3将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?,假设检验的基本原理与t检验,配对t检验:,假设检验的基本原理与t检验,配对t检验:,例4.4有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4-2所示。试判断此减肥药是否有效。,假设检验的基本原理与t检验,配对t检验:,假设检验的基本原理与t检验,配对t检验:,假设检验的基本原理与t检验,SAS运行结果,例题:为研究女性服用某种避孕药后是否影响其血清总胆固醇含量,将20名女性按年龄配成10对。每对随机抽取1人服用该药,另1人服用安慰剂。经一段时间后,测定血清总胆固醇含量如下。问该药是否影响女性血清总胆固醇含量?,SAScode,配对t检验:,假设检验的基本原理与t检验,SAS运行结果,SASoutput,配对t检验:,假设检验的基本原理与t检验,SAS运行结果,SASoutput,完全随机设计的两组数值变量资料比较:,小样本t检验法:,完全随机设计(completelyrandomdesign):把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。目的:比较两总体均数是否相同。,适用条件:两样本均数均来自正态分布总体;两总体方差相等(方差齐),若有一条以上不符合:采用适当的变量变换方法,使其达到上述条件;若变量变换后仍不满足条件,则用非参数检验法(秩和检验)。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,小样本t检验法:,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,小样本t检验法:,例4.6将20份钩端螺旋体患者的血清随机分为2组,分别用标准株和水生株做凝溶试验,结果见表4-3。试比较两法测得的血清抗体平均效价有无差别。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,小样本t检验法:,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,正态性检验:,正态性检验(normalitytest)方法:统计指标:偏度系数、峰度系数;W值、D值等统计图:PP图、QQ图、直方图、茎叶图、箱图等,正态性检验是推断资料是否服从正态分布,或样本是否来自正态分布总体的方法。医学统计学中,许多统计方法仅适用于正态分布或近似正态分布资料。例如,用均数和标准差描述数值变量资料的分布特征,以及t、u检验和方差分析时,均要求样本资料服从正态分布。因此,选定统计方法时,先要用正态性检验(testofnormality)推断资料是否服从正态分布。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,正态性检验:,假设检验的基本原理与t检验,P-P图,完全随机设计的两组数值变量资料比较:,正态性检验:,假设检验的基本原理与t检验,P-P图,完全随机设计的两组数值变量资料比较:,正态性检验矩法(即分别对总体分布的偏度与峰度进行检验):,假设检验的基本原理与t检验,P-P图,完全随机设计的两组数值变量资料比较:,正态性检验矩法(即分别对总体分布的偏度与峰度进行检验):,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,正态性检验矩法(即分别对总体分布的偏度与峰度进行检验):,假设检验的基本原理与t检验,检验水准取大些!,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,两独立小样本均数的t检验,除要求两组数据均应服从正态分布外,还要求两组数据相应的两总体方差相等,即方差齐性(homoscedasticity)。但即使两总体方差相等,两个样本方差也会有抽样误差,两个样本方差不等是否能用抽样误差解释?可进行方差齐性检验。,注意:方差齐性检验本为双侧检验,但由于公式规定以较大的方差作分子,F值必然大于1,故附表3单侧0.025的界值,实对应双侧检验P=0.05;当样本含量较大时(如n1和n2均大于50),可不必作方差齐性检验。,假设检验的基本原理与t检验,根据专业知识确定单、双侧检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,根据专业知识确定单、双侧检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,例某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。,深层水:n1=8,样本均数=1.781(mg/L),S1=1.899(mg/L)表层水:n2=10,样本均数=0.247(mg/L),S2=0.210(mg/L),确定P值作出推断结论本例18-1=7,210-1=9,查附表3,F界值表(方差齐性检验用),得F0.05,7,9=4.20,本例F80.97F0.05,7,9=4.20;故P0.05,按=0.05水准,拒绝H0,接受H1,结论:故可认为两总体方差不齐。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,t检验:,近似t检验有3种方法可供选择,包括Cochran&Cox法、Satterthwaite法和Welch法。其中1、2两种方法较为常用。Cochran&Cox法是对临界值校正,而Satterthwaite法和Welch法则是对自由度校正。Satterthwaite法是目前计算机软件中普遍使用的方法。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,两大样本均数的u检验(two-sample-testforindependentsamples):,在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计算公式为:,例4.8某医师欲比较某地工人和农民全血胆碱脂酶活力,检测工人143名,均数3.52mol/L,标准差为0.49mol/L;检测农民156名,均数3.36mol/L,标准差为0.53mol/L。问该地工人与农民全血胆碱脂酶活力有无差别?,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,两大样本均数的u检验(two-sample-testforindependentsamples):,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,SAS运行结果,假设检验的基本原理与t检验,例题:某克山病区测得急性克山病患者11名和该地健康人的血磷值如下,问两组血磷值差异是否有统计学意义?急性克山病患者:4.736.402.603.246.535.185.583.734.435.783.37健康人:2.342.501.981.671.983.602.333.734.574.825.784.174.14,完全随机设计的两组数值变量资料比较:,SASoutput,假设检验的基本原理与t检验,Group=1,Group=2,完全随机设计的两组数值变量资料比较:,SASoutput,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,SASoutput,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,假设检验中作出的推断结论可能发生两种错误:拒绝了实际上是成立的H0,这叫型错误(typeerror)或第一类错误,也称为错误。(1)即可信度(confidencelevel):重复抽样时,样本区间包含总体参数(m)的百分数。不拒绝实际上是不成立的H0,这叫型错误(typeerror)或第二类错误,也称为错误。(1)即把握度(powerofatest):两总体确有差别,被检出有差别的能力。,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,假设检验中作出的推断结论可能发生两种错误的控制,型错误和型错误:,假设检验的基本原理与t检验,假定做了次检验,通常称为“族检验(familyoftests)”,在每一次检验(第一类错误)不变的情况下,K次检验的联合假阳性率将远远大于。假阳性率(falsediscoveryrate,FDR)是在特定检验水准下,有“统计学意义”的结果中,为真的比例。,多次重复检验造成的假阳性,每人的命中率0.95,而失误率为0.05,则多人的联合失误率会远远大于0.05。,假设检验的基本原理与t检验,多次重复检验造成的假阳性,假设检验的基本原理与t检验,单侧检验与双侧检验:,假设检验的基本原理与t检验,单侧检验与双侧检验:,假设检验的基本原理与t检验,假设检验时应注意的事项:,假设检验的基本原理与t检验,1要有严密的抽样研究设计这是假设检验的前提。样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性,即对比组间除处理因素(如新药和常规药)外,非处理因素(如年龄、性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全中班课件
- 2025年加氢工艺参考题库附+答案
- 2025年四川省建筑安全员B证(项目经理)考试题库
- 保险考试所有题库及答案
- 事业单位招聘必看题库知识点天津市考点(版)-1
- 2025年河南继续教育公需科目模拟考试题及答案
- 2022年2月衡阳市税务系统遴选面试真题附详解
- 国开《刑法学(2)》形考作业参考答案
- 幼儿园中班安全教育课件
- 经济学原理的测试题及答案详解
- 南充市高2026届高三高考适应性考试(一诊)语文试卷(含答案)
- 临床抗生素使用课件
- 2025山东济南医学发展集团有限公司国有企业招聘22人笔试考试参考试题附答案解析
- 律师事务所保密制度和保密措施
- 物业管理费用结构分析报告
- 2025天津港保税区安全生产技术专家招聘26人笔试考试参考题库附答案解析
- 第十六章整式的乘法数学活动课件人教版数学八年级上册
- 旅馆从业人员在线考试及答案解析
- 医疗机构感染控制制度及操作流程规范
- 科学防疫敬畏生命
- 雨课堂在线学堂《小白学人工智能》单元考核测试答案
评论
0/150
提交评论