第七章假设检验基础_第1页
第七章假设检验基础_第2页
第七章假设检验基础_第3页
第七章假设检验基础_第4页
第七章假设检验基础_第5页
已阅读5页,还剩79页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验基础

第一节假设检验的概念与原理对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验(hypothesistesting)。为什么要进行假设检验?假设检验能够处理哪些问题?假设检验的原理是什么?假设检验的基本步骤有哪些?应用假设检验还要涉及哪些问题?一、假设检验的思维逻辑实例:欲探讨男性成人肺炎患者的血红蛋白同男性健康成人有无区别,如果能够测量所有的男性成人肺炎患者和男性健康成人的血红蛋白数值,我们通过计算均数就可以进行大小的比较。可是,男性成人肺炎患者和男性健康成人的群体是无限大的,其血红蛋白值构成的总体也是无限的。因此,若随机抽取两个样本,各10例:10例男性成人肺炎患者的血红蛋白(g/dl)测量值:11.9,10.9,10.1,10.2,9.8,9.9,10.3,9.3,9.8,8.9;10例男性健康成人的血红蛋白(g/dl)测量值:13.9,14.2,14.0,14.3,13.7,13.9,14.1,14.7,13.5,13.6。算得10例男性成人肺炎患者的血红蛋白均数为10.11(g/dl),

10例男性健康成人的血红蛋白均数为

13.99(g/dl),差别的原因?差别的原因可能有两种:本质上的差异抽样误差只要个体之间存在差异,抽样误差就不可避免。欲想知道差别到底是本质上的差异还是纯粹的抽样误差,需进行假设检验。借助抽样误差的分布规律:均数的分布、t分布、z分布、…接受无效假设拒绝H0拒绝H0tt假设检验的原理:假设检验(hypothesistest)也称显著性检验(significancetest),采用的是小概率反证法的思想,即是事先对样本统计量的分布和总体参数作出某种假设,然后判定样本统计量在总体分布所处的位置和对应的概率值,如果样本统计量(如)在总体分布中的位置远离假定的参数,相对应的P值也小(如小于0.05)。根据“小概率事件在一次试验中一般不可能发生”的原理,统计学有理由认为样本统计量不是来自事先假定的总体。

二、假设检验的基本步骤

例7-1已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?1.选择检验方法,建立检验假设并确定检验水准

根据研究目的、研究设计的类型和资料特点(变量种类、样本大小)等因素选择合适的检验方法。并且将需要推断的问题表述为一对关于总体特征的假设。原假设(nullhypothesis),又称无效假设,记为H0;对立假设(alternativehypothesis),又称备择假设,记为H1。H1的内容直接反映了检验单双侧。若H1中只是

0

<

0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。例7-1建立的原假设为:μ=14.1(月),(μ为该县儿童前囟门闭合月龄总体均数),意为“总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同”。对立假设为:μ>14.1(月),意为“该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平”。检验水准(sizeofatest),用希腊字母α表示。实践中常取0.05或0.01等数值。它将小概率事件具体化,即规定概率不超过α就是小概率。第二节t检验一、单样本资料的t检验推断该样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值)有无差别。

例7-1的假设检验说明:只有在儿童前囟门闭合月龄(X)服从正态分布和原假设H0:μ=μ0成立的条件下,才能保证检验统计量(7-1)服从自由度为ν=n-1的t分布。从而可以按照t分布计算相应的P值,进行统计推断。对立假设却可以有所选择。例7-1是单侧检验,对立假设H1是单向不等式(μ>μ0)。双侧检验时的检验假设形式为H0:总体均数为μ0,即μ=μ0H1:μ≠μ0.其对立假设H1包括μ>μ0和μ<μ0两种可能。一般情况下均采用双侧检验。只有在具有充足理由可以认为如果H0不成立,实际情况只能有一种方向的可能时才考虑采用单侧检验。二、配对设计资料的t检验配对设计主要适用于以下情况:第一,配对的两个受试对象分别接受两种不同处理之后的数据;第二,同一样品(或受试对象)用两种处理方法(或测量等)检测的结果;第三,同一受试对象两个部位的数据(若为某种处理前后的数据,需要经历的处理时间较长,测量结果稳定)。例7-3用两种方法测定12份血清样品中Mg2+含量(mmol/l)的结果见表7-2。试问两种方法测定结果有无差异?三、两组独立样本资料的t检验例7-4某职防所测定了某工厂不同工种的两个车间的氟作业工人的尿氟含量(μmol/L),资料如下,问两车间的氟作业工人的尿氟含量有无差别?

甲车间:126.12143.20139.41161.11123.21110.3398.06151.4486.7631.56

乙车间:86.7193.14106.5190.11121.32116.1456.9278.7861.14100.30(二)两样本所属总体方差不等(Satterthwaite近似法)三、两组独立样本资料的t检验两组独立样本(twoindependentsample)将受试对象随机分配成两个处理组,每一组随机接受的一种处理。一般把这样获得的两组资料视为代表两个不同总体的样本,推断它们的总体均数是否相等。从两个人群(例如某年龄组男性与女性)分别随机抽取一定数量的观察对象,测量某项指标进行比较。在实际工作中这类资料也按完全随机设计的两样本比较来对待。例7-4某职防所测定了某工厂不同工种的两个车间的氟作业工人的尿氟含量(μmol/L),资料如下,问两车间的氟作业工人的尿氟含量有无差别?

甲车间:126.12143.20139.41161.11123.21110.3398.06151.4486.76131.56

乙车间:86.7193.14106.5190.11121.32116.1456.9278.7861.14100.30例7-5为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?四、两组独立样本资料的方差齐性检验

例7-6某口腔医院选择(吉林市)40-50岁慢性牙周炎患者536例,测得吸烟组(201人)菌斑指数(PLI)均值为84.71、标准差为8.14;非吸烟组(335人)菌斑指数的均值为82.20、标准差为6.18,两样本数据是否具有方差齐性(两总体方差相等)?

五、t分布大样本资料的检验(一)单样本资料比较的

u检验两个基本前提:样本数据服从正态分布,已知总体方差。若总体方差未知,用大样本数据的方差作为总体方差的估计值。

(二)两样本均数比较的u检验第三节Poisson分布资料的Z检验(二)两组独立样本资料的Z检验第四节假设检验与区间估计的关系一、置信区间具有假设检验的主要功能

配对资料差值

d双侧95%置信区间

两独立样本资料总体均数差值(1-2)的双侧(1-)置信区间:

利用例7-2资料,估计儿童血红蛋白在健康教育干预措施前后差值的总体均数的可信区间为:

利用例7-4计算两个总体均数间差值的置信区间为:2.置信区间可提供假设检验没有提供的信息

图7-1置信区间可以提供的信息3.假设检验提供,而置信区间不提供的信息在统计推断结论为拒绝H0时,假设检验可以报告确切的P值,从而较为精确地说明检验结论的概率保证。置信区间只能在预先确定的置信度100(1-α)%水平上进行推断。在不能拒绝H0的场合,假设检验可以对检验的功效做出估计,从而可以评价是否在识别差异能力较强的情形下不拒绝H0的。而置信区间并不提供这方面的信息。根据以上的讨论,置信区间与相应的假设检验既能提供相互等价的信息,又有各自不同的功能。把置信区间与假设检验结合起来,可以提供更为全面、完整的信息。因此国际上规定,在报告假设检验结论的同时,必须报告相应区间估计的结果。

第五节假设检验的功效一、假设检验的两类错误二、假设检验的功效1-β称为假设检验的功效(powerofatest)。其意义是,当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率。如果1-β=0.90,则意味着当H0不成立时,理论上在每100次抽样中,在α的检验水准上平均有90次能拒绝H0。一般情况下对同一检验水准α,功效大的检验方法更可取。2.两独立样本资料t检验的功效三、应用假设检验需要注意的问题

(一)在抽样研究中,研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的。严格按照研究设计方案,收集客观的数据。样本的获取必须遵循随机的原则。(二)应用检验方法必需符合其适用条件每一种假设检验方法都有相应的适用条件。在实际应用中,应根据设计类型、变量类型、样本大小等因素选择合适的检验方法。(三)当样本量一定时,第Ⅰ类错误的概率α变小,第Ⅱ类错误的概率β就变大。反之亦然。在假设检验可能出现的两类错误之中,往往会有一种错误危害较大。要权衡两类错误的危害来确定α的大小。

(四)正确理解P值的意义。P值很小时“拒绝H0,接受H1”,但是不要把很小的P值误解为总体参数间差异很大。拒绝H0只是说差异不为零,P值小只是说犯第Ⅰ类错误的机会远小于α。第六节正态性检验(normalitytest)

1.图示法:P-Pplot,Q-Qplot2.矩法偏度系数(skewness),峰度系数(kurtosis)。

3.

W检验法

4.

D检验法一、图示法期望概率(%)期望累计概率(%)

图100个样本均数的P-P图

P-P图图100个样本均数的Q-Q图Q-Q图二、统计检验法W检验由Shapiro和Wilk于1965年提出。简称为W法。适用于小样本。计算时需要采用常数表,大样本时计算很复杂。【例7.6】用小鼠研究正常肝核糖核酸(RNA)对癌细胞的生物学作用,测定水层RNA诱导肝癌细胞的果糖二磷酸酯酶(FDP)活性的结果如下,请分析FDP活性是否服从正态分布?排序后的数据一分为二D检验3.矩法是利用数学上的矩原理来检验偏度和峰度。偏度指分布不对称的程度和方向,用偏度系数(coefficientofskewness)衡量,样本偏度系数用g1表示,总体偏度系数用

1表示;理论上,总体偏度系数

1=0为对称,1>0为正偏态,1<0为负偏态;总体峰度系数2=0为正态峰,2>0为尖峭峰,2<0为平阔峰。样本峰度系数用g2表示。只有同时满足对称和正态峰两个条件时,才能认为资料服从正态分布。

检验偏度的统计量检验峰度统计量

例3-9试用矩法对表3-1中计算机模拟抽样所得100个样本均数进行正态性检验。(1)建立检验假设,确定检验水准H0:

1=0且2=0,即总体服从正态分布H1:1

0或/和2

0,即总体不服从正态分布

=0.10(欲不拒绝H0,宜稍大以减少II型错误)

(2)计算检验统计量(3)确定P值,作出推断结论峰度P>0.50,偏度P>0.50。按

=0.10水准,不拒绝H0,无统计学意义。还不能认为这些样本均数的总体不服从正态分布。

第七节中英文结果报告某职业病防治所为了检验不同工种氟作业工人的尿氟含量有无差别。随机测定了某工厂不同工种两个车间各10名氟作业工人的尿氟含量(μmol/L),均数±标准差分别为:127.1200±23.4467(μmol/L)、91.1070±21.3553(μmol/L)。Anoccupationaldiseasedispensaryrandomlyselected10workerswhoputinworkonthefluorideineachworkshopandmeasuredthecontentoftheirurinaryfluorideinordertodistinguishthedifferencesbetweendifferenttypesofwork.The(mean±standarddeviation)softhetwogroupswere:(127.1200±23.4467)umol/L、(91.1070±21.3553)umol/L.由两组独立设计样本资料的t检验比较,得t=-3.591,

0.02<P<0.005,差异有统计学意义(P<0.05)。可以认为两工种氟作业工人的尿氟含量(μmol/L)有差别。Theresultsoftwoindependent-samples

ttestresultedint=-3.591,0.02<p<0.05;

thedifferencesinthecontentofurinaryfluoridebetweenthetwogroupswerestatisticallysignificant(p<0.05).

第九节案例讨论见P118-P1191.假设检验是依据样本提供的有限信息对总体作推断的统计学方法,是在对研究

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论