医学]06假设检验基础.ppt_第1页
医学]06假设检验基础.ppt_第2页
医学]06假设检验基础.ppt_第3页
医学]06假设检验基础.ppt_第4页
医学]06假设检验基础.ppt_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验的推断原理 假设检验( Hypothesis test) 假设检验的基本步骤 t检验和Z检验 两样本总体方差齐性检验 正态性检验 假设检验是统计推断的另一重要 内容。正是应用统计推断的理论和 方法,人们才能顺利地通过有限的 样本信息去把握总体特征,实现抽 样研究的目的。 一、假设检验的推断原理 n假设检验是对所估计的总体首先提出 一个假设(假设样本来自同一总体), 然后通过样本数据去推断是否拒绝( 通过概率)这一假设,如果拒绝,认 为该样本很可能不是来自同一总体( 总体之间有差异);否则,认为该样 本很可能来自同一总体(总体之间无 差异)。 让我们先看一个例子. 例: 大量研究显示北方农村儿童前囟门 闭合平均月龄为14.1月。某研究人员从 东北某县抽取36名儿童,得囟门闭合月 龄均值为14.3月,标准差为5.08月。问 该县儿童前囟门闭合月龄是否大于一般 儿童? 对差别的可能原因分析 东北某县儿童囱门闭和月龄的总体均数与北方一般 儿童的均数相等,差异是由抽样误差引起的提 示东北某县儿童是北方一般儿童总体的一部分。 东北某县儿童囱门闭和月龄的总体均数与北方一般 儿童的均数不相等,差异可能是由地域等环境因素 引起的提示东北某县儿童与北方一般儿童是两 个不同的总体。 由上面的例子可以看出,需要检验 两个方面:与一般儿童相同,均数之 间的差别主要是由于抽样误差所致,抽 样误差影响的可能性大,其它因素影响 的可能性小。大于一般儿童,是由于 该区这个环境条件的影响,抽样误差影 响的可能性小。那么,如何进行判断呢 ? 统计上就是以抽样误差发生的可能性 ,也就是以小概率事件发生来判断。 假设检验 通过对假设作出取舍抉择来达到解决问题的目的 A.东北某县儿童囱门闭和月龄的总体均数与北方一般 儿童的均数相等无差异假设、零假设 H0(null hypothesis) B.东北某县儿童囱门闭和月龄的总体均数与北方一般 儿童的均数不相等对立假设、备择假设H1(alternative hypothesis) 证明A还是证明B? 在H0成立的条件下,均数之间的差异是由抽样 误差引起的,有规律可循; 在H1成立的条件下,均数间的不同包含种种未 知情形,无规律可循。 故从H0成立的角度出发,寻求其成立的概率。 变量值(月龄)X服从正态分布,且为小样本, 假定H0成立,样本均数服从t-分布,则 在H0成立的前提下,当前t值出现的概率有多大 ? 如何给出这个量的界限? 小概率事件在一次试验 中基本上不会发生 ! 从附表2中查出在显著性水平 =0.05(双侧),自由度为35所 对应的t界值,即为拒绝域与接 受域的界限。如果计算出的t统 计量大于相应的t界值,则落在 拒绝域中,该统计量出现的概 率小于5%,为小概率事件。 -2 .030 2 .030 接受域 拒绝域 拒绝域 常取 的选择要根据实际情况而定 通常取0.05 检验水准的概念 在假设检验中,称预先规定的小概率值为检 验水准,也称为显著性水准,用 表示。 这里所依据的逻辑是: 如果H0 是成立的,那么衡量差异大小的某 个统计量落入区域 拒绝域 是个小概率事件。如 果该统计量的实测值落入拒绝域,也就是说, H0 成立下的小概率事件发生了,那么就认为H0 不可信而否定它。否则我们就不能否定H0 (只 好接受它). 1. 建立检验假设,确定检验水准; H0:零假设、无效假设。是与研究假设有关的、被推断特 征某种确定的关系; H1:备择假设、对立假设。是被推断总体特征的另一种关 系或状况,与H0既有联系又互相对立。 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。 2. 根据试验设计、资料类型、统计方法的条件选择 检验方法,计算相应的统计量; 3. 确定P值,下结论。 假设检验的基本步骤: 4做统计推断: 根据P值大小,在两个假设 之间进行二者取一的选择。规则是: 如果P(0.05),意味着在H0设定的前提下 发生了(支持H1的)小概率事件。怀疑H0的真实 性(即推测实际情况应为H1)。从而做出拒绝H0 ,接受H1的推断结论。 如果P(0.05),按照事先确定的标准,在 H0的前提下没有发生(支持H1的)小概率事件, 因而没有充足的理由对H0提出怀疑。于是做出不拒 绝H0的推断结论。 无论做出哪一种推断结论,都面临着发生判断错 误的风险。这就是假设检验的两类错误。 P 值的概念 指从H0规定的总体中随机抽样抽得等于或大于 (或等于或小于)现有样本统计量的概率。 t 检验 t-test 单个样本t检验 配对样本t检验 两独立样本t检验 t检验中的注意事项 假设检验中两类错误 t检验(student t检验),它以t分布为基础,是 计量资料中最常用的假设检验的方法.包括 单样本t、两独立样本t和配对样本t检验。 学习时,要熟悉每种t检验它所对应的实验 设计、适用条件、注意事项! 理论上,t检验的应用条件是样本来自正态 分布的总体,两样本均数比较时,还要求 两总体方差齐同。在实际工作中,与上述 条件略有偏离,只要其分布为单峰且近似 对称分布,也可应用。当样本含量比较大 时,可用u检验。 单样本t检验 One sample t-test 试验设计 一组样本均数(代表未知总体均数)与已知总 体均数(一般为理论值、标准值或经过大量观 察所得稳定值等)的比较。 应用条件:样本来自正态分布的总体 且为随机样本! 例:根据大量调查,已知健康成年男子的脉 搏均数为72次/分。某医生在某山区随机 调查30名健康男子,求得脉搏均数为74.2 次/分,标准差为6.5次/分。能否认为该山 区的成年男子的脉搏均数高于一般成年男 子的脉搏均数? 1.建立检验假设,确定检验水准; 2.确定检验方法,计算统计量; 3.确定P值,下结论。 查附表2,t界值为2.045,统计量小于界值,则P0.05,接受H0 ,差异无统计学意义。尚不能认为该山区成年男子脉搏数与一 般男子相同。 配对样本t检验 Paired design t-test 试验设计 配对设计 将受试对象按照某些重要特征(主要是非处理因 素)配成对子,每对中的两个受试对象随机分配到两 处理组。 特点 控制较多的个体变异,可比性好, 常用于个体变 异较大的资料。 类型 1. 将受试对象配成特征相近的对子,随机接受两种处理; 2. 同一受试对象或同一份样品分成两份,随机分别接受不 同处理; 3. 同一受试对象处理前后的结果比较。 编编号 (1) 标标准品 (2) 新制品 (3) 差值值d (4)=(2)(3) 112.010.02.0 214.510.04.5 315.512.53.0 412.013.0-1.0 87.56.51.0 98.05.53.5 1015.08.07.0 1113.06.56.5 1210.59.51.0 39/12=3.25 12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 配对设计下的数据具有一一对应的特征,人们 关心的变量是对子的效应差值而不是各自的效 应值。把两种处理后的数据之差看作处理效果 的一个样本,假定这种差值服从正态分布,那 么其总体均数为0,即表明该处理没有作用。 问题转化为单组完全随机化设计资料总体均数 为零的检验。 应用条件:差值服从正态分布! 1.建立检验假设,确定检验水准; 2.计算统计量; 3. 确定P值,下结论。 假设检验的步骤 编编号 (1) 哥特里罗罗紫法 (2) 脂肪酸水解法 (3) 差值值d (4)=(2)(3) 10.8400.5800.260 20.5910.5090.082 30.6740.5000.174 40.6320.3160.316 50.6870.3370.350 60.9780.5170.461 70.7500.4540.296 80.7300.5120.218 91.2000.9970.203 100.8700.5060.364 2.724 两种方法对乳酸饮料中脂肪含量的测定结果(%) 两独立样本t检验 Two independent sample t-test 试验设计 完全随机设计 将受试对象完全随机地分配到两组中,分别接 受不同的处理;或者从两个总体完全随机地抽取 一部分个体进行研究。 目的:比较两总体均数是否相同。 特点 设计简单易行。常用于个体变异较小、同质性 较好的资料。 应用条件 两样本含量较小(n60); 两样本来源于正态分布的总体; 两总体方差相同,即方差齐性。 独立样本。 方差齐性时 方差齐性检验 (homogeneity of variance test) 查附表3F界值表。 附表3 两样本所属总体方差不等时: 例,某妇产科医院的研究者探索孕妇在孕期补充钙 制剂对血清骨钙素(ng/ml)的影响,选取孕妇的年龄 、基础骨钙素值接近,孕周在26-28周的30名孕妇,随 机分成两组,每组15人。试验组孕妇补充选定的某种 钙制剂,对照组孕妇采用传统膳食,产后40-50天内测 定两组孕妇血清骨钙素的改变值(产前与产后骨钙素 的差值)。如下表: 9.493 4.127 例3: 某口腔科测得长春市13-16岁居民男 性20人恒牙初期腭弓深度均值为17.15mm,标 准差为1.59mm;女性34人均值为16.92mm, 标准差为1.42mm。根据这份数据可否认为该 市13-16岁居民腭弓深度有性别差异? 若方差不齐,且不想用t检验,则可 以进行数据转换,达到方差齐性,再用t检 验也可以。也可以用非参数检验方法。 这里,当样本含量较大时,t分布临界 值接近Z分布临界值,可用1.96或1.645来代 替 。这就是所谓的Z检验。 四、两样本总体方差齐性检验: 两总体方差是否齐同,要进行F检验, 检验统计量为F。 例:某研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一 组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大 鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数 6.5mmol/L,标准差1.34mmol/L;D组8只,样本均数13.7mmol/L,标 准差4.21mmol/L。两组数据变异度是否相同? 注意到方差的统计学意义,是 对两个总体的变异程度是否相同作 推断。因此,它还可以用于处理另 外一类问题。 例: 将同一瓶液样分成20份,随机分成 两组,每组10份。用不同的方法分别检测液 样中某物质的含量(mmol/L)。结果两种 方法测得样本均数差异没有统计学意义,样 本标准差分别为1.02与0.56。试问两法检测 稳定性是否相同。 完全随机设计两样本几何均数比较的t 检验 基本思想:某些资料不服从正态分布,两样本所 代表的总体方差也可能不齐,但进行变量变换后 (对数变换),则服从正态分布,相应的两总体 方差也可能具有齐性。数据变换后两组间的关系 并没有改变。 正态性检验: 进行t检验的各种资料,必须 满足符合正态分布的总体,若不 能满足该条件,就不能进行t检验 。 正态概率纸法: 以变量量纲的刻度(组段)为横坐 标,以概率单位(相应频率转换)为纵 坐标,将数据在直角坐标平面描点,为 正态概率纸法。 如果数据服从正态分布,所描出的 散点(尤其是中间的点)沿一直线分布 。 P-P图法: 以样本的实际累计频率作为横坐标,以按照正态 分布规律计算的相应的理论累计概率作为纵坐标,把 样本点在直角坐标平面中。所得到的点图就是P-P图。 如果资料服从正态分布,样本点应围绕第一象限的对 角线散布。 Q-Q图法: 以样本的实际分位数(PX)作为横坐标,以按照 正态分布规律计算的相应的理论分位数作为纵坐标, 把样本点在直角坐标平面中。所得到的点图就是Q-Q 图。如果资料服从正态分布,样本点应围绕第一象限 的对角线散布。 目前流行的统计学软件主要提供P-P图或Q-Q图。 直方图法。 统计检验法: W检验(S.S. Shapiro and M.B. Wilk):统计量 为W 值。 D检验(DAgostino):统计量为D值。 矩法峰度与偏度检验、皮尔逊拟合优度检验等, 也可以用于正态性检验。 正态性检验法(在SPSS中可实现,推荐) 经验法: 均数大于2倍以上的标准差。 25例正常人TL-6资料的P-P图 t检验中应注意的事项 假设检验的前提是要有严密的抽样研究设 计 选用的假设检验方法应符合其应用条件 正确理解差别有无统计意义 结论不能绝对化 假设检验与可信区间的关系 假设检验中单侧检验与双侧检验 1.699 假设检验与可信区间的关系 可信区间具有假设检验的主要功能 可信区间可提供假设检验没有提供的信息 假设检验提供区间估计所不能提供的信息 例: 根据大量调查,已知健康成年男子的脉搏均数为72次/分。某 医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分 ,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高 于一般成年男子的脉搏均数? 用区间估计的方法: 由于95区间估计包含了健康成年男子的脉搏均数72,故可以认 为该山区30名成年男子脉搏的总体均数与健康成年男子的脉搏均 数来源于同一总体,两者的总体均数相等与假设检验的结果是 相同的 由于假设检验是根据有限的样本信息 对总体作推断,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论