




已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数值变量资料的假设检 验 1 1 主要内容 1 假设检验的基本思想和步骤 2 t 检验 3 u 检验 4 正态性检验(自学) 5 两个方差的齐性检验 6 型错误和型错误 7 假设检验时应注意的事项 2 2 1 假设检验的基本思想 n假设检验的目的 n假设检验的原理 n假设检验的基本步骤 3 3 一、假设检验的目的 据大量调查得知,健康成年男子脉搏的均数为72次/分,某 医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2 次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏 高于一般健康成年男子? 判断均数差别引起的原因: 一种可能是,样本是从该总体中随机抽取的,其差异仅仅是由 抽样误差造成的; 另一种可能是,样本不是从该总体中随机抽取的,而是有本质 上的不同,单纯用抽样误差解释不了。 4 4 n前已述及,由于个体变异的普遍存在,抽样研究 时,不可避免地存在着抽样误差。 n从 cm, cm的正态分布总 体中,以固定 随机抽取100个样本时, 各样本均数基本不等,也不等于155.4,这些差 别是由抽样误差造成的。 n因此,在医学研究中,由样本资料得出样本统计 量( 、 、 )后,首先要考虑抽样误差的 存在。 5 5 假设检验的目的 n也就是说,当遇到样本统计量与某一总体参数不等 时,应想到两种可能性: n一种可能是,样本是从该总体中随机抽取的,其差 异仅仅是由抽样误差造成的; n另一种可能是,样本不是从该总体中随机抽取的, 而是有本质上的不同,单纯用抽样误差解释不了。 n那么,如何判断这两种可能呢? 需要进行假设检验 6 6 假设检验的目的: 判断均数差别引起的原因: 一种可能是,样本是从该总体中随机抽取的,其差 异仅仅是由抽样误差造成的; 另一种可能是,样本不是从该总体中随机抽取的, 而是有本质上的不同,单纯用抽样误差解释不了。 7 7 0 t 分 布 一 簇 曲 线 0N ( 0 , 1 ) n 足 够 大 时 , ( 1 ) ( 2 ) ( 3 ) 以 固 定 n 随 机 抽 样 二、假设检验的基本思想 8 8 当以固定 n 从均数为 的正态分布总体中随机 抽样时,对于 u 分布,理论上,有95的 ,有5的 。若进 行一次抽样,则有95的可能 ,而 的可能只有5。 -1.96 1.96 2.5 % 2.5 % 95% 9 9 n对于 t 分布,理论上有95的 ,有5的 ;若进行一次抽样时 ,有95的可能 ,而 的可能只有5。 0 -t0.05/2,vt0.05/2,v 2.5%2.5% 95% t 1010 n总之,当以固定n从均数为 的正态分布总体中 进行一次随机抽样时,抽到 或 的机会(概率)很小。 n假设,在一次抽样研究中,就得到了 或 ,即 ,为小概率事 件,依据小概率事件在一次试验不可能发生的定 理,可认为此样本不是来自均数为 的正态分布 总体,而是来自均数不等于 的另一个正态分布 总体。 假设检验的原理 1111 三、假设检验的基本步骤 适用于任何类型的变量 n通过实例说明:据大量调查知,健康成年男子脉 搏的均数为72次/分,某医生在山区随机调查了 25名健康成年男子,其脉搏均数为74.2次/分, 标准差为6.5次/分,能否认为该山区成年男子的 脉搏高于一般健康成年男子? 1212 n分析思路:两个均数不等的可能原因有二:一是 抽样误差,即山区健康成年男子的脉搏均数与一 般健康成年男子的脉搏均数相同,其不同是由抽 样误差造成的;二是本质上的不同,即因山区的 影响,人体的生理代偿所致。可通过假设检验来 判断。 n基本步骤:1.建立假设和确定检验水准 2.选定检验方法和计算统计量 3. 确定P值,做出推断结论 假设检验的基本步骤 1313 (一) 建立假设和确定检验水准 1. 建立假设: n检验假设(常称无效假设或零假设, null hypothesis, hypothesis under test)用 表 示,假设样本所代表的总体参数与已知总体参数相 等 ( ); n备择假设(alternative hypothesis),用 表示 ,与 是对立且相互联系的假设,假设样本所 代表的总体参数与已知的总体参数不等 (,或 , 或72次/分, 。 假设检验的基本步骤 1515 (一) 建立假设和确定检验水准 2. 确定单、双侧检验 n建立假设前,先要根据专业知识和研究目的来确定是 单侧检验还是双侧检验。 n若从专业知识和研究目的上考虑,未知的总体参数只 能大于(或只能小于)已知总体参数时,用单侧检验; 若从专业知识和研究目的上认为,未知的总体参数大 于或小于已知总体参数的两种情况都可能存在时,用 双侧检验。通常用双侧检验。 n单、双侧检验的区别可从备择假设反映出来:双侧检 验时, ;单侧检验时, 。 假设检验的基本步骤 1616 (一) 建立假设和确定检验水准 3. 确定检验水准 是判断拒绝或不拒绝无效假设的水准 假设检验的基本步骤 1717 (二)选定检验方法和计算统计量 n假设检验的方法很多,如t检验、u检验、方差分 析、 检验、秩和检验、,各检验方法都有其 应用条件。 n选择时,须根据研究目的、设计类型、资料类型 及其分布特征等选用适当的统计检验方法,并计 算出相应的检验统计量。 n如本例,是样本与总体均数的比较,样本是按完全 随机设计抽取的,是数值变量资料,且样本含量较 小,总体标准差未知,须选用样本均数与总体均数 比较的t检验。 假设检验的基本步骤 1818 n求出检验统计量后,查相应的统计用表,得出概 率P值。 nP值是指从 所规定的总体中随机抽样时,获得 等于及大于(负值时为等于及小于)现有样本统 计量的概率。 (三)确定P值,做出推断结论 假设检验的基本步骤 1919 (三)确定P值,做出推断结论 n若所得的概率 时,认为现有样本所代表的 总体与已知总体的差别是由抽样误差造成的,不拒 绝 ;若 时,认为从该总体抽到现有样 本的可能性很小,其差别并非是由单纯的抽样误差 造成的,根据小概率事件一次不可能发生的定理, 拒绝 ,接受 。以上为统计推断,还要结合 专业做出专业结论。 n本例, 按 检验水准,不拒绝 ,尚不 能认为山区成年男子的总体脉搏均数高于一般人群 。 假设检验的基本步骤 2020 第二节 t 检验 nt 检验(t-test) ,其理论基础为1908年 W.S.Gosset以笔名“student”发表的 t 分布, 故 t 检验亦称students t-test。 nt 检验适用于: 样本均数与总体均数比较( 未知且 或 ); 成组设计的两小样本均数比较( 均小 于30或50); 配对设计的两样本均数比较。 2121 t 检验 nt 检验的应用条件: 当样本含量较小( 或 )时,要求 样本来自正态分布总体; 用于成组设计的两样本均数比较时,要求两样本来自 总体方差相等的总体。 用于配对设计的两样本均数比较时,要求差值来自正态 分布总体。 n主要包括: 单样本 t 检验 配对 t 检验 两样本 t 检验 2222 1. 单样本 t 检验(one sample t-test) n用于样本均数与已知总体均数(一般为理论值、标 准值或经过大量观察所得的稳定值等)比较。 n研究目的:推断样本所代表的未知总体均数 与 已知总体均数 有无差别。 n计算公式: 2323 对例4.1进行 t 检验 (1)建立假设,确定检验水准 单侧 (2)计算统计量 本例, 次/min, , 次/min, 次/min 单样本 t 检验 2424 (3)确定P 值,做出推断结论 以 ,查附表2 t界值表 ,得单侧 , , , ,按 检验水准不拒绝 ,根据本资 料尚不能认为男性汽车司机的脉搏平均数高于一 般男性脉搏平均数。 对例4.1进行 t 检验 单样本 t 检验 2525 2. 配对 t 检验(paired t-test for dependent samples ) n用于配对设计资料的两均数的比较。 n配对设计类型: 先将受试对象按配比条件配对,然后用随机分组 方法将各对中的2个受试对象分别分配到不同处理组 ; 同一对象分别接受2种不同处理(同一标本、不 同部位); 同一对象处理前后。 n研究目的:推断2种处理的效果有无差别(或) , 推断某种处理有无作用()。 2626 配对 t 检验 n计算公式: n式中, 为差值d 的样本均数; 为 所代表的 未知总体均数,当2种处理的效应相同或某种处理 无作用时 ; 为差值的标准差, 为差 值样本均数的标准误;n为对子数, 为自由度。 2727 例4.3 n例4.3 将20只按体重、月龄及性别配对的 大白鼠随机分入甲、乙2组,甲组给正常饲 料,乙组饲料缺乏维生素E。10天后测定 大白鼠肝脏的维生素A含量(IU/g),结 果如下。问2组大白鼠肝脏维生素A含量是 否有差别? 配对 t 检验 2828 配对 t 检验 2929 例4.3 (1)建立假设,确定检验水准 (2)计算统计量 本例, , , , , 配对 t 检验 3030 (3)确定P值,做出推断结论 以 ,查附表2 t界值表,得 双侧 , , , ,按 检验水 准拒绝 ,接受 ,可认为2组大白鼠肝脏 维生素A含量的差别有统计学意义,维生素E缺乏 组的大白鼠肝脏维生素A含量低于正常饲料组。 例4.3 配对 t 检验 3131 例4.4 有12名志愿受试者服用某减肥药,服药前和服药一 个疗程后各测量一次体重(kg),数据如表4-2所示。试判断 此减肥药是否有效。 配对 t 检验 3232 例4.4 (1)建立假设,确定检验水准 单侧 (2)计算统计量 本例, , , , , 配对 t 检验 3333 (3)确定P值,做出推断结论 以 ,查附表2 t界值表,得 单侧 , , ,按 检验水准不拒绝 ,根据本资 料尚不能认为该减肥药有效。 例4.3 配对 t 检验 3434 3. 两样本 t 检验 (two-sample/group t-test for independent samples ) n用于完全随机设计的两样本均数的比较,两样本 来自于两个总体(如不同的处理方法、 不同 职业、性别等) 。 n研究目的:推断两样本所分别代表的总体均数 是否相等 。 3535 两样本 t 检验 n计算公式: n式中, 为两样本均数差值的标准误, 为 两样本的合并方差, 、 分别为两样本的方差 。 3636 例4.5 n例4.5 将19只雌性大白鼠随机分为2组,分别 饲以高蛋白和低蛋白饲料8周,各鼠体重的增加 克数如下,问不同饲料组大白鼠的增重有无差别 ? 高蛋白组( ): 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白组( ): 70 118 101 85 107 132 94 两样本 t 检验 3737 (1)建立假设,确定检验水准 两样本 t 检验 例4.5 3838 (2)计算统计量 本例 例4.5 两样本 t 检验 3939 (3)确定P值,做出推断结论 以 ,查附表2 t界值表 ,得双侧 , , ,按 检验水准不拒绝 ,可认为两 组雌性大白鼠增重的差别无统计学意义,尚不能 认为两种饲料对雌鼠的增重不同。 例4.5 两样本 t 检验 4040 成组设计的两样本几何均数比较 n在医学研究中,有些资料为对数正态分布资料和倍 数资料,其平均水平宜用几何均数表示。当成组设 计的两样本几何均数比较时,其检验统计量值计算 公式为: 4141 例4.6 n例4.6 将20份钩端螺旋体患者的血清随机 分为2组,分别用标准株和水生株做凝溶试 验,结果见表4-3。试比较两法测得的血清 抗体平均效价有无差别。 成组设计的两样本几何均数比较 4242 成组设计的两样本几何均数比较 4343 例4.6 (1)建立假设,确定检验水准 :两总体几何均数相等 :两总体几何均数不等 (2)计算统计量 本例 成组设计的两样本几何均数比较 4444 例4.6 成组设计的两样本几何均数比较 4545 (3)确定P值,做出推断结论 以 ,查附表2 t界值表 ,得双侧 , , ,按 检验水准 拒绝 ,接受 ,认为两组抗体平均效价的差 别有统计学意义,标准株组高于水生株组。 例4.6 成组设计的两样本几何均数比较 4646 第三节 u 检验 nu 检验(u-test),亦称Z-test。 n适用于:样本均数与总体均数的比较; 成组设计两样本均数的比较。 n应用条件:样本含量n足够大(n50),或n虽小 但 已知时。 n包括: 单样本u检验 两样本u检验 4747 1. 单样本 u 检验(one sample u-test) n用于样本均数与已知总体均数(一般为理论值、标 准值或经过大量观察所得的稳定值等)比较。 n研究目的:推断样本所代表的未知总体均数 与 已知总体均数 有无差别。 n计算公式: 4848 例4.7 n例4.7 一般男性血色素含量的医学参考值为 14.0g()。某研究者从某高原地区人群中随机 抽取120名健康男性,测得其血色素均数 g(),标准差 g()。问该高原地区 健康男性血色素含量是否高于一般男性? 单样本 u 检验 4949 例4.7 (1)建立假设,确定检验水准 单侧 (2)计算统计量 本例, , , , 单样本 u 检验 5050 例4.7 (3)确定P值,做出推断结论 , ,按 检验水准拒绝 ,接受 ,该地健康男性 与一般男性血色素含量的差别有统计学意义, 可认为该高原地区健康男性血色素含量高于一 般男性。 单样本 u 检验 5151 2.两样本 u 检验 (two-sample u-test for independent samples ) n用于完全随机设计的两样本均数的比较,两样本 来自于两个总体。 n研究目的:推断两样本所分别代表的总体均数 是否相等。 n计算公式: 5252 例4.8 n例4.8 某医师欲比较某地工人和农民全血胆碱脂 酶活力,检测工人143名,均数为3.52mol/L ,标准差为0.49mol/L;检测农民156名,均 数为3.36mol/L,标准差为0.53mol/L。问 该地工人与农民全血胆碱脂酶活力有无差别? 两样本 u 检验 5353 例4.8 (1)建立假设,确定检验水准 (2)计算统计量 本例, 两样本 u 检验 5454 例4.8 (3)确定P值,做出推断结论 , ,按 检验水准拒绝 ,接受 ,可认为该地工 人与农民的全血胆碱脂酶活力不同,工人高于 农民。 两样本 u 检验 5555 第四节 正态性检验 n医学统计学中,许多统计方法仅适用于正态分布 或近似正态分布资料。例如,用均数和标准差描 述数值变量资料的分布特征,以及t、u检验和方 差分析时,均要求样本资料服从正态分布。因此 ,选定统计方法时,首先要检验资料是否服从正 态分布。 n正态性检验(test of normality)是推断资料是否 服从正态分布,或样本是否来自正态分布总体的 方法。 5656 n正态分布有2个特征,即对称性(symmetry)和 正态峰(mesokurtosis)。 n当频数分布不对称时为偏态(skewness)。依据 高峰所处的位置,又可分为正偏态和负偏态:高 峰偏左,长尾向右侧延伸的为正偏态;高峰偏右 ,长尾向左侧延伸的为负偏态。在医学研究中, 偏态资料以正偏态居多。 5757 5858 非正态峰又有尖峭峰 (leptokurtosis) 和 平阔峰 (platykurtosis)之分 :峰态尖峭而尾部伸 展,两尾部曲线在正 态曲线之上的为尖峭 峰;峰态平阔而尾部 短促,两尾部曲线在 正态曲线之下的为平 阔峰。 5959 正态性检验方法 n正态性检验的方法有2类(本节仅介绍矩法): 对偏度和峰度分别用一个指标评定,其中矩 法(method of moment)效率较高; 仅用一个指标综合评定,其中W 检验和D 检 验效率较高。 n矩法亦称动差法。它是应用数学上矩的原理检验 偏度和峰度。 为偏度系数(coefficient of skewness), 为峰度系数(coefficient of kurtosis)。 6060 矩法计算公式 n式中, 为变量值, 为相同 的个数,n为样本 含量;对于频数表资料, 为组中值, 为各组段 的频数, 。 6161 n理论上,总体偏度系数 为对称, 为正偏态, 为负偏态;总体峰度系数 为正态峰, 为尖峭峰, 为平阔峰 。 n 和 为统计量,其抽样分布为近似正态分布 ,故在计算其标准误( 和 )后,可通过 u 检验推断资料的正态性。 6262 6363 第五节 两个方差的齐性检验 n两个方差的齐性检验用于推断两样本方差 和 所 分别代表的总体方差 和 是否相等。当 和 分别代表的总体方差相等时称两样本方差齐;反之, 当 和 分别代表的总体方差不等时称两样本方 差不齐。 n两样本的t检验要求两样本来自方差相等的总体,即 方差齐。因此,在两样本t检验时,需先进行两个方 差的齐性检验。 6464 两样本方差齐性检验方法 nF 检验: n式中, 为较大的样本方差, 为较小的样本方 差, 为分子的自由度, 为分母的自由度,n1和 n2分别为相应的样本含量。 6565 例4.9 n例4.9 来自正态分布总体的2个随机样本的血清 IgA(u/ml)测定结果如下,试检验两个方差的齐 性。 肺气肿组: 健康组: 6666 例4.9 (1)建立假设,确定检验水准 (2)计算统计量 (3)确定P值,做出推断结论 以 , 查附表3F界值表得 , ,按 检验 水准不拒绝 ,可认为两总体方差相等,即两 样 本方差齐。 6767 第六节 型错误和型错误 n假设检验利用小概率反证法的思想,根据 样本统计量做出的推断结论具有概率性, 因此其结论有可能出现判断错误,通常可 能发生以下两类错误。 n以单样本t检验为例说明。 6868 6969 型错误 (type error) n型错误 拒绝了实际上成立的 ,即样本来 自 的总体,由于抽样的偶然性,检验统 计量 , ,按 检验水准拒绝 ,接受 ( )。这 类在假设检验中拒绝了原本正确的 的错误为 型错误。理论上犯型错误的概率为 , 值 的大小视研究目的确定。通常设 ,即 允许犯型错误的概率为0.05。 7070 型错误 (type error) n型错误 不拒绝实际上不成立的 ,即样本 来自 的总体,由于抽样的偶然性,检 验统计量 , ,按 检验水准不拒绝 。这类在假设检验中不拒绝 原本不正确的 的错误为型错误。犯型错 误的概率为 ,它只有与特定的 结合起来才 有意义。 7171 7272 n型错误的概率 只取单尾,通常在假设检验时 其大小是未知的,需在已知两总体差值 、总 体标准差 、检验水准 和样本含量n时尚能 算出(详见第10章实验设计概述)。 n通常,当样本含量不变时, 越小, 越大;反 之, 越大, 越小。同时减少 和 的方法 是增加样本含量。 7373 n 称为检验效能或把握度(power of a test),即两总体确有差别时,按 水准能识 别该差别的能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年康复医疗器械市场前景展望:需求升级创新产品驱动行业变革报告
- 2025年特色乡村旅游民宿集群项目投资风险评估报告
- 2025年生态旅游项目可持续发展规划与管理最佳实践报告
- 2025年广播媒体融合发展中的新媒体内容监管与合规报告
- 2025年智能建筑系统集成节能降耗技术路线图深度解析报告
- 2025年工业互联网平台可信执行环境(TEE)在智能制造中的应用研究报告
- 2025年机械制造企业服务化转型对市场策略的影响报告
- 江苏扬州市宝应县公车公司招聘笔试题库带答案详解
- 数据中心合作协议的主要内容
- 解析卷四川绵阳南山中学双语学校7年级数学下册第四章三角形章节练习试题(解析版)
- 运维巡检服务方案
- 河南航空港发展投资集团招聘笔试真题2024
- 微机五防系统培训课件
- 心脏骤停后高质量目标温度管理专家共识2024
- 气道解剖知识
- 教学课件-《燃烧学(第2版)》徐通模
- 《中国心衰指南深度解析》课件
- 农业电力线路改造施工合同
- 选矿厂租赁合同范本
- QC/T 757-2024乘用车列车
- 中小学主题班会-我们为什么要努力学习【课件】
评论
0/150
提交评论