




已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章 数值变量资料的假设检验 1 主要内容 1 假设检验的基本思想和步骤 2 t 检验 3 u 检验 4 正态性检验(自学) 5 两个方差的齐性检验 6 型错误和 型错误 7 假设检验时应注意的事项 2 1 假设检验的基本思想 n 假设检验的目的 n 假设检验的原理 n 假设检验的基本步骤 3 一、假设检验的目的 据大量调查得知,健康成年男子脉搏的均数为 72次 /分,某 医生在山区随机调查了 25名健康成年男子,其脉搏均数为 74.2 次 /分,标准差为 6.5次 /分,能否认为该山区成年男子的脉搏 高于一般健康成年男子? 判断均数差别引起的原因: 一种可能是,样本是从该总体中随机抽取的,其差异仅仅是由 抽样误差造成的; 另一种可能是,样本不是从该总体中随机抽取的,而是有本质 上的不同,单纯用抽样误差解释不了。 4 0 t 分布 一簇曲线 0 N(0,1) n足够大时, (1) (2) (3) 以固定 n 随机抽样 二、假设检验的基本思想 5 当以固定 n 从均数为 的正态分布总体中随机 抽样时, 对于 u 分布,理论上,有 95的 ,有 5的 。 若进 行一次抽样,则有 95的可能 ,而 的可能只有 5。 -1.96 1.96 2.5 % 2.5 % 95% 6 n 对于 t 分布,理论上有 95的 ,有 5的 ;若进行一次抽样时,有 95的可能 ,而 的可能只 有 5。 0-t0.05/2,v t0.05/2,v 2.5% 2.5%95% t 7 三、假设检验的基本步骤 适用于任何类型的变量 n 通过实例说明:据大量调查知,健康成年男子 脉搏的均数为 72次 /分,某医生在山区随机调查了 25名健康成年男子,其脉搏均数为 74.2次 /分,标 准差为 6.5次 /分,能否认为该山区成年男子的脉 搏高于一般健康成年男子? 8 (一 ) 建立假设和确定检验水准 1. 建立假设 : n 检验假设 (常称无效假设或零假设 , null hypothesis, hypothesis under test)用 表示, 假设样本所代表的 总体参数与已知总体参数相等 ( ); n 备择假设 (alternative hypothesis),用 表示,与 是对立且相互联系的假设, 假设样本所代表的总体 参数与已知的总体参数不等 (,或 ,或 72次 /分, 。 假设检验的基本步骤 10 (一 ) 建立假设和确定检验水准 2. 确定单、双侧检验 n 建立假设前,先要根据专业知识和研究目的来确定是 单侧检验还是双侧检验。 n 若从专业知识和研究目的上考虑,未知的总体参数只 能大于 (或只能小于 )已知总体参数时,用单侧检验;若 从专业知识和研究目的上认为,未知的总体参数大于 或小于已知总体参数的两种情况都可能存在时,用双 侧检验。通常用双侧检验。 n 单、双侧检验的区别可从备择假设反映出来:双侧检 验时, ;单侧检验时, 。 假设检验的基本步骤 11 (一 ) 建立假设和确定检验水准 3. 确定检验水准 是判断拒绝或不拒绝无效假设的水准 假设检验的基本步骤 12 (二 )选定检验方法和计算统计量 n 假设检验的方法很多,如 t检验、 u检验、方差分 析、 检验、秩和检验、 ,各检验方法都有其 应用条件。 n 选择时,须根据 研究目的、设计类型、资料类型 及其分布特征等 选用适当的统计检验方法,并计 算出相应的检验统计量。 n 如本例,是样本与总体均数的比较,样本是按完全 随机设计抽取的,是数值变量资料,且样本含量较 小,总体标准差未知,须选用样本均数与总体均数 比较的 t检验。 假设检验的基本步骤 13 n 求出检验统计量后,查相应的统计用表,得出概 率 P值。 n P值是指从 所规定的总体中随机抽样时,获得 等于及大于(负值时为等于及小于)现有样本统 计量的概率。 (三 )确定 P值,做出推断结论 假设检验的基本步骤 14 (三 )确定 P值,做出推断结论 n 若所得的概率 时,认为现有样本所代表的总 体与已知总体的差别是由抽样误差造成的,不拒绝 ;若 时,认为从该总体抽到现有样本的可能 性很小,其差别并非是由单纯的抽样误差造成的, 根据小概率事件一次不可能发生的定理,拒绝 , 接受 。以上为统计推断,还要结合专业做出专 业结论。 n 本例, 按 检验水准,不拒绝 ,尚不能 认为山区成年男子的总体脉搏均数高于一般人群。 假设检验的基本步骤 15 第二节 t 检验 n t 检验 (t-test) ,其理论基础为 1908年 W.S.Gosset 以笔名 “student”发表的 t 分布,故 t 检验亦称 students t-test。 n t 检验适用于: 样本均数与总体均数比较 ( 未知且 或 ); 成组设计的两小样本均数比较 ( 均小于 30或 50); 配对设计的两样本均数比较。 16 t 检验 n t 检验的应用条件: 当样本含量较小( 或 )时,要求 样本来自正态分布总体; 用于成组设计的两样本均数比较时,要求两样 本来自总体方差相等的总体。 n 主要包括: 单样本 t 检验 配对 t 检验 两样本 t 检验 17 1. 单样本 t 检验 (one sample t-test) n 用于 样本均数与已知总体均数 (一般为理论值、标 准值或经过大量观察所得的稳定值等 )比较。 n 研究目的: 推断样本所代表的未知总体均数 与 已知总体均数 有无差别。 n 计算公式: 18 对例 4.1进行 t 检验 (1)建立假设,确定检验水准 单侧 (2)计算统计量 本例, 次 /min, , 次 /min , 次 /min 单样本 t 检验 19 (3)确定 P 值,做出推断结论 以 ,查附表 2 t界值表,得单侧 , , , ,按 检验水准不拒绝 ,根据本资料尚不能认为男 性汽车司机的脉搏平均数高于一般男性脉搏平均 数。 对例 4.1进行 t 检验 单样本 t 检验 20 2. 配对 t 检验 (paired t-test for dependent samples ) n 用于 配对设计资料的两均数的比较。 n 配对设计类型: 先将受试对象按配比条件配对,然后用随机分组 方法将各对中的 2个受试对象分别分配到不同处理组 ; 同一对象分别接受 2种不同处理(同一标本、不同 部位); 同一对象处理前后。 n 研究目的: 推断 2种处理的效果有无差别( 或 ) , 推断某种处理有无作用( )。 21 配对 t 检验 n 计算公式: n 式中, 为差值 d 的样本均数; 为 所代表的未 知总体均数,当 2种处理的效应相同或某种处理无 作用时 ; 为差值的标准差, 为差值样本 均数的标准误; n为对子数, 为自由度。 22 例 4.3 n 例 4.3 将 20只按体重、月龄及性别配对的 大白鼠随机分入甲、乙 2组,甲组给正常饲 料,乙组饲料缺乏维生素 E。 10天后测定大 白鼠肝脏的维生素 A含量( IU/g), 结果如 下。问 2组大白鼠肝脏维生素 A含量是否有 差别? 配对 t 检验 23 配对 t 检验 24 例 4.3 (1)建立假设,确定检验水准 (2)计算统计量 本例, , , , , 配对 t 检验 25 (3)确定 P值,做出推断结论 以 ,查附表 2 t界值表,得双侧 , , , ,按 检验水准拒绝 ,接受 ,可认为 2组大白鼠肝脏维生素 A含量的 差别有统计学意义,维生素 E缺乏组的大白鼠肝脏 维生素 A含量低于正常饲料组。 例 4.3 配对 t 检验 26 例 4.4 有 12名志愿受试者服用某减肥药,服药前和服药一个 疗程后各测量一次体重 (kg), 数据如表 4-2所示。试判断此减 肥药是否有效。 配对 t 检验 27 例 4.4 (1)建立假设,确定检验水准 单侧 (2)计算统计量 本例, , , , , 配对 t 检验 28 (3)确定 P值,做出推断结论 以 ,查附表 2 t界值表,得单侧 , , ,按 检验水准不拒绝 ,根据本资料 尚不能认为 该减肥药有效。 例 4.3 配对 t 检验 29 3. 两样本 t 检验 (two-sample/group t-test for independent samples ) n 用于 完全随机设计的两样本均数的比较,两样本 来自于两个总体(如不同的处理方法、不同 职业、性别等) 。 n 研究目的: 推断两样本所分别代表的总体均数 是否相等 。 30 两样本 t 检验 n 计算公式: n 式中, 为两样本均数差值的标准误, 为两 样本的合并方差, 、 分别为两样本的方差。 31 例 4.5 n 例 4.5 将 19只雌性大白鼠随机分为 2组,分别饲 以高蛋白和低蛋白饲料 8周,各鼠体重的增加克 数如下,问不同饲料组大白鼠的增重有无差别? 高蛋白组( ) : 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白组( ) : 70 118 101 85 107 132 94 两样本 t 检验 32 (1)建立假设,确定检验水准 两样本 t 检验 例 4.5 33 (2)计算统计量 本例 例 4.5 两样本 t 检验 34 (3)确定 P值,做出推断结论 以 ,查附表 2 t界值表,得 双侧 , , ,按 检验水准不拒绝 ,可认为两组雌性大白鼠增重的差别无统计学意 义, 尚不能认为 两种饲料对雌鼠的增重不同。 例 4.5 两样本 t 检验 35 成组设计的两样本几何均数比较 n 在医学研究中,有些资料为 对数正态分布资料和倍 数资料 ,其平均水平宜用几何均数表示。当成组设 计的两样本几何均数比较时,其检验统计量值计算 公式为: 36 例 4.6 n 例 4.6 将 20份钩端螺旋体患者的血清随机分 为 2组,分别用标准株和水生株做凝溶试验, 结果见表 4-3。试比较两法测得的血清抗体平 均效价有无差别。 成组设计的两样本几何均数比较 37 成组设计的两样本几何均数比较 38 例 4.6 (1)建立假设,确定检验水准 :两总体几何均数相等 :两总体几何均数不等 (2)计算统计量 本例 成组设计的两样本几何均数比较 39 例 4.6 成组设计的两样本几何均数比较 40 (3)确定 P值,做出推断结论 以 ,查附表 2 t界值表,得双侧 , , ,按 检 验水准拒绝 ,接受 ,认为两组抗体平均效价 的差别有统计学意义,标准株组高于水生株组。 例 4.6 成组设计的两样本几何均数比较 41 第三节 u 检验 n u 检验( u-test), 亦称 Z-test。 n 适用于: 样本均数与总体均数的比较; 成组设计两样本均数的比较。 n 应用条件: 样本含量 n足够大( n50), 或 n虽小 但 已知时。 n 包括: 单样本 u检验 两样本 u检验 42 1. 单样本 u 检验 (one sample u-test) n 用于 样本均数与已知总体均数 (一般为理论值、标 准值或经过大量观察所得的稳定值等 )比较。 n 研究目的: 推断样本所代表的未知总体均数 与 已知总体均数 有无差别。 n 计算公式: 43 例 4.7 n 例 4.7 一般男性血色素含量的医学参考值为 14.0g()。 某研究者从某高原地区人群中随机抽 取 120名健康男性,测得其血色素均数 g() , 标准差 g()。 问该高原地区健康男性 血色素含量是否高于一般男性? 单样本 u 检验 44 例 4.7 (1)建立假设,确定检验水准 单侧 (2)计算统计量 本例, , , , 单样本 u 检验 45 例 4.7 (3)确定 P值,做出推断结论 , ,按 检验 水准拒绝 ,接受 ,该地健康男性与一般 男性血色素含量的差别有统计学意义,可认为 该高原地区健康男性血色素含量高于一般男性 。 单样本 u 检验 46 2.两样本 u 检验 (two-sample u-test for independent samples ) n 用于 完全随机设计的两样本均数的比较,两样本 来自于两个总体。 n 研究目的: 推断两样本所分别代表的总体均数 是否相等。 n 计算公式: 47 例 4.8 n 例 4.8 某医师欲比较某地工人和农民全血胆碱脂 酶活力,检测工人 143名,均数为 3.52mol/L, 标 准差为 0.49mol/L; 检测农民 156名,均数为 3.36mol/L, 标准差为 0.53mol/L。 问该地工人与 农民全血胆碱脂酶活力有无差别? 两样本 u 检验 48 例 4.8 (1)建立假设,确定检验水准 (2)计算统计量 本例, 两样本 u 检验 49 例 4.8 (3)确定 P值,做出推断结论 , ,按 检验 水准拒绝 ,接受 ,可认为该地工人与农 民的全血胆碱脂酶活力不同,工人高于农民。 两样本 u 检验 50 第四节 正态性检验 n 医学统计学中,许多统计方法仅适用于正态分布 或近似正态分布资料。例如,用均数和标准差描 述数值变量资料的分布特征,以及 t、 u检验和方 差分析时,均要求样本资料服从正态分布。因此 ,选定统计方法时,首先要检验资料是否服从正 态分布。 n 正态性检验 (test of normality)是推断资料是否服从 正态分布,或样本是否来自正态分布总体的方法 。 51 n 正态分布有 2个特征,即 对称性 (symmetry)和 正 态峰 (mesokurtosis)。 n 当频数分布不对称时为偏态 (skewness)。 依据高 峰所处的位置,又可分为正偏态和负偏态:高峰 偏左,长尾向右侧延伸的为 正偏态 ;高峰偏右, 长尾向左侧延伸的为 负偏态 。在医学研究中,偏 态资料以正偏态居多。 52 53 非正态峰又有 尖峭峰 (leptokurtosis) 和平阔 峰 (platykurtosis)之分 :峰态尖峭而尾部伸 展,两尾部曲线在正 态曲线之上的为 尖峭 峰 ;峰态平阔而尾部 短促,两尾部曲线在 正态曲线之下的为 平 阔峰 。 54 正态性检验方法 n 正态性检验的方法有 2类 (本节仅介绍矩法 ): 对偏度和峰度分别用一个指标评定,其中矩法 ( method of moment) 效率较高; 仅用一个指标综合评定,其中 W 检验和 D 检验 效率较高。 n 矩法 亦称动差法。它是应用数学上矩的原理检验 偏度和峰度。 为偏度系数 (coefficient of skewness) , 为峰度系数 (coefficient of kurtosis)。 55 矩法计算公式 n 式中, 为变量值, 为相同 的个数, n为样本含 量;对于频数表资料, 为组中值, 为各组段的 频数, 。 56 n 理论上,总体偏度系数 为对称, 为正 偏态, 为负偏态;总体峰度系数 为正 态峰, 为尖峭峰, 为平阔峰。 n 和 为统计量,其抽样分布为近似正态分布, 故在计算其标准误 ( 和 )后,可通过 u 检验 推断资料的正态性。 57 58 第五节 两个方差的齐性检验 n 两个方差的齐性检验 用于推断两样本方差 和 所分别代表的总体方差 和 是否相等。当 和 分别代表的总体方差相等时称 两样本方差齐 ;反 之,当 和 分别代表的总体方差不等时称 两样 本方差不齐 。 n 两样本的 t检验要求两样本来自方差相等的总体, 即方差齐。因此,在两样本 t检验时,需先进行两 个方差的齐性检验。 59 两样本方差齐性检验方法 n F 检验: n 式中, 为较大的样本方差, 为较小的样本 方差, 为分子的自由度, 为分母的自由度, n1 和 n2分别为相应的样本含量。 60 例 4.9 n 例 4.9 来自正态分布总体的 2个随机样本的血清 IgA( u/ml) 测定结果如下,试检验两个方差的 齐性。 肺气肿组: 健康组: 61 例 4.9 (1)建立假设,确定检验水准 (2)计算统计量 (3)确定 P值,做出推断结论 以 , 查附表 3F界值表得 , ,按 检验 水准不拒绝 ,可认为两总体方差相等,即两样 本方差齐。 62 第六节 型错误和 型错误 n 假设检验利用小概率反证法的思想,根据 样本统计量做出的推断结论具有概率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社区智能养老驿站智慧养老社区服务设施配置与优化报告
- Module 9 Unit 2 Arnwick was a city with a population of 10,000,000. 说课稿 2024-2025学年外研版英语八年级上册
- 2025年三零客户经理面试模拟题及答案
- 2025-2026学年常州市实验初级中学生物高三第一学期期末检测模拟试题
- 2025年自动驾驶汽车智能驾驶系统研发趋势与市场前景分析报告
- 2025年安全员A考试bi备题集及答案
- 2025年宠物水疗AI算法师笔试备考攻略及解析
- 毒蛇咬伤防治
- 1物体在水中是沉还是浮教学设计-2025-2026学年小学科学浙教版2017五年级下册-浙教版
- 第二课 和老师的沟通交流(说课稿)-2025-2026学年龙教版初中心理健康八年级下册
- (完整版)万科物业服务合同2024
- 孩子抵抗力提升的方法与技巧
- 教学副校长给教师培训课件
- 一级建造师之一建矿业工程实务高分复习资料
- 交通信号设施施工技术交底
- 关于股权性质与货币市场的思考
- 市场监管个人纪律作风整顿心得体会
- 育婴员理论模拟考试试题及答案
- 小学数学教师业务水平考试试题
- 安全文明施工措施费支付申请表实用文档
- 杨式85式太极拳现用图解
评论
0/150
提交评论