




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
均数的假设检验 例题 例7-17 一般认为:健康成年男 子的脉搏为72次/分钟。现调查 某山区25名健康成年男子的脉 搏,得均数74.2次/分钟,是否 说明某山区健康成年男子的脉 搏高于一般人? 均数的假设检验 (hypothesis test of mean) 判断样本均数与总体均数之间 或样本均数与样本均数之间的差别 在统计上有无显著性意义,即这种 差别是来自于抽样误差还是本质上 存在的方法称为均数的假设检验。 常用的检验方法有:t检验、u检验 和F检验等。 妈妈:小明,去买些火柴来,要好 用的! 小明:好的! 小明到了小卖部,买了火柴 ,并一一试验,然后回家了。 妈妈:小明你买的火柴怎么样啊! 小明:挺好用的,我一根一根都试 过了,都能着! (一)假设检验的意义假设检验的 基本步骤 产生差异的原因: 1. 抽样误差 2. 来自不同的总体 假设检验的基本步骤 1、建立假设,确定单侧检验或是双侧检验 H0:无效假设(零假设),差别由抽样误差引起。 H1:备择假设,差别是本质上存在的。 2、确定检验水准(显著性水准),指进行假设检 验发生假阳性的概率,多取0.05。 3、根据资料性质及类型,计算样本检验统计量,如 计算t、u、x2等统计量。 4、根据样本检验统计量,确定概率P。 5、做出推断结论:以检验水准判断H0是否成立, 结合专业知识做出结论。 (二)均数的t检验 1、样本均数与总体均数的比较 (t检验或u检验) 2、配对资料的比较(t检验) 3、两个样本均数的比较 (t检验或u检验) 1 1、样本均数与总体均数的比较、样本均数与总体均数的比较 样本均数与已知总体均数样本均数与已知总体均数( (理理 论值、标准值或经过大量观察所得论值、标准值或经过大量观察所得 的稳定值的稳定值) )的比较,其的比较,其目的是目的是推断推断 样本所代表的未知总体均数样本所代表的未知总体均数 与已与已 知总体均数知总体均数 有无差别。有无差别。 例题 例7-17 一般认为:健康成年男子的 脉搏为72次/分钟。现调查某山区 25名健康成年男子的脉搏,得均 数74.2次/分钟,标准差为6.5次/ 分钟,是否说明某山区健康成年 男子的脉搏高于一般人? 样本均数与总体均数的比较(计算公式) (1). t检验 适用条件:未知,且n较小 计算公式: (2). u检验 适用条件:已知或未知,但n足够大 (n100) 计算公式: 若 n 较大,则 ,可按算得 的t值用v=查t界值表(t即为u)得P值。 实 例 算得的统计量u值与P值 和统计推断结论 0.05 u值 p值 统计推断结论 双侧检验 0.05 不拒绝H0 , 单侧检验 0.05 不拒绝H0 , 单侧检验 ,按按水准,不拒绝水准,不拒绝 H H0 0 ,无统计无统计 学意义,尚不能认为学意义,尚不能认为不同或不等。不同或不等。 统计结论只说明有统计学意义或无统计统计结论只说明有统计学意义或无统计 学意义,而不能说明专业上的差异大小。应学意义,而不能说明专业上的差异大小。应 注意统计学意义与专业意义的区别。注意统计学意义与专业意义的区别。 2、配对设计资料的比较 配对设计的类型 1、异源配对:两个受试对象配成对子,接受不同 处理,目的是推断两种处理效果有无差别; 2、同源配对(自身配对) 、同一受试对象处理前后的比较,目的是推 断这种处理有无作用; 、同一受试对象两个部位,接受相同处理, 目的是推断该项处理在两个部位有无差别; 、采自同一受试对象的一个样品分为两份, 接受不同处理,目的是推断两种处理效果有无 差别。 配对资料的比较(t检验) 例7-18 手术前后舒张压变化情况 表7-7 手术前后舒张压变化情况 患者编编号舒张压张压 ((kPa) 手术术前手术术后 116.012.0 212.013.3 314.610.6 413.312.0 512.012.0 612.010.6 714.610.6 814.614.6 912.012.7 1012.313.3 例7-18 手术前后舒张压变化情况 3、两样本均数的比较 完全随机设计完全随机设计( (completely completely random design) random design) :把受试对象完全把受试对象完全 随机分为两组,分别给予不同处理,随机分为两组,分别给予不同处理, 然后比较独立的两组样本均数。各组然后比较独立的两组样本均数。各组 对象数不必严格相同。对象数不必严格相同。 目的目的: :比较两个总体均数是否相比较两个总体均数是否相 同。同。 条件条件:假定资料来自正态总体,:假定资料来自正态总体, 且且 1 1 2 2= = 2 2 2 2 两个样本均数比较的计算公式 (1). t检验 适用条件:两个小样本比较,且两样本方差齐同。 计算公式: (2). u检验 适用条件:两个大样本(n1和n2均50)比较。 计算公式: 实 例 (三)两大样本均数比较的u 检验 两样本均数比较时,当每组样本量两样本均数比较时,当每组样本量 大于大于5050时,可以采用时,可以采用 u u 检验;但只是近似检验;但只是近似 方法。方法。 优点:简单,优点:简单, u u 界值与自由度无关,界值与自由度无关, u u 0.050.05 1.961.96, u u 0.010.01 2.582.58 例7-20 某地对40-50岁年龄组的男、女不同性别的健康人群随机测定了脂蛋白 ,其中男性193人,得均数3.97g/L,标准差为1.04g/L,女性128人,得均数为 3.58g/L,标准差为0.90g/L,问该人群男女不同性别的脂蛋白有无差别? 1.建立假设、确定检验水准。 H0: 即该地40-50岁人群的脂蛋白男女之间无差别 H1: 即该地40-50岁人群的脂蛋白男女之间有差别 =0.05 计算统计量u值: 本例:n=193,x =3.97g/L,s=1.04g/L,n=128,x=3.58g/L,s=0.90g/L .代 入公式: 确定值:查界值表最后一行, u u0.050.051.961.96 , , u u0.010.012.582.58,现,现u u u0.05,u0.05,故故 推断结论:推断结论:按按=0.05=0.05水准,拒绝水准,拒绝H0H0,接受,接受 H H ,差别有统计学意义,故可认为,差别有统计学意义,故可认为 该地正常人群该地正常人群不同性别的脂蛋白有差别,男性,男性脂蛋白含量高于女性高于女性 (四)假设检验中的两类错误假设检验中的两类错误 假设检验必须对所检验的假设作出明确的判断。假设检验必须对所检验的假设作出明确的判断。 从从“拒绝拒绝”或或“不拒绝不拒绝”中选择一个较为合理的决定中选择一个较为合理的决定 ,因此,因此,假设检验结论具有概率性假设检验结论具有概率性。不论结论是拒绝。不论结论是拒绝 或者不拒绝或者不拒绝H H 0 0 ,都可能犯都可能犯型错误或者型错误或者型错误。型错误。 当当 P P ,结论为按所规定的检验水准结论为按所规定的检验水准,拒绝拒绝 H H0 0 ,接受接受 H H1 1 。因为现有样本信息不支持因为现有样本信息不支持 H H0 0 成立成立,故拒绝,故拒绝 H H0 0 。显然,拒绝显然,拒绝 H H0 0 ,不能认为不能认为 H H0 0 肯定不成立,有可能犯肯定不成立,有可能犯 型错误。型错误。 相反,如果相反,如果 P P ,即样本信息支持即样本信息支持 H H0 0 成立成立,故不拒,故不拒 绝绝 H H0 0 。同样,不拒绝同样,不拒绝 H H0 0 ,也不能认为也不能认为 H H0 0 肯定成立,有可肯定成立,有可 能犯能犯型错误。型错误。 I型错误与II型错误示意图(以单侧t检验为例) 型错误和型错误 由样本推断的结果 真实结果 拒绝H0 不拒绝H0 H0成立 型错误 a 推断正确(1a ) H0不成立 推断正确(1b) 型错误b (1b)即把握度(power of a test):两总体 确有差别,被检出有差别的能力 (1a)即可信度(confidence level):重复 抽样时,样本区间包含总体参数(m)的百分数 减少(增加)I型错误,将会 增加(减少)II型错误 增大n 同时降低 与 与 间的关系 第一类错误 (type error) 第一类错误又称型错误,是 指无效假设H0实际上是成立的,但 由于抽样误差的偶然性,而得到了较 大的t 值(单侧t 检验为例),使观 察者按照原来的检验水准拒绝了H0 所犯的错误(假阳性错误即“弃真” 错误)。型错误的概率用表示, 其大小根据研究者的要求来确定,常 取0.05。 第二类错误 (type error) 第二类错误又称型错误,是 指无效假设H0实际上是不成立的, 但由于抽样误差的偶然性,而得到了 较小的t 值(单侧t 检验为例),使 观察者按照原来的检验水准接受了 H0所犯的错误(假阴性错误即“存伪 ”错误)。型错误的概率用表示 ,其大小很难确切估计。 两类错误的关系 1、假设检验中,不可能同时犯两类错 误。拒绝H0,只可能犯型错误,不可能犯 型错误;不拒绝H0,只可能犯型错误, 不可能犯型错误。 2、通常当n固定时, 愈小,愈大; 反之愈大,愈小。 3、实际工作中,可根据研究要求适当 控制和。若重点在于减少,一般取 =0.01;若重点在于减少 ,一般取 =0.05。若要同时减小型错误以及型 错误,唯一的方法是增加样本含量n。 假设检验时的两类错误 假设检验的结果判断 假设检验 客观实际情况 H0成立 H0不成立 拒绝H0 犯第一类错误() 推断正确(1) 接受H0 推断正确(1) 犯第二类错误() 注:,假阳性,以新药疗效为例,会将疗效依旧的一种新药奉为 高明的创新而投入生产,无故废弃常规药(在诊断试验中,称 为误诊率); ,假阴性,将会埋没效果较好的新药,使其得不到投产利用 (在诊断试验中,称为漏诊率); 1,可信度,两总体确无差别,按水准作出无差别推断的 概率,即真阴性率(诊断试验中称特异度); 1,把握度,又称检验效能,两总体确有差别,按水准作 出有差别推断的概率,即真阳性率(诊断试验中称敏感度)。 (五)、假设检验的注意事项 n1、 要有严密的抽样设计 n这是假设检验的前提,同质总体中随 机抽取的,组间要具有均衡性和可比 性(即除了要比较的因素外,其它可 能影响结果的因素如年龄、性别、病 情轻重、病程等在对比的组间应尽可 能相同或相近) 2、用的检验方法必须符合 其适用条件 n应根据分析目的、设计类型、资料类 型、样本含量大小等选用适当的检验 方法。 1)、t 检验理论上要求样本来 自正态分布总体。资料的正态性可用 正态性检验加以分析。 (1)配对t检验(配对设计的计量资料) (2)两独立样本t 检验(完全随机设计 的计量资料) nt检验(n1,n2较小且12=22) 2)u 检验(已知或未知但n较大) 如 n50或n100 单样本u 检验 或 两独立样本u 检验 3、正确理解差别有无显著性的 统计学意义 统计推断应包括统计结论和专业结论 两部分。统计结论只说明有统计学意义 (statistical significance) 或无统计学 意义,而不能说明专业上的差异大小。只有 将统计结论和专业知识有机地相结合,才能 得出恰如其分的专业结论。 n4、假设检验的结论不能绝对化 n因为是否拒绝H0,决定于被研究事物有无本 质差异和抽样误差的大小,以及选用检验 水准的高低。 n报告结论时应列出通过样本算得的统计量 ,注明采用的是单侧检验或双侧检验,并 写出P值的确切范围,如:0.01B),此时,备择假设成 立时只有一种可能(另一种可能已事先 被排除了),这就是单侧检验。 n备注:单侧检验和双侧检验中计算统计 量t的过程是一样的,但确定概率时的 临界值是不同的。 复习思考题 n1、假设检验的基本步骤 n2、如何理解差别有无统计学意义 n3、为什么假设检验的推断结论不能绝对化 进行假设检验应注意的问题 1、 严格实验设计,保证被比较的资料具有可比性; 2、 没有意义或没有实用价值的结果不进行假设检验; 3、对差别有无显著性意义的判断不能绝对化,显著性 界限是人为规定的界限,统计结论是有概率性的; 4、 统计上显著性水平的高低不代表实际差别的大小; 5、t检验适用于正态分布的资料,若对数正态分布的 资料,应将变量值变换成对数,在对数条件下作t检 验; 6、两小样本均数差异的t检验,事先应进行方差齐性检验 ,方差齐同时,作t检验;方差不齐时,作t检验; 7、根据资料性质和专业知识,选择双侧检验还是单侧 检验; 8、报告结论时,应列出样本检验统计量和确切的概率。 数值变量资料常用统计分析方法一览表数值变量资料常用统计分析方法一览表 名 称 统计统计 符号 主 要 应应 用 均 数 或 反映计计量正态资态资 料的集中趋势趋势 标标准差 s 或 反映计计量正态资态资 料的离散趋势趋势 均数标标准差 s 制定计计量正态资态资 料的参考值值或正常值值范 围围 t 检验检验 t 计计量配对资对资 料研究;样样本均数 与总总体均数比较较;两个小样样本 均数比 较较; 数值变量资料常用统计分析方法一览表数值变量资料常用统计分析方法一览表 数值变量资料常用统计分析方法一览表数值变量资料常用统计分析方法一览表( (续续 1 1 ) ) 名 称 统计统计 符号 主 要 应应 用 u 检验检验 u 两大样样本均数比较较 方差分析 F 多个样样本均数比较较; 因素间间交互作用研究;回归归 方程的线线性假设检验设检验 等 表达假设检验的结果时,最好同时 给出以下信息: 选用的统计分析方法; 统计量的具体取值及其自由度; 假设检验的确切 P 值; 有关总体参数的 95%置信区间。 表达假设检验的结果时,应给出的信息 1. 1. 选用统计指标来描述平均水平和离散趋势选用统计指标来描述平均水平和离散趋势 时时, , 使用正态分布方法表达呈偏态分布的使用正态分布方法表达呈偏态分布的 资料资料(见例见例1 1、例、例2 2) 2. 2. 忽视忽视 t t 检验的使用条件,在多组均数比较检验的使用条件,在多组均数比较 中,用中,用 t t 检验代替方差分析检验代替方差分析(见例见例3 3) 数值变量资料数据处理及分析中 常见差错的类型 【例 1】原先的资料表达形式(见下表) 表 两组症状总积分比较( s) 组组 别别 症状总积总积 分 试试 验验 组组 0.931.02 对对 照 组组 1.851.89 有些资料中的标准差比均数 还大,这样的资料不服从正态分 布,而是服从偏态分布。在选用 统计指标来描述资料的平均水平 和离散趋势时,主要应根据资料 的分布类型来选择合适的统计指 标。 对于正态或近似正态分 布的资料,常使用均数和标 准差来描述;对于偏态分布 资料则应使用中位数和四分 位数间距来描述。 【例2】某人观察了某
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安徽机电职业技术学院高层次人才引进15人考前自测高频考点模拟试题及一套完整答案详解
- 2025年合肥市口腔医院引进高层次人才10人模拟试卷附答案详解(模拟题)
- 2025国家三门峡黄河明珠(集团)有限公司招聘高校毕业生8人模拟试卷及答案详解(典优)
- 广清区域质量安全培训课件
- 2025安徽芜湖前湾集团有限公司选聘2名模拟试卷参考答案详解
- 安全培训教室布置课件
- 2025年钢包精炼成套设备项目建议书
- 安全培训教学计划表课件
- 2025年穿水冷却装置合作协议书
- 安全培训教学开场白课件
- DZ∕T 0283-2015 地面沉降调查与监测规范(正式版)
- 人事专员简历模板
- 围手术期安全管理
- 幼儿园食堂6T培训
- 《人类简史》读书分享交流
- 核对考勤工作总结
- 供应商质量管理工程师SQE培训材料课件
- 小孩子受伤调解协议书
- 公务员考试的数学备考指导
- 2024年纺织服装培训资料
- 业务回款冲刺方案
评论
0/150
提交评论