




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章假设检验 统计推断 随机抽样 参数 统计量 x s p 参数估计假设检验 通过样本统计量推断总体参数之间是否存在差异 其推断过程称为假设检验 教学目的与要求 掌握 假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验二项分布与Poisson分布资料的Z检验假设检验应注意的问题了解 置信区间与假设检验的关系 教学内容提要 重点讲解 假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验Z检验假设检验应注意的问题介绍 置信区间与假设检验的关系 假设检验的基本任务 事先对总体分布或总体参数作出假设 利用样本信息判断原假设是否合理 从而决定是否拒绝或接受原假设 参数检验 parametrictest 若总体分布类型已知 需要对总体的未知参数进行假设检验 非参数检验 若总体分布类型未知 需要对未知分布函数的总体的分布类型或其中的某些未知参数进行假设检验 假设检验 hypothesistest 的基本思想 亦称显著性检验 significancetest 是先对总体的特征 如总体的参数或分布 位置 提出某种假设 如假设总体均数 或总体率 为一定值 总体均数 或总体率 相等 总体服从某种分布 两总体分布位置相同等等 然后根据随机样本提供的信息 运用 小概率原理 推断假设是否成立 概率很小 接近于零 的事件在一次抽样中不太可能出现 故可以认为小概率事件在一次随机抽样中是不会发生的 小概率原理 例如在2000粒中药丸中只有一粒是虫蛀过的 现从中随机取一粒 则取得 虫蛀过的药丸 的概率是1 2000 这个概率是很小的 因此也可以将这一事件看作在一次抽样中是不会发生的 若从中随机抽取一粒 恰好是虫蛀过的 这种情况发生了 我们自然可以认为 假设 有问题 即虫蛀率p不是1 2000 从而否定了假设 否定假设的依据就是小概率事件原理 由此我们得到一个推理方法 如果在某假设 记为H0 成立的条件下 事件A是一个小概率事件 现在只进行一次试验 事件A就发生了 我们就认为原来的假设 H0 是不成立的 例如 根据大量调查 已知正常成年男性平均脉搏数为72次 分 现随机抽查了20名肝阳上亢成年男性病人 其平均脉搏为84次 分 标准差为6 4次 分 问肝阳上亢男病人的平均脉搏数是否较正常人快 以上两个均数不等有两种可能 第一 由于抽样误差所致 第二 由于肝阳上亢的影响 例如 已知正常成年男子脉搏平均为72次 分 现随机检查20名慢性胃炎所致脾虚男病人 其脉搏均数为75次 分 标准差为6 4次 分 问此类脾虚男病人的脉搏快于健康成年男子的脉搏 抽样误差 脾虚 假设检验 1 原因2 目的3 原理4 过程 步骤 5 结果 第一节假设检验原理 某事发生了 是由于碰巧 还是由于必然的原因 统计学家运用显著性检验来处理这类问题 1 假设检验的原因 由于总体不同或因个体差异的存在 在研究中进行随机抽样获得的样本均数 x1 x2 x3 x4 不同 样本均数不同有两种 而且只有两种 可能 1 分别所代表的总体均数相同 由于抽样误差造成了样本均数的差别 差别无显著性 差别无统计学意义 2 分别所代表的总体均数不同 差别有显著性 差别有统计学意义 2 假设检验的目的判断是由于何种原因造成的不同 以做出决策 反证法 当一件事情的发生只有两种可能A和B 为了肯定其中的一种情况A 但又不能直接证实A 这时否定另一种可能B 则间接的肯定了A 概率论 小概率 如果一件事情发生的概率很小 那么在进行一次试验时 我们说这个事件是 不会发生的 从一般的常识可知 这句话在大多数情况下是正确的 但是它一定有犯错误的时候 因为概率再小也是有可能发生的 3 假设检验的原理 4 假设检验的步骤 建立假设 反证法 确定显著性水平 计算统计量 u t 2 确定概率P值 做出推论 例5 1 已知正常成年男子脉搏平均为72次 分 现随机检查20名慢性胃炎所致脾虚男病人 其脉搏均数为75次 分 标准差为6 4次 分 推断此类脾虚男病人的脉搏是否不同于健康成年男子的脉搏 1 建立假设 选定检验水准 假设两种 一种是检验假设 假设差异完全由抽样误差造成 常称无效假设 用H0表示 另一种是和H0相对立的备择假设 用H1表示 假设检验是针对H0进行的 确定双侧或单侧检验 H0 此类脾虚病对脉搏数无影响 H0 72次 分H1 脾虚病人的脉搏数不同于正常人 H1 72次 分 选定检验水准 0 05 是在统计推断时 预先设定的一个小概率值 是当H0为真时 允许错误地拒绝H0的概率 双侧与单侧检验界值比较 2 选定适当的检验方法 计算检验统计量值 t检验Z检验 设计类型资料的类型和分布统计推断的目的n的大小如完全随机设计实验中 已知样本均数与总体均数比较 n又不大 可用t检验 计算统计量t值 3 计算P值 P值 是在H0成立时 取得大于或等于现有检验统计量值的概率 3 计算概率值 P 将计算得到的Z值或t值与查表得到Z 或t 比较 得到P值的大小 根据u分布和t分布我们知道 如果 Z Z 或 t t 则P 当P 时 统计学结论为按所取 检验水准拒绝H0 接受H1 称 差异有显著性 差异有统计学意义 当P 时 没有理由怀疑H0的真实性 统计学结论为按所取 检验水准不拒绝H0 称 差异无显著性 差异无统计学意义 4 作出推断结论 与P异同 相同 与P都是用检验统计量分布的尾部面积大小表示 不同 是在统计推断时 预先设定的一个小概率值 是当H0为真时 允许错误地拒绝H0的概率 是检验水准 P值是由实际样本决定的 是指从由H0所规定的总体中随机抽样 获得大于及等于 或小于 现有样本检验统计量值的概率 5 两类错误 I型错误与 型错误 统计推断可能出现的4种结果 I型错误 推断正确 1 推断正确 1 型错误 假阳性错误 假阴性错误 检验效能 把握度 可信度 无效假设 H0 备择假设 H1 两类错误 型错误与 型错误 型错误 H0原本是正确的拒绝H0弃真假阳性错误误诊用 表示 型错误 H0原本是错误的不拒绝H0存伪假阴性错误漏诊用 表示 两均数的假设检验 样本均数与总体均数的比较成对资料均数的t检验成组资料两样本均数的比较方差不齐时两小样本均数的比较 第二节单样本正态资料的假设检验 不 满足 不 满足 满足 满足 已知 正态性 非参数 检验 变量替换 结论 不 满足 大样本 u 检验 t 检验 满足 z 思路 一 正态总体均数的假设检验 方法 1 大样本 例5 2 一般女性平均身高160 1cm 某大学随机抽取100名女大学生 测量其身高 身高的均数是163 74cm 标准差是3 80cm 请问某大学18岁女大学生身高是否与一般女性不同 目的 比较样本均数所代表的未知总体均数与已知总体均数有无差别 计算公式 z统计量 适用条件 1 已知一个总体均数 2 可得到一个样本均数 3 可得到该样本标准误 4 样本量不小于100 假设检验 建立假设 确定显著性水平 检验假设 某校女大学生身高均数与一般女子身高均数相同 H0 0 备择假设 某校女大学生身高均数与一般女子身高均数不同 H1 0 0 05 做出推论 Z 9 58 1 96 p 0 05 小概率事件发生了 原H0假设不成立 拒绝H0 接受H1 可认为 某校女大学生身高均数与一般女子身高均数不同 某校女大学生身高均数与一般女子身高均数差别有显著性 计算统计量 Z统计量 Z 确定概率值 Z 9 58Z 1 96 Z Z p 0 05 2 小样本 例5 3 已知中学一般男生的心率平均为74次 分钟 为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同 在某地区中学生中随机抽取常年参加体育锻炼的男生16名 测量他们的心率 结果均数为65 63次 分 标准差为7 2次 分 目的 比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别 计算公式 t统计量 t 自由度 n 1 适用条件 1 已知一个总体均数 2 可得到一个样本均数及该样本标准误 3 样本量小于100 4 样本来自正态或近似正态总体 假设检验 建立假设 确定显著性水平 检验假设 常参加体育锻炼的中学男生的心率与一般中学生相等 H0 0 备择假设 常参加体育锻炼的中学男生的心率与一般中学生不同 H1 0 0 05 计算统计量 t 4 65 确定概率值 n 16 自由度 n 1 15 t0 05 15 2 131t t0 05 15 p 0 05 做出推论 p 0 05 小概率事件发生了 原假设不成立 拒绝H0 接受H1 可认为 常参加体育锻炼的中学男生的心率与一般中学生不同 常参加体育锻炼的中学男生的心率比一般中学生心率慢 常参加体育锻炼的中学男生的心率与一般中学生差别有显著性 二 正态总体方差的假设检验 正态总体方差 2的检验 如表5 3所示 例5 4 某药含碳量服从正态分布 生产时允许方差在0 0482 mg2 内 现任取5件 测得含碳量 mg 为 1 32 1 55 1 36 1 40 1 44 根据 0 05判断该药生产是否稳定 H0 0 0482 H1 0 0482 0 05n 5 1 414 S 0 0882 df n 1 4 查统计用表6得单侧概率P 0 01 以 0 01 水准的单侧检验拒绝H0 接受H1 检验有统计学意义 可认为该药生产不稳定 第三节两样本正态资料的假设检验 1 配对样本资料 或称为相关资料 的假设检验2 两组独立样本 成组 资料的方差齐性检验3 两组独立样本比较的t检验 一 配对样本资料的t检验 什么是配对设计资料 将可能影响指标的一些特征相同或近似的两个个体配成一对 然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理 对处理的结果进行分析 有哪几种形式 配对比较主要有四种情况 同一对象处理前后的数据同一对象两个部位的数据同一对象分别接受两种不同处理的数据两个同质的对象分别接受两种处理后的数据 1 目的 通过对两组配对资料的比较 判断不同的处理效果是否有差别 或某种治疗方法是否起作用 2 基本原理 假设两种处理方法的效果相同 1 2 即 1 2 0 计算出两组资料各对的差值d 这时 检验两个总体均值是否相等 转化为检验差值d的总体均值是否为零 即检验假设H0 d 0 3 公式 t 自由度 对子数 14 适用条件 配对资料 对子差值满足正态性 例5 5 为考察一种新型透析疗法的效果 随机抽取了10名病人测量透析前后的血中尿素氮含量如下表 请根据本实验资料对此疗法进行评价 d13 413 49 99 46 910 025 210 312 911 6 H0 d 0H1 d 0 单侧检验 确定显著性水平 0 05 计算统计量 t 7 826 确定概率 10 1 9 查表t0 05 9 1 833t 7 826 t0 05 9 p 0 05 判断结果 因为p 0 05 故拒绝检验假设H0 10名病人透析前后血中尿素氮含量差异有显著性 即透析可以降低血中尿素氮含量 例5 6 为研究三棱莪术液的抑瘤效果 将20只小白鼠配成10对 将每对中的两只小白鼠随机分到实验组和对照组中 两组都接种肿瘤 实验组在接种肿瘤三天后注射30 的三棱莪术液0 5mL 对照组则注射蒸馏水0 5mL 结果见表5 4 比较两组瘤体大小是否相同 单侧检验 二 成组资料两样本均数的比较 思路 小样本 大样本 先进行F检验 再作Z检验 1 成组资料的方差齐性检验 成组t检验的前提条件是两总体方差齐 两总体方差相等称为方差齐性 两总体方差不等称为方差不齐 检验两组资料的方差是否齐性 以决定采用适宜的检验统计量 方差齐性检验假设 查F界值表 附表8 确定P大小 作推论 例5 9 研究功能性子宫出血症实热组与虚寒组的免疫功能 测定淋巴细胞转化值如表5 5所示 设两组的淋巴细胞转化值都服从正态分布 判断两组的总体方差是否不等 2 成组资料的t检验 例5 11 干燥芜菁叶含钙量服从正态分布 用两种方法各10次测定含钙量 g 100g 测定值均数分别为 2 2150 g 100g 2 2651 g 100g 标准差分别为S1 0 1284 g 100g S2 0 0611 g 100g 第1种方法测定的含钙量是否低于第2种方法 例5 12 某地检查正常成年人的血液红细胞数 样本容量 均数 标准差分别为 男子组156名 465 13万 mm3 54 80万 mm3 女子组74 名 422 16万 mm3 49 20万 mm3 若该地正常成年男女血液红细胞数均服从正态分布 判断其红细胞平均数是否与性别有关 第四节二项分布与Poisson分布资料的Z检验 一 二项分布资料的Z检验 1 单组资料的Z检验2 成组资料的Z检验 1 单组资料的Z检验如果二项分布的 或 1 均不太小 则当n足够大时 二项分布接近正态分布 故二项分布资料的样本率与总体率比较可用z检验 Z X n 0 5 6 式中X为阳性频数 0为已知总体率 n为样本含量 若不用绝对数表示 改用率表示时 将上式的分子 分母同时除以n Z p 0 5 7 n不大时 用连续性校正式 Z p 0 0 5 n 5 8 例5 13 根据以往经验 一般胃溃疡病患者有20 发生胃出血症状 现观察65岁以上胃溃疡病人304例 有96例发生胃出血症状 推断老年胃溃疡患者是否比较容易出血 H0 20 即老年患者胃出血率与一般患者相同 H1 20 样本出血率 96 304 31 58 按公式 5 7 Z 0 3158 0 20 5 0471Z 单侧界值Z0 01 2 33 P 0 01 按 0 01水准拒绝H0 接受H1 可认为老年胃溃疡病患者较一般患者容易发生胃出血 2 成组资料的Z检验 n1与n2均大于50时 两样本率p1 X1 n1 p2 X2 n2比较Z p1 p2 5 11 两样本率的合并标准误为 5 10 合并样本率pc的计算公式为 pc 5 9 若两个样本率均有p与 1 p 大于1 且np与n 1 p 均大于5 则两样本率的比较亦可用Z检验 例5 14 用某中草药治疗慢性支气管炎患者 其中吸烟组治疗86人 显效35人 不吸烟组治疗107人 显效82人 推断吸烟与不吸烟组显效率是否相同 H0 1 2 H1 1 2 0 05p1 X1 n1 35 86 0 4070 p2 X2 n2 82 107 0 7664 pc 0 6062 0 0717Z 0 4070 0 7664 0 0717 5 0119因 Z 2 58 P 0 01 按 0 05水准拒绝H0 接受H1 可认为用该中药治疗慢性气管炎不吸烟组的显效率高于吸烟组 二 Poisson分布资料的Z检验 单组资料的Z检验成组资料的Z检验 1 单组资料的Z检验 当Poisson分布的均数 20时 Poisson分布近似正态分布 样本阳性频数X与已知总体平均数 0比较可用正态近似Z检验 检验统计量为Z X 0 5 12 例5 15 一般认为全国食管癌死亡率为28 10万 某省1990年死亡回顾调查10万人 食管癌死亡人数22人 该地食管癌死亡率水平是否与全国相同 2 成组资料的Z检验 当两总体均数的估计值均大于20时 可用正态近似作两样本均数比较的Z检验 根据两样本的观察单位数是否相等 分为两种情况计算 当两样本n1 n2时 Z值计算公式为Z X1 X2 5 13 当两样本n1 n2时 由样本均数计算Z值Z 1 2 5 14 例题 例5 15 用艾叶苍术烟雾对室内空气进行消毒 在室内设6个地点 每点消毒前后各放置一平皿 时间及空间相同 培养葡萄球菌个数消毒前分别为22 27 23 29 20 23 消毒后分别为12 8 15 19 10 12 比较消毒前后效果有无差别 例5 17 某制药车间在改革工艺前 测取3次 每升空气中分别有38 29 36颗粉尘 改进工艺后 测取2次 分别有25 18颗粉尘 推断工艺改革前后粉尘数有无差别 1 正确理解假设检验的结论 概率性 假设检验的结论是根据概率推断的 所以不是绝对正确的 当p 不能拒绝H0 不能接受H1 按不能接受H1下结论 也可能犯错误 第五节假设检验应注意的问题 1 当拒绝H0时 可能犯错误 可能拒绝了实际上成立的H0 称为 类错误 弃真 的错误 其概
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东女子职业技术学院《微生物学(含实验)》2023-2024学年第二学期期末试卷
- 山西电力职业技术学院《汉俄翻译》2023-2024学年第二学期期末试卷
- 北海康养职业学院《财务管理案例分析》2023-2024学年第二学期期末试卷
- 云南水利水电职业学院《数据挖掘基础》2023-2024学年第二学期期末试卷
- 山东财经大学燕山学院《播音主持作品赏析与研究》2023-2024学年第二学期期末试卷
- 杭州电子科技大学信息工程学院《运动疗法技术学》2023-2024学年第二学期期末试卷
- 钟山职业技术学院《Java程序设计基础》2023-2024学年第二学期期末试卷
- 贵州护理职业技术学院《粉末冶金材料原理》2023-2024学年第二学期期末试卷
- 动物世界美术课件
- 2024年工业缝制机械项目投资申请报告代可行性研究报告
- JJF 1343-2022 标准物质的定值及均匀性、稳定性评估
- 水文学习题和答案解析
- 高效课堂新授课评价量化表
- 信和SDS2MS使用说明书
- 维修手册震旦218现场
- 画法几何与阴影透视复习题(DOC)
- 螺旋密封的设计及在流体机械中的应用
- 青岛市失业人员登记表
- 《中国好声音》全国校园海选招商方案(冠名)
- 广西安全文明施工费使用管理细则桂建质新版
- 存货质押贷款业务管理规定
评论
0/150
提交评论