已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章假设检验 6 1假设检验的基本问题6 2大样本情形下的总体均值检验6 3小样本情形下的总体均值检验6 3总体比例的检验 学习目标 假设检验的基本思想和原理假设检验的步骤总体均值的检验总体比例的检验 6 1假设检验的基本问题 原假设与备择假设拒绝域和检验统计量两类错误和显著性水平单侧检验与双侧检验 什么是假设检验 什么是假设 hypothesis 对总体参数的具体数值所作的陈述总体参数包括总体均值 比例 方差等分析之前必需陈述 我认为这种新药的疗效比原有的药物更有效 什么是假设检验 hypothesistest 先对总体的参数提出某种假设 然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法 统计上依据小概率原理 区间估计是用给定的大概率推断出总体参数的范围 而假设检验是以小概率为标准 对总体的状况所做出的假设进行判断 假设检验与区间估计结合起来 构成完整的统计推断内容 假设检验与区间估计的差别主要在于 假设检验的基本思想 因此我们拒绝假设 50 样本均值 m 50 抽样分布 H0 假设检验的过程 例1 消费者协会接到消费者投诉 指控品牌纸包装饮料存在容量不足 有欺骗消费者之嫌 包装上标明的容量为250毫升 消费者协会从市场上随机抽取50盒该品牌纸包装饮品 测试发现平均含量为248毫升 小于250毫升 这是生产中正常的波动 还是厂商的有意行为 消费者协会能否根据该样本数据 判定饮料厂商欺骗了消费者呢 消费者协会实际要进行的是一项统计检验工作 检验总体平均 250是否成立 这就是一个原假设 nullhypothesis 通常用表示 原假设与备择假设 原假设 nullhypothesis 研究者想收集证据予以反对的假设又称 0假设 表示为H0H0 指定为符号 或 例如 H0 10cm 研究者想收集证据予以支持的假设也称 研究假设 表示为H1H1 某一数值 或 某一数值例如 H1 10cm 或 10cm 备择假设 alternativehypothesis 提出假设 例 原假设和备择假设是一个完备事件组 而且相互对立在一项假设检验中 原假设和备择假设必有一个成立 而且只有一个成立先确定备择假设 再确定原假设等号 总是放在原假设上因研究目的不同 对同一问题可能提出不同的假设 也可能得出不同的结论 提出假设 结论与建议 备择假设没有特定的方向性 并含有符号 的假设检验 称为双侧检验或双尾检验 two tailedtest 备择假设具有特定的方向性 并含有符号 或 称为右侧检验 双侧检验与单侧检验 双侧检验与单侧检验 假设的形式 两类错误与显著性水平 假设检验中的两类错误 1 第 类错误 弃真错误 原假设为真时拒绝原假设第 类错误的概率记为 被称为显著性水平2 第 类错误 取伪错误 原假设为假时未拒绝原假设第 类错误的概率记为 Beta H0 无罪 假设检验中的两类错误 决策结果 假设检验就好像一场审判过程 统计检验过程 错误和 错误的关系 影响 错误的因素 1 总体参数的真值随着假设的总体参数的减少而增大2 显著性水平 当 减少时增大3 总体标准差 当 增大时增大4 样本容量n当n减少时增大 显著性水平 significantlevel 1 是一个概率值2 原假设为真时 拒绝原假设的概率被称为抽样分布的拒绝域3 表示为 alpha 常用的 值有0 01 0 05 0 104 由研究者事先确定 假设检验中的小概率原理 什么小概率 1 在一次试验中 一个几乎不可能发生的事件发生的概率2 在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设3 小概率由研究者事先确定 统计量与拒绝域 构造一个统计量来决定是否拒绝原假设 对不同的问题 要选择不同的检验统计量 根据样本观测结果计算得到的 并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布 检验统计量 teststatistic 标准化的检验统计量 检验统计量确定后 就要利用该统计量的分布以及由实际问题中所确定的显著性水平 来进一步确定检验统计量拒绝原假设的取值范围 即拒绝域 在给定的显著性水平 下 检验统计量的可能取值范围被分成两部分 小概率区域与大概率区域 小概率区域就是概率不超过显著性水平 的区域 是原假设的拒绝区域 大概率区域是概率为1 的区域 是原假设的接受区域 单侧检验与双侧检验 双侧检验 左侧检验 右侧检验 显著性水平和拒绝域 双侧检验 抽样分布 显著性水平和拒绝域 双侧检验 显著性水平和拒绝域 双侧检验 显著性水平和拒绝域 双侧检验 显著性水平和拒绝域 单侧检验 显著性水平和拒绝域 左侧检验 显著性水平和拒绝域 左侧检验 显著性水平和拒绝域 右侧检验 显著性水平和拒绝域 右侧检验 决策规则 双侧检验 I统计量I 临界值 拒绝H0左侧检验 统计量临界值 拒绝H0 假设检验结论的表述 假设检验结论的表述 假设检验的目的就在于试图找到拒绝原假设 而不在于证明什么是正确的拒绝原假设时结论是清楚的例如 H0 10 拒绝H0时 我们可以说 10当不拒绝原假设时并未给出明确的结论不能说原假设是正确的 也不能说它不是正确的例如 当不拒绝H0 10 我们并未说它就是10 但也未说它不是10 我们只能说样本提供的证据还不足以推翻原假设 假设检验步骤的总结 陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量 并利用样本数据算出其具体数值确定一个适当的显著性水平 并计算出其临界值 指定拒绝域将统计量的值与临界值进行比较 作出决策统计量的值落在拒绝域 拒绝H0 否则不拒绝H0也可以直接利用P值作出决策 6 2总体均值的检验 大样本情形下总体均值的检验小样本情形下总体均值的检验 总体均值的检验 大样本 例1 消费者协会接到消费者投诉 指控品牌纸包装饮料存在容量不足 有欺骗消费者之嫌 包装上标明的容量为250毫升 消费者协会从市场上随机抽取50盒该品牌纸包装饮品 测试发现平均含量为248毫升 小于250毫升 这是生产中正常的波动 还是厂商的有意行为 消费者协会能否根据该样本数据 判定饮料厂商欺骗了消费者呢 在例1中 按历史资料 总体的标准差是4毫升 我们通过检验总体均值是否等于250毫升 来判断饮料厂商是否欺骗了消费者 程序如下 第一步 确定原假设与备选假设 250 250以上的备选假设是总体均值小于250毫升 因为消费者协会希望通过样本数据推断出厂商的欺骗行为 大于250毫升一般不会发生 因此使用左侧检验 第二步 构造出检验统计量 如果总体的标准差已知 则正态总体 正常情况下 生产饮料的容量服从正态分布 的抽样平均数 也服从正态分布 对它进行标准化变换 可得到 可用z作为检验统计量 第三步 确定显著性水平 拒绝域 通常显著水平由实际问题确定 我们这里取 0 05 左侧检验 拒绝域安排在左边 查标准正态分布表得临界值 1 645 拒绝域是z 1 645 第四步 计算检验统计量的数值 样本平均数 n 50 代入检验统计量得 第五步 判断 检验统计量的样本取值落入拒绝域 拒绝原假设 接受备选假设 认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升 厂商有欺诈之嫌 总体标准差未知时对总体均值检验经常用t统计量 但是 在大样本场合 样本容量n大于30时 t 统计量与标准正态分布统计量近似 通常用z检验代替t检验 总体均值的检验 大样本 1 假定条件正态总体或非正态总体大样本 n 30 使用z检验统计量 2已知 2未知 总体均值的检验 大样本检验方法的总结 总体均值的检验 小样本 总体均值的检验 小样本 1 假定条件总体服从正态分布小样本 n 30 检验统计量 2已知 2未知 总体均值的检验 小样本检验方法的总结 注 已知的拒绝域同大样本 6 2总体比例的检验 总体比例检验 假定条件总体服从二项分布可用正态分布来近似 大样本 检验的z统计量 0为假设的总体比例 总体比例的检验 检验方法的总结 总体比例的检验 例题分析 例 一种以休闲和娱乐为主题的杂志 声称其读者群中有80 为女性 为验证这一说法是否属实 某研究部门抽取了由200人组成的一个随机样本 发现有146个女性经常阅读该杂志 分别取显著性水平 0 05和 0 01 检验该杂志读者群中女性的比例是否为80 它们的值各是多少 双侧检验 总体比例的检验 例题分析 H0 80 H1 80 0 05n 200临界值 c 检验统计量 拒绝H0 该杂志的说法并不属实 决策 结论 总体比例的检验 例题分析 H0 80 H1 80 0 01n 200临界值 c 检验统计量 不拒绝H0 样本提供的证据还不足以推翻 该杂志声称读者群中有80 为女性 的看法 决策 结论 例2 某企业声明有30 以上的消费者对其产品质量满意 如果随机调查600名消费者 表示对该企业产品满意的有220人 试在显著性水平 0 05下 检验调查结果是否支持企业的自我声明 第一步 作出假设 解 30 30 以上的备选假设是企业自我声明的结论 我们希望该企业说的是实话 因此使用右侧检验 第二步 构造z检验统计量 第三步 确定拒绝域 显著水平 0 05 查标准正态分布表得临界值 1 645 拒绝域是z 1 645 第四步 计算检验统计量的数值 样本成数p 220 600 0 37 总体假设的成数 0 3 代入z检验统计量得 第五步 判断 检验统计量的样本取值z 3 5 1 645 落入拒绝域 拒绝原假设 认为样本数据证明该企业声明属实 p 值检验 p 值检验就是通过计算p 值 再将它与显著性水平 作比较 决定拒绝还是接受原假设 所谓p 值就是拒绝原假设所需的最低显著性水平 p 值判断的原则是 如果p 值小于给定的显著性水平 则拒绝原假设 否则 接受原假设 或者 更直观来说就是 如果p 值很小 拒绝原假设 p 值很大 不拒绝原假设 请大家注意的是这里的p 值是指概率 z检验的p 值 检验统计量为z统计量的p 值计算公式 表示检验统计量的抽样数据 则p 值为 如果 p值 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026陕西西安职业技术学院招聘高层次人才和紧缺特殊专业人才10人笔试备考试题及答案解析
- 2026年宠物安全扣行业分析报告及未来发展趋势报告
- 赣州蓉江新区人民医院招聘劳务派遣制工作人员备考题库附答案详解(夺分金卷)
- 2026年土石料开采行业分析报告及未来发展趋势报告
- 2026年电热开水器行业分析报告及未来发展趋势报告
- 2026广东江门台山公用事业集团有限公司招聘9人备考题库及完整答案详解一套
- 2026年福建晋江市西滨中学招聘教师备考题库及答案详解(考点梳理)
- 2026年新疆大学(喀什校区)“银龄教师”招募备考题库含答案详解(黄金题型)
- 2026浙江理工大学闻敏杰教授团队招聘科研助理岗位备考题库含答案详解(考试直接用)
- 2026广东湛江市廉江市第三批兜底安置类公益性岗位招聘3人备考题库附答案详解(突破训练)
- 江西铜业校招题库及答案
- (新修订)部编人教版语文一年级经典诵读30首
- 电工基础第3版微课版逄锦梅教学课件全套
- 沐足技师培训资料
- 云南省义务教育人工智能课程教学指南(2025年版)
- 赌博教育警示课件
- 2025年河南省行政执法人员执法证考试题库及答案
- 汽车用油油液课件
- 高处坠落培训安全培训
- 技术咨询合同(中华人民共和国科学技术部制)
- 治安管理处罚法普法讲座
评论
0/150
提交评论