统计学——假设检验概念和方法.ppt_第1页
统计学——假设检验概念和方法.ppt_第2页
统计学——假设检验概念和方法.ppt_第3页
统计学——假设检验概念和方法.ppt_第4页
统计学——假设检验概念和方法.ppt_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第 6章 假设检验 1 假设检验的基本问题 2 一个正态总体参数的检验 3 两个正态总体参数的检验 4 假设检验中的其他问题 假设检验在统计方法中的地位 统计方法 描述统计推断统计 参数估计假设检验 学习目标 了解假设检验的基本思想 掌握假设检验的步骤 对实际问题作假设检验 利用置信区间进行假设检验 利用P - 值进行假设检验 6.1 假设检验的基本问题 一. 假设问题的提出 二. 假设的表达式 三. 两类错误 四. 假设检验中的值 五. 假设检验的另一种方法 六. 单侧检验 让我们先看一个例子. 基本概念 生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 罐装可乐的容量按标准应为 355毫升. 基本概念 每隔一定时间,抽查若干罐 . 如每隔1小时 ,抽查5罐,得5个容量的值X1,X5, 根据这些值来判断生产是否正常. 通常的办法是进行抽样检查. 基本概念 根据样本的信息检验关于总体的某个命题 是否正确.这类问题称作假设检验问题 . 基本概念 什么是假设?(hypothesis) 对总体参数的的数值所 作的一种陈述 总体参数包括总体 均值、比例、方差等 分析之前必需陈述 我认为该地区新生婴儿我认为该地区新生婴儿 的平均体重为的平均体重为31903190克克! ! 什么是假设检验? (hypothesis testing) 事先对总体参数或分布形式作出某种假 设,然后利用样本信息来判断原假设是 否成立 有参数假设检验和非参数假设检验 采用逻辑上的反证法,依据统计上的小 概率原理 假设检验的基本思想 . . 因此我们拒因此我们拒 绝假设绝假设 = 50= 50 . . 如果这是总如果这是总 体的真实均值体的真实均值 样本均值样本均值 = 50 抽样分布抽样分布 H H0 0 这个值不像我这个值不像我 们应该得到的们应该得到的 样本均值样本均值 2020 总体总体 假设检验的过程 抽取随机样本抽取随机样本 均值均值 X X = 20= 20 我认为人口的平 均年龄是50岁 提出假设提出假设 拒绝假设! 别无选择. 作出决策作出决策 假设检验的步骤假设检验的步骤 提出假设提出假设 确定适当的检验统计量确定适当的检验统计量 规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值 作出统计决策作出统计决策 提出原假设和备择假设 什么是原假设?(null hypothesis) 待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 3.总是有等号 , 或 4.表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克) 为什么叫为什么叫0 0 假设假设? ? 为什么叫 0 假设? 之所以用零来修饰原假设,其原因是原假设 的内容总是没有差异或没有改变,或变量间 没有关系等等 零假设总是一个与总体参数有关的问题,所 以总是用希腊字母表示。关于样本统计量如 样本均值或样本均值之差的零假设是没有意 义的,因为样本统计量是已知的,当然能说 出它们等于几或是否相等 什么是备择假设?(alternative hypothesis) 与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设总是有不 等号: , 或 表示为 H1 H1: ,不拒绝 H0 若p-值 , 不拒绝 H0 若p-值 0 双侧检验 (原假设与备择假设的确定) 属于决策中的假设检验 不论是拒绝H0还是不拒绝H0,都必需采取 相应的行动措施 例如,某种零件的尺寸,要求其平均长度为 10cm,大于或小于10cm均属于不合格 我们想要证明(检验)大于或小于这两种可 能性中的任何一种是否成立 建立的原假设与备择假设应为 H0: = 10 H1: 10 双侧检验 (显著性水平与拒绝域 ) 抽样分布抽样分布 H H0 0 值值 临界值临界值临界值临界值 /2 /2 /2 样本统计量样本统计量 拒绝域拒绝域拒绝域拒绝域 1 - 1 - 置信水平置信水平 双侧检验 (显著性水平与拒绝域) H H0 0 值值 临界值临界值 临界值临界值 /2 /2/2 样本统计量样本统计量 拒绝域拒绝域拒绝域 拒绝域 抽样分布抽样分布 1 - 1 - 置信水平置信水平 双侧检验 (显著性水平与拒绝域) H H0 0 值值 临界值临界值临界值 临界值 /2 /2/2 样本统计量样本统计量 拒绝域拒绝域拒绝域拒绝域 抽样分布抽样分布 1 - 1 - 置信水平置信水平 双侧检验 (显著性水平与拒绝域) H H0 0 值值 临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量 拒绝域拒绝域 拒绝域拒绝域 抽样分布抽样分布 1 - 1 - 置信水平置信水平 单侧检验 (原假设与备择假设的确定) 将研究者想收集证据予以支持的假设作为备择 假设H1 例如,一个研究者总是想证明自己的研究结论 是正确的 一个销售商总是想正确供货商的说法是不正 确的 备择假设的方向与想要证明其正确性的方向 一致 将研究者想收集证据证明其不正确的假设作为 原假设H0 先确立备择假设H1 单侧检验 (原假设与备择假设的确定) q一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到1500小 时以上。检验这一结论是否成立 研究者总是想证明自己的研究结论(寿 命延长)是正确的 备择假设的方向为“”(寿命延长) 建立的原假设与备择假设应为 H0: 1500 H1: 1500 单侧检验 (原假设与备择假设的确定) q一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这一 结论是否成立 研究者总是想证明自己的研究结论(废 品率降低)是正确的 备择假设的方向为“ 1020 = 0.05 n = 16 临界值(s): 检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H 0 0 有证据表明这批灯泡的使用有证据表明这批灯泡的使用 寿命有显著提高寿命有显著提高 决策决策: : 结论结论: : Z Z 0 0 拒绝域拒绝域 0.050.05 1.6451.645 2 未知大样本均值的检验 (例题分析) 【例】某电子元件批量生产的 质量标准为平均使用寿命1200 小时。某厂宣称他们采用一种 新工艺生产的元件质量大大超 过规定标准。为了进行验证, 随机抽取了100件作为样本, 测得平均使用寿命1245小时, 标准差300小时。能否说该厂 生产的电子元件质量显著地高 于规定标准? (0.05) 单侧单侧检验检验 2 未知大样本均值的检验 (例题分析) H0: 1200 H1: 1200 = 0.05 n = 100 临界值(s): 检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H 0 0 不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命 显著地高于显著地高于12001200小时小时 决策决策: : 结论结论: : Z Z 0 0 拒绝域拒绝域 0.050.05 1.6451.645 总体均值的检验 (2未知小样本) 1.假定条件 总体为正态分布 2未知,且小样本 2.使用t 统计量 2 未知小样本均值的检验 (例题分析) 【例】某机器制造出的肥 皂厚度为5cm,今欲了解机 器性能是否良好,随机抽 取10块肥皂为样本,测得 平均厚度为5.3cm,标准差 为0.3cm,试以0.05的显著 性水平检验机器性能良好 的假设。 双侧检验双侧检验 2 未知小样本均值的检验 (例题分析) H0: = 5 H1: 5 = 0.05 df = 10 - 1 = 9 临界值(s): 检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H 0 0 说明该机器的性能不好说明该机器的性能不好 决策:决策: 结论:结论: t t 0 0 2.2622.262-2.262-2.262 . .025025 拒绝拒绝 H H 0 0 拒绝拒绝 H H 0 0 . .025025 2 未知小样本均值的检验 (P 值的计算与应用) 第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击,并在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定 第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.01155 均值 值 2 H0 1 2 = 0 1 2 0 1 2 0 H1 1 20 1 2 0 两个总体均值之差的检验 (例题分析) 双侧检验!双侧检验! 【例例】有两种方法可用于制造某种以有两种方法可用于制造某种以 抗拉强度为重要特征的产品。根据以抗拉强度为重要特征的产品。根据以 往的资料得知,第一种方法生产出的往的资料得知,第一种方法生产出的 产品其抗拉强度的标准差为产品其抗拉强度的标准差为8 8公斤,公斤, 第二种方法的标准差为第二种方法的标准差为1010公斤。从两公斤。从两 种方法生产的产品中各抽取一个随机种方法生产的产品中各抽取一个随机 样本,样本容量分别为样本,样本容量分别为n n 1 1 =32=32,n n 2 2 =40=40 ,测得测得 x x 2 2 = = 5050公斤,公斤, x x 1 1 = = 4444公斤。问公斤。问 这两种方法生产的产品平均抗拉强度这两种方法生产的产品平均抗拉强度 是否有显著差别?是否有显著差别? ( ( = 0.05) = 0.05) 两个总体均值之差的检验 (例题分析) H0: 1- = 0 H1: 1- 0 = 0.05 n1 = 32,n2 = 40 临界值(s): 检验统计量检验统计量: : 决策决策: : 结论结论: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H 0 0 有证据表明两种方法生产的产有证据表明两种方法生产的产 品其抗拉强度有显著差异品其抗拉强度有显著差异 Z Z 0 0 1.961.96-1.96-1.96 .025.025 拒绝拒绝 H H 0 0 拒绝拒绝 H H 0 0 .025.025 两个总体均值之差的检验 (12、 22 未知且不相等,小样本) 检验具有不等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且不相等1 检验统计量 其中:其中: 两个总体均值之差的检验 (12、 22 未知但相等,小样本) 检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等1 = 检验统计量 两个总体均值之差的检验 (例题分析) 单侧检验单侧检验 【例例】 “ “多吃谷物,将有助于减多吃谷物,将有助于减 肥。肥。” ”为了验证这个假设,随机为了验证这个假设,随机 抽取了抽取了3535人,询问他们早餐和午人,询问他们早餐和午 餐的通常食谱,根据他们的食谱餐的通常食谱,根据他们的食谱 ,将其分为二类,一类为经常的,将其分为二类,一类为经常的 谷类食用者谷类食用者( (总体总体1 1) ),一类为非经,一类为非经 常谷类食用者常谷类食用者( (总体总体2 2) )。然后测度。然后测度 每人午餐的大卡摄取量。经过一每人午餐的大卡摄取量。经过一 段时间的实验,得到如下结果:段时间的实验,得到如下结果: 检验该假设检验该假设 ( ( = 0.05) = 0.05) 两个总体均值之差的检验 (例题分析用统计量进行检验) H0: 1- 0 H1: 1- 总总体2 H0D = 0D 0D 0 H1D 0D 0 注:注:D D i i = = X X 1 1i i - - X X 2 2i i ,对第对第 i i 对观察值对观察值 匹配样本的 t 检验 (数据形式) 观观察序号样样本1样样本2差值值 1x 11x 21D1 = x 11 - x 21 2x 12x 22D1 = x 12 - x 22 MMMM ix 1ix 2iD1 = x 1i - x 2i MMMM nx 1nx 2nD1 = x 1n- x 2n 匹配样本的 t 检验 (检验统计量) 样本差值均值样本差值均值样本差值标准差样本差值标准差 自由度自由度dfdf n n D D - 1- 1 统计量统计量 D D0 0 :假设的差值假设的差值 【例】一个以减肥为主要目标的健美俱乐部声称, 参加其训练班至少可以使减肥者平均体重减重8.5kg 以上。为了验证该宣称是否可信,调查人员随机抽 取了10名参加者,得到他们的体重记录如下表: 匹配样本的 t 检验 (例题分析) 在在 = 0.05= 0.05的显著性水平下,调查结果是否支持的显著性水平下,调查结果是否支持 该俱乐部的声称?该俱乐部的声称? 训练训练 前94.5101110103.59788.596.5101104116.5 训练训练 后8589.5101.5968680.58793.593102 单侧检验单侧检验 样样本差值计值计 算表 训练训练 前训练训练 后差值值Di 94.5 101 110 103.5 97 88.5 96.5 101 104 116.5 85 89.5 101.5 96 86 80.5 87 93.5 93 102 9.5 11.5 8.5 7.5 11 8 9.5 7.5 11 14.5 合计计98.5 配对样本的 t 检验 (例题分析) 配对样本的 t 检验 (例题分析) 差值均值差值均值 差值标准差差值标准差 H0: 1 2 8.5 H1: 1 2 比例2 H0P1P2 = 0P1P20P1P20 H1P1P20P1P20 两个总体比例之差的Z检验 (例题分析) 单侧检验单侧检验 【例例】对两个大型企业青年对两个大型企业青年 工人参加技术培训的情况进工人参加技术培训的情况进 行调查,调查结果如下:甲行调查,调查结果如下:甲 厂:调查厂:调查6060人,人,1818人参加技人参加技 术培训。乙厂调查术培训。乙厂调查4040人,人,1414 人参加技术培训。能否根据人参加技术培训。能否根据 以上调查结果认为乙厂工人以上调查结果认为乙厂工人 参加技术培训的人数比例高参加技术培训的人数比例高 于甲厂?于甲厂?( ( = 0.05 = 0.05) ) 两个总体比例之差的Z检验 (例题分析) H0: 1- 0 H1: 1- ) 检验统计量 F = S12 /S22F(n1 1 , n2 1) 两个总体方差的 F 检验 (临界值) 0 不能拒绝H0 F 拒绝H0 /2/2 /2/2 拒绝 H0 两个总体方差的 F 检验 (例题分析) H H0 0: : 1 1 = = H H1 1: : 1 1 = 0.05 = 0.05 n n1 1 = 15 = 15,n n 2 2 = 20= 20 临界值临界值(s):(s): 检验统计量检验统计量: : 决策决策: : 结论结论: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H 0 0 不能认为这两个总体的方差有不能认为这两个总体的方差有 显著差异显著差异 0F F F 0.0975 0.0975 =0.352 =0.352 .025.025 拒绝拒绝 H H 0 0 拒绝拒绝 H H 0 0 .025.025 F F 0.025 0.025 =2.62 =2.62 6.4 假设检验中的其他问题 一. 用置信区间进行检验 二. 单侧检验中假设的建立 用置信区间进行检验 (双侧检验) 求出双侧检验均值的置信区间 已知时:已知时: 未知时:未知时: 2.2.若总体的假设值若总体的假设值 0 0 在置信区间外,拒绝在置信区间外,拒绝H H0 0 用置信区间进行检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论