假设检验的一般问题(ppt 93页).ppt_第1页
假设检验的一般问题(ppt 93页).ppt_第2页
假设检验的一般问题(ppt 93页).ppt_第3页
假设检验的一般问题(ppt 93页).ppt_第4页
假设检验的一般问题(ppt 93页).ppt_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本资料来源 第六章假设检验和方差分析 一 假设检验 第一节假设检验的一般问题第二节一个总体的参数检验第三节两个总体的参数检验第四节非参数检验 假设检验在统计方法中的地位 统计方法 描述统计 推断统计 参数估计 第一节假设检验的一般问题 一 假设检验和抽样估计的不同点二 假设检验的概念与思想三 假设检验 一个实例 四 假设检验的步骤五 假设检验中的两类错误 一 假设检验和抽样估计的不同点 抽样估计 通过样本的观察结果来推断总体参数的取值范围以及得到此结论的可靠程度 假设检验 预先对总体参数的取值作出假定 然后用样本数据来验证 从而作出是接受还是拒绝该假设的结论 二 假设检验的概念与思想 对总体参数的一种看法总体参数包括总体均值 比例 方差等 分析之前必需陈述 我认为该企业生产的零件的平均长度为4厘米 什么是假设 什么是假设检验 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 包括参数假设检验和非参数假设检验 假设检验的基本思想 因此我们拒绝假设 50 样本均值 m 50 抽样分布 H0 在一次试验中 一个几乎不可能发生的事件发生的概率称为小概率 在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设 小概率原理 假设检验的过程 提出假设 抽取样本 作出决策 三 假设检验 实例 某地区水土中缺乏一种微量元素 根据医学研究结果可知 人们如果摄取这种元素过少 脑功能可能受影响 因此可推测该地区儿童的智力水平可能低于一般水平 心理学家使用某一标准化智力检验方法 对该地区随机选取36名儿童进行智力测验 得到智力分数的平均值是94分 已知总体标准差为15分 问该地区儿童的智力水平是否和一般水平 100分 有明显差异 拒绝假设接受假设 原假设 备择假设 四 假设检验的步骤 1 提出原假设和备择假设2 确定适当的检验统计量3 规定显著性水平 查出临界值 确定拒绝域和接受域4 计算检验统计量的值5 作出统计决策 提出原假设和备择假设 什么是原假设 NullHypothesis 陈述待检验的假设 又称 0假设 开始时总假设原假设是正确的总是有等号 或 表示为H0H0 某一数值原假设可能会被否决 什么是备择假设 AlternativeHypothesis 与原假设相反的假设总是有不等号 或 表示为H1H1 某一数值 或 某一数值例如 H1 3910 克 或 3910 克 备择假设不一定会被接受 提出原假设和备择假设 什么检验统计量 用于假设检验问题的统计量选择统计量的方法与参数估计相同 需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为 确定适当的检验统计量 规定显著性水平 什么显著性水平 是一个概率值原假设为真时 拒绝原假设的概率被称为抽样分布的拒绝域表示为 alpha 常用的 值有0 01 0 05 0 10由研究者事先确定 双侧检验 显著性水平与拒绝域 双侧检验 显著性水平与拒绝域 双侧检验 显著性水平与拒绝域 双侧检验 显著性水平与拒绝域 作出统计决策 计算检验的统计量根据给定的显著性水平 查表得出相应的临界值Z 或Z 2将检验统计量的值与 水平的临界值进行比较得出接受或拒绝原假设的结论 用P值决策 P value 如果原假设为真 所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们 如果原假设是正确的话 我们得到目前这个样本数据的可能性有多大 如果这个可能性很小 就应该拒绝原假设被称为观察到的 或实测的 显著性水平决策规则 若p值 拒绝H0值越小 你拒绝原假设的理由就越充分 五 假设检验中的两类错误 决策风险 1 第一类错误 弃真错误 原假设为真时拒绝原假设第一类错误的概率为 被称为显著性水平2 第二类错误 取伪错误 原假设为假时接受原假设第二类错误的概率为 Beta H0 无罪 假设检验中的两类错误 决策结果 假设检验就好像一场审判过程 统计检验过程 错误和 错误的关系 你不能同时减少两类错误 和 的关系就像翘翘板 小 就大 大 就小 参数检验和非参数检验 参数方法在检验过程中比较的是总体参数 最常见的是总体均数 这种检验方法需要事先对数据的分布做出假定 如t检验要求数据服从正态分布 方差相同等 非参数方法不依赖于总体分布 参数假设检验除了大样本情况下进行的参数假设检验外 其余都是假定总体服从某一分布的检验 非参数假设检验适用于比较低的计量水准 如等级的 顺序的计量 如中位数计量 第二节一个总体的参数检验 总体均值的检验总体比例的检验 总体均值的检验 大样本 假定条件大样本 n 30 使用z检验统计量 2已知 2未知 总体均值的检验 2已知 例题分析 例 一种罐装饮料采用自动生产线生产 每罐的容量是255ml 标准差为5ml 为检验每罐容量是否符合要求 质检人员在某天生产的饮料中随机抽取了40罐进行检验 测得每罐平均容量为255 8ml 取显著性水平 0 05 检验该天生产的饮料容量是否符合标准要求 双侧检验 总体均值的检验 2已知 H0 255H1 255 0 05n 40临界值 c 检验统计量 决策 结论 用Excel中的 NORMSDIST 函数得到的双尾检验P 0 312945不拒绝H0 没有证据表明该天生产的饮料不符合标准要求 总体均值的检验 z检验 P值的计算与应用 第1步 进入Excel表格界面 直接点击 fx 第2步 在函数分类中点击 统计 并在函数名菜单下选择 NORMSDIST 然后 确定 第3步 将z的绝对值1 01录入 得到的函数值为0 843752355P值 2 1 0 843752355 0 312495P值远远大于 故不拒绝H0 总体均值的检验 2未知 例题分析 例 一种机床加工的零件尺寸绝对平均误差为1 35mm 生产厂家现采用一种新的机床进行加工以期进一步降低误差 为检验新机床加工的零件平均误差与旧机床相比是否有显著降低 从某天生产的零件中随机抽取50个进行检验 利用这些样本数据 检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低 0 01 左侧检验 总体均值的检验 例题分析 大样本 H0 1 35H1 1 35 0 01n 50临界值 c 检验统计量 拒绝H0 新机床加工的零件尺寸的平均误差与旧机床相比有显著降低 决策 结论 总体均值的检验 2未知 例题分析 例 某一小麦品种的平均产量为5200kg hm2 一家研究机构对小麦品种进行了改良以期提高产量 为检验改良后的新品种产量是否有显著提高 随机抽取了36个地块进行试种 得到的样本平均产量为5275kg hm2 标准差为120 hm2 试检验改良后的新品种产量是否有显著提高 0 05 右侧检验 总体均值的检验 2未知 H0 5200H1 5200 0 05n 36临界值 c 检验统计量 拒绝H0 P 0 000088 0 05 改良后的新品种产量有显著提高 决策 结论 总体均值的检验 z检验 P值的图示 总体均值的检验 小样本 假定条件总体服从正态分布小样本 n 30 检验统计量 2已知 2未知 总体均值的检验 例题分析 小样本 例 一种汽车配件的平均长度要求为12cm 高于或低于该标准均被认为是不合格的 汽车生产企业在购进配件时 通常是经过招标 然后对中标的配件提供商提供的样品进行检验 以决定是否购进 现对一个配件提供商提供的10个样本进行了检验 假定该供货商生产的配件长度服从正态分布 在0 05的显著性水平下 检验该供货商提供的配件是否符合要求 总体均值的检验 例题分析 小样本 H0 12H1 12 0 05df 10 1 9临界值 c 检验统计量 不拒绝H0 没有证据表明该供货商提供的零件不符合要求 决策 结论 总体均值的检验 P值的计算与应用 t检验 第1步 进入Excel表格界面 直接点击 fx 第2步 在函数分类中点击 统计 并在函数名的菜单下选择 TDIST 然后 确定 第3步 在出现对话框的 X 栏中输入计算出的t的绝对值0 7035 在 Deg freedom 自由度 栏中输入本例的自由度9 在 Tails 栏中输入2 表明是双侧检验 如果是单测检验则在该栏输入1 第4步 P值 0 499537958P值 0 05 故不拒绝H0 一个总体均值的检验 样本量n 总体比例检验 假定条件总体服从二项分布可用正态分布来近似 大样本 检验的z统计量 P为假设的总体比例 总体比例的检验 例题分析 例 一种以休闲和娱乐为主题的杂志 声称其读者群中有80 为女性 为验证这一说法是否属实 某研究部门抽取了由200人组成的一个随机样本 发现有146个女性经常阅读该杂志 分别取显著性水平 0 05和 0 01 检验该杂志读者群中女性的比例是否为80 它们的P值各是多少 总体比例的检验 例题分析 H0 P 80 H1 P 80 0 05n 200临界值 c 检验统计量 拒绝H0 P 0 013324 0 05 该杂志的说法并不属实 决策 结论 总体比例的检验 例题分析 H0 P 80 H1 P 80 0 01n 200临界值 c 检验统计量 不拒绝H0 P 0 013324 0 01 没有证据表明 该杂志声称读者群中有80 为女性 的看法不正确 决策 结论 第三节两个总体的参数检验 两个总体均值之差的检验两个总体比例之差的检验 两个总体均值之差的检验 独立大样本 假定条件两个样本是独立的随机样本正态总体或非正态总体大样本 n1 30和n2 30 检验统计量 12 22已知 12 22未知 两个总体均值之差的检验 例题分析 独立大样本 例 某公司对男女职员的平均小时工资进行了调查 独立抽取了具有同类工作经验的男女职员的两个随机样本 并记录下两个样本的均值 方差等资料如右表 在显著性水平为0 05的条件下 能否认为男性职员与女性职员的平均小时工资存在显著差异 两个总体均值之差的检验 例题分析 独立大样本 H0 1 2 0H1 1 2 0 0 05n1 44 n2 32临界值 c 检验统计量 决策 结论 拒绝H0 该公司男女职员的平均小时工资之间存在显著差异 两个总体均值之差的检验 独立小样本 12 22已知 假定条件两个独立的小样本两个总体都是正态分布 12 22已知检验统计量 两个总体均值之差的检验 独立小样本 12 22未知但 12 22 假定条件两个独立的小样本两个总体都是正态分布 12 22未知但相等 即 12 22检验统计量 其中 自由度 两个总体均值之差的检验 独立小样本 12 22未知且不等 12 22 假定条件两个总体都是正态分布 12 22未知且不相等 即 12 22检验统计量 自由度 两个总体均值之差的检验 例题分析 独立小样本 12 22 例 甲 乙两台机床同时加工某种同类型的零件 已知两台机床加工的零件直径 单位 cm 分别服从正态分布 并且有 12 22 为比较两台机床的加工精度有无显著差异 分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件 通过测量得到如下数据 在 0 05的显著性水平下 样本数据是否提供证据支持 两台机床加工的零件直径不一致 的看法 两个总体均值之差的检验 例题分析 12 22 H0 1 2 0H1 1 2 0 0 05n1 8 n2 7临界值 c 检验统计量 决策 结论 不拒绝H0 没有证据表明两台机床加工的零件直径不一致 两个总体均值之差的检验 用Excel进行检验 第1步 将原始数据输入到Excel工作表格中第2步 选择 工具 下拉菜单并选择 数据分析 选项第3步 在 数据分析 对话框中选择 t 检验 双样本等方差假设 第4步 当对话框出现后在 变量1的区域 方框中输入第1个样本的数据区域在 变量2的区域 方框中输入第2个样本的数据区域在 假设平均差 方框中输入假定的总体均值之差在 方框中输入给定的显著性水平 本例为0 05 在 输出选项 选择计算结果的输出位置 然后 确定 两个总体均值之差的检验 例题分析 独立小样本 12 22 例 甲 乙两台机床同时加工某种同类型的零件 已知两台机床加工的零件直径 单位 cm 分别服从正态分布 并且有 12 22 为比较两台机床的加工精度有无显著差异 分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件 通过测量得到如下数据 在 0 05的显著性水平下 样本数据是否提供证据支持 两台机床加工的零件直径不一致 的看法 两个总体均值之差的检验 用Excel进行检验 第1步 将原始数据输入到Excel工作表格中第2步 选择 工具 下拉菜单并选择 数据分析 选项第3步 在 数据分析 对话框中选择 t 检验 双样本异方差假设 第4步 当对话框出现后在 变量1的区域 方框中输入第1个样本的数据区域在 变量2的区域 方框中输入第2个样本的数据区域在 假设平均差 方框中输入假定的总体均值之差在 方框中输入给定的显著性水平 本例为0 05 在 输出选项 选择计算结果的输出位置 然后 确定 两个总体均值之差的检验 配对样本 假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的数据配对或匹配 重复测量 前 后 检验统计量 样本差值均值 样本差值标准差 匹配样本 数据形式 两个总体均值之差的检验 例题分析 配对样本 例 某饮料公司开发研制出一新产品 为比较消费者对新老产品口感的满意程度 该公司随机抽选一组消费者 8人 每个消费者先品尝一种饮料 然后再品尝另一种饮料 两种饮料的品尝顺序是随机的 而后每个消费者要对两种饮料分别进行评分 0分 10分 评分结果如下表 取显著性水平 0 05 该公司是否有证据认为消费者对两种饮料的评分存在显著差异 两个总体均值之差的检验 用Excel进行检验 配对样本 第1步 选择 工具 下拉菜单 并选择 数据分析 选项第3步 在分析工具中选择 t检验 平均值成对二样本分析 第4步 当出现对话框后在 变量1的区域 方框内键入变量1的数据区域在 变量2的区域 方框内键入变量2的数据区域在 假设平均差 方框内键入假设的差值 这里为0 在 框内键入给定的显著性水平 然后 确定 两个总体均值之差的检验 方法总结 假定条件两个总体都服从二项分布可以用正态分布来近似检验统计量检验H0 P1 P2 0检验H0 P1 P2 d0 两个总体比例之差的检验 两个总体比例之差的检验 例题分析 例 一所大学准备采取一项学生在宿舍上网收费的措施 为了解男女学生对这一措施的看法是否存在差异 分别抽取了200名男学生和200名女学生进行调查 其中的一个问题是 你是否赞成采取上网收费的措施 其中男学生表示赞成的比例为27 女学生表示赞成的比例为35 调查者认为 男学生中表示赞成的比例显著低于女学生 取显著性水平 0 05 样本提供的证据是否支持调查者的看法 两个总体比例之差的检验 例题分析 H0 P1 P2 0H1 P1 P2 0 0 05n1 200 n2 200临界值 c 检验统计量 决策 结论 拒绝H0 P 0 041837 0 05 样本提供的证据支持调查者的看法 两个总体比例之差的检验 例题分析 例 有两种方法生产同一种产品 方法1的生产成本较高而次品率较低 方法2的生产成本较低而次品率则较高 管理人员在选择生产方法时 决定对两种方法的次品率进行比较 如方法1比方法2的次品率低8 以上 则决定采用方法1 否则就采用方法2 管理人员从方法1生产的产品中随机抽取300个 发现有33个次品 从方法2生产的产品中也随机抽取300个 发现有84个次品 用显著性水平 0 01进行检验 说明管理人员应决定采用哪种方法进行生产 两个总体比例之差的检验 例题分析 H0 P2 P1 8 H1 P2 P1 8 0 01n1 300 n2 300临界值 c 检验统计量 决策 结论 拒绝H0 P 1 22E 15 0 05 方法1的次品率显著低于方法2达8 应采用方法1进行生产 小结 第四节非参数检验 总体分布情况不明时对总体参数的假设检验 特点 假定前提比参数性假设检验方法少的多 也容易满足 适用于计量信息较弱的资料且计算方法也简便易行 所以在实际中有广泛的应用 内容 X2检验 1 分类数据的拟合优度检验 2 随机变量的独立性进行的检验 曼 惠特尼U检验 Mann Whitney 独立样本的检验威尔科克森带符号的秩检验 WilcoxonSignedRanks 配对样本的检验 一 2检验 在实践中 经常要对一些观察值的实际频数与某种理论频数进行比较 以判断实际结果与理论是否一致 设有k个观察值 f0为它们的实际频数 fe为理论频数 构造一个统计量数理统计证明 在大量试验中 若f0与fe相一致时 2服从 2分布 f0 fe 比较小时 2值也较小 f0 fe 比较大时 2也较大 当 2值大到按 2分布超过设定的临界值时 即为小概率事件 就可以认为实际结果与理论假设不一致 在实际应用统计方法时 常常先将收集到的数据进行分组 形成频数分布表 这是显示数据规律性的一种方法 人们为了掌握其规律性 往往还想进一步了解这一数据是否来自某一分布或与某一理论分布相一致的程度如何 拟合优度检验 2检验的应用1 拟合优度检验 拟合优度检验的基本步骤 这是利用随机样本资料对总体是否服从某种理论分布的检验 检验步骤 1 对总体分布建立假设H0 总体服从某种理论分布H1 总体不服从该理论分布 2 抽样并对样本资料编成频数分布 f0 3 以 原假设H0为真 导出一组期望频数 fe 4 计算检验统计量 2 f0 fe 2 fe 5 2 f0 fe 2 fe给定的 查 2表 得到临界值 6 比较 2值与临界值作出检验判断 注意事项 1 各组理论频数fe不得小于5 如不足5 可合并组 2 为使组数不致太少 总频数n 50 3 根据具体情况确定自由度 如果理论分布的参数是已知的 则自由度为m 1 若理论分布的参数未知 则自由度为m r 1 r为需要估计的参数的个数 2拟合优度检验 举例 例 某百货公司的电器部下半年各月洗衣机的销售量如下 该电器部经理想了解洗衣机的销售数量是否在各月是均匀分布的 也就是说各月中销售数量的差别可以归结为随机原因 这样可以为以后的进货提供依据 要求以 0 05的显著性水平进行检验 是利用样本资料对总体的两个变量的数据是否彼此关联的检验 如果不关联 即为独立 建立在列联表基础上 检验步骤 1 对总体的两个变量建立假设H0 两变量独立H1 两变量关联 2 将样本资料编成r c列联表 并列出实际频数Oij 3 计算理论频数 4 计算检验统计量 5 给定的 查 2表 得到临界值 6 比较 2值与临界值作出检验判断 2检验的应用2 独立性检验 要点说明 列联表形式 r c O11O21O31 Or1 O12O22O32 Or2 O13O23O33 Or3 O1cO2cO3c Orc O1O2O3 Or 123 r 行 r 列 c 123 c x y 合计 n 1n 2n 3 n cn 合计 X的边缘频数 y的边缘频数 先求理论频率 作为概率的近似 概率论中关于概率独立的基本规则 如果两事件独立 则它们的联合概率等于它们各自概率的乘积 P A B P A P B 因此 某一行某一列的联合概率 自由度 df 的确定 df r 1 c 1 理论频数Eij的计算 r c 2 2的列联表资料 2值简算公式 2独立性检验 举例 例 某市场调研机构 调查某种光盘的购买者和性别之间是否有关系 取得如下数据 令 0 05 用 2独立性检验推断购买某种光盘与性别是否有关 例1 为了提高市场占有率 某行业两个最主要的竞争对手A公司和B公司同时开展了广告宣传 在广告宣传战之前 A公司的市场占有率为45 B公司的市场占有率为40 C公司的市场占有率为15 为了了解广告战之后市场占有率是否发生变化 随机抽取了200名消费者 其中102人表示准备购买A公司产品 82人表示准备购买B公司产品 另外16人表示准备购买其他公司产品 以 0 05的显著性水平检验广告战前后各公司的市场占有率是否发生了变化 例2 一种原料来自三个不同的地区 原料质量被分为三个不同等级 从这批原料中随机抽取500件进行检验 结果如表所示 要求检验各个地区和原材料质量之间是否存在依赖关系 检验两个总体的分布是否相同 或者说两个总体的中位数是否相同对应的参数方法 两个配对样本的t检验提出的假设为H0 Md 0 H1 Md 0 Md表示差值的中位数 检验步骤计算各数据对的差值di 并取绝对值 排序后求出秩计算检验统计W或z根据P值作出决策 二 威尔科克森带符号的秩检验 WilcoxonSignedRanks 配对样本 检验统计量小样本情况下 统计量服从Wilcoxon符号秩分布大样本情况下 统计量近似服从正态分布 例 一家制造企业准备采用一种新的方法生产产品 为确定新方法与旧方法生产的产品数量是否相同 随机抽取10个工人 每个工人分别使用新旧两种方法生产产品 10个工人采用两种生产的产品数量如下 检验新旧两种方法所生产的产品数量是否有显著差异 0 05 第1步 选择 Analyze NonparametricTests 2RelatedSamples 主对话框第2步 将两个变量同时选入 TestPair s List 旧方法 和 新方法 第3步 在 TestType 下选择 Wilcoxon 点击 Exact 并选择 Exact 返回主对话框 点击 OK 两配对样本Wilcoxon符号秩检验 SPSS Wilcoxontest 例 SPSS的输出结果 统计量为 2 296 精确的双尾P 0 021 0 05 拒绝H0 两种方法生产的产品数量有显著差异 两配对样本Wilcoxon符号秩检验 SPSS Wilcoxontest 也称为Mann WhitneyU检验 Mann WhitneyUtest 或称为Wilcoxon秩和检验用于确定两个总体间是否存在差异的一种非参数检验方法 对应的参数方法 两个独立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论