




已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分析阶段 ZTE GB304 V1 5 统计的假设检验 主要内容 1 统计的假设检验2 假设检验的定义3 样本的设定4 平均值检验5 方差检验6 比率检验 1 统计的假设检验 我们可以经常看到如下说法 设备的效率为97 5 两个销售人员的能力不同 材料的采购周期为30天 资金周转天数为20天上面的说法具有多少可信性 这些说法是否可以进行统计的检验 在许多实际问题中 只能先对总体的某些参数做出可能的假设 然后根据得到的样本 运用统计的知识对假设的正确性进行判断 这就是所谓的统计假设检验 先看下面几个事例 康讯生产部有一批用户板 按照规定的标准 单板的合格率应该达到99 产检科从中任意抽取100件 发现其中有2块单板不合格 请问这批用户板是否可以移交事业部 供应一部IC类材料的采购日期以前平均为48天 现在对采购流程作了大的调整 收集了3个月IC类材料的采购周期的数据 试问 现在的采购周期是否比以前缩短了 康讯工艺部去年成立了焊接直通率项目团队 以前单板的焊点不良为98 经过对工艺方面的改善 试问 单板的焊点不良率是否下降了 www ZQZL cn中国最大的资料库下载2001年度二营与三营不同销售人员的销售额有显著性差异 总体 整个集合的全体特征 样本 具有总体特征的子集 根据样本确定总体 为什么需要假设检验 总体参数与样本统计 1 总体参数 值 是固定的 但不知道 2 样本统计值是用来估计总体的特征 假设是对总体值进行阐述 而不是对样本进行阐述 假设检验如下 假设检验可如下进行 例如 供应部的IC类材料的平均采购周期为大于50天 公司2001年对采购流程进行了优化组合 供应部认为流程优化后IC类材料的采购周期比原先缩短了 现在我们要确认流程优化后采购周期是否缩短了 大家为了确认这种说法 可以作以下假设 假设检验 H0 50H1 50 一般把已知的事实设定为原假设 我们要主张的设为原假设 我们真正想确认的为备择假设 原假设和备择假设是关于总体的两个对立的解释 要么原假设为真 要么备则假设为真 假设检验的一般顺序是 统计检验的一般顺序1 分析问题转化为统计问题2 确认目的3 进行假设 原假设 备择假设 4 选择统计的检验方法5 制定 危险度6 制定 危险度7 制定大家要寻找的 或差异8 确定寻找 必要的样本大小9 确定样本收集方法10 收集数据11 统计的检验12 以检验结果为基础 做出判断 啊 为了证明两个总体或几个总体间之间差异进行统计检验 假设检验的种类有哪些 那么 我们看一下我们经常用的假设检验的种类或什么时候用哪些检验方法 均值检验 方差检验 比率检验 1 Samplettest 2 Samplettest Pairedttest ANOVA Equalvariancetest Ftest 1 Proportion 2 Proportion Chi squaretest 样本为正态分布时使用了解一个或几个总体的平均值是否一致时使用 主要使用的情况 检验种类 了解一个或几个总体的方差是否一致时使用 了解一个或几个总体的比率是否一致时使用 数据形态 连续型数据 离散型数据 假设检验如何与实际问题相结合 为了确认我们实际遇到的问题 取出样本并通过统计假设检验 确认我们的判断是否正确 我们的实际问题是 平均值是否有差异吗 或者是 我们的实际问题是 方差是否有差异吗 或者是 两种问题都存在 假设有两种相反的假设 原假设 假设没有关系 这是所有统计检验的基本假设 备择假设 假定有差异或有关系 大部分的统计检验实际评价的就是这个假设 原假设 nullhypothesis H0假设检验的起点是零假设 H0 H0是相同或没有差异的假设 举例 总体均值等于检验均值 备择假设 alternativehypothesis H1第二条假设是H1 备择假设 即差异假设 举例 总体均值不等于检验均值 2 假设检验的定义 通过从假定相等或没有变化 Ho 开始 您通常想表明差异确实存在的 H1 如果数据表明它们不相等 则它们一定存在差异 Ha 单侧检验 两侧检验 单侧验证 one sidedtest 备择假设中的特性值只在一侧的检验 两侧验证 two sidedtest 备择假设中的特性值在两侧的检验 备择假设表示检验的特性值的范围在一侧或两侧 H1 0 单侧检验 H1 0 单侧检验 H1 0 两侧检验 拒绝范围 无法拒绝HO 临界值 临界值 临界值 临界值 拒绝范围 无法拒绝HO 拒绝范围 拒绝范围 2 2 无法拒绝HO 双侧检验 单侧右检验 单侧左检验 单侧和双侧检验 H1 不等于 H1 大于 H1 小于 假设检验的两类错误 假设检验的基本思路及方法我们已了解 但是这种检验方法做出的决策是不是一定都正确 答案是否定的 由于我们做出判断的依据仅仅是一个样本 作判断的方法是由部分来推断总体 事实上可能发生两种类型的错误 第一种错误 Type Error 原假设实际上正确 这时我们做出了拒绝原假设的决策 因而犯了错误 这类错误称为第 类错误 也简称为弃真错误 我们无法排除犯这类错误的可能性 因此自然希望将犯这种错误的概率控制在一定的限度内 事实上 允许犯这类错误的概率最大为 即1 置信度 称为显著水平 关于有无显著性差异的判断是在显著水平 之下做出的 P 拒绝H0 H0为真 第二种错误 Type Error 原假设实际上不正确 这时我们做出了接受原假设的决策 因而犯了错误 这类错误称为第 类错误 也简称为伪错误 实际上有差异 但我们认为 没有差异 犯这种错误出现的概率 风险一般不能通过统计检验直接求得 第一种错误 第二种误差 正确的决定 正确的决定 真条件 无差异 有差异 无差异 不同 统计的条件 P 接受H0 H0不真 什么是 显著性的 Significant 差异 上图两个总体的平均推断值有 显著性差异 吗 对从总体采取一些样本 得到的此结论 我们有多少的自信呢 d 显著性差异 SignificantDifference 用于描述统计假设检验结果的术语 即 差异大得不能合理地归因于偶然因素 把 sigma定为1 5 增加样本大小时 平均分布的重复量就越小 如果我们很有自信地说不得两个总体的平均不同 就尽可能把重复量变小 总体为有限的1000个 从总体各抽取2个样本的平均的分布 从总体各取30个样本的平均分布 样本的大小对检验的影响 什么是P value P value是原假设H0真实的结论时 我们观察到样本的值有多大的概率 简称P值 如果此值小 就下原假设为不真实的结论 统计学上称为小概率事件 即样本不是从原假设的分布中抽出的 一般P值大于 则无法拒绝原假设 相反 P值小于 则拒绝原假设 P value为多少是好呢 一般P value 0 05 就拒绝原假设H0总得适用5 的规则吗 不 根据情况可用1 或10 适用1 第一种错误引起的损失大时 适用10 损失不深刻时 第二种错误引起的损失大时 在Minitab中我们进行假设验证 P value是我们判断的基准 其它用语定义 显著性差异 SignificantDifference 统计性假设的结果不能看成是偶然的 有很大差异时用的记法 显著水平 Significancelevel 犯第一种错误的最大允许范围 危险 检验能力 Power 归零假设的内容与实际有差异时 可以检验此差异的概率 1 为了加强检验能力 所用的数据要多 检验统计量 TestStatistics 我们做统计检验后得到的标准化的值 t f Chi square值 一般跟P value意义相同 如果计算出来的检验统计量大于临界值 就采纳对立假设H1 3 样本的不正确性 为了解总体的特性 抽取样本时 样本要正确反映总体 受下列要因的影响 抽样方法 样本间的变动 样本的大小 在这种情况下 需要多少样本数据 有可能达到多少程度的准确性呢 因此在假设检验中 应提前制定误差的允许范围 并按照其基准 决定采纳或放弃假设 根据样本的判断总有可能出现错误 所以在假设检验时 错误发生的事前管理是非常重要的 我们作假设检验的目的区分两个样本 多个样本或一个样本和一个基准值之间的差异 从而断定总体是否存在差异 在这里我们观察一下平均差异 样本的大小增加 对推断的平均值的标准偏差 SEMean 减少 其结果我们发现差异的信息更多我们做出的判断更有可信性 在右图表中n 2时理论分布的很多部分都被重复 即无法区分属于哪一个分布 样本容量的大小 N 30样本的分布 d N 2样本的分布 样本容量大小的设定 我们通过假设检验证明某些差异有可能因为样本的大小会得出错误的结论 那么为了分析实际的问题 我们面临着样本的大小应为多少的问题 当然样本越多 我们可避开这个问题 但样本多意味着多的费用 www ZQZL cn中国最大的资料库下载那么 我们为分析的样本的差异 多少的样本才是妥当的 我们可以用MINITAB求出 在所有的统计及假设检验中选定样本与样本大小是非常重要的 样本数选定错误时我们有可能无法得到我们想知道的 SIGMA 与 间的比率 是指2个或1个的平均和一个基准值间的差异SIGMA s 是从样本分布得出的样本标准偏差 大时 没有必要做统计检验可以说两个总体不同 因为差异 很大 一般数据的分散 大时 有时证明差异较困难 为减少不真实性 增加样本大小可以较精确地证明差异 在作统计假设检验时 如果我们自信地说它们之间有差异时 就尽量减少重复地带 Stat PowerandSamplesize 2 Samplet 输入标准偏差 输入 SIGMA值 输入1 值 输入 值 大部分时 5 10 Sessionwindows 1 一个话务员接完一个电话订购的平均时间是5 6分钟 这个过程的历史标准差是0 8分钟 你的任务是找到一种方法 将订购完成时间降低到4 0分钟 假定 风险为5 风险为10 需要有多少样本才能恰当地估算是否发生了变化 2 假设 是1 6 n要求是何值 3 使用问题1中的初值 要求将呼叫通话时间降低0 32分钟以达到5 28分钟的平均值 这种情况下需要多少样本 样本容量练习 样本大小表 比较2个样本时 对两个样本已知 与SIGMA时可利用下表求样本的大小 SIGMA计算及确定 与 使用样本容量表需要了解什么 1 是需要检验的各平均值之间的差异大小 2 检验灵敏度为 用于连续数据样本容量表中 3 Alpha a 是不存在差异时而声称存在差异的机率 4 Beta b 是未发现重要差异的机率 5 发现差异的机率随以下方面而增加 增加样本容量增加平均值间的差异减小标准变差6 增加样本容量可减小置信区间的长度 4 平均检验 t检验 问题是平均的时候 或想了解两个设备 销售人员 的能力差异时主要使用t分布 样本数小 30个以下 或不知道总体的偏差时必需使用t验证 样本的数大时 t检验与Z检验两个都可以用 一般很少有正确知道我们所研究问题标准偏差 这时应用t 统计量为基础的t 检验法 T检验方法中现在的情况与基准值比较时使用1 Samplet比较两个总体的平均时使用2 Samplet 遵守自由度为n 1的t分布 均值检验的一般程序 阶段1 定义实际的问题阶段2 确认数据是否为正态分布 阶段3 叙述原假设 Ho 1 2 1 2 1 2叙述备择假设 H1 1 2or 1 2or 1Basicstatistics 1 Samplet 2Samplet Pairedt中的一个 实施平均验证阶段5 从分析的结果确认P Value 阶段6 如果P Value 0 05时 放弃Ho 采纳备择假设 0 05时 阶段7 统计的结论转换为实际问题的用语 1Sample 检验是比较目标值与 个平均值后 决定统计上有无显著性差异时使用 对一个连续型的数据 如果想知道与总体的目标值有多大差异时使用1 Samplet验证 Stat BasicStatistics 1 Samplet 1 Samplet 一个总体与基准的平均值比较 事例分析 2001年10月份 深圳至西安的头等舱机票打折后价格均值是1290元 我们从12月份打折后的机票中随机选取15张机票组成一个样本 其数据如下 假设 H0 1290H1 1290 取 水平是0 05 检验机票打折后的均值是否比10月份增加了 你的结论是什么 正态性验证 Stat Basicstatistics 1 Samplet Sessionwindows P Value0 000 因P Value 0 05 采纳H1 即 有95 自信认为机票打折后的价格高于1290元 P Value小于0 05采纳备择假设 2 Samplet 两个总体平均值的比较 2samplet检验两个平均值是否有显著性差异时使用 如果通过2samplet验证发现有显著性差异时 也可以认为找到X 如果想表示两上连续型数据属于不同总体时通过2 Samplet验证确认统计上的显著性差异差异 Stat BasicStatistics 2 Samplet 事例分析 对于技术一部的材料工程师想检验国内供应商和国外供应商提供的电容质量是否有显著性差异 如果没有显著性差异 为了降低成本 我们就可以用国内供应商的产品进行替代 因此分别选择了两个供应商的10个产品 由设计部门进行测试 以5 的有意水平 验证两个供应商的电容性能是否相同 打开 A 05电容 mtw 假设 观察比较两个总体的2Samplet检验是否满足如下条件 是否连续型的数据 t检验是不能用缺陷数或比率 两个总体的方差是否明显不同 两个样本的方差不同时不选择2samplet检验的 AssumeEqualvariance 正态性检验 方差检验 Stat Basicstatistics 2 Samplet 两个样本为等方差时选择 Sessionwindows P Value0 788 P Value 0 05 不能放弃H0 采纳备择假设H1是错误的表现 采纳原假设H0是正确的表现 统计检验问题转化为实际问题 国内供应商和国外供应商电容的质量特性是一样的 Pairedt 成对数据检验 Pairedt检验对成对数据比较平均的差异后确认是否有显著性差异时使用 对同一个体 测量两次后比较时使用的检验方法 Stat BasicStatistics Pairedt 对同一个体测量两次后得到的成对的数据时为比较两个总体的平均值时使用 在统计上又称对应比较 事例分析 字处理系统的好坏通常根据能否提高秘书的工作效率来判定 以前使用电子打字机 现在使用计算机字处理系统的7名秘书的打字速度 每分钟字数 如下 在显著水平0 05下检验使用计算机字处理系统是否使平均的打字速度改变了 Stat Basicstatistics Pairedt P Value 0 05 采纳H0 放弃H1 Sessionwindows P Value大于0 05因此有95 的把握说秘书用两种字处理系统没有显著性差异 比较多个总体时 首先要考虑是方差否存在统计的显著性差异 其理由是方差影响平均检验 5 方差检验 方差的同一性检验 TestforEqualVariance 对几个总体或两个总体检验方差是否相同时使用 假设 1 2 方差的同一性检验是对两个或两个以上总体的方差是否存在显著性差异 相对平均值来说更注重变动的差异 Stat ANOVA TestforEqualVariances TestforEqualVariances 方差检验 对两个或以上数据证明至少一个变动不同时使用方差检验 事例分析 技术一部为了确认不同的SE人员处理信息时间的方差是否相同 收集30个数据后分析不同的SE的处理时间的方差是否相同 请用5 的显著水平检验 打开 A 06SE信息 mtw Stat ANOVA Testforequalvariance Sessionwindows P Value0 970 P Value0 837 非正态分布时使用Levene sTest 对两种情况P Value大于0 05 所以采纳原假设 说明作业者间的散布没有显著性差异 正态性检验 P Value0 100 正态分布时使用Bartlett sTest 6 比率的检验 与现在为止了解了总体平均 总体标准偏差不同的概念 还有有总体比率 总体比率检验是指如不良率 失败率 占有率等总体中具有某些特定属性的比率检验 在总体比率为p的总体中抽取n个样品 具有特定属性的有X个时 X遵守二项分布 n p 为了加深大家的理解 通过例题作一下几种比率检验的例子 总体比率为p的总体中取出n个样品 具有特定属性为X时X遵守二项颁B n p 1proportion 一个比率和基准值的比较检验 Stat BasicStatistics 1Proportion 1Proportion检验是比较特定的比率 目标比率 与调查的一个比率 决定有显著性差异 事例分析 目前公司整个签订合同的缺陷率为5 公司总部为了确定某个办事处的工作质量 通过随机抽取办事处和客户签订的合同单作为样本 并且确认那些合同是存在缺陷的 通过这种办法公司总部可以估计这个办事处签订合同的缺陷是否高于总部 随机抽取320份合同 发现18分有缺陷 假设 H0 p 0 05H1 p 0 05 Stat BasicStatistics 1proportion Sessionwi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 成为邮电人:大学第一课 课件 第4章“邮”岗位
- 东南亚跨境电商市场短视频营销策略与2025年市场应用报告
- 东南亚跨境电商市场消费者忠诚度研究报告
- 导游课件内容
- 东南亚跨境电商市场产品退货率分析与降低策略报告
- 导学案的使用培训课件
- 安会考试卷及答案
- 关于玫瑰题目及答案
- 环境资源知识题库及答案
- 寒号鸟课件讲解
- 神州数码在线测评题答案
- 小学数学三年级(多位数乘一位数)连打版 2000题
- DL∕T 1917-2018 电力用户业扩报装技术规范
- 《环境与资源保护法(第5版)》全套教学课件
- GB/T 44139.2-2024睡袋的要求第2部分:原材料性能
- 模态逻辑的本体论含义
- 顶楼违建房买卖协议书
- 医学伦理与道德规范
- 大学团支书竞选
- 2022年中国大唐集团有限公司招聘考试试题及答案
- (高清版)JTG 2120-2020 公路工程结构可靠性设计统一标准
评论
0/150
提交评论