




已阅读5页,还剩114页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析 方法与案例 正如一个法庭宣告某一判决为 无罪 notguilty 而不为 清白 innocent 统计检验的结论也应为 不拒绝 而不为 接受 JanKmenta 统计名言 第6章假设检验 6 1假设检验的基本原理6 2一个总体参数的检验6 3两个总体参数的检验 hypothesistest 学习目标 假设检验的基本思想和原理假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验 正常人的平均体温是37oC吗 当问起健康的成年人体温是多少时 多数人的回答是37oC 这似乎已经成了一种共识 下面是一个研究人员测量的50个健康成年人的体温数据 正常人的平均体温是37oC吗 根据样本数据计算的平均值是36 8oC 标准差为0 36oC根据参数估计方法得到的健康成年人平均体温的95 的置信区间为 36 7 36 9 研究人员发现这个区间内并没有包括37oC因此提出 不应该再把37oC作为正常人体温的一个有任何特定意义的概念 我们应该放弃 正常人的平均体温是37oC 这个共识吗 本章的内容就将提供一套标准统计程序来检验这样的观点 6 1假设检验的基本原理6 1 1怎样提出假设 6 1 2怎样做出决策 6 1 3怎样表述决策结果 第6章假设检验 6 1 1怎样提出假设 6 1假设检验的基本原理 什么是假设 hypothesis 在参数检验中 对总体参数的具体数值所作的陈述就一个总体而言 总体参数包括总体均值 比例 方差等分析之前必需陈述 我认为这种新药的疗效比原有的药物更有效 什么是假设检验 hypothesistest 先对总体的参数 或分布形式 提出某种假设 然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法 统计上依据小概率原理小概率是在一次试验中 一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设 原假设 nullhypothesis 又称 0假设 研究者想收集证据予以反对的假设 用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初被假设是成立的 之后根据样本数据确定是否有足够的证据拒绝它总是有符号 或 H0 某一数值H0 某一数值H0 某一数值例如 H0 10cm null 也称 研究假设 研究者想收集证据予以支持的假设 用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法 然后就是想办法收集证据拒绝原假设 以支持备择假设总是有符号 或 H1 某一数值H1 某一数值H1 某一数值 备择假设 alternativehypothesis 备择假设没有特定的方向性 并含有符号 的假设检验 称为双侧检验或双尾检验 two tailedtest 备择假设具有特定的方向性 并含有符号 或 称为右侧检验 双侧检验与单侧检验 双侧检验与单侧检验 假设的形式 以总体均值的检验为例 例6 1 一种零件的生产标准是直径应为10cm 为对生产过程进行控制 质量监测人员定期对一台加工机床检查 确定这台机床生产的零件是否符合标准要求 如果零件的平均直径大于或小于10cm 则表明生产过程不正常 必须进行调整 试陈述用来检验生产过程是否正常的原假设和被择假设 提出假设 例题分析 解 研究者想收集证据予以证明的假设应该是 生产过程不正常 建立的原假设和备择假设为H0 10cmH1 10cm 例6 2 某品牌洗涤剂在它的产品说明书中声称 平均净含量不少于500克 从消费者的利益出发 有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实 试陈述用于检验的原假设与备择假设 提出假设 例题分析 解 研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 建立的原假设和备择假设为H0 500H1 500 例6 3 一家研究机构估计 某城市中家庭拥有汽车的比例超过30 为验证这一估计是否正确 该研究机构随机抽取了一个样本进行检验 试陈述用于检验的原假设与备择假设 提出假设 例题分析 解 研究者想收集证据予以支持的假设是 该城市中家庭拥有汽车的比例超过30 建立的原假设和备择假设为H0 30 H1 30 原假设和备择假设是一个完备事件组 而且相互对立在一项假设检验中 原假设和备择假设必有一个成立 而且只有一个成立先确定备择假设 再确定原假设等号 总是放在原假设上因研究目的不同 对同一问题可能提出不同的假设 也可能得出不同的结论 提出假设 结论与建议 6 1 2怎样做出决策 6 1假设检验的基本原理 两类错误与显著性水平 研究者总是希望能做出正确的决策 但由于决策是建立在样本信息的基础之上 而样本又是随机的 因而就有可能犯错误原假设和备择假设不能同时成立 决策的结果要么拒绝H0 要么不拒绝H0 决策时总是希望当原假设正确时没有拒绝它 当原假设不正确时拒绝它 但实际上很难保证不犯错误第 类错误 错误 原假设为正确时拒绝原假设第 类错误的概率记为 被称为显著性水平2 第 类错误 错误 原假设为错误时未拒绝原假设第 类错误的概率记为 Beta 两类错误的控制 一般来说 对于一个给定的样本 如果犯第 类错误的代价比犯第 类错误的代价相对较高 则将犯第 类错误的概率定得低些较为合理 反之 如果犯第 类错误的代价比犯第 类错误的代价相对较低 则将犯第 类错误的概率定得高些一般来说 发生哪一类错误的后果更为严重 就应该首要控制哪类错误发生的概率 但由于犯第 类错误的概率是可以由研究者控制的 因此在假设检验中 人们往往先控制第 类错误的发生概率 显著性水平 significantlevel 事先确定的用于拒绝原假设H0时所必须的证据能够容忍的犯第 类错误的最大概率 上限值 2 原假设为真时 拒绝原假设的概率抽样分布的拒绝域3 表示为 alpha 常用的 值有0 01 0 05 0 104 由研究者事先确定 依据什么做出决策 若假设为H0 500 H1 500 样本均值为495 拒绝H0吗 样本均值为502 拒绝H0吗 做出拒绝或不拒绝原假设的依据是什么 传统上 做出决策所依据的是样本统计量 现代检验中人们直接使用由统计量算出的犯第 类错误的概率 即所谓的P值 根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布 检验统计量 teststatistic 标准化的检验统计量 用统计量决策 双侧检验 用统计量决策 左侧检验 抽样分布 H0 临界值 a 拒绝H0 1 非拒绝域 RegionofRejection RegionofNonrejection 用统计量决策 右侧检验 抽样分布 H0 临界值 拒绝H0 1 非拒绝域 RegionofNonrejection RegionofRejection 统计量决策规则 给定显著性水平 查表得出相应的临界值z 或z 2 t 或t 2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验 I统计量I 临界值 拒绝H0左侧检验 统计量临界值 拒绝H0 用P值决策 P value 如果原假设为真 所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们 如果原假设是正确的话 我们得到得到目前这个样本数据的可能性有多大 如果这个可能性很小 就应该拒绝原假设被称为观察到的 或实测的 显著性水平决策规则 若p值 拒绝H0 双侧检验的P值 2 2 Z 拒绝H0 拒绝H0 0 临界值 计算出的样本统计量 计算出的样本统计量 临界值 1 2P值 1 2P值 左侧检验的P值 Z 拒绝H0 0 临界值 计算出的样本统计量 P值 右侧检验的P值 Z 拒绝H0 0 计算出的样本统计量 临界值 P值 P值是关于数据的概率 P值原假设的对或错的概率无关它反映的是在某个总体的许多样本中某一类数据出现的经常程度 它是当原假设正确时 得到目前这个样本数据的概率比如 要检验全校学生的平均生活费支出是否等于500元 检验的假设为H0 500 H0 500 假定抽出一个样本算出的样本均值600元 得到的值为P 0 02 这个0 02是指如果平均生活费支出真的是500元的话 那么 从该总体中抽出一个均值为600的样本的概率仅为0 02 如果你认为这个概率太小了 就可以拒绝原假设 因为如果原假设正确的话 几乎不可能抓到这样的一个样本 既然抓到了 就表明这样的样本不在少数 所以原假设是不对的值越小 你拒绝原假设的理由就越充分 要证明原假设不正确 P值要多小 才能令人信服呢 原假设的可信度又多高 如果H0所代表的假设是人们多年来一直相信的 就需要很强的证据 小的P值 才能说服他们拒绝的结论是什么 如果拒绝H0而肯定H1 你就需要有很强的证据显示要支持H1 比如 H1代表要花很多钱把产品包装改换成另一种包装 你就要有很强的证据显示新包装一定会增加销售量 因为拒绝H0要花很高的成本 多大的P值合适 有了P值 我们并不需要用5 或1 这类传统的显著性水平 P值提供了更多的信息 它让我们可以选择任意水平来评估结果是否具有统计上的显著性 从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了 你就可以在这样的P值水平上拒绝原假设传统的显著性水平 如1 5 10 等等 已经被人们普遍接受为 拒绝原假设足够证据 的标准 我们大概可以说 10 代表有 一些证据 不利于原假设 5 代表有 适度证据 不利于原假设 1 代表有 很强证据 不利于原假设 固定显著性水平是否有意义 用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平 以此为标准进行决策 无法知道实际的显著性水平究竟是多少比如 根据统计量进行检验时 只要统计量的值落在拒绝域 我们拒绝原假设得出的结论都是一样的 即结果显著 但实际上 统计量落在拒绝域不同的地方 实际的显著性是不同的 比如 统计量落在临界值附近与落在远离临界值的地方 实际的显著性就有较大差异 而P值给出的是实际算出的显著水平 它告诉我们实际的显著性水平是多少 P值决策与统计量的比较 拒绝H0 P值决策与统计量的比较 拒绝H0的两个统计量的不同显著性 Z 拒绝H0 0 统计量1 P1值 统计量2 P2值 拒绝H0 临界值 6 1 3怎样表述决策结果 6 1假设检验的基本原理 假设检验不能证明原假设正确 假设检验的目的主要是收集证据拒绝原假设 而支持你所倾向的备择假设假设检验只提供不利于原假设的证据 因此 当拒绝原假设时 表明样本提供的证据证明它是错误的 当没有拒绝原假设时 我们也没法证明它是正确的 因为假设检验的程序没有提供它正确的证据这与法庭上对被告的定罪类似 先假定被告是无罪的 直到你有足够的证据证明他是有罪的 否则法庭就不能认定被告有罪 当证据不足时 法庭的裁决是 被告无罪 但这里也没有证明被告就是清白的 假设检验不能证明原假设正确 假设检验得出的结论都是根据原假设进行阐述的我们要么拒绝原假设 要么不拒绝原假设当不能拒绝原假设时 我们也从来不说 接受原假设 因为没有证明原假设是真的采用 接受 原假设的说法 则意味着你证明了原假设是正确的没有足够的证据拒绝原假设并不等于你已经 证明 了原假设是真的 它仅仅意为着目前还没有足够的证据拒绝原假设 只表示手头上这个样本提供的证据还不足以拒绝原假设比如 在例6 2中 如果拒绝原假设 表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符 如果不拒绝原假设 只能说这个样本提供的证据还不足证明净含量不是500克或500克以上 并不等于证明了净含量就超过了500克 不拒绝 的表述方式实际上意味着没有得出明确的结论 假设检验不能证明原假设正确 接受 的说法有时会产生误导这种说法似乎暗示着原假设已经被证明是正确的了实事上 H0的真实值我们永远也无法知道 不知道真实值是什么 又怎么能证明它是什么 H0只是对总体真实值的一个假定值 由样本提供的信息也就自然无法证明它是否正确采用 不拒绝 的表述方法更合理一些 因为这种表述意味着样本提供的证据不够强大 因而没有足够的理由拒绝 这不等于已经证明原假设正确 假设检验不能证明原假设正确 例 比如原假设为H0 10 从该总体中抽出一个随机样本 得到 x 9 8 在 0 05的水平上 样本提供的证据没有推翻这一假设 我们说 接受 原假设 这意为着样本提供的证据已经证明 10是正确的 如果我们将原假设改为H0 10 5 同样 在 0 05的水平上 样本提供的证据也没有推翻这一假设 我们又说 接受 原假设 但这两个原假设究竟哪一个是 真实的 呢 假设检验不能证明原假设正确 假设检验中通常是先确定显著性水平 这就等于控制了第 类错误的概率 但犯第 类错误的概率却是不确定的在拒绝H0时 犯第 类错误的概率不超过给定的显著性水平 当样本结果显示没有充分理由拒绝原假设时 也难以确切知道第 类错误发生的概率 采用 不拒绝 而不采用 接受 的表述方式 在多数场合下便避免了 错误发生的风险因为 接受 所得结论可靠性将由第 类错误的概率 来测量 而 的控制又相对复杂 有时甚至根本无法知道的值 除非你能确切给出 否则就不宜表述成 接受 原假设 假设检验不能证明原假设正确 在实际检验中 针对一个具体的问题 将检验结果表述为 不拒绝 原假设 这似乎让人感到无所是从比如 你想购买一批产品 检验的结果没有拒绝原假设 即达到合同规定的标准要求 你是否购买这批产品呢 这时 你可以对检验的结果采取某种默认态度 退一步说 你可以将检验结果表述为 可以接受 原假设 你但这并不等于说你 确实接受 它 统计上显著不一定有实际意义 当拒绝原假设时 我们称样本结果是统计上显著的 statisticallySignificant 当不拒绝原假设时 我们称样本结果是统计上不显著的在 显著 和 不显著 之间没有清除的界限 只是在P值越来越小时 我们就有越来越强的证据 检验的结果也就越来越显著 显著的 Significant 一词的意义在这里并不是 重要的 而是指 非偶然的 一项检验在统计上是 显著的 意思是指 这样的 样本 结果不是偶然得到的 或者说 不是靠机遇能够得到的如果得到这样的样本概率 P 很小 则拒绝原假设在这么小的概率下竟然得到了这样的一个样本 表明这样的样本经常出现 所以 样本结果是显著的 统计上显著不一定有实际意义 统计上显著不一定有实际意义 在进行决策时 我们只能说P值越小 拒绝原假设的证据就越强 检验的结果也就越显著但P值很小而拒绝原假设时 并不一定意味着检验的结果就有实际意义因为假设检验中所说的 显著 仅仅是 统计意义上的显著 一个在统计上显著的结论在实际中却不见得就很重要 也不意味着就有实际意义因为值与样本的大小密切相关 样本量越大 检验统计量的P值也就越大 P值就越小 就越有可能拒绝原假设 统计上显著不一定有实际意义 如果你主观上要想拒绝原假设那就一定能拒绝它这类似于我们通常所说的 欲加之罪 何患无词 只要你无限制扩大样本量 几乎总能拒绝原假设当样本量很大时 解释假设检验的结果需要小心在大样本情况下 总能把与假设值的任何细微差别都能查出来 即使这种差别几乎没有任何实际意义在实际检验中 不要刻意追求 统计上的 显著性 也不要把统计上的显著性与实际意义上的显著性混同起来一个在统计上显著的结论在实际中却不见得很重要 也不意为着就有实际意义 6 2一个总体参数的检验6 2 1总体均值的检验6 2 2总体比例的检验6 2 3总体方差的检验 第6章假设检验 6 2 1总体均值的检验 大样本 6 2一个总体参数的检验 总体均值的检验 大样本 1 假定条件大样本 n 30 使用z检验统计量 2已知 2未知 总体均值的检验 2已知 例题分析 大样本 例6 4 一种罐装饮料采用自动生产线生产 每罐的容量是255ml 标准差为5ml 为检验每罐容量是否符合要求 质检人员在某天生产的饮料中随机抽取了40罐进行检验 测得每罐平均容量为255 8ml 取显著性水平 0 05 检验该天生产的饮料容量是否符合标准要求 双侧检验 总体均值的检验 2已知 例题分析 大样本 H0 255H1 255 0 05n 40临界值 c 检验统计量 决策 结论 用Excel中的 NORMSDIST 函数得到的双尾检验P 0 312945不拒绝H0 没有证据表明该天生产的饮料不符合标准要求 总体均值的检验 z检验 P值的计算与应用 第1步 进入Excel表格界面 直接点击 fx 第2步 在函数分类中点击 统计 并在函数名菜单下选择 NORMSDIST 然后 确定 第3步 将z的绝对值1 01录入 得到的函数值为0 843752345P值 2 1 0 843752345 0 312495P值远远大于 故不拒绝H0 总体均值的检验 2未知 例题分析 大样本 例6 5 一种机床加工的零件尺寸绝对平均误差为1 35mm 生产厂家现采用一种新的机床进行加工以期进一步降低误差 为检验新机床加工的零件平均误差与旧机床相比是否有显著降低 从某天生产的零件中随机抽取50个进行检验 利用这些样本数据 检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低 0 01 左侧检验 总体均值的检验 例题分析 大样本 H0 1 35H1 1 35 0 01n 50临界值 c 检验统计量 拒绝H0 新机床加工的零件尺寸的平均误差与旧机床相比有显著降低 决策 结论 总体均值的检验 P值的计算与应用 大样本 第1步 进入Excel表格界面 直接点击 fx 第2步 在函数分类中点击 统计 并在函数名的菜单下选择 ZTEST 然后 确定 第3步 在所出现的对话框 Array 框中 输入原始数据所在区域 在 X 后输入参数的某一假定值 这里为1 35 在 Sigma 后输入已知的总体标准差 若总体标准差未知则可忽略不填 系统将自动使用样本标准差代替 第4步 用1减去得到的函数值0 995421023即为P值P值 1 0 995421023 0 004579P值 0 01 拒绝H0 计算P值 Excel 总体均值的检验 P值的图示 计算出的样本统计量 2 6061 P 0 004579 Z 拒绝H0 0 临界值 P值 总体均值的检验 2未知 例题分析 例6 6 某一小麦品种的平均产量为5200kg hm2 一家研究机构对小麦品种进行了改良以期提高产量 为检验改良后的新品种产量是否有显著提高 随机抽取了36个地块进行试种 得到的样本平均产量为5275kg hm2 标准差为120 hm2 试检验改良后的新品种产量是否有显著提高 0 05 右侧检验 总体均值的检验 2未知 例题分析 H0 5200H1 5200 0 05n 36临界值 c 检验统计量 拒绝H0 P 0 000088 0 05 改良后的新品种产量有显著提高 决策 结论 总体均值的检验 z检验 P值的图示 总体均值的检验 小样本 1 假定条件总体服从正态分布小样本 n 30 检验统计量 2已知 2未知 总体均值的检验 例题分析 小样本 例6 7 一种汽车配件的平均长度要求为12cm 高于或低于该标准均被认为是不合格的 汽车生产企业在购进配件时 通常是经过招标 然后对中标的配件提供商提供的样品进行检验 以决定是否购进 现对一个配件提供商提供的10个样本进行了检验 假定该供货商生产的配件长度服从正态分布 在0 05的显著性水平下 检验该供货商提供的配件是否符合要求 总体均值的检验 例题分析 小样本 H0 12H1 12 0 05df 10 1 9临界值 c 检验统计量 不拒绝H0 没有证据表明该供货商提供的零件不符合要求 决策 结论 总体均值的检验 P值的计算与应用 t检验 第1步 进入Excel表格界面 直接点击 fx 第2步 在函数分类中点击 统计 并在函数名的菜单下选择 TDIST 然后 确定 第3步 在出现对话框的 X 栏中输入计算出的t的绝对值0 7053 在 Deg freedom 自由度 栏中输入本例的自由度9 在 Tails 栏中输入2 表明是双侧检验 如果是单测检验则在该栏输入1 第4步 P值 0 498453P值 0 05 故不拒绝H0 总体均值的检验 用SPSS进行检验 小样本t检验 第1步 选择 Analyze 下拉菜单 并选择 CompareMeans One SamplesTTest 选项 进入主对话框第2步 将检验变量 零件长度 选入 TestVariable s 在 TestValue 框内输入假设值 本题为12 第3步 点击 Options 选择所需的置信水平 隐含值为95 点击 Continue 回到主对话框 点击 OK 用SPSS进行检验 SPSS 总体均值的检验 用SPSS进行检验 小样本t检验 不拒绝H0 没有证据表明该供货商提供的零件不符合要求 一个总体均值的检验 作出判断 样本量n 6 2 2总体比例的检验 6 2一个总体参数的检验 总体比例检验 假定条件总体服从二项分布可用正态分布来近似 大样本 检验的z统计量 0为假设的总体比例 总体比例的检验 例题分析 例6 8 一种以休闲和娱乐为主题的杂志 声称其读者群中有80 为女性 为验证这一说法是否属实 某研究部门抽取了由200人组成的一个随机样本 发现有146个女性经常阅读该杂志 分别取显著性水平 0 05和 0 01 检验该杂志读者群中女性的比例是否为80 它们的P值各是多少 双侧检验 总体比例的检验 例题分析 H0 80 H1 80 0 05n 200临界值 c 检验统计量 拒绝H0 P 0 013328 0 05 该杂志的说法并不属实 决策 结论 总体比例的检验 例题分析 H0 80 H1 80 0 01n 200临界值 c 检验统计量 不拒绝H0 P 0 013328 0 01 没有证据表明 该杂志声称读者群中有80 为女性 的看法不正确 决策 结论 6 2 3总体方差的检验 6 2一个总体参数的检验 总体方差的检验 2检验 检验一个总体的方差或标准差假设总体近似服从正态分布使用 2分布检验统计量 假设的总体方差 总体方差的检验 例题分析 例6 9 啤酒生产企业采用自动生产线灌装啤酒 每瓶的装填量为640ml 但由于受某些不可控因素的影响 每瓶的装填量会有差异 此时 不仅每瓶的平均装填量很重要 装填量的方差同样很重要 如果方差很大 会出现装填量太多或太少的情况 这样要么生产企业不划算 要么消费者不满意 假定生产标准规定每瓶装填量的标准差不应超过4ml 企业质检部门抽取了10瓶啤酒进行检验 得到的样本标准差为s 3 8ml 试以0 05的显著性水平检验装填量的标准差是否符合要求 总体方差的检验 例题分析 H0 2 42H1 2 42 0 10df 10 1 9临界值 s 统计量 不拒绝H0 p 0 52185 没有证据表明装填量的标准差不符合要求 决策 结论 6 3两个总体参数的检验6 3 1两个总体均值之差的检验6 3 2两个总体比例之差的检验6 3 3两个总体方差比的检验 第6章假设检验 6 3 1两个总体均值之差的检验 6 3两个总体参数的检验 两个总体均值之差的检验 独立大样本 1 假定条件两个样本是独立的随机样本正态总体或非正态总体大样本 n1 30和n2 30 检验统计量 12 22已知 12 22未知 两个总体均值之差的检验 例题分析 独立大样本 例6 10 某公司对男女职员的平均小时工资进行了调查 独立抽取了具有同类工作经验的男女职员的两个随机样本 并记录下两个样本的均值 方差等资料如右表 在显著性水平为0 05的条件下 能否认为男性职员与女性职员的平均小时工资存在显著差异 两个总体均值之差的检验 例题分析 独立大样本 H0 1 2 0H1 1 2 0 0 05n1 44 n2 32临界值 c 检验统计量 决策 结论 拒绝H0 该公司男女职员的平均小时工资之间存在显著差异 两个总体均值之差的检验 独立小样本 12 22已知 假定条件两个独立的小样本两个总体都是正态分布 12 22已知检验统计量 两个总体均值之差的检验 独立小样本 12 22未知但 12 22 假定条件两个独立的小样本两个总体都是正态分布 12 22未知但相等 即 12 22检验统计量 其中 自由度 两个总体均值之差的检验 独立小样本 12 22未知且不等 12 22 假定条件两个总体都是正态分布 12 22未知且不相等 即 12 22样本量不相等 即n1 n2检验统计量 自由度 两个总体均值之差的检验 例题分析 独立小样本 12 22 例6 11 甲 乙两台机床同时加工某种同类型的零件 已知两台机床加工的零件直径 单位 cm 分别服从正态分布 并且有 12 22 为比较两台机床的加工精度有无显著差异 分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件 通过测量得到如下数据 在 0 05的显著性水平下 样本数据是否提供证据支持 两台机床加工的零件直径不一致 的看法 两个总体均值之差的检验 例题分析 12 22 H0 1 2 0H1 1 2 0 0 05n1 8 n2 7临界值 c 检验统计量 决策 结论 不拒绝H0 没有证据表明两台机床加工的零件直径不一致 两个总体均值之差的检验 用Excel进行检验 第1步 将原始数据输入到Excel工作表格中第2步 选择 工具 下拉菜单并选择 数据分析 选项第3步 在 数据分析 对话框中选择 t 检验 双样本等方差假设 第4步 当对话框出现后在 变量1的区域 方框中输入第1个样本的数据区域在 变量2的区域 方框中输入第2个样本的数据区域在 假设平均差 方框中输入假定的总体均值之差在 方框中输入给定的显著性水平 本例为0 05 在 输出选项 选择计算结果的输出位置 然后 确定 进行检验 Excel 两个总体均值之差的检验 用Excel进行检验 Excel的输出结果 两个总体均值之差的检验 例题分析 独立小样本 12 22 例6 12 甲 乙两台机床同时加工某种同类型的零件 已知两台机床加工的零件直径 单位 cm 分别服从正态分布 并且有 12 22 为比较两台机床的加工精度有无显著差异 分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件 通过测量得到如下数据 在 0 05的显著性水平下 样本数据是否提供证据支持 两台机床加工的零件直径不一致 的看法 两个总体均值之差的检验 用Excel进行检验 第1步 将原始数据输入到Excel工作表格中第2步 选择 工具 下拉菜单并选择 数据分析 选项第3步 在 数据分析 对话框中选择 t 检验 双样本异方差假设 第4步 当对话框出现后在 变量1的区域 方框中输入第1个样本的数据区域在 变量2的区域 方框中输入第2个样本的数据区域在 假设平均差 方框中输入假定的总体均值之差在 方框中输入给定的显著性水平 本例为0 05 在 输出选项 选择计算结果的输出位置 然后 确定 进行检验 Excel 两个总体均值之差的检验 用Excel进行检验 Excel的输出结果 用SPSS进行检验 独立小样本 12 22 12 22 在用SPSS中进行检验时 需要把两个样本的观测值作为一个变量输入 本例为 零件尺寸 然后设计另一个变量用于标记每个观测值所属的样本 本例为 机床 1表示机床1 2表示机床2 第1步 选择 Analyze CompareMeans Independent SamplesTTest 进入主对话框第2步 检验变量 零件尺寸 选入 TestVariable s 将分组变量 机床 选入 GroupingVariable s 并选择 DefineGroups 在 Group1后输入1 在 Group2后输入2 点击 Continue 回到主对话框 点击 OK 进行检验 SPSS 两个总体均值之差的检验 用SPSS进行检验 ESPSS的输出结果 Levene sTestforEqualityofVariances 检验两个总体方差相等的假设 两个总体均值之差的检验 配对样本 假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的数据配对或匹配 重复测量 前 后 检验统计量 样本差值均值 样本差值标准差 匹配样本 数据形式 两个总体均值之差的检验 例题分析 配对样本 例6 13 某饮料公司开发研制出一新产品 为比较消费者对新老产品口感的满意程度 该公司随机抽选一组消费者 8人 每个消费者先品尝一种饮料 然后再品尝另一种饮料 两种饮料的品尝顺序是随机的 而后每个消费者要对两种饮料分别进行评分 0分 10分 评分结果如下表 取显著性水平 0 05 该公司是否有证据认为消费者对两种饮料的评分存在显著差异 两个总体均值之差的检验 用Excel进行检验 配对样本 第1步 选择 工具 下拉菜单 并选择 数据分析 选项第3步 在分析工具中选择 t检验 平均值成对二样本分析 第4步 当出现对话框后在 变量1的区域 方框内键入变量1的数据区域在 变量2的区域 方框内键入变量2的数据区域在 假设平均差 方框内键入假设的差值 这里为0 在 框内键入给定的显著性水平 然后 确定 进行检验 Excel 配对总体均值之差的检验 用Excel进行检验 Excel的输出结果 两个总体均值之差的检验 用SPSS进行检验 配对样本 第1步 选择 Analyze 下拉菜单 并选择 CompareMeans Paired SamplesTTest 选项 进入主对话框第2步 将两个样本同时选入 PairedVariables 第3步 点击 Options 选择所需的置信水平 隐含值为95 点击 Continue 回到主对话框 点击 OK 进行检验 SPSS 配对总体均值之差的检验 用SPSS进行检验 SPSS的输出结果 两个总体均值之差的检验 TTEST函数的应用 函数语法 TTEST array1 array2 tails type 说明 Array1 为样本1的数据区域 array2 为样本2的数据区域 tails 表示分布曲线的尾数如果tails 1 返回分布的单尾概率如果tails 2 返回分布的双尾概率 type 为检验的类型1代表配对样本检验1代表双样本等方差假设3代表双样本异方差假设 用TTEST进行检验 Excel 两个总体均值之差的检验 方法总结 6 3 2两个比例均值之差的检验 6 3两个总体参数的检验 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 班主任的卫生安全管理工作计划
- 部编版小学语文阅读活动总结计划
- 隧道施工混凝土安全保障措施
- 2025年零售业工会工作总结及客户服务计划
- 建筑项目工人安排与安全保障措施
- 城市基础设施施工文件管理措施
- 新教科版四年级下册科学实验室管理计划
- 农业企业行政岗位职责与生产调度
- 网络科技公司团队协作措施
- 老年护理部2025年度健康管理计划
- 乳腺癌课件教学课件
- T-CASME 1514-2024 市域智慧共享中药房建设指南
- 《全球各大邮轮公司》课件
- CQI-30英文审核表格资料
- 【MOOC】创新与创业管理-南京邮电大学 中国大学慕课MOOC答案
- 2024年3月天津高考英语第一次高考真题(原卷版)
- 2024年度高端医疗服务合同for海外医疗咨询与安排
- 池塘河道治理方案
- 华为HCIA-Transmission-H31-311v2试题及答案
- 2024-2030年新版中国铝钪合金项目可行性研究报告(甲级资质)
- 活动板房制作安装施工合同
评论
0/150
提交评论