统计学贾俊平第章 假设检验ppt课件.ppt_第1页
统计学贾俊平第章 假设检验ppt课件.ppt_第2页
统计学贾俊平第章 假设检验ppt课件.ppt_第3页
统计学贾俊平第章 假设检验ppt课件.ppt_第4页
统计学贾俊平第章 假设检验ppt课件.ppt_第5页
已阅读5页,还剩137页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章假设检验 8 1假设检验的问题8 2单个总体的假设检验8 3两个总体的假设检验8 4假设检验的进一步讨论 1 需要无罪证明的证明 引例 2 引例 引例1 再谈女士品茶在实验中 那位女士被奉上一连串的已经调制好的茶 其中 有的是先加茶有的先加奶 各占一半情形一 如果只给那位女士一杯茶 那么即使她没有区分能力 她也有50 的机会猜对 如果给两杯茶 她仍可能猜对 事实上 如果她知道两杯茶分别以不同的方式调制 她可能一下子全部猜对 或全部猜错 情形二 这位女士能做出区分 她仍然有猜错的可能 或者是其中的一杯与奶没有充分地混合 或者是泡制时茶水不够热 即便这位女士能做出区分 也很有可能是奉上了10杯茶 她却只是猜对了其中的9杯 3 引例 引例2 维生素真相 见BBC视频 2007年2月28日出版的国际权威医学杂志 美国医学会杂志 发表了一项由多国研究人员共同完成的研究 这项研究显示 服用维生素E死亡率增加4 服用茁胡萝卜素死亡率增加7 服用维生素A死亡率增加16 没有证据表明维生素C能延年益寿 4 5 8 1假设检验的一般问题 6 假设检验的基本思想假设的陈述两类错误与显著性水平检验统计量与拒绝域检验中的P值 7 假设检验的基本思想 什么是假设 hypothesis 对总体参数的具体数值所作的陈述总体参数包括总体均值 比率 方差等分析之前必须陈述 我认为这种新药的疗效比原有的药物更有效 8 假设检验的基本思想 假设检验 hypothesistesting 先给予总体未知参数一个假设值 再利用样本或实验结果来推断此假设的可信度 逻辑上采用反证法 依据统计上的小概率原理概率证伪 9 假设检验的基本思想 小概率原理在一次试验中 一个几乎不可能发生称为小概率事件在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设小概率的大小一般由研究者事先确定 10 假设检验的基本思想 IdentifythePopulation Assumethe population 平均GPA 学分绩点 is3 5 REJECT TakeaSample NullHypothesis No notlikely 11 假设检验的基本思想 3 5 不太可能得到这个样本均值 如果事实上 这正是总体的均值 因此我们拒绝原假设 3 5 的抽样分布 2 4 如果H0为真 12 假设的陈述 原假设和备择假设原假设 nullhypothesis 稻草人待检验的假设 又称 0假设 研究者想收集证据予以反对的假设总是有等号 或 表示为H0例如 H0 某特定值若为不等式 或 也可写为 例H0 3 5 13 假设的陈述 备择假设 alternativehypothesis 与原假设对立的假设 也称 研究假设 这与原假设为互斥研究者想收集证据予以支持的假设 总是有不等号 或 表示为H1例如 H 某特定值如H 3 5 14 假设的陈述 零假设的提出所假设的总体参数值为研究者认为不对的总体参数值实质 科学研究中的保守主义比如 新的工艺或技术没有造成任何改变 新药没有任何疗效 变量间没有联系 15 假设的陈述 例析消协接到很多消费者的投诉 超市中五磅的碎牛肉缺斤少两 消协检查时 原及备择假设为 市政府所用的红绿灯平均寿命为2000小时 一家制造商宣称他们新产品比原来的寿命要长 且价格相同 市政府想要测试新灯泡的寿命是否超过2000小时 原及备择假设为 16 假设的陈述 一家公司的产品市场占有率为30 公司在某些区域测试新推出的广告 要检验广告是否会增加销售 汽车车门的油漆平均五年会开始脱落 某科学家宣称新的油漆寿命比较长 汽车公司想测试新油漆的寿命 17 假设的陈述 选择的结果由于我们只有在证据很充分的情况下才能推翻原假设 因此原假设比备择假设占据更有利的地位 假设的写法对于结果有很大影响例 FoodandDrugAdministration FDA 在核准新药上市中 面临以下两个可能的结果新药对于大众有益新药对于大众无益处两者都可以被选为nullhypothesis 18 假设的陈述 若FDA选择以下的方式 H0 新药对于大众没有益处不应该上市H1 新药对于大众有益处此时药厂必须举证推翻H0 否则FDA不会核准新药上市由于这种假设方式 美国的新药上市过程十分冗长 但好处为有害药物要上市十分困难 19 假设的陈述 若FDA选择以下的方式 H0 新药对于大众有益处应该上市 H1 新药对于大众没有益处不应该上市 此时除非有强而有力的证据显示药物无效或有害 否则暂且假定此药为有益处的 这种方式可以使新药快速上市 但风险也很高 20 假设的陈述 评述实际上 假设检验中 我们计算的条件概率为 P observeddata theoryistrue 即在假设理论为真的前提下 观察到目前样本数据的概率为何 如果理论为真 则样本数据应比较有可能是 比较不可能是 若观察到与理论一致的样本 较有可能发生的样本 则暂且假定理论为真若观察到样本在理论为真的假设下不太可能发生 则推翻理论 21 假设的陈述 对提出假设的建议原假设和备择假设是一个完备事件组 而且相互对立在一项假设检验中 原假设和备择假设必有一个成立 而且只有一个成立先确定备择假设 再确定原假设等号 总是放在原假设上 为什么 因研究目的不同 对同一问题可能提出不同的假设 也可能得出不同的结论 检验的目的主要是收集证据拒绝原假设 22 双侧检验和单侧检验 双侧检验备择假设没有特定的方向性 无论是大于还是小于某一假设值 都必需采取相应的行动措施例如 某种零件的尺寸 要求其平均长度为10cm 大于或小于10cm均属于不合格我们想要证明 检验 大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为H0 10H1 10 23 双侧检验和单侧检验 单侧检验备择假设具有特定的方向性 并含有符号 或 称为右侧检验 24 双侧检验和单侧检验 例析 一项研究表明 采用新技术生产后 将会使产品的使用寿命明显延长到1500小时以上 检验这一结论是否成立研究者总是想证明自己的研究结论 寿命延长 是正确的备择假设的方向为 寿命延长 建立的原假设与备择假设应为H0 1500H1 1500 25 双侧检验和单侧检验 一项研究表明 改进生产工艺后 会使产品的废品率降低到2 以下 检验这一结论是否成立研究者总是想证明自己的研究结论 废品率降低 是正确的备择假设的方向为 废品率降低 建立的原假设与备择假设应为H0 2 H1 2 26 双侧检验和单侧检验 某灯泡制造商声称 该企业所生产的灯泡的平均使用寿命在1000小时以上 如果你准备进一批货 怎样进行检验检验权在销售商一方作为销售商 你总是想收集证据证明生产商的说法 寿命在1000小时以上 是不正确的备择假设的方向为 寿命不足1000小时 建立的原假设与备择假设应为H0 1000H1 1000 27 双侧检验和单侧检验 28 两类错误与显著性水平 两类错误统计检验有点像法院审案 在样本数据 证据 还没有充分显示嫌疑人 有罪 之前 我们暂且假定原假设为 嫌疑人 无罪 在法院的审判中有两种可能的错误 无罪的人被误判为有罪 有罪的人被无罪释放 29 两类错误与显著性水平 续 与法院审判类似 检验也有两种犯错的可能 nullhypothesis在正确的情况下被推翻 typeIerror错杀无辜 及nullhypothesis不正确但没有被拒绝 typeIIerror放纵坏人 辛普森杀妻案 聂树斌案 30 H0 无罪 假设检验就好像一场审判过程 假设检验过程 两类错误与显著性水平 31 第一类错误和第二类错误第一类错误 弃真错误 原假设为真时拒绝原假设第一类错误的概率为 即显著性水平 则置信水平 两类错误与显著性水平 32 第二类错误 取伪错误 原假设为假时没有拒绝原假设第二类错误的概率为 Beta Thepowerofthetestis 两类错误与显著性水平 33 例析USAToday报导在美国非法赌博的金额至少平均每人每年 200 你觉得这个数字太过于夸张 因此找了n个人的样本来估计每年非法赌博的平均金额 你想要检验的假设为 H0 200H1 200 两类错误与显著性水平 34 假设真正的总体均值为 200 如果你估计的样本平均远低于 200 则你会推翻正确的假设 从而而犯下型I错误如果实际非法赌博的金额远低于 200 即H0并不正确 但你运气欠佳 得到的样本估计的均值十分接近200 则你应该推翻H0 但样本数据却不足以推翻错误的假设 此时你犯了型II的错误 两类错误与显著性水平 35 切记当检验统计量落在拒绝域 rejectionregion 内 不代表我们证明 prove 原假设为错误的 只能说我们对于原假设所陈述的内容真实性有很大的怀疑 原假设不是不正确 就是极不可能发生同理 当检验统计量落在无法拒绝域中 并不是证明 prove 零假设为真 仅是表示证据不足以推翻零假设 两类错误与显著性水平 36 例析饮料的例子 拒绝域 无法拒绝域 0 05 两类错误与显著性水平 37 05 拒绝Ho 无法拒绝Ho HoisTrue HoisFalse 95 8023 正确决策 第I类错误 第II类错误 正确决策 19 77 Z0 Z1 如果 11 99 两类错误与显著性水平 38 05 HoisTrue HoisFalse 95 拒绝Ho 无法拒绝Ho 0708 正确决策 第I类错误 第II类错误 正确决策 92 92 Z0 Z1 如果 11 96 两类错误与显著性水平 39 1 b 概率的变化 两类错误与显著性水平 40 和 的关系就像翘翘板 小 就大 大 就小 Reduceprobabilityofoneerrorandtheotheronegoesupholdingeverythingelseunchanged 两类错误与显著性水平 41 影响 错误的因素总体参数的真值随着假设的总体参数与真实参数值差异的减小而增大显著性水平 当 减少时增大 n 两类错误与显著性水平 42 显著性水平 significantlevel 显著性水平是一个概率值 零假设不被接受 零假设为真 原假设为真时 拒绝原假设的概率抽样分布的拒绝域的面积表示为 alpha 常用的 值有0 01 0 05 0 10由研究者事先确定 两类错误与显著性水平 43 如何选择 考虑犯错误的代价 地震 ChooseSmallerTypeIErrorWhentheCostofRejectingtheMaintainedHypothesisisHighLevelAcriminaltrial convictinganinnocentperson挑战者号失事与检验功效 两类错误与显著性水平 44 原假设在检验前被视为是正确的 除非有充分的证据 不然我们不轻易推翻原假设 通常我们选择极小的显著水平如 01或 05来确保我们不会推翻一个正确的原假设 两类错误与显著性水平 45 检验统计量与拒绝域 检验统计量根据样本观测结果计算得到的 并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果假设H0为真点估计量的抽样分布标准化的检验统计量 46 检验统计量与拒绝域 拒绝域根据显著性水平 我们可以将检验统计量分成穷尽及互斥的两组数值区域 Therejectionregion 拒绝域 Thenonrejectionregion 无法拒绝域 临界值是区分拒绝域及无法拒绝域的界线 47 检验统计量与拒绝域 0 0 0 a a a 2 临界值 拒绝域 48 检验统计量与拒绝域 续 49 检验统计量与拒绝域 50 检验统计量与拒绝域 51 检验统计量与拒绝域 52 检验统计量与拒绝域 抽样分布 H0值 临界值 a 样本统计量 拒绝域 1 置信水平 53 检验统计量与拒绝域 H0值 临界值 a 样本统计量 拒绝域 1 置信水平 观察到的样本统计量 左侧检验 54 检验统计量与拒绝域 H0值 临界值 a 样本统计量 拒绝域 1 置信水平 观察到的样本统计量 55 检验统计量与拒绝域 H0值 临界值 a 样本统计量 拒绝域 1 置信水平 观察到的样本统计量 右侧检验 56 检验统计量与拒绝域 H0值 临界值 a 样本统计量 拒绝域 1 置信水平 观察到的样本统计量 57 检验统计量与拒绝域 统计决策将检验统计量的值与 水平的临界值进行比较 给定显著性水平 查表得出相应的临界值z 或z 2 t 或t 2作出决策双侧检验 I统计量I 临界值 拒绝H0左侧检验 统计量临界值 拒绝H0 58 检验统计量与拒绝域 注意根据样本所提供的信息 我们面临两种可能的决定 拒绝nullhypothesis rejectingH0 无法拒绝nullhypothesis notrejectingH0 有人会说接受acceptednullhypothesis 不过较为正确的说法应该是无法拒绝或无法推翻H0 59 假设检验中的 值 P值 P value 的缘起在假设检定中 我们通常会事先决定显著水平 然后根据决定之后的 值找出拒绝域及接受域但在很多的情况下 我们无法预估typeI错误及typeII错误的成本 因此无法确定合意的 值 所以有时候我们直接指出得到观察统计量的概率 60 假设检验中的 值 P值如果原假设为真 P 值是抽样分布中大于或小于样本统计量的概率左侧检验时 P 值为曲线上方小于等于检验统计量部分的面积右侧检验时 P 值为曲线上方大于等于检验统计量部分的面积被称为观察到 theobservedsignificantlevel 的显著性水平 61 假设检验中的 值 P value告诉我们 如果零假设为真 我们观察到目前数据显示的检验统计量的概率有多高 如果这个概率很小 则我们可以拒绝零假设 因为如果假设为真 则仅有很小的概率抽取任意的随机样本会得到目前的观察值P value是不仅止于告诉我们在某一显著水平下是否拒绝H0 如果我们知道P value 002则我们知道H0不但在 05的显著水平下会被拒绝 在 005的水平下也会被拒绝 62 假设检验中的 值 如果仅知道P value 04 则是否拒绝H0可以由读者来决定 如果某一研究人员决得 01才算显著 则H0不会被拒绝 如果将显著水平置于 05 则拒绝一般在研究报告中 研究者经常直接写出p value而让读者自己去决定是否要拒绝H0一些证据 P 010适度证据 P 005很强证据 P 001 63 假设检验中的 值 2 2 Z 拒绝 拒绝 H0值 临界值 计算出的样本统计量 计算出的样本统计量 临界值 1 2P值 1 2P值 双侧检验 64 假设检验中的 值 左侧检验 65 假设检验中的 值 右侧检验 66 小结 假设检验的步骤 67 8 2单个总体的假设检验 68 Z检验 单尾和双尾 t检验 单尾和双尾 Z检验 单尾和双尾 2检验 单尾和双尾 均值 单个总体 比例 方差 69 单个总体均值检验 总体 是否已知 用样本标准差S代替 t检验 小 是 z检验 z检验 大 70 单个总体均值检验 总体均值的检验 2已知 或 2未知但大样本 假定条件总体服从正态分布若不服从正态分布 可用正态分布来近似 n 30 使用Z 统计量 2已知 2未知 71 单个总体均值检验 例解 2已知 Doesanaverageboxofcerealcontain368gramsofcereal Arandomsampleof25boxesshowed 372 5 Thecompanyhasspecifiedstobe15gramsandthedistributiontobenormal Testatthea 0 05level H0 m 368H1 m 368 72 单个总体均值检验 Z 0 1 96 025 Reject 1 96 025 1 50 372 5 Reject 73 单个总体均值检验 a 0 05n 25临界值 1 96 检验统计量 决策 结论 DoNotRejectata 05 Z 0 1 96 025 Reject 1 96 025 H0 m 368H1 m 368 1 50 InsufficientEvidencethatTrueMeanisNot368 74 单个总体均值检验 值解法 p Value 0 1336 a 0 05 DoNotReject 0 1 50 Z Reject a 0 05 1 96 p Value 2x0 0668 TestStatistic1 50isintheDoNotRejectRegion Reject 75 单个总体均值检验 例解 2未知但大样本 某电子元件批量生产的质量标准为平均使用寿命1200小时 某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准 为了进行验证 随机抽取了100件作为样本 测得平均使用寿命1245小时 标准差300小时 能否说该厂生产的电子元件质量显著地高于规定标准 0 05 76 单个总体均值检验 H0 1200H1 1200 0 05n 100临界值 s 检验统计量 在 0 05的水平上不能拒绝H0 不能认为该厂生产的元件寿命显著地高于1200小时 决策 结论 Z 0 拒绝域 0 05 1 645 77 单个总体均值检验 总体均值的检验 2未知小样本 假定条件总体为正态分布 2未知 且小样本使用t统计量 78 单个总体均值检验 例解某汽车制造商宣称该公司一款低价车肇事平均修车费低于等于 200 消费者基金会认为修车费高于此数值 欲检证下列假设 H0 u u0H1 u u0消费者基金会不愿在证据不充分的条件下 随意驳斥制造商的宣称 因此将假设检定的显著水平 严格地定在1 因为检证肇事修车的成本甚高 因此消基会仅找了9个样本点 发现 245 305 175 250 280 160 250 195 210 79 单个总体均值检验 H0 200H1 200 0 0 n 100临界值 s t 01 8 2 896 检验统计量 在 0 01的水平上不能拒绝H0 不能认为收费较高 决策 结论 Z 0 拒绝域 0 01 2 896 80 单个总体均值检验 例解一个汽车轮胎制造商声称 某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里 对一个由20个轮胎组成的随机样本作了试验 测得平均值为41000公里 标准差为5000公里 已知轮胎寿命的公里数服从正态分布 我们能否根据这些数据作出结论 该制造商的产品同他所说的标准相符 0 05 81 单个总体均值检验 H0 40000H1 40000 0 05df 20 1 19临界值 s 检验统计量 在 0 05的水平上不能拒绝H0 有证据表明轮胎使用寿命显著地大于40000公里 决策 结论 82 单总体比率检验 单总体比率检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的Z统计量 83 单总体比率检验 例析Amarketingcompanyclaimsthatasurveywillhavea4 responserate Totestthisclaim arandomsampleof500weresurveyedwith25responses Testatthea 05significancelevel 84 单总体比率检验 0 05 临界值 1 96 1 1411 a 05n 500 Donotrejectata 05 H0 p 04H1 p 04 检验统计量 决策 结论 Z 0 Reject Reject 025 025 1 96 1 96 Wedonothavesufficientevidencetorejectthecompany sclaimof4 responserate 0 04 85 单总体比率检验 p Value 0 2538 a 0 05 DoNotReject 0 1 1411 Z Reject a 0 05 1 96 p Value 2x 1269 TestStatistic1 1411isintheDoNotRejectRegion Reject 值解法 86 单总体方差检验 单总体方差的检验 2检验 检验单个总体的方差或标准差假设总体近似服从正态分布检验统计量 87 单总体方差检验 例解某厂商生产出一种新型的饮料装瓶机器 按设计要求 该机器装一瓶一升 1000cm3 的饮料误差上下不超过1cm3 如果达到设计要求 表明机器的稳定性非常好 现从该机器装完的产品中随机抽取25瓶 分别进行测定 用样本减1000cm3 得到如下结果 检验该机器的性能是否达到设计要求 0 05 88 单总体方差检验 H0 2 1H1 2 1 0 05df 25 1 24临界值 s 统计量 在 0 05的水平上不能拒绝H0 不能认为该机器的性能没有达到设计要求 2 0 39 36 12 40 2 05 决策 结论 89 8 3两个总体的假设检验 90 91 两总体均值的检验 92 两总体均值的检验 独立样本 12 22已知 假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布 可以用正态分布来近似 n1 30和n2 30 检验统计量为 93 两总体均值的检验 当样本n 30时 两样本均值的抽样分布为近似正态分布 1 21 n1 2 22 n2 1 2 94 两总体均值的检验 独立样大样本 12 22未知 如果是大样本 n 30 则我们可以用样本方差s2來取代未知的总体方差 2 95 两总体均值的检验 例解 P G 公司宣布含氟牙膏Crest可以防止蛀牙 为了检证此一假设 我们找了一群牙齿健康状况相同的十岁小朋友 将之分成用 含氟 及用普通牙膏两组 观察一年后纪录其蛀牙状况假设从用普通牙膏的小朋友中取100个随机样本 其蛀牙平均值为4 8颗 方差为s12 1 1颗 在从用含氟牙膏的小朋友中取120独立样本 计算其平均蛀牙数为3 6颗 方差为s22 0 9颗 在显著水平5 下检定上述的假说 96 两总体均值的检验 续 RejectH0 97 两总体均值的检验 例解IsthereevidencetoconcludethattheaveragemonthlychargeintheentirepopulationofAmericanExpressGoldCardmembersisdifferentfromtheaveragemonthlychargeintheentirepopulationofPreferredVisacardholders 98 两总体均值的检验 99 两总体均值的检验 独立小样本 12 22 检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等 12 22检验统计量 其中 100 两总体均值的检验 NYSENASDAQNumber2125SampleMean3 272 53SampleStdDev1 301 16Assumingequalvariances isthereadifferenceinaverageyield a 0 05 1984 1994T MakerCo 例解You reafinancialanalystforCharlesSchwab IsthereadifferenceinaveragedividendyieldbetweenstockslistedontheNYSE NASDAQ Youcollectthefollowingdata 101 两总体均值的检验 p Value2 p Valueisbetween 02and 05 a 0 05 Reject 0 2 03 Z Reject a2 2 0154 isbetween 01and 025 TestStatistic2 03isintheRejectRegion Reject 2 0154 025 值解法 102 两总体均值的检验 H0 m1 m2 0i e m1 m2 H1 m1 m2 0i e m1 m2 a 0 05df 21 25 2 44临界值 s 检验统计量 决策结论 Rejectata 0 05 Thereisevidenceofadifferenceinmeans t 0 2 0154 2 0154 025 RejectH 0 RejectH 0 025 2 03 103 两总体均值的检验 独立小样本 12 22 检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等 12 22检验统计量 104 两总体均值的检验 续 匹配样本检验两个总体的均值配对或匹配 各种前测 后测的比较如广告前后的销售额 接受训练前后的成绩差异 等由于两组数据不是独立随机样本 我们将两两的差异当成一个随机样本来处理假定条件两个总体都服从正态分布如果不服从正态分布 可用正态分布来近似 105 两总体均值的检验 106 两总体均值的检验 样本差值均值 样本差值标准差 自由度df n 1 统计量 d 假设的差值 107 两总体均值的检验 例解Assumeyouworkinthefinancedepartment Isthenewfinancialpackagefaster a 0 05level Youcollectthefollowingprocessingtimes UserExistingSystem 1 NewSoftware 2 DifferenceDiC B 9 98Seconds9 88Seconds 10T F 9 889 86 02M H 9 849 75 09R K 9 999 80 19M O 9 949 87 07D S 9 849 84 00S S 9 869 87 01C T 10 129 98 14K T 9 909 83 07S Z 9 919 86 05 108 两总体均值的检验 Isthenewfinancialpackagefaster 0 05level H0 md 0H1 md 0 a 05 检验统计量 临界值 1 8331df n 1 9 Reject a 05 1 8331 决策 RejectH0tStat intherejectionzone 结论 Thenewsoftwarepackageisfaster 3 66 109 两总体比率之差检验 比率之差检验假定条件两个总体是独立的两个总体都服从二项分布n1p1 5 n1q1 5 n2p2 5 n2q2 5可以用正态分布来近似检验统计量 110 两总体比率之差检验 例解在高校学生的一个随机样本中 36名男生中有16人说他们购买食品时看生产日期 而36名女生中则有28人说说好们购买食品时看生产日期 判断在这一点上 女生是否比男生更细心 0 05 111 两总体比率之差检验 H0 1 2 0H1 1 2 0 0 05n1 36 n2 36临界值 s 检验统计量 决策 结论 在 0 05的水平拒绝H0 女生显著高 112 两总体方差比检验 两个总体方差比的检验假定条件两个总体都服从正态分布 且方差相等两个独立的随机样本假定形式H0 s12 s22或H0 s12 s22 或 H1 s12 s22H1 s12 检验统计量F s12 s22 F n1 1 n2 1 113 两总体方差比检验 114 两总体方差比检验 NYSENASDAQNumber2125SampleMean3 272 53SampleStdDev1 301 16IsthereadifferenceinthevariancesbetweentheNYSE NASDAQatthea 0 05level 1984 1994T MakerCo 例解You reafinancialanalystforCharlesSchwab IsthereadifferenceinaveragedividendyieldbetweenstockslistedontheNYSE NASDAQ Youcollectthefollowingdata 115 两总体方差比检验 H0 s12 s22H1 s12 s22a 05df1 20df2 24临界值 检验统计量 决策 结论 Donotrejectata 0 05 0 F 2 33 0 415 025 Reject Reject 025 1 25 Thereisinsufficientevidencetoproveadifferenceinvariances 116 8 4假设检验的进一步讨论 117 区间估计与假设检验比较 根据置信区间检验求出双侧检验均值的置信区间若总体的假设值 0在置信区间外 拒绝H0 2已知时 2未知时 118 区间估计与假设检验比较 抽样分布 H0值 上限 下限 a 2 a 2 样本统计量 1 置信水平 H0值 119 区间估计与假设检验比较 左侧检验 求出单边置信下限若总体的假设值 0小于单边置信下限 拒绝H0 120 区间估计与假设检验比较 右侧检验 求出单边置信上限若总体的假设值 0大于单边置信下限 拒绝H0 121 区间估计与假设检验比较 假设检验的局限小心诠释统计显著性样本很大时 即使效应 effect 差异不大也会产生统计显著性 但可能因为效应差异不大而没有实际的效用数据上呈现的统计显著性应配合资料形态来诠释离群值的检查等配合估计区间来诠释置信区间也估计效应的大小 122 区间估计与假设检验比较 例析1000组配对样本的相关系数为0 08 在1 的显著性水平下具有显著性 仅表示有足够的证据认为总体相关系数不是零且应为正在实用上 0 08的相关性常可忽略而不会影响后续分析以散布图检查资料的相关性检查数据间是否具有函数关系 或是离群值影响相关性的强度等以相关系数的置信区间来了解相关性的强度 123 区间估计与假设检验比较 置信区间只能在预先规定的概率 前提下进行计算 而假设检验能够根据样本数据获得的统计量 Z t 及样本的其他信息 如自由度n 获得确切的概率P值 124 假设检验的几点补充说明 再谈统计显著性统计显著性的价值在于 指出 效应 effect 的发生并非偶然 的证据 可应用于 新药产品的有效性与安全性需显著性证据法庭在审理差别待遇的诉讼需要统计显著性营销者需要知道新的广告策略是否显著地优于旧的策略医学研究者要了解新的疗法是否显著得好 125 假设检验的几点补充说明 续 检验的原理是 小概率事件在一次试验中不发生 以此作为推断的依据 决定是无法拒绝或拒绝 但是这一原理只是在概率意义下成立 并不是严格成立的 即不能说小概率事件在一次试验中绝对不可能发生 126 假设检验的几点补充说明 续 在假设检验中 原假设与备选假设的地位是不对等的 一般来说是较小的 因而检验推断是 偏向 原假设 而 歧视 备选假设的 因为 通常若要否定原假设 需要有显著性的事实 即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论