03HypothesisTesting
2 假设检验在统计方法中假设检验在统计方法中的地位的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验3课程目标课程目标 什么是假设? 介定 “原假设”和“备择假设”. 说明相关术语 什么是假设检验? 假设检验的分类.4总体总体: 统计总体统计总体用以定义所有可知或不可知参数(m, s)的数据或信息样品样品: 总体中具有共同特征的子集。可以计算其形成的统计表(X).应取多少样本?应取多少样本?为何要选取样本?为何要选取样本?样本需要随机抽取吗?样本需要随机抽取吗?可能出现取样可能出现取样错误吗?错误吗?5样本样本 A所有的过程都有差异.来源于给定过程的样本也可能是多样化的.样本样本 B我们怎样区分随机变化的样本和真实总体的差别呢?6 对总体参数的具体数值所作的陈述总体参数包括总体均值总体均值、比例比例、方差方差等分析之前之前必需陈述什么是假设什么是假设?(hypothesis)7原假设 (Ho)通常用以描述现状除非其它方面有所说明,否则就是人为设想的。在Minitab中用“=”表示备择假设 (Ha ):通常用以描述差別以证据为基础接受或拒绝的类型在Minitab中用“not =or ”表示 不是不是全全虚虚性性假设(相同)就是选择性假设(相区别的)假设(相同)就是选择性假设(相区别的)8原假设HO: X1=TargetHO: X1=mHO: X1-X2=0HO:m1-m2=0HO: X1=X2=X3=.XnHO: s1=s2HO: S1=S2HO: S1=S2=S3=.Sn备择性假设HA:m1m2 不等式是针对两边的测试HA:X1X2HA:m1m2HA:X1X2 单边测试用于 假设.HA: m1m2HA:X1X2HA: X1-X20 _HA: X1-X20 _HA: s1s2 _HA: s1S2 _把假设以等式陈述很有用把假设以等式陈述很有用. 9假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : m m = m m0 0H0 : : m m m m0 0H0 : : m m m m0 0备择假设备择假设H1 : : m m m m0 0H1 : : m m m m0 010【例】例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,并说明你的理由。11【例】例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,并说明你的理由。12【例】例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,并说明你的理由。131.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理14 什么小概率?什么小概率? 1.在一次试验中,一个几乎不可能发生的事件发生的概率 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3.小概率由研究者事先确定15m m = 5016我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择! 171. 为了改进过程,我们需要确定影响均值和标准偏差的因素为了改进过程,我们需要确定影响均值和标准偏差的因素.2. 一旦确定了这些因素并对改进措施进行了调整,我们就需要一旦确定了这些因素并对改进措施进行了调整,我们就需要验证其在过程中的切实效果。验证其在过程中的切实效果。3. 若过程中存在统计上的重大差别,有时我们就不能利用图表若过程中存在统计上的重大差别,有时我们就不能利用图表或算得的统计数据(样本均值和样本标准偏差)作出决策或算得的统计数据(样本均值和样本标准偏差)作出决策.4. 在这种情况下,决定可能是主观的在这种情况下,决定可能是主观的.5. 我们采用我们采用正统正统假设检验以客观地判断是否存在差別。假设检验以客观地判断是否存在差別。假设检验有助于判断一个明显的差别是否真实存在还是偶然的,假设检验有助于判断一个明显的差别是否真实存在还是偶然的,而且还可以提高差异真实性的可信度而且还可以提高差异真实性的可信度.数据帮助数据帮助每个每个人作出同样的决定。人作出同样的决定。18美国的司法体系可以用于阐述假设检验的概念.在美国罪犯在被判有罪之前均是清白的.清白对应原假设.它需要强而有力的证据,必需“排除所有合理的怀疑”才能把被告定罪. 若陪审团裁定被告有罪则相当于拒绝原假设接受备择假设. 更具体些更具体些,我们拥有重要的证据证明差別的存在我们拥有重要的证据证明差別的存在.Ho : 被告是清白的被告是清白的.Ha : 被告有罪被告有罪.当得知真相后,可能的结果是什么当得知真相后,可能的结果是什么?19真相真相裁决裁决Ho, =Ha, not =Ho, =Ha, not =清白清白监禁监禁有罪有罪释放释放清白清白释放释放有罪有罪监禁监禁释放释放监禁监禁清白清白有罪有罪Type I 错误错误 (a a 错误错误) 当当 Ho 是是无无误时而误时而拒绝拒绝 有时称作有时称作 生产者风险生产者风险Type II 错误错误 ( (b b 错误错误) 是当是当 Ho有错误时却有错误时却接受接受 有时称作有时称作 消费者风险消费者风险.DecisionType 1错误错误a aType 2错误错误b b正确正确决定决定(1- a a)正确正确决定决定(1- b b)真相真相Ho, =Ha, not =Ho, =Ha, not =20 1. 第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设第类错误的概率记为a 被称为显著性水平 2. 第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设第类错误的概率记为b (Beta)21你不能同时减你不能同时减少两类错误少两类错误!221.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为 a (alpha)常用的 a 值有0.01, 0.05, 0.104.由研究者事先确定23 衡量决策风险的另一种方法是通过衡量决策风险的另一种方法是通过P值值. P值是指一个因素可测的重要性水平. 当样本和总体相对时,P值是指观测到其中差別的机会率. P值也指如果拒绝虚无性假设可能发生错误的概率(错误I) 除非在基于工程判断上的例外,我们将错误I 的可接受水平定在a = 0.05. 从而,任何小于0.05的P值就表示虚无性假设被拒绝。24置信区间置信区间 确定了总体参数中样本确定了总体参数中样本统计可能的数值范围统计可能的数值范围. 它它们可以们可以是单边也可是双边是单边也可是双边。a-12a2aRiskRiska-12a2aRiskRiskXa-1a-1a-12a2a2a2a2a2aRiskRiska-1a-1a-12a2a2a2a2a2aRiskRiskX样本均值、样本标准偏差、样本样本均值、样本标准偏差、样本方异和其它样本统计被称为特征方异和其它样本统计被称为特征值评估者。因为它们是用以代表值评估者。因为它们是用以代表总体参数的单一总体参数的单一数数值。值。25 所有的估计都有一个范围(基于一定的置信度),这个范围即所谓的置信区间。 举个例子:在95%的置信度下估计某样本平均值为100+/-7,换句话说你有95的信心从总体中抽取的样本平均值应落在93107之间。 不同置信水平下的置信区间: 909598102105110-+-+-+-+-+-+-|-70%-|-80%-|-90%-|26 工程中总存在变异,这些变异通常导致试验结果与目标值之间存在偏移(当试验样本无限大时,这种偏移会趋近于零)。 根据某一样本(样本大小有限)来估计总体(样本无限大时)的整体的平均值和标准差就是区间估计. 平均值估计: 标准差估计:27a a/2 28假设总是关于总体参数的假设总是关于总体参数的陈述陈述.1. 定明原假设 (Ho ) HO : A国与B国居民身高相等 (m A = m B ).规定选择性假设 (Ha )HA : A国居民身高低于B国居民的身高 (m A m B ).2. 基于在需被测试的假设上,决定适合的统计测试.3. 决定可接受的风险程度.a 风险: 通常 5% (默认值)b 风险: 通常10 20% (默认值)294.决定适合测试的样本数量5.从总体中选取需观察的样本群.6.计算样本的统计.7.用统计测试方法测验备择假设. 8.在测试结果的基础上,根据先前确定的标准,做出选择或拒绝Ho 的决定.9.转化结果. 将统计的结论转换为现实的结果.统计结论: 我们能从统计的角度证明差別吗?现实结果: 我们需注意这些差別吗?30数数: 31一个总体参数的检验一个总体参数的检验z 检验检验(单侧和双侧单侧和双侧) t 检验检验(单侧和双侧单侧和双侧)z 检验检验(单侧和双侧单侧和双侧) 2 2 检验检验(单侧和双侧单侧和双侧)均值均值一个总体一个总体比例比例方差方差