版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
CHAP8假设检验第01讲假设检验的基本方法第02讲假设检验的基本概念、两类错
误、基本步骤第03讲正态总体参数的双侧检验第04讲正态总体参数的单侧检验第05讲假设总体分布已知的拟合检验第06讲假设总体分布未知的拟合检验武汉学院《概率论与数理统计》
假设检验是指对总体的分布或分布参数作某种假设,用总体的一个样本检验此假设是否成立,从而做出接受此假设还是拒绝此假设的决策,它是统计推断的又一重要内容.
§8.1假设检验的基本方法假设检验可分为两类:参数假设检验分布假设检验{从生产线上抽取一些产品进行检测,判断整批产品是否合格结合历史资料判断一段时间之内某路口发生交通事故的次数是否服从泊松分布观察大量投掷同一颗骰子的结果,判断该骰子是否均匀通过种植试验田判断某种微量元素是否对水稻有增产作用参数假设检验分布假设检验如何利用样本值对一个具体的假设进行检验?假设检验的主要依据——实际推断原理:下面结合实例来说明假设检验的基本思想.一个小概率事件在一次试验中几乎是不可能发生的例1
有一大批产品,须经检验合格后才能出厂,按标准其次品率不得超过4%.今从这批产品中任意抽查10件,发现有3件次品,问这批产品能否出厂?解:直观上看,这批产品似乎不能出厂,但理论依据何在?现以p表示这批产品的次品率,按标准,,则这批产品可以出厂;我们的问题就是要根据“10件产品中有3件次品”这一抽样结果来判断还是若若,则这批产品不能出厂.为此,我们先提出两个相互对立的假设:然后分析在成立的前提下会出现什么样的后果.
<0.01注意到,在假设成立的前提下,出现“10件产品中有3件次品”这一抽样结果的概率为这一抽样结果平均在100次抽样中难得出现1次,是小概率事件.
根据实际推断原理,这是不合理的!
产生这种不合理现象的原因就在于事先作了假设因此,应该拒绝(否定)假设,接受其对立假设即,故按标准这批产品不能出厂.
认为这批产品的次品率例2某面粉厂用自动装袋机包装面粉,面粉的袋装重量是一个随机变量,它服从正态分布.当机器工作正常时,其均值为25(kg),标准差为0.10(kg).为了正常生产,每隔一段时间要检查一次机器工作情况.现随机抽取10袋面粉,称得其袋装重量为(kg):25.1024.9525.1524.9525.2025.0525.3024.9524.9025.25假定面粉袋装重量的标准差稳定不变,试问这段时间机器工作是否正常?以X表示这段时间生产的各袋面粉的重量总体,
解由题意知,X~N(μ,0.12),其中μ未知
问题就是要根据已知样本来判断μ=25还是μ≠25
机器工作正常机器工作异常为此,我们先提出下面两个对立的假设
在H0为真时,包装出来的平均重量应该和25kg差不多,也就是对于某个常数K,因此只要找到合适的K值就可以判断包装机是否正常。
即应该比较小,应该是个小概率事件,(不难理解,K值与样本容量n是有关系的.)在假设H0成立的前提下,将有由定理6.1可知由附表2可得使相当于取给定一个小概率α,N(0,1)如果则拒绝H0如果则接受H0通常α取0.05、0.01、0.1等值
因此,对于给定的假设H0现在抽样结果算得若取则于是即在一次抽样中小概率事件居然发生了
这表明在假设H0成立的前提下出现了不合理的现象
因此,我们应该拒绝(否定)H0,接受H1即认为这段时间机器工作不正常,需要检修.
谢谢!
CHAP8假设检验第02讲 假设检验的基本概念、两类错误、基本步骤在上述两个例子中,我们称假设H0为原假设,称其对立假设H1为备择假设。假设检验的目的就是要在H0与H1之间做出一种选择:接受原假设H0而拒绝备择假设H1或者拒绝原假设H0而接受备择假设H1在前面的第一个例子中,备择假设H1表示p在0.04的右侧,称为右侧备择假设,相应的检验称为右侧检验则称H1为左侧备择假设,相应的检验称为左侧检验.
类似地,如果需要检验假设左侧检验与右侧检验统称为单侧检验.
在前面的第二个例子中,备择假设H1表示μ在0.5的两侧,称为双侧备择假设,相应的检验称为双侧检验.一般地,对于双侧检验问题,只写出原假设H0就可以了.但对单侧检验,必须提出备择假设.在前面的第二个例子中,用统计量U的观测值的绝对值与进行比较为假设H0的拒绝域为假设H0的接受域和为检验统计量U的临界值.
称称称通常称U为检验统计量假设检验实际上就是概率意义下的“反证法”.如果假设H0为真而导致小概率事件在一次抽样中发生了,则认为出现了不合理现象,这表明原假设H0很可能不成立,从而应拒绝H0如果原假设H0没有导致上述不合理现象发生,则没有理由拒绝H0
,只好接受H0
.
但是,必须注意,这个反证法是带有概率性质的,它与我们在纯数学中所使用的反证法不能完全等同.
这里所谓的“出现了不合理现象”,并不是逻辑推理中出现的绝对矛盾,而是根据“小概率事件在一次抽样中不会发生”这样一个人们在实践中广泛采用的原理推断的结果.
假设检验有可能犯的两类错误:原假设H0为真
客观事实决策结果原假设H0为假
接受H0
拒绝H0
接受H0
拒绝H0
犯第一类错误(又称“弃真”错误)犯第二类错误(又称“取伪”错误)犯第一类错误(“弃真”错误)的概率记为α犯第二类错误(“取伪”错误)的概率记为β当然,我们总希望犯上述两类错误的概率都很小
但实际上,在样本容量固定时,要使两类错误都很小是很难办到的.nαβ要使α与β都很小,只有充分地增大样本容n才行,而这又是实际不允许的.为了不犯错误地检验火柴的质量,那就把火柴厂一天生产的所有火柴都划一遍?!为了不犯错误地检验钢筋的抗拉强度,那就把钢铁厂一天生产的所有钢筋都拉断测量?!人们对犯两类错误所产生的后果看法一致吗?如果有人告诉你,本课程所有的考试题均来自于某一本习题集,但不知具体是哪几道,你将怎样复习?如果你得知自家的花园中埋着一只珍贵的元青花瓷盘,为了得到它,但不知具体位置,你会怎么做?经常在影视中看到的“地毯式搜索”,其意义何在?事实上,人们通常认为犯第一类错误的后果要比犯第二类错误的后果严重得多.基于这种情况,一般遵循控制犯第一类错误的原则,即在控制犯第一类错误的概率不超过α的条件下,尽量使犯第二类错误的概率减小.
这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的假设检验,称为显著性检验.
在显著性检验中,如果控制犯第一类错误的概率不超过α,则称α为显著性水平.对显著性水平进行限制,体现了“保护原假设”的原则.显著性水平对所做的推断有何影响?通常,α越小,则拒绝域也会越小,产生的后果就是使原假设更难以被拒绝.因此,在原假设的选取上应慎重对待。α的大小视具体情况而定,通常取0.1、0.05、0.01、0.005等值。对于同一假设检验问题,在不同的显著性水平下,有可能做出不同的结论.
假设检验问题的基本步骤(1)根据实际问题的要求,提出原假设H0与备择假设H1.当H1为双侧备择假设时也可以不写出;(2)选取适当的检验统计量W,并在原假设H0成立的前提下,确定出统计量W的概率分布;
(3)根据具体情况,选取适当的显著性水平α及样本容量n;(4)利用W的分布求出W相应于α和n的临界值及H0的拒绝域;(5)由样本观察值计算出W的观测值,并与临界值作比较,决定拒绝原假设H0还是接受原假设H0.
谢谢!
CHAP8假设检验第03讲正态总体参数的双侧检验8.2.1单个正态总体均值的双侧检验设总体均值μ未知,要求检验假设为已知常数,下面分已知和未知两种情况进行讨论.是X的一个样本,取显著性水平为α1.已知情形在原假设H0成立的前提下,由定理6.1知对于给定显著性水平α及样本容量n使由附表2可得演示N(0,1)对于样本均值的观测值则拒绝H0这种用标准正态统计量来检验假设的方法称为U检验法(或Z检验法)则接受H0例3
某切割机在正常工作时,切割每段金属棒的平均长度为10.5cm,标准差是0.15cm,今从一批产品中随机的抽取15段进行测量,其结果如下:假定切割的长度服从正态分布,且标准差没有变化,试问该机工作是否正常?查表得解∴接受H0,认为该机器工作正常2.在原假设H0成立的前提下,由定理6.3知对于给定的显著性水平α及样本容量n使未知情形由附表3可查得演示t(n-1)对于样本均值的观测值则拒绝H0由于这里的检验统计量服从t分布,通常称上面的检验方法为t检验法
.则接受H0和样本标准差的观测值s例4某电器厂生产一种云母片,云母片的厚度服从正态分布,厚度均值为0.130mm.
现从某天生产的云母片中随机抽取10片,测量其厚度,算得样本均值为0.146mm,样本标准差为0.014mm.问这天生产的云母片的平均厚度与以往有无显著差异?(α=0.05)
查表得解∴拒绝H0,认为今天生产的云母片平均厚度与以往有显著差异.8.2.2单个正态总体方差的双侧检验设总体均值μ要求检验假设为已知常数,是X的一个样本,取显著性水平为α和
未知,在原假设H0成立的前提下,由定理6.2知
对于给定的显著性水平α及样本容量n与使由附表4可查得演示根据样本算出的观测值若或则拒绝H0由上述统计量给出的检验方法称为检验法.若则接受H0例5某电池厂生产一种碱性电池,其寿命长期以来服从方差为(h2)的正态分布.今有一批这种电池,从它的生产情况来看,寿命的波动性有所改变.为判断这一看法是否合乎实际,现从这批电池中随机抽取26只,测出其寿命的样本方差为(h2).问根据这一数据能否断定这批电池的寿命的波动性较以前有显著变化?取显著性水平为0.02.解由附表4查得∴应接受H0,即在显著性水平0.02下可以认为这批电池的寿命的波动性较以前无显著变化.8.2.3两个正态总体均值差的双侧检验设与分别是来自正态总体与的样本,二者相互独立,与分别是这两个样本的样本均值,与设两个正态总体的均值及方差分别是这两个样本的样本方差.均未知,在原假设H0成立的前提下,由定理6.4知其中现要检验假设取显著性水平为α.对于给定的显著性水平α及样本容量由附表3可查得使演示t(n1+n2-2)根据t检验法,进行一次具体的抽样的观测值算出若则拒绝原假设H0
则接受原假设H0若例6
对用两种不同热处理方法加工的金属材料作抗拉强度试验,得到数据如下(kg/cm2)方法Ⅰ:313429263235383430293231方法Ⅱ:262428293029322631293228设用两种不同热处理方法加工的金属材料的抗拉强度各构成正态总体,且两个总体的方差相同.问用两种不同热处理方法加工的金属材料的平均抗拉强度是否有显著差异?取显著性水平α=0.05.解以X和Y分别表示用方法Ⅰ和方法Ⅱ加工的金属材料的抗拉强度总体和分别表示这两个总体的均值.其中与均未知按题意以问题是要检验假设
检验统计量为由附表3查得∴应拒绝假设H0,即可以认为用两种不同热处理方法加工的金属材料的平均抗拉强度有显著差异.8.2.4两个正态总体方差比的双侧检验设与分别是来自正态总体与的样本,二者相互独立,与设两个正态总体的均值及方差现要检验假设取显著性水平为α.分别是这两个样本的样本方差.均未知在原假设H0成立的前提下,由定理6.4知对于给定的显著性水平α及样本容量从附表5可以查得及使演示进行一次具体的抽样,算出观测值若则拒绝原假设H0则接受原假设H0或若上述假设检验中的检验统计量是一F变量,通常称上面检验方法为F检验法.例7
两台车床加工同一零件,分别取6件和9件测量直径,得:假定零件直径服从正态分布,能否据此断定解从附表5查得例8
分别用两个不同的计算机系统检索10个资料,测得平均检索时间及方差(单位:秒)如下:解假定检索时间服从正态分布,问这两系统检索资料有无明显差别?根据题中条件,首先应检验两总体方差是否相等从附表5查得然后再进一步检验下列假设:认为两系统检索资料时间无明显差别.从附表3查得谢谢!
CHAP8假设检验第04讲正态总体参数的单侧检验8.2.5正态总体均值与方差的单侧检验例9
某炼铁厂铁水的平均含碳量过去较长一段时间内一直是4.40,技术革新后测得10炉铁水的含碳量如下4.34,4.40,4.30,4.42,4.354.38,4.32,4.40,4.36,4.34假定铁水的含碳量服从正态分布,问技术革新后铁水含碳量的均值是否显著降低?取显著性水平α=0.05解以X表示技术革新后各炉铁水的含碳量总体和分别表示其均值和方差与要求检验假设
以按题意,均未知根据定理6.3有(1)若对于此类单侧检验问题,由于原假设H0比较复杂,需要分下面两种情况来讨论:于是,对给定的显著性水平α,有
(2)若则因此,对任一常数c,是由概率的性质知的子事件根据定理6.3,于是,对给定的显著性水平α,有
从而
综上所述,在,即原假设H0成立的前提下有对于α=0.05,n=10,查附表3得由测得的数据算得从而t的观测值为即在显著性水平α=0.05下可认为技术革新后铁水含碳量的均值较以前有显著降低.∴拒绝原假设H0而接受备择假设H1例10一台自动机床加工某种轴件的直径(单位:mm)服从正态分布,已知原加工精度某日从该机床加工的轴件中抽取30个,测得数据如下:直径9.29.49.69.810.010.210.410.610.8频数113675421问当日机床的加工精度较前是否变差(即取显著性水平α=0.05变大)?解
以X表示当日加工的轴件的直径总体和分别表示其均值和方差要求检验假设由于此检验为单侧检验,在原假设H0成立的前提下,分两种情况来讨论:(1)若则由定理6.2知以由题意知于是,对给定的显著性水平α,有(2)若则因此,对任一常数c,是由概率的性质知的子事件根据定理6.2,于是,对给定的显著性水平α,有从而由上述讨论结果知,在原假设H0成立的前提下有对于α=0.05,n=30,查附表4得根据测得的数据算得从而的观测值为∴应拒绝原假设H0而接受备择假设H1即在显著性水平α=0.05下可以认为当日自动机床的加工精度变差了.谢谢!
CHAP8假设检验第05讲 假设总体分布已知的拟合检验在实际问题中,有时不知道总体服从什么类型的分布,这时就需要对总体的分布提出某种假设,并用总体的一个样本检验此假设是否成立,即所谓分布假设检验.
分布假设检验分为两类假设总体分布为未知的检验假设总体分布为已知的检验拟合检验法
8.3.1假设总体分布为已知的检验设总体X的分布函数F(x)已知,这里F0(x)是一已知的分布函数,其中不含任何未知参数.是X的一个样本,要求检验假设:下面主要从概率与频率之间的关系的角度出发,构造检验方法.在原假设H0成立的前提下,先将X所有可能的值构成的集合Ω分成适当有限个互不相交的子集并由分布函数F0(x)求出X在中取值的概率
再进行一次具体的抽样,测值落在每个中的频数及相应的频率计算出样本的观统计量的极限分布由下面定理给出.考察频率与概率的偏差的加权平方和由于频率是概率的反映,频率分布与概率分布的拟和程度.所以值的大小可以刻划定理8.1(皮尔逊定理)的分布趋于自由度为l-1的即统计量的极限分布为如果原假设H0成立,则当样本容量n→∞时,统计量分布,该定理证明从略.根据皮尔逊定理,当n充分大(n≥50)时,近似地服从分布.
利用统计量可以检验原假设H0,也叫做皮尔逊统计量.
统计量给定显著性水平α,由附表4可查得使进行一次具体的抽样(n≥50),算出的观测值.则拒绝原假设H0则接受原假设H0若若的值,上述检验方法称为拟和检验法.使用时应注意以下几点:(2)根据实践经验,要求样本容量n≥50,且要求理论频率npk≥5,若npk<5,则应适当合并Ak,以满足此要求.(1)原假设H0中的总体分布也可以用分布律或密度函数来表示只要在H0成立的前提下,能够确定出皮尔逊统计量中的每个概率pk就行.例11
将一枚骰子抛掷120次,结果如下点数123456频数212819241612问这枚骰子的六个面是否匀称?取显著性水平α=0.05.解将骰子六个面的点数作为总体X,问题化为检验假设
下面用由题意知,在原假设H0成立的前提下,的观测值为拟和检验法来检验.对于查附表4得∴应接受原假设H0即在显著性水平0.05下可以认为六个面是匀称的.例12
某正弦波的初相位Φ是一随机变量,其可能取值的全体为区间[0,2π].在100次独立观察中,Φ在[0,2π]的10个等分区间上取值的频数如下其中问Φ在[0,2π]上是否服从均匀分布?(取α=0.05)解记Φ的密度函数为f(x),按题意需要检验假设在H0成立的前提下,有于是皮尔逊统计量的观测值为对于查附表4得∴应接受H0即在显著性水平0.05下,可以认为Φ在[0,2π]上是否分从均匀分布.谢谢!
CHAP8假设检验第06讲 假设总体分布未知的拟合检验8.3.2假设总体分布未知的检验设总体X的分布函数F(x)未知,一个样本,要求检验假设这里函数的表达式已知,而参未知.是X的数检验统计量的计算流程(原假设H0成立为前提)样本观测值最大似然估计法求出估计值
用代替
将Ω分成互不相交的子集求X在每个Ak上的概率计算样本值在每个Ak上的频数的分布由以下定理给出定理8.2
如果原假设H0成立,则当样本容量n→∞时,的分布趋于自由度为的即统计量的极限分布为显然定理8.1是定理8.2在m=0时的特殊情形.统计量分布,定理的证明从略.根据此定理,对于给定的显著性水平α及充分大的样本容量(n≥50),有在一次具体的抽样之后,计算出的观测值则拒绝原假设H0
若则接受原假设H0
若
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 慢病营养干预配餐执行服务方案
- 椎间盘突出整脊治疗指南
- 蔬菜根结线虫防治方案
- 针刀治疗临床方案
- 绿色食品病虫害防控作业标准
- 小麦赤霉病应急处置防治预案
- 玉米螟性诱剂诱捕监测技术
- 牛羊冬季保膘越冬饲养方案
- 门店财务收银对账流程规范
- 急救箱药品配置与管理规定
- 电气建修公司运营方案
- 医疗机构内部管理问题及整改措施
- QCT 242-2024《汽车车轮静不平衡量要求及检测方法》
- 加强业财融合 提升财务管理水平
- 新改版教科版五年级下册科学第四单元测试四(含答案)
- 基于PLC自动门控制系统的设计
- 2023年3月合肥市包河区九年级语文第一次质量检测卷附答案解析
- 中国普通食物营养成分表(修正版)
- 病原微生物实验活动风险评估表
- 21ZJ111 变形缝建筑构造
- 财务报表中英文对照版
评论
0/150
提交评论