置信度置信区间_第1页
置信度置信区间_第2页
置信度置信区间_第3页
置信度置信区间_第4页
置信度置信区间_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、置信水平出自 MBA智库百科()置信水平(Confidence level) 目录显示· 1 什么是置信水平· 2 置信水平的确定· 3 置信水平的置信度· 4 相关条目编辑什么是置信水平 置信水平来表示样本统计值的精确度,它是指样本统计值落在参数值某一正负区间内的概率。 编辑置信水平的确定 但确定置信水平究竟是百分之几,则主要决定于以下两个要素: 第要素是内部控制的健全状况和运用状况如何。也就是说,在内部控制的完备状况和运用状况均属良好的情况下,选择80的置信水平就可以了,但当内部控制的完备状况和运用状况并不充:分时,就必须选择95乃至99的置信水平。

2、 影响确定置信水平的另一要素是受审查公司的环境条件。这种环境条件是指一般的经济条件、特殊的经济法律条件、受审查公司的经营组织和财务构成等。在这些条件对受审查公司不利4如销售收入明显下降)的情况下,就应决定在依据性试验中选择较高的置信水平。 、 但是,因为环境条件的内容是多种多样的,所以,审计人员必领以高度的专业能力来进行判断,并根据这种判断来认真研究环境的条件,以决定置信水平的选择。 编辑置信水平的置信度 置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在

3、一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。 置信水平是描述GIS中线元素与面元素的位置不确定性的重要指标之一。置信水平表示区间估计的把握程度,置信区间的跨度是置信水平的正函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的准确程度。 置信区间出自 MBA智库百科()置信区间(Confidence interval) 目录显示· 1 什么是置信区间· 2 置信区间的概述· 3 置信区间的计算步骤· 4 关于置信区间的宽窄· 5 置信区间与置信水平、样本量的关系· 6 相关条目编辑什么是

4、置信区间 置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。 编辑置信区间的概述 1、对于具有特定的发生概率的随机变量,其特定的价值区间:一个确定的数值范围(“一个区间”)。 2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。 3、该区间包含了参数真值的可信程度。 4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。 编辑置信区间的计算步骤 第一步:求一个样本的均值 第二步:计算出抽样误差。 人们经过实践,通常认为调查: 100个样本的抽样误差为±10%; 500个样本的抽样误差为±5

5、%; 1,200个样本时的抽样误差为±3%; 第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。 编辑关于置信区间的宽窄 窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。 假设全班考试的平均分数为65分,则 置 信 区间 间隔 宽窄度 表 达 的 意 思 0-100分 100 宽 等于什么也没告诉你 30-80分 50 较窄 你能估出大概的平均分了(55分) 60-70分 10 窄 你几乎能判定全班的平均分了(65分) 编辑置信区间与置信水平、样本量的关系 1.样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。

6、 实例分析: 经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同): 样本量置信区间间隔宽窄度 10050%-70%20宽 80056.2%63.2%7较窄 1,60057.5%-63%5.5较窄 3,20058.5%-62%3.5更窄 由上表得出: 1、在置信水平相同的情况下,样本量越多,置信区间越窄。 2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。 通过置信区间的计算公式来

7、验证置信区间与样本量的关系 置信区间=样本的推断值±(可靠程度系数× ) 从上述公式中可以看出: 在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。 2.置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。 实例分析: 美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下: 抽样误差置信水平置信区间间隔宽窄度 ±39560±357-636宽 &#

8、177;2.39060±2.357.7-62.34.6窄 由上表得出: 在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。 抽样误差(Sampling error) 编辑什么是抽样误差 在抽样检查中,由于用样本指标代替全及指标所产生的误差可分为两种:一种是由于主观因素破坏了随机原则而产生的误差,称为系统性误差;另一种是由于抽样的随机性引起的偶然的代表性误差。抽样误差仅仅是指后一种由于抽样的随机性而带来的偶然的代表性误差,而不是指前一种因不遵循随机性原则而造成的系统性误差。 总的说来,抽样误差是指样本指标与全及总体指标之间的绝对误差。在进行抽样检查时不可避

9、免会产生抽样误差,因为从总体中随机抽取的样本,其结构不可能和总体完全一致。例如样本平均数与总体平均数之差,样本成数与总体成数之差 | p P | 。虽然抽样误差不可避免,但可以运用大数定律的数学公式加以精确地计算,确定它具体的数量界限,并可通过抽样设计加以控制。 抽样误差也是衡量抽样检查准确程度的指标。抽样误差越大,表明抽样总体对全及总体的代表性越小,抽样检查的结果越不可靠。反之,抽样误差越小,说明抽样总体对全及总体的代表性越大,抽样检查的结果越准确可靠。在统计学中把抽样误差分为抽样平均误差和抽样极限误差,下面就这两种误差分别进行阐释。为使推理过程简化,这里不对属性总体进行分析,而仅对变量总体

10、进行分析计算。 编辑抽样误差的计算 1、表现形式:平均数指标抽样误差;成数(比重)抽样误差。 2、平均数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: 3、成数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: 编辑抽样误差的控制措施 抽样误差则是不可避免的,但可以减少,其措施有: 1、增加样本个案数。 2、适应选择抽样方式。 例如,在同样条件下,又重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其它方法的抽样误差小。由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。 显著

11、性水平出自 MBA智库百科()(重定向自显著水平)显著性水平(Significance Level) 编辑什么是显著性水平 假设检验是围绕对原假设内容的审定而展开的。如果原假设正确我们接受了(同时也就拒绝了备择假设),或原假设错误我们拒绝了(同时也就接受了备择假设),这表明我们作出了正确的决定。但是,由于假设检验是根据样本提供的信息进行推断的,也就有犯错误的可能。有这样一种情况,原假设正确,而我们却把它当成错误的加以拒绝。犯这种错误的概率用表示,统计上把称为假设检验中的显著性水平,也就是决策中所面临的风险。 显著性水平是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了的概率或风险。它

12、是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取0.05或0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95或99。 显著性水平代表的意义是在一次试验中小概率事物发生的可能性大小。 编辑显著性水平的理解 显著性水平是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受区间。事件属于接受区间,原假设成立而无显著性差异;事件属于拒绝区间,拒绝原假设而认为有显著性差异。对显著水平的理解必须把握以下二点: 1、显著性水平不是一个固定不变的数值,依据拒绝

13、区间所可能承担的风险来决定。 2、统计上所讲的显著性与实际生活工作中的显著性是不一样的。 显著性差异出自 MBA智库百科()显著性差异(Significance Difference) 编辑什么是显著性差异 显著性差异是一个统计学名词。它是统计学(Statistics)上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的。 如比西一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前

14、测后测的数据会有显著性差异。例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异,这一差异很可能来自于学××记忆法对被试记忆能力的改变。 编辑显著性差异的评析 显著性差异是一种有量度的或然性评价。比如,我们说A、B两数据在0.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为95。两个数据所代表的样本还有5的可能性是没有差异的。这5的差异是由于随机误差造成的。 P-value是原假设H0真实的结论时,我们观察到样本的值有多大的概率,简称P值。如果此值小,就下原假设为不真实的结论。统计学上称为小概率事件,即样本不是从原假设的分布中

15、抽出的。一般P值大于,则无法拒绝原假设,相反,P值小于,则拒绝原假设。通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之间具备了显著性差异。在作结论时,应确实描述方向性(例如显著大于或显著小于)。 如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设(Alternative Hypothesis)得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。 假设检验出自 MBA智库百科()假设检验(Hypothesis Testing)

16、 目录显示· 1 什么是假设检验· 2 假设检验的基本思想· 3 假设检验的原理· 4 假设检验的种类· 5 假设检验的基本思想· 6 假设检验规则与两类错误· 7 假设检验的一般步骤· 8 假设检验应注意的问题· 9 假设检验与置信区间的关系· 10 几种常见假设检验· 11 假设检验的应用分析 o 11.1 案例一:假设检验设备判断中的应用1o 11.2 案例二:假设检验在卷烟质量判断中的应用2· 12 相关条目· 13 参考文献编辑什么是假设检验 假设检验是用

17、来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的

18、目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。 在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。假设检验的思想是,先假设两者相等,即:0,然后用统计的方法来计算验证你的假设是否正确。 编辑假设检验的基本思想1.小概率

19、原理 如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。 2.假设的形式 H0原假设, H1备择假设 双尾检验:H0: = 0 , 单尾检验: ,H1: < 0 , H1: > 0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 编辑假设检验的原理 一般地说,对总体某项或某几项作出假设,然后根据样本对假设作出接受或拒绝的判断,这种方法称为假设检验。 假设检验使用了一种类似于“反证法”的推理方法,它的特

20、点是: (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受

21、的假设,记作H1。 编辑假设检验的种类假设检验可分为正态分布检验、正态总体均值分布检验、非参数检验三类。 正态分布检验包括三类:JB检验、KS检验、Lilliefors检验,用于检验样本是否来自于一个正态分布总体。 正态总体均值检验检验分析方法和分析结果的准确度,考察系统误差对测试结果的影响。从统计意义上来说,各样本均值之差应在随机误差允许的范围之内。反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了显著性差异。 正态总体均值检验分为两种情况, t检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均数的显

22、著性,分为单侧检验与双侧检验。当为双样本检验时,在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。 Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。 上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。非参数检验方法,对样本是否来自正态总体不做严格的限制,而且计算简单。统计工具箱提供了符号检验和秩和检验两种非参数检验方法。 编辑假设检

23、验的基本思想 假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。 编辑假设检验规则与两类错误 1.确定检验规则 检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。 差异临界点判断 c拒绝H0 c接受H0 怎样确定c? 2.两类错误 接受或拒绝H0,都可能犯错误 I类错误弃真错误,发生的概率为 II类错误取伪错误

24、,发生的概率为 检验决策H0为真H0非真 拒绝H0犯I类错误()正确 接受H0正确犯II类错误() 大就小,小就大 基本原则:力求在控制前提下减少 显著性水平,取值:0.1, 0.05, 0.001, 等。如果犯I类错误损失更大,为减少损失,值取小;如果犯II类错误损失更大,值取大。 确定,就确定了临界点c。 设有总体:XN(,2),2已知。 随机抽样:样本均值barXN(mu,sigma2/n)。 标准化: 确定值, 查概率表,知临界值 计算Z值,作出判断。 编辑假设检验的一般步骤 编辑假设检验应注意的问题 1、做假设检验之前,应注意资料本身是否有可比性。 2、当差别有统计学意义时应注意这样

25、的差别在实际应用中有无意义。 3、根据资料类型和特点选用正确的假设检验方法。 4、根据专业及经验确定是选用单侧检验还是双侧检验。 5、当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。 6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。 7、报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围

26、。 编辑假设检验与置信区间的关系假设检验与置信区间有密切的联系,我们往往可以由某参数的显著性水平为的检验,得到该参数的置信度为1的置信区间,反之亦然。例如,显著性水平的均值的双侧检验问题: H0: = 0, 与置信度为1- 的置信区间之间有着这样的关系;若检验在水平下接受H0,则的1 - 的置信区间必须包含0;反之,若检验在 水平下拒绝H0,则的1-的置信区间必定不包含0。因此,我们可以用构造的1-置信区间的方法来检验上述假设,如果构造出来的置信区间包含0,就接受H0;如果不包含0就拒绝H0。同样给定显著水平 ,可以从构造检验规则的过程中,得到的 1-置信区间。 如上例,的置信度为95%的置信

27、区间为: 即置信区间为(80.55 , 85.45),因为0 = 80,不在这个区间内,拒绝H0 编辑几种常见假设检验考虑下面三种类型的假设检验: (4.12) (1)(双边检验) (2)(右侧单边检验) (3)(左侧单边检验) 编辑假设检验的应用分析 编辑案例一:假设检验设备判断中的应用1例如:某公司想从国外引进一种自动加工装置。这种装置的工作温度X服从正态分布(,52),厂方说它的平均工作温度是80度。从该装置试运转中随机测试16次,得到的平均工作温度是83度。该公司考虑,样本结果与厂方所说的是否有显著差异?厂方的说法是否可以接受? 类似这种根据样本观测值来判断一个有关总体的假设是否成立的

28、问题,就是假设检验的问题。我们把任一关于单体分布的假设,统称为统计假设,简称假设。上例中,可以提出两个假设:一个称为原假设或零假设,记为H0:=80(度);另一个称为备择假设或对立假设,记为H1 :80(度)这样,上述假设检验问题可以表示为: H0:=80H1:80 原假设与备择假设相互对立,两者有且只有一个正确,备择假设的含义是,一旦否定原假设H0,备择假设H1备你选择。所谓假设检验问题就是要判断原假设H0是否正确,决定接受还是拒绝原假设,若拒绝原假设,就接受备择假设。 应该如何作出判断呢?如果样本测定的结果是100度甚至更高(或很低),我们从直观上能感到原假设可疑而否定它,因为原假设是真实

29、时,在一次试验中出现了与80度相距甚远的小概率事件几乎是不可能的,而现在竟然出现了,当然要拒绝原假设H0。现在的问题是样本平均工作温度为83度,结果虽然与厂方说的80度有差异,但样本具有随机性,80度与83度之间的差异很可能是样本的随机性造成的。在这种情况下,要对原假设作出接受还是拒绝的抉择,就必须根据研究的问题和决策条件,对样本值与原假设的差异进行分析。若有充分理由认为这种差异并非是由偶然的随机因素造成的,也即认为差异是显著的,才能拒绝原假设,否则就不能拒绝原假设。假设检验实质上是对原假设是否正确进行检验,因此,检验过程中要使原假设得到维护,使之不轻易被否定,否定原假设必须有充分的理由;同时

30、,当原假设被接受时,也只能认为否定它的根据不充分,而不是认为它绝对正确。 编辑案例二:假设检验在卷烟质量判断中的应用2在卷烟生产企业经常会遇到如下的问题:卷烟检验标准中要求烟支的某项缺陷的不合格品率P不能超过3%,现从一批产品中随机抽取50支卷烟进行检验,发现有2支不合格品,问此批产品能否放行?按照一般的习惯性思维:50支中有2支不合格品,不合格品率就是4%,超过了原来设置的3%的不合格品率,因此不能放行。但如果根据假设检验的理论,在0.05的显著性水平下,该批产品应该可以放行。这是为什么呢? 最关键的是由于我们是在一批产品中进行抽样检验,用抽样样本的质量水平来判别整批的质量水平,这里就有一个

31、抽样风险的问题。举例来说,我们的这批产品共有10000支卷烟,里面有4支不合格品,不合格品率是0.04%,远低于3%的合格放行不合格品率。但我们的检验要求是随机抽样50支,用这50支的质量水平来判别整批 10000支的质量水平。如果在50支中恰好抽到了2支甚至更多的不合格品,简单地用抽到的不合格品数除以50来作为不合格品率来判断,那我们就会对这批质量水平合格的产品进行误判。 如何科学地进行判断呢?这就要用到假设检验的理论。 步骤1:建立假设 要检验的假设是不合格品率P是否不超过3%,因此立假设 H0:P0.03 这是原假设,其意是:与检验标准一致。 H1:P0.03 步骤2:选择检验统计量,给

32、出拒绝域的形式 若把比例P看作n=1的二项分别b(1,p)中成功的概率,则可在大样本场合(一般n25)获得参数p的近似的检验,可得样本统计量:近似服从N(0,1) 其中2/500.04,p=0.03,n50 步骤3:给出显著性水平,常取0.05。 步骤4:定出临界值,写出拒绝域W。 根据0.05及备择假设知道拒绝域W为 步骤5:由样本观测值,求得样本统计量,并判断。 结论:在0.05时,样本观测值未落在拒绝域,所以不能拒绝原假设,应允许这批产品出厂。 假设检验中的两类错误。 进一步研究一下这个例子,在50个样品中抽到多少个不合格品,就要拒绝入库呢?我们仍取0.05,根据上述公式,得出,解得x&

33、gt;3.48,也就是在50个样品中抽到4个不合格品才能判整批为不合格。 而如果我们改变的取值,也就是我们定义的小概率的取值,比如说取0.01,认为概率不超过0.01的事件发生了就是不合理的了,那又会怎样呢?还是用上面的公式计算,则得出,解得x>4.30,也就是在50个样品中抽到5个不合格品才能判整批为不合格。检验要求是不合格品率P不能超过3%,而现在根据0.01,算出来50个样品中抽到5个不合格品才能判整批为不合格,会不会犯错误啊!假设检验是根据样本的情况作的统计推断,是推断就会犯错误,我们的任务是控制犯错误的概率。在假设检验中,错误有两类: 第一类错误(拒真错误):原假设H0为真(批

34、产品质量是合格的),但由于抽样的随机性(抽到过多的不合格品),样本落在拒绝域W内,从而导致拒绝H0(根据样本的情况把批质量判断为不合格)。其发生的概率记为,也就是显著性水平。控制的其实是生产方的风险,控制的是生产方所承担的批质量合格而不被接受的风险。 第二类错误(取伪错误):原假设H0不真(批产品质量是不合格的),但由于抽样的随机性(抽到过少的不合格品),样本落在W外,从而导致接受H0(根据样本的情况把批质量判断为合格)。其发生的概率记为。控制的其实是使用方的风险,控制的是使用方所承担的接受质量不合格批的风险。 再回到刚刚计算的上例的情况,由0.05变化为0.01,我们对批质量不合格的判断由5

35、0 个样本中出现4个不合格变化为5个,批质量是合格的而不被接受的风险就小了,犯第一类错误的风险小了,也就是生产方的风险小了;但同时随着的减小对批质量不合格的判断条件其实放宽了50个样本中出现4个不合格变化为5个,批质量是不合格的而被接受的风险大了;犯第二类错误的风险大了,也就是使用方的风险大了。在相同样本量下,要使小,必导致大;要使小,必导致大,要同时兼顾生产方和使用方的风险是不可能的。要使、皆小,只有增大样本量,这又增加了质量成本。 因此综上所述,假设检验可以告诉我们如何科学地进行质量合格判定,又告诉我们要兼顾生产方和使用方的质量风险,同时考虑质量和成本的问题。 显著性检验出自 MBA智库百

36、科()显著性检验(Significance Testing) 目录显示· 1 什么是显著性检验· 2 显著性检验的含义· 3 显著性检验的原理· 4 显著性检验的相关概念 o 4.1 原假设和备择假设o 4.2 双尾检验和单尾检验· 5 显著性检验的作用· 6 显著性检验的基本思想· 7 显著性检验的两类错误· 8 显著性检验的P值1· 9 显著性检验的结果· 10 显著性检验中的总体和样本· 11 显著性检验的步骤· 12 总体均值为某定值的显著性检验· 13 总

37、体比例为某定值的显著性检验· 14 显著性检验应注意的问题· 15 常用显著性检验· 16 显著性检验的应用2· 17 显著性检验的实例分析 o 17.1 案例一:大豆籽粒品种检验分析· 18 相关系数显著性检验表· 19 相关条目编辑什么是显著性检验 显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致

38、所引起的。 显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。 抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。 编辑显著性检验的含义 显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。 常把一个要检验的假设记作H0,称为原假设(或零假设) (null hypothesis) ,与H0对立的假设记作H1,称为备择假设(alternative hypothesis)

39、。 在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作; 在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作。 通常只限定犯第一类错误的最大概率, 不考虑犯第二类错误的概率。这样的假设 检验又称为显著性检验,概率称为显著性水平。 最常用的值为0.01、0.05、0.10等。一般情况下,根据研究的问题,如果犯弃真错误损失大,为减少这类错误,取值小些 ,反之,取值大些。 编辑显著性检验的原理 · 无效假设 显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组

40、结果间差异不显著,即实验处理对结果没有影响或无效。经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的(即实验处理有效)。 · “无效假设”成立的机率水平 检验“无效假设”成立的机率水平一般定为5%(常写为p0.05),其含义是将同一实验重复100次,两者结果间的差异有5次以上是由抽样误差造成的,则“无效假设”成立,可认为两组间的差异为不显著,常记为p>0.05。若两者结果间的差异5次以下是由抽样误差造成的,则“无效假设”不成立,可认为两组间的差异为

41、显著,常记为p0.05。如果p0.01,则认为两组间的差异为非常显著。 编辑显著性检验的相关概念 编辑原假设和备择假设 1、原假设:对总体所作的论断或推测,指观察到的差异只反映机会变异。记作H0。 2、备择假设:是指观察到的差异是真实的。记作H1。 3、原假设和备择假设合在一起,应涵盖我们所研究的总体特征的所有可能性。 编辑双尾检验和单尾检验 采用双尾检验还是采用单尾检验(以及左单尾还是右单尾),取决于备择假设的形式。 表1:拒绝域的单、双尾与备择假设之间的对应关系 拒绝域位置原假设备择假设 双尾H0: = 0左单尾(不可能有 > 0时,H0: = 0)H1: < 0 右单尾(不可

42、能有 < 0时,H0: = 0)H1: > 0 编辑显著性检验的作用 分析工作者常常用标准方法与自己所用的分析方法进行对照试验,然后用统计学方法检验两种结果是否存在显著性差异。若存在显著性差异而又肯定测定过程中没有错误,可以认定自己所用的方法有不完善之处,即存在较大的系统误差。 因此分析结果的差异需进行统计检验或显著性检验。 编辑显著性检验的基本思想 显著性检验的基本思想可以用小概率原理来解释。 1、小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件 事实上发生了。那只能认为事件 不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。 2、观察到的显

43、著水平:由样本资料计算出来的检验统计量观察值所截取的尾部面积为。这个概率越小,反对原假设,认为观察到的差异表明真实的差异存在的证据便越强,观察到的差异便越加理由充分地表明真实差异存在。 3、检验所用的显著水平:针对具体问题的具体特点,事先规定这个检验标准。 4、在检验的操作中,把观察到的显著性水平与作为检验标准的显著水平标准比较,小于这个标准时,得到了拒绝原假设的证据,认为样本数据表明了真实差异存在。大于这个标准时,拒绝原假设的证据不足,认为样本数据不足以表明真实差异存在。 5、检验的操作可以用稍许简便一点的作法:根据所提出的显著水平查表得到相应的 值,称作临界值,直接用检验统计量的观察值与临

44、界值作比较,观察值落在临界值所划定的尾部内,便拒绝原假设;观察值落在临界值所划定的尾部之外,则认为拒绝原假设的证据不足。 编辑显著性检验的两类错误 1、显著性检验中的第一类错误及其概率 显著性检验中的第一类错误是指,原假设H0: = 0事实上正确,可是检验统计量的观察值却落入拒绝域,因而否定了本来正确的假设。这是弃真的错误。 发生第一类错误的概率(记作 )也就是当原假设H0: = 0正确时检验统计量的观察值落入拒绝域的概率。显然,在双尾检验时是两个尾部的拒绝域面积之和;在单尾检验时是单尾拒绝域的面积。 2、显著性检验中的第二类错误及其概率 显著性检验中的第二类错误是指,原假设H0: = 0不正

45、确,而备择假设H1: < 0或H1: > 0是正确的,可是检验统计量的观察值却落入了接受域,因而没有否定本来不正确的原假设。这是取伪的错误。 发生第二类错误的概率(记作 )是指,把来自的总体的样本值代入检验统计量所得结果落入接受域的概率。 3、和的关系 当样本容量一定时,越小,就越大;反之,越大,就越小。 编辑显著性检验的P值1若用计算机统计软件进行假设检验, 我们会见到P值。将算得检验统计量样本值查表得的概率是就是P值(在那里我们称之为观察到的显著水平)。 P值是怎么来的 从某总体中抽样所得的样本,其参数会与总体参数有所不同,这可能是由于两种原因: 、这一样本是由该总体抽出,其差

46、别是由抽样误差所致; 、这一样本不是从该总体抽出,所以有所不同。 如何判断是那种原因呢?统计学中用显著性检验赖判断。其步骤是: 、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。 、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。 、根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0。 如果P0.05,不能否定“差别由抽样误差引起”,则接受H0;如果P0.05或P 0.01,可以认为差别不由抽样误差引起,可以拒绝H0,则可以接受令一种可能性的假

47、设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。 统计学上规定的P值意义见下表 P值碰巧的概率对无效假设统计意义 P0.05碰巧出现的可能性大于5%不能否定无效假设两组差别无显著意义 P0.05碰巧出现的可能性小于5%可以否定无效假设两组差别有显著意义 P 0.01碰巧出现的可能性小于1%可以否定无效假设两者差别有非常显著意义 理解P值,下述几点必须注意: P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。因此,与对照组相比,C药取得P0.05,D药取得P 0.01并不表示D的药效比C强。 P0.05时,差异无显著意义,根据统计学原理可知

48、,不能否认无效假设,但并不认为无效假设肯定成立。在药效统计分析中,更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。 统计学主要用上述三种P值表示,也可以计算出确切的P值,有人用P 0.001,无此必要。 显著性检验只是统计结论。判断差别还要根据专业知识。 编辑显著性检验的结果 关于显著性检验的结果: (一)显著性检验回答什么问题 我们所观察到的差异(是纯属于机会变异,还是反映了真实的差异? 1、如果显著性检验得到差异显著的结论这时并不能评价差异的大小和重要性。 2、显著性检验只能告诉我们差异是否在事实上存在,而不能回答差异产生的原因。 3、显著性检

49、验不能检查我们对实验所作的设计是否有缺陷 (二)显著性检验回答问题的方式 在表述显著性检验结论的时候,应与检验的逻辑推理相符。 当检验统计量的观察值落在拒绝域时,我们应该说,样本资料显著地(或高度显著地)表明,差异是存在的。 (三)对观察到的显著水平数值的评价 编辑显著性检验中的总体和样本 1、显著性检验的对象是无限总体。 2、大样本可能会使检验统计量过分敏感。 3、从有限总体中抽取样本用于显著性检验时,必须作概率抽样。 编辑显著性检验的步骤 显著性检验的一般步骤或格式,如下: 1、提出假设 H0:_ H1:_ 同时,与备择假设相应,指出所作检验为双尾检验还是左单尾或右单尾检验。 2、构造检验

50、统计量,收集样本数据,计算检验统计量的样本观察值。 3、根据所提出的显著水平 ,确定临界值和拒绝域。 4、作出检验决策。 把检验统计量的样本观察值和临界值比较,或者把观察到的显著水平与显著水平标准比较;最后按检验规则作出检验决策。当样本值落入拒绝域时,表述成:“拒绝原假设”,“显著表明真实的差异存在”;当样本值落入接受域时,表述成:“没有充足的理由拒绝原假设”,“没有充足的理由表明真实的差异存在”。另外,在表述结论之后应当注明所用的显著水平。 编辑总体均值为某定值的显著性检验总体均值的显著性检验可有双尾、左单尾、右单尾三种不同的情况。下面就总体分布的不同情况,总体方差是否已知的不同情况以及样本

51、大小的不同情况分别介绍检验统计量和检验规则。 一、总体为正态分布,总体方差已知,样本不论大小 对于假设:H0: = 0,在H0成立的前提下,有检验统计量 如果规定显著性水平为 ,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为: 和;。 二、总体分布未知,总体方差已知,大样本 对于假设H0: = 0,在H0成立的前提下,如果样本足够大(n30),近似地有检验统计量 如果规定显著性水平为a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为和;。 三、总体为正态分布,总体方差未知,小样本 对于假设H0: = 0,在H0成立的前提下,有检验统计量 如果规定显著性水平为a,在双尾,左单尾,右单尾三

52、种不同情形下,拒绝域分别为:和;。 四、总体分布未知,总体方差未知,大样本 对于假设H0: = 0,在H0成立的前提下,如果总体偏斜适度,且样本足够大,近似地有检验统计量 如果规定显著性水平为a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为: 和; ; 编辑总体比例为某定值的显著性检验总体比例指的是随机试验中某种指定事件出现的概率。随机试验中某种指定事件出现叫做“成功”,把一次试验中成功的概率记作。 对于假设H0: = 0,在H0成立的前提下,如果,并且样本容量足够大,大到足以满足时,近似地有检验统计量 其中p是样本比例。 如果规定显著性水平为a,在双尾,左单尾,右单尾三种不同情形下,拒

53、绝域分别为: 和;。 编辑显著性检验应注意的问题 进行显著性检验还应注意以下几个问题: 1、要有合理的试验设计和准确的试验操作,避免系统误差、降低试验误差,提高试验的准确性和精确性。 2、选用的显著性检验方法要符合其应用条件。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所选用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其应用条件和适用范围。 3、选用合理的统计假设。进行显著性检验时,无效假设和备择假设的选用,决定了采用两尾检验或是一尾检验。4、正确理解显著性检验结论的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不

54、能认为在实际应用上一定就有重要或很重要的价值。“显著”或“极显著”是指表面差异为试验误差可能性小于0.05或0.01,已达到了可以认为存在真实差异的显著水平。有些试验结果虽然表面差异大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果虽然表面差异小,但由于试验误差小,反而可能推断为“差异显著”。 显著水平的高低只表示下结论的可靠程度的高低,即在0.01水平下否定无效假设的可靠程度为99,而在0.05水平下否定无效假设的可靠程度为95%。 “差异不显著”是指表面差异为试验误差可能性大于统计上公认的概率水平0.05,不能理解为没有差异。下“差异不显著”的结论时,客观上存在两种可能:一是无本质差异,二是有本质差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本容量,则可能表现出差异显著性。显著性检验只是用来确定无效假设能否被否定,而不能证明无效假设是正确的。 5、统计分析结论的应用,还要与经济效益等结合起来综合考虑。 编辑常用显著性检验 1.t检验 适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。 2.t'检验 应用条件与t检验大致相同,但t检验用于两组间方差不齐时,t检验的计算公式实际上是方差不齐时t检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论