第六章 假设检验和方差分析_第1页
第六章 假设检验和方差分析_第2页
第六章 假设检验和方差分析_第3页
第六章 假设检验和方差分析_第4页
第六章 假设检验和方差分析_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章假设检验和方差分析(一)假设检验第一节假设检验的一般问题第二节一个总体的参数检验第三节两个总体的参数检验第四节非参数检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验第一节假设检验的一般问题一、假设检验和抽样估计的不同点二、假设检验的概念与思想三、假设检验(一个实例)四、假设检验的步骤五、假设检验中的两类错误一、假设检验和抽样估计的不同点抽样估计:通过样本的观察结果来推断总体参数的取值范围以及得到此结论的可靠程度。假设检验:预先对总体参数的取值作出假定,然后用样本数据来验证,从而作出是接受还是拒绝该假设的结论。二、假设检验的概念与思想对总体参数的一种看法总体参数包括总体均值、比例、方差等,分析之前必需陈述我认为该企业生产的零件的平均长度为4厘米!什么是假设?什么是假设检验?事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。包括参数假设检验和非参数假设检验假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20在一次试验中,一个几乎不可能发生的事件发生的概率称为小概率。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。小概率原理总体

假设检验的过程

(提出假设→抽取样本→作出决策)抽取随机样本均值

X=20

我认为人口的平均年龄是50岁提出假设拒绝假设!别无选择.作出决策三、假设检验(实例)某地区水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取这种元素过少,脑功能可能受影响,因此可推测该地区儿童的智力水平可能低于一般水平。心理学家使用某一标准化智力检验方法,对该地区随机选取36名儿童进行智力测验,得到智力分数的平均值是94分,已知总体标准差为15分,问该地区儿童的智力水平是否和一般水平(100分)有明显差异?拒绝假设接受假设原假设备择假设四、假设检验的步骤1、提出原假设和备择假设2、确定适当的检验统计量3、规定显著性水平,查出临界值,确定拒绝域和接受域4、计算检验统计量的值5、作出统计决策提出原假设和备择假设

什么是原假设?(NullHypothesis)陈述待检验的假设,又称“0假设”开始时总假设原假设是正确的总是有等号

表示为H0H0:

某一数值原假设可能会被否决

什么是备择假设?(AlternativeHypothesis)与原假设相反的假设总是有不等号

表示为H1H1:

<某一数值,或

某一数值例如,H1:

<3910(克),或3910(克)备择假设不一定会被接受提出原假设和备择假设

什么检验统计量?用于假设检验问题的统计量选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为确定适当的检验统计量规定显著性水平

什么显著性水平?是一个概率值原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域表示为

(alpha)常用的值有0.01,0.05,0.10由研究者事先确定双侧检验

(显著性水平与拒绝域)

抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域1-

置信水平双侧检验

(显著性水平与拒绝域)

H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-

置信水平双侧检验

(显著性水平与拒绝域)

H0值临界值临界值

a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-

置信水平双侧检验

(显著性水平与拒绝域)

H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-

置信水平作出统计决策计算检验的统计量根据给定的显著性水平

,查表得出相应的临界值Z

或Z/2将检验统计量的值与

水平的临界值进行比较得出接受或拒绝原假设的结论用P值决策

(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值<

,拒绝H0值越小,你拒绝原假设的理由就越充分五、假设检验中的两类错误(决策风险)1. 第一类错误(弃真错误)原假设为真时拒绝原假设第一类错误的概率为

被称为显著性水平2. 第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为

(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-a第二类错误(b)取伪拒绝H0第一类错误(a)弃真(1-b)假设检验就好像一场审判过程统计检验过程错误和

错误的关系

你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小参数检验和非参数检验参数方法在检验过程中比较的是总体参数(最常见的是总体均数),这种检验方法需要事先对数据的分布做出假定,如t检验要求数据服从正态分布、方差相同等。非参数方法不依赖于总体分布。参数假设检验除了大样本情况下进行的参数假设检验外,其余都是假定总体服从某一分布的检验。非参数假设检验适用于比较低的计量水准,如等级的、顺序的计量,如中位数计量。第二节一个总体的参数检验总体均值的检验总体比例的检验总体均值的检验(大样本)假定条件大样本(n

30)使用z检验统计量

2

已知:

2

未知:总体均值的检验(

2

已知)(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平

=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验总体均值的检验(

2

已知)H0

=255H1

255

=0.05n

=40临界值(c):检验统计量:决策:结论:

用Excel中的【NORMSDIST】函数得到的双尾检验P=0.312945不拒绝H0没有证据表明该天生产的饮料不符合标准要求z01.96-1.960.005拒绝H0拒绝H00.005总体均值的检验(z检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击【fx】第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】第3步:将z的绝对值1.01录入,得到的函数值为

0.843752355

P值=2(1-0.843752355)=0.312495

P值远远大于

,故不拒绝H0总体均值的检验(

2

未知)

(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(

=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验(例题分析—大样本)H0

1.35H1

<1.35

=0.01n

=50临界值(c):检验统计量:拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01总体均值的检验(

2

未知)(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2

。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2

。试检验改良后的新品种产量是否有显著提高?(

=0.05)右侧检验总体均值的检验(

2

未知)H0

5200H1

>5200

=0.05n

=36临界值(c):检验统计量:

拒绝H0(P=0.000088<

=0.05)改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645总体均值的检验(z检验)

(P值的图示)抽样分布P=0.000088

01.645a=0.05拒绝H01-

计算出的样本统计量=3.75P值总体均值的检验(小样本)假定条件总体服从正态分布小样本(n<

30)检验统计量

2

已知:

2

未知:总体均值的检验(例题分析—小样本)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3总体均值的检验(例题分析—小样本)H0

=12H1

12

=0.05df=10-1=9临界值(c):检验统计量:不拒绝H0没有证据表明该供货商提供的零件不符合要求

决策:结论:t02.262-2.2620.025拒绝

H0拒绝H00.025总体均值的检验

(P值的计算与应用-t

检验)第1步:进入Excel表格界面,直接点击【fx】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【TDIST】,然后【确定】第3步:在出现对话框的【X】栏中输入计算出的t的绝对值0.7035,在【Deg-freedom】(自由度)栏中输入本例的自由度9,在【Tails】栏中输入2(表明是双侧检验,如果是单测检验则在该栏输入1)第4步:P值=0.499537958

P值>

=0.05,故不拒绝H0

一个总体均值的检验

是否已知小样本量n大

是否已知否

t检验否z检验是z检验

是z检验总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量P为假设的总体比例总体比例的检验

(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平

=0.05和

=0.01

,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?总体比例的检验

(例题分析)H0

:P=80%H1

:P

80%

=0.05n

=200临界值(c):检验统计量:拒绝H0(P=0.013324<

=0.05)该杂志的说法并不属实

决策:结论:z01.96-1.960.025拒绝

H0拒绝

H00.025总体比例的检验

(例题分析)H0

:P=80%H1

:P

80%

=0.01n

=200临界值(c):检验统计量:不拒绝H0(P=0.013324>

=0.01)没有证据表明“该杂志声称读者群中有80%为女性”的看法不正确

决策:结论:z02.58-2.580.005拒绝H0拒绝H00.005第三节两个总体的参数检验两个总体均值之差的检验两个总体比例之差的检验两个总体均值之差的检验

(独立大样本)假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n1

30和n2

30)检验统计量

12

22

已知:

12

22

未知:两个总体均值之差的检验

(例题分析—独立大样本)【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?

两个样本的有关数据

男性职员女性职员n1=44n1=32

x1=75

x2=70S12=64

S22=42.25两个总体均值之差的检验

(例题分析—独立大样本)H0

1-

2=0H1

1-

2

0

=0.05n1=44,n2

=32临界值(c):检验统计量:决策:结论:拒绝H0该公司男女职员的平均小时工资之间存在显著差异z01.96-1.960.025拒绝

H0拒绝

H00.025两个总体均值之差的检验

(独立小样本:

12,

22

已知)假定条件两个独立的小样本两个总体都是正态分布

12,

22已知检验统计量两个总体均值之差的检验

(独立小样本:

12,

22

未知但

12=

22)假定条件两个独立的小样本两个总体都是正态分布

12、

22未知但相等,即

12=

22检验统计量其中:自由度:两个总体均值之差的检验

(独立小样本:

12,

22

未知且不等

12

22)假定条件两个总体都是正态分布

12,

22未知且不相等,即

12

22检验统计量自由度:两个总体均值之差的检验

(例题分析—独立小样本,

12=

22)

【例】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有

12=

22

。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在

=0.05的显著性水平下,样本数据是否提供证据支持

“两台机床加工的零件直径不一致”的看法?两台机床加工零件的样本数据

(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2两个总体均值之差的检验

(例题分析—

12=

22)H0

1-

2

=0H1

1-

2

0

=0.05n1=8,n2

=7临界值(c):检验统计量:决策:结论:不拒绝H0没有证据表明两台机床加工的零件直径不一致t02.160-2.1600.025拒绝

H0拒绝H00.025两个总体均值之差的检验

(用Excel进行检验)第1步:将原始数据输入到Excel工作表格中第2步:选择【工具】下拉菜单并选择【数据分析】选项第3步:在【数据分析】对话框中选择

【t-检验:双样本等方差假设】第4步:当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【

】方框中输入给定的显著性水平(本例为0.05)在【输出选项】选择计算结果的输出位置,然后【确定】两个总体均值之差的检验

(例题分析—独立小样本,

12

22)

【例】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有

12

22

。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在

=0.05的显著性水平下,样本数据是否提供证据支持

“两台机床加工的零件直径不一致”的看法?两台机床加工零件的样本数据

(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2两个总体均值之差的检验

(用Excel进行检验)第1步:将原始数据输入到Excel工作表格中第2步:选择“工具”下拉菜单并选择【数据分析】选项第3步:在【数据分析】对话框中选择

【t-检验:双样本异方差假设】第4步:当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【

】方框中输入给定的显著性水平(本例为0.05)在【输出选项】选择计算结果的输出位置,然后【确定】两个总体均值之差的检验

(配对样本)假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的

数据配对或匹配(重复测量(前/后))检验统计量样本差值均值样本差值标准差匹配样本(数据形式)

观察序号样本1样本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi

=x1i

-x2iMMMMnx1nx2ndn

=x1n-x2n两个总体均值之差的检验

(例题分析—配对样本)

【例】某饮料公司开发研制出一新产品,为比较消费者对新老产品口感的满意程度,该公司随机抽选一组消费者(8人),每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别进行评分(0分~10分),评分结果如下表。取显著性水平

=0.05,该公司是否有证据认为消费者对两种饮料的评分存在显著差异?两种饮料平均等级的样本数据旧饮料54735856新饮料66743976两个总体均值之差的检验

(用Excel进行检验—配对样本)第1步:选择“工具”下拉菜单,并选择【数据分析】选项第3步:在分析工具中选择【t检验:平均值成对二样本分析】第4步:当出现对话框后在【变量1的区域】方框内键入变量1的数据区域在【变量2的区域】方框内键入变量2的数据区域在【假设平均差】方框内键入假设的差值(这里为0)在【

】框内键入给定的显著性水平,然后【确定】

两个总体均值之差的检验

(方法总结)均值差检验独立样本匹配样本大样本小样本小样本

12、

22已知

12、

22未知

12、

22已知

12、

22未知Z检验Z

检验Z检验t检验

12=

22

12≠

22t检验t

检验假定条件两个总体都服从二项分布可以用正态分布来近似检验统计量检验H0:P1-P2=0检验H0:P1-P2=d0两个总体比例之差的检验两个总体比例之差的检验

(例题分析)

【例】一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法是否存在差异,分别抽取了200名男学生和200名女学生进行调查,其中的一个问题是:“你是否赞成采取上网收费的措施?”其中男学生表示赞成的比例为27%,女学生表示赞成的比例为35%。调查者认为,男学生中表示赞成的比例显著低于女学生。取显著性水平

=0.05,样本提供的证据是否支持调查者的看法?两个总体比例之差的检验

(例题分析)H0

:P1-P2

0H1

:P1-P2<0

=0.05n1=200,n2=200临界值(c):检验统计量:决策:结论:拒绝H0(P=0.041837<

=0.05)样本提供的证据支持调查者的看法-1.645Z0拒绝域

两个总体比例之差的检验

(例题分析)

【例】有两种方法生产同一种产品,方法1的生产成本较高而次品率较低,方法2的生产成本较低而次品率则较高。管理人员在选择生产方法时,决定对两种方法的次品率进行比较,如方法1比方法2的次品率低8%以上,则决定采用方法1,否则就采用方法2。管理人员从方法1生产的产品中随机抽取300个,发现有33个次品,从方法2生产的产品中也随机抽取300个,发现有84个次品。用显著性水平

=0.01进行检验,说明管理人员应决定采用哪种方法进行生产?两个总体比例之差的检验

(例题分析)H0

:P2-P1

8%H1

:P2-P1>8%

=0.01n1=300,n2=300临界值(c):检验统计量:决策:结论:拒绝H0(P=1.22E-15<

=0.05)方法1的次品率显著低于方法2达8%,应采用方法1进行生产-2.33Z0拒绝域

小结总体参数检验一个总体两个总体均值比例方差均值差比例差方差比独立样本匹配样本大样本F检验Z检验大样本小样本Z检验

12

22已知

12

22未知Z检验t检验大样本小样本Z检验

2已知Z检验

2未知t检验Z检验卡方检验第四节非参数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论