《应用统计学(第六版)(微课版)》 课件 第5、6章 参数估计;假设检验_第1页
《应用统计学(第六版)(微课版)》 课件 第5、6章 参数估计;假设检验_第2页
《应用统计学(第六版)(微课版)》 课件 第5、6章 参数估计;假设检验_第3页
《应用统计学(第六版)(微课版)》 课件 第5、6章 参数估计;假设检验_第4页
《应用统计学(第六版)(微课版)》 课件 第5、6章 参数估计;假设检验_第5页
已阅读5页,还剩242页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章参数估计5.1参数估计的一般问题5.2一个总体参数的区间估计5.3两个总体参数的区间估计5.4样本容量的确定5.5 抽样设计学习目标抽样调查的概念估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准一个总体参数的区间估计方法两个总体参数的区间估计方法样本容量的确定方法抽样组织设计参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计5.1参数估计的一般问题5.1.1抽样调查的概念5.1.2抽样中涉及的几个基本概念5.1.3评价估计量的优良标准5.1.1抽样调查的概念抽样调查:按随机原则从总体中抽取一部分单位进行调查,用调查所得的数值对总体数量特征作出推断的一种统计调查方法。特点:(1)遵循随机原则(2)以部分推断总体(3)抽样误差可以事先计算并加以控制。5.1.1抽样调查的概念作用:(1)某些现象不可能采用全面调查时,可以通过抽样调查作出推断(2)当某些现象没有必要采用全面调查时,也可通过抽样调查来作出推断(3)抽样调查和全面调查相结合,可以相互补充,也可以对全面调查资料起到检验核对的作用(4)对某些总体的假设需要依靠抽样调查进行检验(5)抽样调查方法可以用于工业生产过程中的质量控制。5.1.2抽样中涉及的几个基本概念总体与样本总体参数和样本统计量重复抽样与不重复抽样估计量与估计值点估计与区间估计总体与样本总体是根据研究目的确定的所要研究的事物的全体,是由客观存在的、具有同一性质的大量个别事物构成的集合。对于特定的问题来说,总体是唯一的确定的。组成总体的个别事物称为总体单位,总体所包含的总体单位的个数称为总体容量,通常用大写的字母N表示。样本是按随机原则从总体中抽取出来的那部分单位组成的集合。样本中所包含的单位个数称为样本容量,一般用小写的字母n表示。通常将样本容量小于30的样本称为小样本,而将样本容量大于30的样本称为大样本。与总体是唯一确定的不同,样本不是唯一的,从一个总体中可以抽取很多个样本,全部样本的可能数目与样本容量及随机抽样的方法有关。总体参数是根据总体各单位的标志值或标志表现计算的反映总体数量特征的综合指标,是抽样推断的对象。由于总体是唯一确定的,根据总体计算的总体参数也是唯一确定的,只不过通常是未知的。一个总体可以有多个参数,从不同方面反映总体的综合数量特征。常用的总体参数有:

总体平均数总体比例总体方差总体标准差等。总体参数与样本统计量样本统计量是根据样本中各单位标志值或标志表现计算的样本指标,是样本变量的函数,是用来估计总体参数的。其计算方法是确定的,但它的取值随着样本的不同而发生变化,因此统计量是随机变量。与总体参数相对应,样本统计量有:

样本平均数样本比例样本方差样本标准差等。总体参数与样本统计量常用的总体参数总体均值总体方差总体比例

常用的样本统计量(一)样本均值样本方差样本比例

常用的样本统计量(二)Z统计量t统计量χ2统计量重复抽样与不重复抽样

重复抽样,也称放回抽样,是指按随机原则从总体中抽取一个单位登记后,又放回总体参加下一次抽选的方法,同一单位有重复抽中的可能。在重复抽样的情况下,每次抽取的样本单位都是在完全相同的条件下进行的,总体容量N保持不变,每个单位被抽中的机会均等。其样本可能的数目是不重复抽样,也称不放回抽样,是指从总体中随机抽取一个单位登记后,不再放回总体参加下一次抽选的方法,每个单位最多只能被抽中一次。每抽一个,总体单位数就减少一个,因此各次样本单位被抽中的机会发生变化,第一个样本单位被抽中的机会是,第二个样本单位被抽中的机会是,依此类推。不重复抽样相当于一次从总体中抽出n个单位。在不重复抽样条件下,样本可能的数目为。估计量与估计值1.估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如:样本均值就是总体均值

的一个估计量2.参数用

表示,估计量用表示3.估计值:估计参数时计算出来的统计量的具体值如果样本均值

x=80,则80就是

的估计值估计方法点估计区间估计点估计与区间估计点估计

(pointestimate)1.用样本的估计量的某个取值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量区间估计

(intervalestimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%

样本统计量

(点估计)置信区间置信下限置信上限区间估计的图示

x95%的样本

-1.96

x

+1.96

x99%的样本

-2.58

x

+2.58

x90%的样本

-1.65

x

+1.65

x将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平表示为(1-

为是总体参数未在区间内的比例常用的置信水平值有99%,95%,90%相应的

为0.01,0.05,0.10置信水平

(confidencelevel)

由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个总体参数以一定的概率落在这一区间的表述是错误的置信区间

(confidenceinterval)置信区间

(95%的置信区间)重复构造出的20个置信区间

点估计值置信区间与置信水平

均值的抽样分布(1-

)区间包含了

的区间未包含

1–aa/2a/2影响区间宽度的因素1.总体数据的离散程度,用

来测度2.样本容量n 3.置信水平(1-

),影响z的大小5.1.3评价估计量的优良标准无偏性有效性一致性无偏性

(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P(

)BA无偏有偏有效性

(efficiency)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效AB

的抽样分布

的抽样分布P(

)一致性

(consistency)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(

)5.2一个总体参数的区间估计5.2.1总体均值的区间估计5.2.2总体比例的区间估计5.2.3总体方差的区间估计一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差总体均值的区间估计

(正态总体、

2已知,或非正态总体、大样本)总体均值的区间估计

(大样本)假定条件总体服从正态分布,且方差(

2)

已知;或如果不是正态分布,可由正态分布来近似(n

30)使用正态分布统计量z总体均值

在1-

置信水平下的置信区间为总体均值的区间估计

(例题分析)【例】一家食品生产企业以生产袋装食品为主,为对产品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量(单位:g)如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值的区间估计

(例题分析)解:已知X~N(

,102),n=25,1-

=95%,z

/2=1.96。根据样本数据计算得:。由于是正态总体,且方差已知。总体均值

在1-

置信水平下的置信区间为该食品平均重量的置信区间为101.44g~109.28g总体均值的区间估计

(例题分析)【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计

(例题分析)解:已知n=36,1-

=90%,z

/2=1.645。根据样本数据计算得:,

总体均值

在1-

置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁~41.63岁总体均值的区间估计

(正态总体、

2未知、小样本)总体均值的区间估计

(小样本)1. 假定条件总体服从正态分布,但方差(

2)

未知小样本(n<30)2.使用t

分布统计量总体均值

在1-

置信水平下的置信区间为t分布

t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zt分布

(用Excel生成t分布的临界值表)将分布自由度n的值输入到工作表的A列将右尾概率

的取值输入到第1行在B2单元格输入公式“=TINV(B$1*$A2)”,然后将其向下、向右复制即可得

t分布

(用Excel绘制t分布图)第1步:在工作表的第1列A2:A62输入一个等差数列,初始值为“-3”,步长为“0.1”,终值为“3”第2步:在单元格C1输入t分布的自由度(如“20”)第3步:在单元格B2输入公式“=TDIST(-A2,$C$1,1)”,并将其复制到B3:B32区域,在B33输入公式

“=TDIST(A33,$C$1,1)”并将其复制到B34:B62区域第4步:在单元格C3输入公“=(B3-B2)*10”,并将其复制到C4:C31区域,在单元格C32输入公式“=(B32-B33)*10”并将其复制到C33:C61区域第5步:将A2:A62作为横坐标,C2:C62作为纵坐标,根据“图表向导”绘制折线图t分布

(用Excel绘制t分布图)总体均值的区间估计

(例题分析)【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间16只灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计

(例题分析)解:已知X~N(

,2),n=16,1-

=95%,t

/2=2.131

根据样本数据计算得:,

总体均值

在1-

置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8h~1503.2h总体比例的区间估计总体比例的区间估计1. 假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量z3.总体比例

在1-

置信水平下的置信区间为总体比例的区间估计

(例题分析)【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%

总体方差的区间估计总体方差的区间估计1. 估计一个总体的方差或标准差2. 假设总体服从正态分布总体方差

2

的点估计量为s2,且4.总体方差在1-

置信水平下的置信区间为总体方差的区间估计

(图示)

2

21-

2

总体方差1-

的置信区间自由度为n-1的

2总体方差的区间估计

(例题分析)【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间25袋食品的重量单位:g112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体方差的区间估计

(例题分析)解:已知n=25,1-

=95%,根据样本数据计算得

s2=93.21

2置信度为95%的置信区间为该企业生产的食品总体重量标准差的的置信区间为7.54g~13.43g一个总体参数的区间估计

(小结)5.3两个总体参数的区间估计5.3.1两个总体均值之差的区间估计5.3.2两个总体比例之差的区间估计5.3.3两个总体方差比的区间估计两个总体参数的区间估计总体参数符号表示样本统计量均值差比例差方差比两个总体均值之差的区间估计

(独立大样本)两个总体均值之差的估计

(大样本)1. 假定条件两个总体都服从正态分布,

12,

22已知若不是正态分布,可以用正态分布来近似(n1

30和n2

30)两个样本是独立的随机样本2.使用正态分布统计量z两个总体均值之差的估计

(大样本)1.

12,

22已知时,两个总体均值之差

1-

2在1-

置信水平下的置信区间为

12,

22未知时,两个总体均值之差

1-

2在1-

置信水平下的置信区间为两个总体均值之差的估计

(例题分析)【例】某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表所示。建立两所中学高考英语平均分数之差95%的置信区间

两个样本的有关数据中学1中学2n1=46n1=33S1=5.8S2=7.2两个总体均值之差的估计

(例题分析)解:两个总体均值之差在1-

置信水平下的置信区间为

两所中学高考英语平均分数之差的置信区间为5.03分-10.97分两个总体均值之差的区间估计

(独立小样本)两个总体均值之差的估计

(小样本:

12=

22

)1. 假定条件两个总体都服从正态分布两个总体方差未知但相等:

12=

22两个独立的小样本(n1<30和n2<30)2.总体方差的合并估计量

3.估计量

x1-x2的抽样标准差两个总体均值之差的估计

(小样本:

12=

22

)两个样本均值之差的标准化两个总体均值之差

1-

2在1-

置信水平下的置信区间为两个总体均值之差的估计

(例题分析)【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(单位:min)如下表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521两个总体均值之差的估计

(例题分析)解:根据样本数据计算得合并估计量为两种方法组装产品所需平均时间之差的置信区间为0.14min~7.26min两个总体均值之差的估计

(小样本:

12

22

)1. 假定条件两个总体都服从正态分布两个总体方差未知且不相等:

12

22两个独立的小样本(n1<30和n2<30)2.使用统计量两个总体均值之差的估计

(小样本:

12

22

)

两个总体均值之差

1-

2在1-

置信水平下的置信区间为自由度两个总体均值之差的估计

(例题分析)【例】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排8名工人,即n1=12,n2=8,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221两个总体均值之差的估计

(例题分析)解:根据样本数据计算得自由度为两种方法组装产品所需平均时间之差的置信区间为0.192min~9.058min两个总体均值之差的区间估计

(匹配样本)两个总体均值之差的估计

(匹配大样本)假定条件两个匹配的大样本(n1

30和n2

30)两个总体各观察值的配对差服从正态分布两个总体均值之差

d=

1-

2在1-

置信水平下的置信区间为对应差值的均值对应差值的标准差两个总体均值之差的估计

(匹配小样本)假定条件两个匹配的小样本(n1<30和n2<30)两个总体各观察值的配对差服从正态分布两个总体均值之差

d=

1-

2在1-

置信水平下的置信区间为两个总体均值之差的估计

(例题分析)【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如右表。试建立两种试卷分数之差

d=

1-

295%的置信区间

10名学生两套试卷的得分学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916两个总体均值之差的估计

(例题分析)解:根据样本数据计算得两种试卷所产生的分数之差的置信区间为6.33分~15.67分两个总体比例之差区间的估计1.假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2.两个总体比例之差

1-

2在1-

置信水平下的置信区间为两个总体比例之差的区间估计两个总体比例之差的估计

(例题分析)【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间

12两个总体比例之差的估计

(例题分析)解:已知

n1=500,n2=400,p1=45%,p2=32%,

1-

=95%,z/2=1.96

1-

2置信度为95%的置信区间为城市与农村收视率差值的置信区间为6.68%~19.32%两个总体方差比的区间估计两个总体方差比的区间估计1. 比较两个总体的方差比用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S12/S22远离1,说明两个总体方差之间存在差异总体方差比在1-

置信水平下的置信区间为两个总体方差比的区间估计

(图示)FF1-

F

总体方差比1-

的置信区间方差比置信区间示意图两个总体方差比的区间估计

(例题分析)【例】为了研究男女学生在生活费支出(单位:元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间两个总体方差比的区间估计

(例题分析)解:根据自由度

n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F1-/2(24)=1/1.98=0.505

12/22置信度为90%的置信区间为男女学生生活费支出方差比的置信区间为0.47~1.84

两个总体参数的区间估计

(小结)5.4样本容量的确定5.4.1估计总体均值时样本容量的确定5.4.2估计总体比例时样本容量的确定5.4.3估计两个总体均值之差时样本容量的确定5.4.4估计两个总体比例之差时样本容量的确定估计总体均值时样本容量的确定估计总体均值时样本容量n为样本容量n与总体方差

2、边际误差E、可靠性系数Z或t之间的关系为与总体方差成正比与边际误差的平方成反比与可靠性系数成正比样本容量的圆整法则:当计算出的样本容量不是整数时,将小数点后面的数值一律进位成整数,如24.68取25,24.32也取25等等估计总体均值时样本容量的确定

其中:估计总体均值时样本容量的确定

(例题分析)【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?估计总体均值时样本容量的确定

(例题分析)解:已知

=2000,E=400,1-

=95%,z/2=1.96

应抽取的样本容量为即应抽取97人作为样本估计总体比例时样本容量的确定1.根据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定

2.E的取值一般小于0.13.

未知时,可取使方差最大值0.5其中:估计总体比例时样本容量的确定

(例题分析)【例】根据以往的生产统计,某种产品的合格率约为90%,现要求边际误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?解:已知

=90%,

=0.05,z/2=1.96,E=5%

应抽取的样本容量为

应抽取139个产品作为样本估计两个总体均值之差时

样本容量的确定设n1和n2为来自两个总体的样本,并假定n1=n2根据均值之差的区间估计公式可得两个样本的容量n为估计两个总体均值之差时

样本容量的确定

其中:估计两个总体均值之差时样本容量的确定

(例题分析)【例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班

12=90,普通班

22=120。如果要求估计的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查?English估计两个总体均值之差时样本容量的确定

(例题分析)解:已知

12=90,22=120,E=5,1-

=95%,z/2=1.96即应抽取33人作为样本估计两个总体比例之差时

样本容量的确定设n1和n2为来自两个总体的样本,并假定n1=n2根据比例之差的区间估计公式可得两个样本的容量n为估计两个总体比例之差时

样本容量的确定

其中:估计两个总体比例之差时样本容量的确定

(例题分析)【例】一家瓶装饮料制造商想要估计顾客对一种新型饮料认知的广告效果。他在广告前和广告后分别从市场营销区各抽选一个消费者随机样本,并询问这些消费者是否听说过这种新型饮料。这位制造商想以10%的误差范围和95%的置信水平估计广告前后知道该新型饮料消费者的比例之差,他抽取的两个样本分别应包括多少人?(假定两个样本容量相等)绿色健康饮品估计两个总体比例之差时样本容量的确定

(例题分析)解:E=10%,1-

=95%,z/2=1.96,由于没有

的信息,用0.5代替即应抽取193位消费者作为样本5.5抽样设计5.5.1抽样设计的基本原则5.5.2抽样组织设计抽样设计的基本原则

保证抽样随机原则的实现

随机取样是抽样推断的前提,失去这个前提,推断的理论和方法也就失去存在的意义。从理论上说,随机原则就是要保证总体每一单位都有同等的中选机会,或样本的抽选的概率是已知的。保证实现最大的抽样效果原则在一定的误差要求下选择费用最少的方案;或在一定的费用开支条件下,选择误差最小的方案。抽样组织设计

简单随机抽样类型抽样等距抽样整群抽样阶段抽样非概率抽样简单随机抽样

简单随机抽样:也称为纯随机抽样是从总体包含的N个单位中任意抽取n个单位作为样本总体中每个单位可能被抽中的概率相等它是一种最基本的抽样方法它是其他抽样方法的基础类型抽样类型抽样:又称为分类抽样或分层抽样首先将总体按某种特征或原则划分成若干层然后在每层内独立地、随机地抽取子样本最后将子样本合起来构成总体样本划分层时应使层内各单位的差异尽可能小而使层间各单位的差异尽可能大等距抽样等距抽样:首先将总体中的所有单位按某一标志排序然后在规定的范围内抽取一个单位作为初始单元最后按事先定好的间隔K确定其他样本单位计算公式:

N为总体单位数,n为样本容量整群抽样整群抽样首先将总体划分成若干群然后以群为抽样单元抽取样本最后对抽中的各个群内的所有单位进行调查划分群时应使群内各单位的差异尽可能大而使群间各单位的差异尽可能小阶段抽样阶段抽样是指在抽样时先抽总体中某种更大范围的单位,再从中选大单位中抽较小范围的单位,逐次类推,最后从更小范围单位中抽选样本的基本单位,分阶段来完成抽样的组织工作。当总体很大时,抽样调查要直接抽选总体的基本单位在技术上有很大困难,一般都要采用多阶段抽样方法。两阶段抽样在组织技术上可以看为是整群抽样和类型抽样的结合。即整群抽样第一阶段从总体的全部组(群)中,随机抽取部分的组(群),和类型抽样第二阶段从中选组中抽选部分单位两上程序的结合。两阶段抽样的平均误差是由两部分构成的,第一部分是第一阶段从总体全部组抽部分组所引起的组间误差,第二部分是由第二阶段在中选组中抽部分单位所引起的组内平均误差。非概率抽样方便抽样:是一种非概率抽样技术,顾名思义,样本的确定主要是基于简便。样本中所包括的元素不是事先确定或按照已知概率选取的。方便抽样具有相对易于样本选择和搜集数据的优点。判断抽样:在这种抽样方法中,由对所研究总体非常了解的人选择总体中他认为最具总体代表性的元素。通常,这是一个相对容易选择样本的方法。本章小结参数估计的一般问题一个总体参数的区间估计两个总体参数的区间估计样本容量的确定抽样组织设计第6章

假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验学习内容6.1假设检验的基本问题6.2一个总体参数的检验6.3两个总体参数的检验学习目标假设检验的基本思想和原理假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验6.1假设检验的基本问题6.1.1假设的陈述6.1.2两类错误与显著性水平6.1.3统计量与拒绝域6.1.4利用P值进行决策假设的陈述什么是假设?

(hypothesis)

对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!什么是假设检验?

(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的假设均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20总体

假设检验的过程抽取随机样本均值

x

=20

我认为人口的平均年龄是50岁提出假设

拒绝假设别无选择!

作出决策原假设与备择假设原假设

(nullhypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号

,

4. 表示为H0H0:

=某一数值指定为符号=,

例如,H0:

10cmnull为什么叫0假设?之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等

也称“研究假设”总是有符号

,

表示为H1研究者想收集证据予以支持的假设H1:

<某一数值,或

某一数值例如,H1:

<10cm,或

10cm备择假设(alternativehypothesis)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为:

H0:

10cmH1:

10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g绿叶洗涤剂【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)双侧检验与单侧检验备择假设没有特定的方向性,并含有符号“

”的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

双侧检验与单侧检验双侧检验与单侧检验

(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0以总体均值的检验为例两类错误与显著性水平假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为

被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为

(Beta)

H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–

a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程

错误和

错误的关系

你要同时减少两类错误的惟一办法是增加样本容量!

的关系就像翘翘板,

就大,

就小两类错误的控制一般来说,对于一个给定的样本,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ类错误的概率定得低些较为合理;反之,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错误的概率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率影响

错误的因素1. 总体参数的真值随着假设的总体参数的减少而增大2. 显著性水平

减少时增大3. 总体标准差

增大时增大4. 样本容量n当n减少时增大检验能力

(poweroftest)拒绝一个错误的原假设的能力根据

的定义,

是指没有拒绝一个错误的原假设的概率。这也就是说,1-

则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)可解释为正确地拒绝一个错误的原假设的概率显著性水平

(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域3. 表示为

(alpha)常用的

值有0.01,0.05,0.104. 由研究者事先确定显著性水平

(significantlevel)我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度。这等于说我们要求多小的P值。而这个P值就叫显著性水平,用

表示显著性水平表示总体中某一类数据出现的经常程度假如我们选择

=0.05,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择

=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1%如果P值小于或等于

,我们称该组数据不利于原假设的证据有

显著性水平统计显著性

(significant)significant(显著的)一词的意义在这里并不是“重要的”,而是指“非偶然的”在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的拒绝原假设,表示这样的样本结果并不是偶然得到的;不拒绝原假设(拒绝原假设的证据不充分),则表示这样的样本结果只是偶然得到的假设检验中的小概率原理

什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定统计量与拒绝域根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)

标准化的检验统计量

显著性水平和拒绝域

(双侧检验)抽样分布H0临界值临界值a/2a/2

拒绝H0拒绝H01-

置信水平拒绝域非拒绝域拒绝域显著性水平和拒绝域

(双侧检验)H0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-

置信水平显著性水平和拒绝域

(双侧检验)H0临界值临界值

a/2a/2

样本统计量拒绝H0拒绝H0抽样分布1-

置信水平显著性水平和拒绝域

(双侧检验)H0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-

置信水平显著性水平和拒绝域

(单侧检验)H0临界值a拒绝H0抽样分布1-

置信水平拒绝域非拒绝域显著性水平和拒绝域

(左侧检验)H0临界值a拒绝H0抽样分布1-

置信水平样本统计量显著性水平和拒绝域

(左侧检验)H0临界值a样本统计量拒绝H0抽样分布1-

置信水平显著性水平和拒绝域

(右侧检验)H0临界值a样本统计量拒绝H0抽样分布1-

置信水平显著性水平和拒绝域

(右侧检验)H0临界值a样本统计量抽样分布1-

置信水平拒绝H0决策规则给定显著性水平

,查表得出相应的临界值z

或z

/2,t

或t

/2将检验统计量的值与

水平的临界值进行比较作出决策双侧检验:|统计量|>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0利用P值进行决策什么是P值?

(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值<

,拒绝H0双侧检验的P值

/

2

/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-

置信水平计算出的样本统计量P值右侧检验的P值0临界值a拒绝H0抽样分布1-

置信水平计算出的样本统计量P值原假设的可信度有多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么?如果拒绝H0而肯定H1

,就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)多大的P值合适?显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是,要证明原假设不正确,P值要多小,才能令人信服呢?这要根据两种情况来确定有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设固定显著性水平是否有意义用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P值决策与统计量的比较拒绝H0P值决策与统计量的比较拒绝H0的两个统计量的不同显著性

Z拒绝H00统计量1

P1

值统计量2

P2

值拒绝H0临界值与其人为地把显著性水平

固定按某一水平上,不如干脆选取检验统计量的P值与其大致知道犯第Ⅰ错误的概率,不如干脆知道一个确切的犯第Ⅰ类错误的概率(P值)与其为选取“适当的”的而苦恼,不如干脆把真正的

(P值)算出来P值决策与统计量的比较(结论)样本容量对检验结果的影响投掷硬币1000次、4040次和10000次时出现正面样本比例的抽样分布0.50.507这个结果出乎预料吗?n=1000n=4040n=10000假设检验结论的表述假设检验结论的表述

(“显著”与“不显著”)当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的假设检验结论的表述

(“接受”与“不拒绝”)假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确假设检验结论的表述

(为什么不说“接受”)【例】比如原假设为H0:

=10,从该总体中抽出一个随机样本,得到

x=9.8,在

=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明

=10是正确的。如果我们将原假设改为H0:

=10.5,同样,在

=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道假设检验结论的表述

(为什么不说“接受”)表述为“接受”一个原假设,应该注意到另一个原假设也可能同样地与数据相符。因此,我们宁愿说“不拒绝”当然,在实际检验中,针对一个具体问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所适从比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可以接受”原假设,但这并不等于说你“确实接受”它假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策6.2一个总体参数的检验6.2.1总体均值的检验6.2.2总体比例的检验6.2.3总体方差的检验一个总体参数的检验z检验(单尾和双尾)

t检验(单尾和双尾)z

检验(单尾和双尾)

2检验(单尾和双尾)均值总体参数比例方差总体均值的检验总体均值的检验

(作出判断)

是否已知小样本容量n大

是否已知否t检验否z检验是z检验

是z检验总体均值的检验

(大样本)总体均值的检验

(大样本) 1.假定条件正态总体或非正态总体大样本(n

30)2.使用z检验统计量

2

已知:

2

未知:总体均值的检验(

2

已知)

(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平

=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255总体均值的检验(

2

已知)

(例题分析)H0

=255H1

255

=0.05n=40临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:

不拒绝H0样本提供的证据还不足以推翻“该天生产的饮料符合标准要求”的看法总体均值的检验(z检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】第3步:将z的绝对值1.01录入,得到的函数值为

0.843752345

P值=2(1-0.843752345)=0.312495

P值远远大于

,故不拒绝H0总体均值的检验(

2

未知)

(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(

=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验(

2

未知)

(例题分析)H0

1.35H1

<1.35

=0.01n=50临界值(c):检验统计量:拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01总体均值的检验(z检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【ZTEST】,然后【确定】第3步:在所出现的对话框【Array】框中,输入原始数据所在区域;在【X】后输入参数的某一假定值(这里为1.35);在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023

即为P值

P值=1-0.995421023=0.004579

P值<

=0.01,拒绝H0总体均值的检验(z检验)

(P值的图示)0-2.33a=0.01z拒绝H0抽样分布1-

计算出的样本统计量=2.6061P值P=0.004579

总体均值的检验(

2

未知)

(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2

。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2

。试检验改良后的新品种产量是否有显著提高?(

=0.05)右侧检验总体均值的检验(

2

未知)

(例题分析)H0

5200H1

>5200

=0.05n=36临界值(c):检验统计量:拒绝H0(P=0.000088<

=0.05)改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645总体均值的检验(z检验)

(P值的图示)抽样分布P=0.00008801.645a=0.05拒绝H01-

计算出的样本统计量=3.75P值总体均值的检验

(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

:m=m0H1:m

m0H0:m

m0H1:m<m0H0:m

m0H1:m>m0统计量

已知

未知拒绝域P值决策拒绝H0总体均值的检验

(小样本)总体均值的检验

(小样本)1. 假定条件总体服从正态分布小样本(n<

30)2.检验统计量

2

已知:

2

未知:总体均值的检验

(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

:m=m0H1:m

m0H0

:m

m0H1:m<m0H0:m

m0H1:m>m0统计量

已知

未知拒绝域P值决策拒绝H0注:

已知的拒绝域同大样本总体均值的检验

(例题分析)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3总体均值的检验

(例题分析)H0

=12H1

12

=0.05df=10-1=9临界值(c):检验统计量:不拒绝H0样本提供的证据还不足以推翻“该供货商提供的零件符合要求”的看法决策:结论:t02.262-2.2620.025拒绝

H0拒绝H00.025总体均值的检验(t检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【TDIST】,然后【确定】第3步:在出现对话框的【X】栏中输入计算出的t的绝对值0.7035,在【Deg-freedom】(自由度)栏中输入本例的自由度9,在【Tails】栏中输入2(表明是双侧检验,如果是单测检验则在该栏输入1)第4步:P值=0.499537958

P值>

=0.05,故不拒绝H0

总体比例的检验适用的数据类型离散数据

连续数据数值型数据数据品质数据总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量

0为假设的总体比例总体比例的检验

(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:

=

0H1:

0H0

0H1:

<

0H0

0H1:

>

0统计量拒绝域P值决策拒绝H0总体比例的检验

(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平

=0.05和

=0.01,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?双侧检验总体比例的检验

(例题分析)H0

=80%H1

80%

=0.05n=200临界值(c):检验统计量:拒绝H0(P=0.013328<

=0.05)该杂志的说法并不属实

决策:结论:z01.96-1.960.025拒绝

H0拒绝

H00.025总体比例的检验

(例题分析)H0

=80%H1

80%

=0.01n=200临界值(c):检验统计量:不拒绝H0(P=0.013328>

=0.01)样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法

决策:结论:z02.58-2.580.025拒绝H0拒绝H00.025总体方差的检验

(

2检验)总体方差的检验

(

2检验)

检验一个总体的方差或标准差假设总体近似服从正态分布使用

2分布检验统计量样本方差假设的总体方差总体方差的检验

(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

2=

02H1:

2

0H0

2

02H1:

2

<

02H0:

2

02H1:

2

>

02统计量拒绝域P值决策

拒绝H0总体方差的检验

(例题分析)【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求?朝日BEER朝日BEER朝日BEER朝日总体方差的检验

(例题分析)H0

2=42H1

2

42

=0.10df=10-1=9临界值(s):统计量:不拒绝H0样本提供的证据还不足以推翻“装填量的标准差不符合要求”的看法

2016.91903.32511

/2=0.05决策:结论:6.3两个总体参数的检验6.3.1两个总体均值之差的检验6.3.2两个总体比例之差的检验6.3.3两个总体方差比的检验两个总体参数的检验总体参数独立样本配对样本均值差比例差方差比z

检验(大样本)t

检验(小样本)t

检验(小样本)z检验F

检验两个总体均值之差的检验

(独立大样本)两个总体均值之差的检验

(独立大样本)1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n1

30和n2

30)2.检验统计量

12

22

已知:

12

22

未知:两个总体均值之差的检验

(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

:m1-m2=0H1:m1-m2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论