参数估计与假设检验_第1页
参数估计与假设检验_第2页
参数估计与假设检验_第3页
参数估计与假设检验_第4页
参数估计与假设检验_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 12021-11-2样本统计量样本统计量如:样本均值如:样本均值、比例、方差、比例、方差总体均值、比总体均值、比例、方差等例、方差等2 22021-11-2统计推断统计推断(Statistical inference) 统计推断统计推断就是根据随机样本的实际数据,就是根据随机样本的实际数据,对总体的数量特征作出具有一定可靠程度的估对总体的数量特征作出具有一定可靠程度的估计和判断。统计推断的计和判断。统计推断的基本内容基本内容有有参数估计参数估计和和假设检验假设检验两方面。概括地说,研究一个随机变两方面。概括地说,研究一个随机变量,推断它具有什么样的数量特征,按什么样量,推断它具有什么样的数

2、量特征,按什么样的模式来变动,这属于估计理论的内容,而推的模式来变动,这属于估计理论的内容,而推测这些随机变量的数量特征和变动模式是否符测这些随机变量的数量特征和变动模式是否符合我们事先所作的假设,这属于检验理论的内合我们事先所作的假设,这属于检验理论的内容。参数估计和假设检验的共同点是它们都对容。参数估计和假设检验的共同点是它们都对总体无知或不很了解,都是利用样本观察值所总体无知或不很了解,都是利用样本观察值所提供的信息,对总体的数量特征作出估计和判提供的信息,对总体的数量特征作出估计和判断,但两者所要解决问题的着重点及所用方法断,但两者所要解决问题的着重点及所用方法有所不同。有所不同。3

3、32021-11-2主要内容主要内容5.1 参数估计的一般问题参数估计的一般问题 5.2 一个一个总体参数的区间估计总体参数的区间估计5.3 必要抽样数目的确定必要抽样数目的确定5.4 假设检验的基本问题假设检验的基本问题5.5 一个总体参数的假设检验一个总体参数的假设检验4 42021-11-25.1 5.1 参数估计的一般问题参数估计的一般问题 5.1.1 5.1.2 5.1.3 5.1.4 5 52021-11-2 所谓参数估计,就是以样本统计量(即样本数字特征)来估计未知的总体参数(或参数的函数)。实际工作中一般首先进行概率抽样得到随机样本,然后通过对样本单位的实际观察取得样本数据,最

4、后计算样本统计量的取值对未知的总体参数进行估计。 5.1.1 参数估计的含义参数估计的含义1、什么是参数估计、什么是参数估计6 62021-11-22、参数估计的特点和逻辑思想、参数估计的特点和逻辑思想(1)以随机样本为基础;(2)以分布理论为依据;(3)推断的只是一种可能的结果;(4)是归纳推理和演绎推理的结合。 归纳推理 从样本 总体 大前提 小前提 (分布规律) (样本信息)结果演绎推理5.1.1 参数估计的含义参数估计的含义7 72021-11-23、参数估计的主要问题、参数估计的主要问题5.1.1 参数估计的含义参数估计的含义8 82021-11-2 1)估计量估计量:用于估计总体参

5、数的统计量:用于估计总体参数的统计量如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如: 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量 2)参数用)参数用 表示,估计量表示,估计量用用 表示表示 3)估计值估计值:估计参数时计算出来的估计量的具:估计参数时计算出来的估计量的具体数值体数值如果样本均值如果样本均值 x =80,则,则80就是就是 的估计值的估计值1、什么是估计量与估计值、什么是估计量与估计值 (estimator & estimated value)5.1.2 估计量与估计值估计量与估计值9 92021-11-22、统计估计的基

6、本过程、统计估计的基本过程1)首先对所要研究的总体进行概率抽样,通过首先对所要研究的总体进行概率抽样,通过随机样本获取相关统计量,然后利用这些随机样本获取相关统计量,然后利用这些统计量统计量与总体参数之间的联系与总体参数之间的联系(获得统计量的分布),(获得统计量的分布),利用有关统计方法计算估计量,估计总体参数。利用有关统计方法计算估计量,估计总体参数。2)由此可以看出,统计量与总体参数、估计量由此可以看出,统计量与总体参数、估计量的不同:总体的不同:总体参数参数通常是未知的通常是未知的常数常数,是待估计是待估计的量的量;统计量统计量是根据样本计算的函数,通常是随是根据样本计算的函数,通常是

7、随机变量(对于总体而言);机变量(对于总体而言);估计量估计量是是用来对总体用来对总体参数进行估计的统计量。参数进行估计的统计量。5.1.2 估计量与估计值估计量与估计值10102021-11-21、参数估计的方法、参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计5.1.3 点估计量与区间估计点估计量与区间估计11112021-11-22、点估计、点估计 (point estimate)用样本统计量的某个取值直接作为总体参数用样本统计量的某个取值直接作为总体参数的估计值的估计值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例如:用两个样本均值之

8、差直接例如:用两个样本均值之差直接作为作为总体均值总体均值之差的估计之差的估计2) 没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法、顺序统计量法、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等最大似然法、最小二乘法等5.1.3 点估计量与区间估计点估计量与区间估计12122021-11-23、区间估计、区间估计 (interval estimate)(1)有关概念)有关概念l 点估计是通过样本估计量的某一次估计值来推断总体参数的可能取值;l 区间估计则是根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。l 人们在得到点估计

9、值的同时,自然希望知道 与到底相差多少?这就引出了区间估计问题。即希望对的取值估计出一个范围,并希望知道这个范围包含 的可靠程度。 即 P = 1- 其中 是置信区间; 是置信区间下、上限;1- 是置信水平、置信度或置信系数; 是估计不准的概率,通常取=0.05,或0.01。l 由上式可知,要想求出被估计参数的置信区间,必须找到一个和被估计参数相关联的统计量,并知其概率分布。1212,21,5.1.3 点估计量与区间估计点估计量与区间估计13132021-11-2 (2)置信区间的构造)置信区间的构造当总体服从正态分布N(,2)时(2已知),来自该总体的所有容量为n的样本的均值x也服从正态分布

10、,x 的数学期望为,方差为2/n。即xN(,2/n)1)(2znxp /2 1)(2nxpz2xzn5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计14142021-11-2(3)区间估计的图示)区间估计的图示xn2xx z 5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计15152021-11-2 2) 1- 可以认为是用样本估计值 代替总体真值时误差在某一范围内的“可能性”,则 可认为是用 代替时误差超过这一范围的“可能性”。 3)用一个具体的样本所构造的区间是一个特定的区间用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生

11、的区间是否包含总体参数的真值。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。 总体参数以一定的概率落在这一区间的表述是错误的。总体参数以一定的概率落在这一区间的表述是错误的。 1)置信区间的直观意义为:n次抽样形成的n个置信区间中,有n (1- ) 个区间包含总体参数真值。5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计注意:注意:(3)区间估计的图示)区间估计的图示16162021-11-2-4-2240.10.20.30.4 x45505560657075800204060805.1.3 点估计量与区间估计

12、点估计量与区间估计3、区间估计、区间估计(3)区间估计的图示)区间估计的图示17172021-11-2(4)影响区间宽度的因素)影响区间宽度的因素1. 总体数据的离散程度,总体数据的离散程度,用用 来测度来测度样本容量样本容量 n 置信水平置信水平 (1 - ),影响,影响 z /2的大小的大小抽样方法抽样方法2. 抽样的组织方式抽样的组织方式5.1.3 点估计量与区间估计点估计量与区间估计3、区间估计、区间估计18182021-11-2置信区间与置信水平(置信区间与置信水平(1- )的关系)的关系70%80%90%95%99%置信区间宽度5.1.3 点估计量与区间估计点估计量与区间估计3、区

13、间估计、区间估计(4)影响区间宽度的因素)影响区间宽度的因素Neyman原则:原则: 即在保证置信度的前提下,尽可能提高估计的精确度。即在保证置信度的前提下,尽可能提高估计的精确度。 19192021-11-21、点估计、点估计以样本指标直接估计总体参数。以样本指标直接估计总体参数。评价准则评价准则的数学期望的数学期望等于总体参等于总体参数,即数,即E该估计量称该估计量称为无偏估计。为无偏估计。无偏性无偏性有效性有效性 当当 为为 的的无偏估计时,无偏估计时, 方差方差 越越小,无偏估计小,无偏估计越有效。越有效。2()E 一致性一致性对于无限总体,对于无限总体,如果对如果对任意任意 ,0(|

14、) 0nnLimP 则称则称的一致估计。的一致估计。是是充分性充分性估计量如估计量如能包含样能包含样本中关于本中关于未知参数未知参数的全部信的全部信息,即为息,即为充分量。充分量。估计量估计量5.1.4 评价估计量的标准评价估计量的标准20202021-11-22、区间估计、区间估计估计未知参数所在的可能区间。估计未知参数所在的可能区间。评价准则评价准则随机区间随机区间置信度置信度精确度精确度随机区间随机区间()1LUP ,LU包含包含(即可靠程度即可靠程度)越大越好。越大越好。的概率的概率,LU的平均长度的平均长度(误差范围误差范围)越小越好。越小越好。()ULE5.1.4 评价估计量的标准

15、评价估计量的标准21212021-11-2 5.2 一个总体参数的区间估计 5.2.1 5.2.2 5.2.3 22222021-11-21、有关符号、有关符号总体参数总体参数样本统计量样本统计量均值均值比例比例方差方差2xp2s5.2.1 一个总体均值的区间估计一个总体均值的区间估计23232021-11-2(1)总体服从正态分布总体服从正态分布, ,且且方差方差( ) 已知已知;或者总体不是正或者总体不是正态分布但大样本态分布但大样本 (n 30)时总体均值的区间估计时总体均值的区间估计 该条件下使用标准正态分布统计量 z下面通过标准正态分布构造总体均值的置信区间(0,1)(0,1)(xz

16、NnxzNsn未或知,大样本)5.2.1 一个总体均值的区间估计一个总体均值的区间估计2、一个总体均值的置信区间、一个总体均值的置信区间24242021-11-2 给定置信度1- ,可由标准正态分布表查得临界值Z/2,使得从而可得置信度为1- 时总体均值的置信区间: 在大样本(n30)条件下,不论总体分布形式如何,均可用上述方法进行总体均值的区间估计。如果总体方差未知,则直接用样本方差代替。 注意:注意:5.2.1 一个总体均值的区间估计一个总体均值的区间估计2021-11-225 (2)小样本下小样本下总体方差未知总体方差未知时,正态分布总体均时,正态分布总体均值的区间估计值的区间估计 如果

17、是小样本,但总体为正态分布,在总体方差未知如果是小样本,但总体为正态分布,在总体方差未知而需用样本方差代替时,则下式而需用样本方差代替时,则下式服从自由度为服从自由度为n-1n-1的的t t分布分布。5.2.1 一个总体均值的区间估计一个总体均值的区间估计2、一个总体均值的置信区间、一个总体均值的置信区间2021-11-226 注意:注意: 如果小样本下总体分布非正态,则无法进行区间估计,唯一的解决方法就是增大样本。从而可得置信度为1- 时总体均值的置信区间: 于是,给定置信度为1- ,可由t分布表查得临界值t /2(n-1),使得5.2.1 一个总体均值的区间估计一个总体均值的区间估计272

18、72021-11-25.2.1 一个总体均值的区间估计一个总体均值的区间估计3、极限误差(、极限误差(1)含义)含义(大样本条件下)(大样本条件下)(2)极限误差的计算公式极限误差的计算公式2xxz边际误差边际误差2ppz28282021-11-2 Z与相应的置信水平存在一一对应关系,与相应的置信水平存在一一对应关系,常用常用的置信水平及相应的的置信水平及相应的Z值如下:值如下:15.2.1 一个总体均值的区间估计一个总体均值的区间估计3、极限误差、极限误差29292021-11-2计算计算样本样本统计量统计量确定样确定样本统计本统计量分布量分布由置信由置信水平求水平求临界值临界值确定确定置信

19、置信区间区间xxxZxZxxxZxZx,4、区间估计步骤、区间估计步骤 (以大样本下估计(以大样本下估计 为例)为例)其中:其中:xn5.2.1 一个总体均值的区间估计一个总体均值的区间估计30302021-11-25.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析31312021-11-2按按 日产量分组日产量分组(件)(件)工人数工人数(人)(人)组中值(件)组中值(件)1101141141181181221221261261301301341341381381423718232118641121161201241281321361403368122160285

20、2268823768165605887006489284648600784合计合计100126004144fxxf2xxf100100名工人的日产量分组资料名工人的日产量分组资料5.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析32322021-11-221260012610041446.47199xfxfxxfsf件解:件2226.4710001001.961.203110010001xsNnZnN件5.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析33332021-11-2,(),(),xxxxxN xN xx 1261.203126

21、1.203 ,1000 1261.2031000 1261.203XN X即5.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析34342021-11-2例:由例:由532名名商业周刊商业周刊订阅者订阅者组成的样本表明,其每周使用因特网的组成的样本表明,其每周使用因特网的平均时间为平均时间为6.7小时。如果总体标准差为小时。如果总体标准差为5.8小时,求该周刊订阅者总体每周平均小时,求该周刊订阅者总体每周平均花费在因特网上时间的花费在因特网上时间的95置信区间。置信区间。nx96. 12Z则该置信区间为:则该置信区间为:5328 . 596. 17 . 62nZx19

22、. 7,21. 65.2.1 一个总体均值的区间估计一个总体均值的区间估计5、例题分析、例题分析35352021-11-25、例题分析、例题分析8.2.1 一个总体均值的区间估计一个总体均值的区间估计 从某证券市场抽取一个由从某证券市场抽取一个由10只股只股票组成的样本,其市盈率分别为:票组成的样本,其市盈率分别为: 5 7 9 10 14 23 20 15 3 26试求该市场全部股票平均市盈率试求该市场全部股票平均市盈率的置信度为的置信度为95的置信区间(假定的置信区间(假定股票市盈率近似服从正态分布)。股票市盈率近似服从正态分布)。xtx)110(025.08 . 71)(22nxxs2.

23、47xSn262. 2) 110(025. 0t2 .13nxx查表查表总体均值总体均值95置信区间为:置信区间为:即:即:787.18,613.7587.52 .13,587.52 .1336362021-11-2n是否为大样本是否为大样本 是否已知是否已知是否正态总体是否正态总体 是否已知是否已知用用S 估估计计 用用S 估估计计 增大样本增大样本容量到容量到30以上以上是是是是是是是是否否否否否否否否nZx2nZx2nSZx22Sx tn5.2.1 一个总体均值的区间估计一个总体均值的区间估计6、小结、小结37372021-11-2(0,1)(1)pzNn)()-1 ()1 (22未知时

24、或nppzpnzp5.2.2 一个总体比例(成数)的区间估计一个总体比例(成数)的区间估计1、一个总体比例(成数)的置信区间、一个总体比例(成数)的置信区间38382021-11-2 【例】【例】某城市想要估计职工中女性所占的比例,随机地抽取了100名职工,其中65人为女性职工。试以95%的置信水平估计该城市职工中女性比例的置信区间。2(1)65%(165%)65%1.9610065%9.35%55.65%,74.35%pppzn5.2.2 一个总体比例的区间估计一个总体比例的区间估计2、例题分析、例题分析39392021-11-211222nsn111122122222nsnnsn1、一个总

25、体方差的置信区间、一个总体方差的置信区间5.2.3 一个总体方差的区间估计一个总体方差的区间估计40402021-11-22、一个总体方差置信区间图示、一个总体方差置信区间图示5.2.3 一个总体方差的区间估计一个总体方差的区间估计41412021-11-225袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.33、例题分析、例题分析5.2.3 一个总体方差的区间估计一个总

26、体方差的区间估计42422021-11-2401.12)24() 1(2975. 0212n364.39)24() 1(2025. 022n39.18083.56401.1221.93125364.3921.93125223、例题分析、例题分析5.2.3 一个总体方差的区间估计一个总体方差的区间估计43432021-11-2一、从某一总体中随机抽取一个容量为100的样本,其均值为81,标准差为12。要求:1、构造总体均值95%置信水平下的置信区间;2、构造总体均值99%置信水平下的置信区间。二、一个容量为400的随机样本取自均值和标 准差均未知的总体。已经计算出下列值: =38532 要求:1

27、、构造总体均值95.45%置信水平下的置信区间;2、构造总体均值99.73%置信水平下的置信区间。 2280 xixi24、区间估计练习、区间估计练习5.2.3 一个总体方差的区间估计一个总体方差的区间估计44442021-11-25.3 必要抽样数目的确定 5.3.1 5.3.1 5.3.2 5.3.2 5.3.3 5.3.3 5.3.4 5.3.4 45452021-11-2样本容量样本容量找出在规定误差范围找出在规定误差范围内的最小样本容量内的最小样本容量找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量5.3.1 确定样本容量的意义确定样本容量的意义46462021-

28、11-2,xxZZn22222xxZn通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。 通常未知。一般按以通常未知。一般按以下方法确定其估计值下方法确定其估计值: : 过去的经验数据;过去的经验数据; 试验调查样本的试验调查样本的S S。计算结果通常向上进位计算结果通常向上进位5.3.2 推断总体均值所需的样本容量推断总体均值所需的样本容量47472021-11-22,1xxNnZZnN22222(1)xNZnNZ5.3.2 推断总体均值所需的样本容量推断总体均值所需的样本容量48482021-11-25.3.2 推断总体均值所需的样本容量推断总

29、体均值所需的样本容量49492021-11-2222222222222222210000225(1)(100001)522510000,25,5,2,225100599.01100 xxxN ZnNZNZZn己 知克克则 在 重 复 抽 样 条 件 下 :袋在 不 重 复 抽 样 条 件 下 :袋解 :袋5.3.2 推断总体均值所需的样本容量推断总体均值所需的样本容量50502021-11-21,ppPPZZn22211PPZPPPPn通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下通

30、常未知。一般按以下方法确定其估计值:方法确定其估计值:过过去的经验数据;去的经验数据;试验调试验调查样本的查样本的 ;取方差取方差的最大值的最大值0.250.25。2P2Ps5.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量51512021-11-211ppPPNnZZnN2221(1)1pNZ PPnNZ PP 5.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量52522021-11-25.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量53532021-11-2222222222221500030.0651(1)1(50001)0.0330.0651

31、5000,3 ,3,10.0651,130.06516510.03576.004577ppppNZ PPnNZ PPNZPPZ PPn 己知则在重复抽样条件下:件在不重复抽样条件下:件解:件5.3.3 推断总体成数所需的样本容量推断总体成数所需的样本容量54542021-11-2222xZn22222(1)xNZnNZ 5.3.4 必要样本容量的影响因素必要样本容量的影响因素2021-11-255n一、n二、二、n三、三、n四、四、n五、五、n六、六、 n七、七、5.4 假设检验的基本问题假设检验的基本问题2021-11-256 有许多实际问题,需要通过部分信息量,对某有许多实际问题,需要通过

32、部分信息量,对某种看法进行判定或估计。种看法进行判定或估计。 例例1、某企业生产一种零件,以往的资料显示零某企业生产一种零件,以往的资料显示零件平均长度为件平均长度为4cm,标准差为,标准差为0.1cm。工艺改革后。工艺改革后,抽查抽查100个零件发现其平均长度为个零件发现其平均长度为3.94cm。问:工问:工艺改革后零件长度是否发生了显著变化艺改革后零件长度是否发生了显著变化? 例例2、某厂有一天共生产了某厂有一天共生产了2000件产品,按国家件产品,按国家标准,次品率不得超过标准,次品率不得超过3%才能出厂。现从该批产品才能出厂。现从该批产品中随机抽取中随机抽取100件,发现其中有件,发现

33、其中有2件次品,件次品,问这批产问这批产品能否出厂品能否出厂。 一、假设检验一、假设检验(Hypothesis Testing)问题的提出问题的提出2021-11-257 例1要判明判明工艺改革后零件平均长度是否仍为4cm; 例2要判明判明该批产品的次品率是否低于3%。进行这种判断的信息来自所抽取的样本这两个例子中都是要对某种对某种“陈述陈述”做出判做出判断断: 所谓假设检验假设检验,就是事先对总体参数或总体分就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否原假设是否合理,即判断样本信息与原

34、假设是否有显著差异,从而决定是否拒绝原假设。有显著差异,从而决定是否拒绝原假设。 假设检验假设检验分两类分两类:(1)参数假设检验; (2)非参数检验或自由分布检验。一、假设检验一、假设检验(Hypothesis Testing)问题的提出问题的提出2021-11-258 通过提出假设,利用通过提出假设,利用“小概率原理小概率原理”和和“概率概率反证法反证法”,论证假设真伪的一种统计分析方法。,论证假设真伪的一种统计分析方法。 1、小概率原理:小概率原理:也就是实际推断原理,它认也就是实际推断原理,它认为在一次实验中,概率很小的事件,实际上几乎为在一次实验中,概率很小的事件,实际上几乎是不可能

35、发生的。是不可能发生的。 2、概率反证法:概率反证法:如果在其他因素给定的前提如果在其他因素给定的前提下,要证明某一事实(比如对总体参数的假定)下,要证明某一事实(比如对总体参数的假定)是否成立,是否成立,首先假设该事实成立,然后在该事实首先假设该事实成立,然后在该事实成立的前提下,计算由该事实和样本构造的统计成立的前提下,计算由该事实和样本构造的统计量的取值,再根据该统计量的分布,判断已经观量的取值,再根据该统计量的分布,判断已经观测到的样本信息出现的概率是否为小概率,以此测到的样本信息出现的概率是否为小概率,以此来证明该事实是否成立。来证明该事实是否成立。二、假设检验的基本思想二、假设检验

36、的基本思想2021-11-259 因此,置信度大小的不同,有可能做出不同的判断。 3、假设检验是基于样本资料来推断总体特征假设检验是基于样本资料来推断总体特征的,而这种推断是在一定概率置信度下进行的,的,而这种推断是在一定概率置信度下进行的,而而非严格的逻辑证明非严格的逻辑证明。 在例例1中,要判断判断工艺改革后零件平均长度是否仍为4cm, 可先假设先假设仍为4cm,根据样本平均数的抽样分布理论,则样本点应以较大的可能性(置信度)落在以4为中心的某一范围内。二、假设检验的基本思想二、假设检验的基本思想2021-11-260 在给定置信度在给定置信度1- 下下(比如比如99%):):20Znx其

37、中:其中: 0为所要检验的假设(这里为为所要检验的假设(这里为4cm) 为总体标准差(这里为为总体标准差(这里为0.1cm)n为样本容量为样本容量(这里为(这里为100)Z /2为置信度为置信度1- 下,标准正态分布对应的右尾临界值下,标准正态分布对应的右尾临界值二、假设检验的基本思想二、假设检验的基本思想2021-11-261 如果取置信度为0.99,则显著性水平=0.01,对应的临界值为Z/2 =2.58 换言之,如果原假设为真,则样本测算值将以99%的可能性落在-2.58,2.58区间内。 通过一组(实际)样本计算得: 说明小概率事件小概率事件(标准化后的样本均值只有1%的可能性落在-2

38、.58,2.58区间外)发生了发生了。 这是不合理的,应拒绝原假设这是不合理的,应拒绝原假设。二、假设检验的基本思想二、假设检验的基本思想2021-11-262(一)原假设(一)原假设(null hypothesis)研研究者想收集证据究者想收集证据予以反对予以反对的假设的假设又称“零假设”总是有符号 , 或 n表示为 H0nH0 : = 某一数值 n指定为符号 =, 或 1.例如, H0 : 10cm三、有关概念三、有关概念2021-11-263研究研究者想收集证据者想收集证据予以支持予以支持的假设的假设也称“研究假设”总是有符号 , 或 表示为 H1nH1 : 某一数值,或 某一数值n例如

39、, H1 : ”或或“”的假设检验,称为的假设检验,称为单侧检验单侧检验或或单尾检验单尾检验(one-tailed test)n备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验 (三)双侧检验与单侧检验(三)双侧检验与单侧检验三、有关概念三、有关概念2021-11-268注:研究者感兴趣的是备择假设,单侧假设的方研究者感兴趣的是备择假设,单侧假设的方向是按向是按备侧假设的方向备侧假设的方向来说的来说的。假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0 0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : :

40、0 0H1 : : 0 0(三)双侧检验与单侧检验(三)双侧检验与单侧检验三、有关概念三、有关概念2021-11-269 由于假设检验是根据有限的随机样本信息来推断总体特征,而样本的随机性可能致使判断出错。 1、第、第I类错误类错误 当原假设为真时,而拒绝原假设所犯的错误,称称为为第第I类错误类错误或弃真错误弃真错误。易知犯第I类错误的概率就是显著性水平:)|(00trueisHHrejectP)|(00falseisHHrejectnotP 2、第、第II类错误类错误 当原假设为假时,不拒绝原假设所犯的错误,称为称为第第II类错误类错误或采伪错误采伪错误。犯第II类错误的概率常用表示:四、假

41、设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平2021-11-2701)犯第I类错误与犯第II类错误的概率存在此消彼长的关系; 2)若要同时减少 与 ,须增大样本容量n; 3)通常的作法是)通常的作法是,取较小显著性水平,即控制犯第I类错误的概率在较小的范围内; 4)在犯第II类错误的概率不好控制时,将“接受原假设”更倾向于说成“不拒绝原假设”。注意:注意:四、假设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平2021-11-2713、假设检验中的四种可能情况、假设检验中的四种可能情况 H0为真 H0不真 不拒绝H0 Good Bad/Type II er

42、ror 拒绝H0 Bad/Type I error Good4、影响、影响 错误的因素错误的因素n1.显著性水平 n当 减少时增大n2.总体标准差 n当 增大时增大n3.样本容量 nn当 n 减少时增大n4.总体参数的真值四、假设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平2021-11-2725、检验能力、检验能力(power of test)拒绝一个错误的原假设的能力根据 的定义, 是指没有拒绝一个错误的原假设的概率。这也就是说,1- 则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)可解释为正确地拒绝一个错误的原假设的

43、概率四、假设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平2021-11-2736、显著性水平、显著性水平 (significant level)n1)是一个概率值)是一个概率值n2)原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率n被称为抽样分布的拒绝被称为抽样分布的拒绝域域n3)表示为)表示为 (alpha)n常用的常用的 值有值有0.01, 0.05, 0.10n4)由研究者事先确定)由研究者事先确定四、假设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平2021-11-274significant(显著的)一词的意义在这里并不是“重重要的要

44、的”,而是指“非偶然的非偶然的”在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的一项检验在统计上是一项检验在统计上是“显著的显著的”,意思是指:这样,意思是指:这样的的(样本样本)结果不是偶然得到的,或者说,不是靠机结果不是偶然得到的,或者说,不是靠机遇能够得到的遇能够得到的n在假设检验时,如果拒绝原假设,则称检验结果“在在统计上是显著的统计上是显著的”;如果不拒绝原假设,则称检验结果“在统计上是不显著的”。7、统计显著性、统计显著性 (significant)四、假设检验中的两类错误与显著性水平四、假设检验中的两类错误与显著性水平

45、2021-11-275五、检验统计量与拒绝域五、检验统计量与拒绝域1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量检验统计量2、样本估计量标准化的依据:原假设H0为真 点估计量的抽样分布 点估计量假设值标准化检验统计量点估计量的抽样标准差3、对于一个总体均值和比例的检验,标准化、对于一个总体均值和比例的检验,标准化 的检验统计量可表示为的检验统计量可表示为2021-11-2763、显著性水平和拒绝域显著性水平和拒绝域(1) 双侧检验双侧检验 H0 : : = 0 0 H1 : : 0 0 /2 五、检验统计量与拒绝域五、检验统计量与拒绝域2021

46、-11-2773、显著性水平和拒绝域显著性水平和拒绝域(2) 左侧检验左侧检验 H0 : : 0 0 H1 : : 0五、检验统计量与拒绝域五、检验统计量与拒绝域2021-11-2795、总结总结 决策规则决策规则给定显著性水平给定显著性水平 ,查表得出相应的临,查表得出相应的临界值界值z 或或z /2 /2, t 或或t /2 /2将检验统计量的值与将检验统计量的值与 水平的临界值进水平的临界值进行比较行比较作出决策作出决策n双侧检验:双侧检验:I统计量统计量I临界值,拒绝临界值,拒绝H0n左侧检验:左侧检验: 统计量统计量 临界值,拒绝临界值,拒绝H0n右侧检验:右侧检验: 统计量统计量

47、临界值,拒绝临界值,拒绝H0五、检验统计量与拒绝域五、检验统计量与拒绝域2021-11-280在零假设为真的条件下,检验统计量取其在零假设为真的条件下,检验统计量取其计算值或更加极端值(沿着备择假设的方计算值或更加极端值(沿着备择假设的方向)的概率称为向)的概率称为p值值(p-value)。)。反映实际观测到的数据与原假设反映实际观测到的数据与原假设H0之间不之间不一致的程度一致的程度也称为也称为观察到的观察到的(或实测的或实测的)显著性水平显著性水平决策规则:决策规则:若若p值值 , 拒绝拒绝 H0六、利用六、利用P值进行决策值进行决策1、P值及决策规则值及决策规则2021-11-281六、

48、利用六、利用P值进行决策值进行决策2、各种检验的、各种检验的P值值2021-11-282六、利用六、利用P值进行决策值进行决策2、各种检验的、各种检验的P值值2021-11-283六、利用六、利用P值进行决策值进行决策2、各种检验的、各种检验的P值值2021-11-284有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设n只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“有足够证据

49、拒绝原假设”的标准,我们大概可以说:10%代表有“一些证据一些证据”不利于原假设;5%代表有“适度证据适度证据”不利于原假设;1%代表有“很强证据很强证据”不利于原假设。六、利用六、利用P值进行决策值进行决策3、固定显著性水平是否有意义固定显著性水平是否有意义2021-11-285用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少n比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落

50、在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少。六、利用六、利用P值进行决策值进行决策4、 P 值决策与统计量的比较值决策与统计量的比较2021-11-286拒绝拒绝H0的两个统计量的不同显著性的两个统计量的不同显著性六、利用六、利用P值进行决策值进行决策4、 P 值决策与统计量的比较值决策与统计量的比较2021-11-287 1、提出原假设和备择假设、提出原假设和备择假设 原假设(或称零假设)为正待检验的假设:H0 备择假设(研究假设)为可供选择的假设:H1 一般地,假设有三种形式: (1 1)双侧检验)双侧检

51、验: H0 : 0; H1 :0 (2 2)左侧检验)左侧检验: H0 : 0; H1 :0 七、假设检验的步骤七、假设检验的步骤2021-11-288 2、选择适当的统计量,并确定其分布形式、选择适当的统计量,并确定其分布形式 统计量是根据所涉及的问题而定的,如总体均总体均值值、比例比例可选取正态分布的Z统计量等。 3、选择显著性水平或置信度,确定临界值、选择显著性水平或置信度,确定临界值 显著性水平显著性水平为原假设为真时,样本点落在临界值外的概率(即抽样结果远离中心点的概率,它为小概率),也是原假设为真时,拒绝原假设所也是原假设为真时,拒绝原假设所冒的风险冒的风险。 临界值临界值将样本点

52、所落区域分为拒绝域拒绝域与非拒非拒绝域绝域,临界值“外”为拒绝域,“内”为非拒绝域。七、假设检验的步骤七、假设检验的步骤2021-11-289 通过样本计算统计量的具体值,与临界值临界值比较,根据是否落入拒绝域来拒绝或不拒绝原假设。统计量的值落在统计量的值落在拒绝域拒绝域,拒绝,拒绝H0,否则不拒绝,否则不拒绝H0也可以直接利用也可以直接利用P值值作出决策作出决策 4、作出结论、作出结论2 2 拒绝域 拒绝域 拒绝域 (a)双侧检验 (b)左侧检验 (c)右侧检验七、假设检验的步骤七、假设检验的步骤2021-11-2905.5 一个总体参数的假设检验一个总体参数的假设检验n一、一个总体参数检验

53、主要内容一、一个总体参数检验主要内容n二、一个总体均值的假设检验二、一个总体均值的假设检验n三、一个总体比例的假设检验三、一个总体比例的假设检验n四、一个总体方差的假设检验四、一个总体方差的假设检验2021-11-291z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾) 2 2 检验检验(单尾和双尾单尾和双尾)均值均值一个总体一个总体比例比例方差方差一、一个总体参数检验主要内容一、一个总体参数检验主要内容2021-11-292 假定条件假定条件n正态总体或非正态总体大样本正态总体或非正态总体大样本(n 30) 使用使用z检验统计量检验

54、统计量n 2 已知:已知:n 2 未知:未知:) 1 , 0(0Nnxz0(0,1)xzNsn二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(1)假定条件及检验统计量)假定条件及检验统计量2021-11-293n【例】【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的

55、检验方法(2)例题分析)例题分析( 2 已知已知)2021-11-294nH0 : = 255nH1 : 255n = 0.05,n = 40n临界值临界值(c):01. 14052558 .2550nxz解:作假设二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(2)例题分析)例题分析( 2 已知已知)2021-11-295n第第1步步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数)n第第2步步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定n第第3步步:将 z 的绝对值1.01录入,得到的函数值为 0

56、.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(2)例题分析)例题分析(用用E Excel计算正态分布计算正态分布P值值 )2021-11-296n【例】【例】一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?

57、 (=0.01) 50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(2)例题分析)例题分析( 2 未知未

58、知)2021-11-297nH0 : 1.35nH1 : 1.35n = 0.01,n = 50n临界值临界值(c):6061. 250365749. 035. 13152. 1z解:作假设作假设,zz左侧检验左侧检验二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(2)例题分析)例题分析( 2 未知未知)2021-11-298n第第1步:步:进入Excel表格界面,直接点击“f(x)”(粘贴 n 函数)n第第2步:步:在函数分类中点击“统计”,并在函数名的n 菜单下选择“ZTEST”,然后确定n第第3步:步:在所出现的对话框Array框中,输入原始数

59、据所在区 n 域 ;在X后输入参数的某一假定值(这里为1.35);在n Sigma后输入已知的总体标准差(若总体标准差未 n 知则可忽略不填,系统将自动使用样本标准差代替) n第第4步:步:用1减去得到的函数值0.995421023 即为P值n P值=1-0.995421023=0.004579 n P值 5200n = 0.05,n = 36n临界值临界值(c):75. 33612052005275z解:作假设作假设二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(2)例题分析)例题分析( 2 未知未知)2021-11-2102二、一个总体均值的假设

60、检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(2)例题分析)例题分析(拒绝域与拒绝域与P值图示值图示 )2021-11-2103假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : =0H1 : 0H0 : 0H1 : 0统计量统计量 已知: 未知:拒绝域拒绝域P值决策值决策拒绝H00 xzn0 xzsn/2zzzz zzP二、一个总体均值的假设检验二、一个总体均值的假设检验1、大样本的检验方法、大样本的检验方法(3)大大样本检验方法小结样本检验方法小结2021-11-21041. 假定条件n总体服从正态分布n小样本(n 30)检验统计量n 2 已知

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论