第4章参数估计和假设检验_第1页
第4章参数估计和假设检验_第2页
第4章参数估计和假设检验_第3页
第4章参数估计和假设检验_第4页
第4章参数估计和假设检验_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中央财经大学统计学院,参数估计与假设检验,4.1参数估计 4.2假设检验,中央财经大学统计学院 2,4.1 参数估计,4.1.1 参数估计的基本概念 4.1.2 总体均值和比例的区间估计 4.1.3 必要样本容量的确定,中央财经大学统计学院 3,4.1.1 参数估计的基本概念,用来推断总体参数的统计量称为估计量(estimator), 其取值称为估计值(estimate) 。 同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确定的。,中央财经大学统计学院 4,点估计,点估计: 用估计量的数值作为总体参数的估计值。 一个总体参数的估计量可以有多个 。例如,在

2、估计总体方差时, 和 都可以作为估计量。,中央财经大学统计学院 5,点估计量的常用评价准则:无偏性,无偏性:估计量的数学期望与总体待估参数的真值相等:,中央财经大学统计学院 6,点估计量的常用评价准则: 有效性,在两个无偏估计量中方差较小的估计量较为有效。,中央财经大学统计学院 7,估计量的常用评价准则:一致性,指随着样本容量的增大,估计量越来越接近被估计的总体参数。,中央财经大学统计学院 8,区间估计,根据事先确定的置信度1-给出总体参数的一个估计范围。 根据样本统计量的分布推断出总体参数的置信区间。,抽样分布 Sampling Distribution,由于样本是随机变量,统计量是样本的函

3、数,从而统计量也是随机变量。统计量的分布称为抽样分布。 在推断统计中,总体的分布一般是未知的,(常常被假设为正态分布)。 在假设总体服从某一分布的基础上,抽样分布(统计量的分布)一般可以利用概率统计的理论推导得出。,中央财经大学统计学院 10,抽样分布的一个演示:重复抽样时样本均值的抽样分布(1),设一个总体含有4个个体,分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下。,均值和方差,中央财经大学统计学院 11,抽样分布的一个演示:重复抽样时样本均值的抽样分布(2), 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表.,

4、中央财经大学统计学院 12,抽样分布的一个演示:重复抽样时样本均值的抽样分布(3), 各样本的均值如下表,并给出样本均值的抽样分布,中央财经大学统计学院 13,所有样本均值的均值和方差,1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n,M为样本数目,中央财经大学统计学院 14,样本均值的抽样分布与总体分布的比较,中央财经大学统计学院 15,样本均值的抽样分布,一般的,当总体X服从正态分布,XN(,2),来自该总体的容量为n的样本的均值X也服从正态分布,XN(,2/n)。,中心极限定理,从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本

5、均值的抽样分布近似服从均值为、方差为2/n的正态分布。,中央财经大学统计学院 17,4.2 总体均值和比例的区间估计,中央财经大学统计学院 18,总体均值的置信区间,总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因而这是应用最多的公式。在大样本时t值可以用z值来近似。,根据中心极限定理得到的近似结果。 未知时用s来估计。,增大n?数学变换?,中央财经大学统计学院 19,当 时总体比例的置信区间可以使用正态分布来进行区间估计。(样本比例记为 ,总体比例记为),总体比例的置信区间,中央财经大学统计学院 20,有限总体校正系数Finite Population C

6、orrection Factor,简单随机抽样、不重复抽样时,样本均值抽样分布的方差略小于重复抽样的方差,等于 这一系数称为有限总体校正系数。 当抽样比(n/N)0.05时可以忽略有限总体校正系数。,中央财经大学统计学院 21,有限总体不重复抽样时,样本比例的方差也需要乘以“有限总体校正系数”,即,中央财经大学统计学院 22,关于置信度含义的说明,样本均值的 抽样分布,在所有的置信区间中,有(1-)*100% 的区间包含 总体真实值。 对于计算得到的一个具体区间,“这个区间包含总体真实值”这一结论有(1-)*100% 的可能是正确的。 说“总体均值有(1-)*100% 的概率落入某一区间”是不

7、严格的,因为总体均值是非随机的 。,Example:用SPSS进行区间估计,例:儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对100名儿童进行随机调查的结果(小时)。计算平均看电视时间95%的置信区间。,SPSS输出结果(数据:tv.xls)操作:分析-描述统计-探索,中央财经大学统计学院 25,总体比例的置信区间:例子,解:显然有 因此可以用正态分布进行估计。 /2=1.645,结论:我们有90的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。,1986年对悉尼995名青少年的随机调查发现,有216人每天都抽烟。试估计悉尼青少年中每天都抽烟的青少年比例的

8、90%的置信区间。,中央财经大学统计学院 26,4.3 必要样本量的计算,样本量越大抽样误差越小。由于调查成本方面的原因,在调查中我们总是希望抽取满足误差要求的最小的样本量。,中央财经大学统计学院 27,关于抽样误差的几个概念,实际抽样误差 抽样平均误差 最大允许误差,中央财经大学统计学院 28,实际抽样误差,样本估计值与总体真实值之间的绝对离差称为实际抽样误差。 由于在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的; 由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。,抽样平均误差,抽样平均误差:样本均值的标准差,也称为标准误。它反映样本均值(或比例)与总体均值(比例)

9、的平均差异程度。 例如对简单随机抽样中的样本均值有: 或 (不重复抽样) 我们通常说“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法。,中央财经大学统计学院 30,最大允许误差,最大允许误差(allowable error):在确定置信区间时样本均值(或样本比例)加减的量,一般用E来表示,等于置信区间长度的一半。在英文文献中也称为margin of error。 置信区间= 最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差水平。,中央财经大学统计学院 31,简单随机抽样下估计总

10、体均值时样本容量的确定,式中的总体方差可以通过以下方式估计: 根据历史资料确定 通过试验性调查估计,中央财经大学统计学院 32,简单随机抽样下估计总体比例时样本容量的确定,式中的总体比例可以通过以下方式估计: 根据历史资料确定 通过试验性调查估计 取为0.5。,中央财经大学统计学院 33,可见,影响样本容量的因素: 1、总体标准差。总体的变异程度越大,必要样本量也就越大。 2、最大允许误差。最大允许误差越大,需要的样本量越小。 3、置信度1- 。要求的置信度越高,需要的样本量越大。 4、抽样方式 。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也

11、不同。,中央财经大学统计学院 34,不重复抽样时的必要样本量,比重复抽样时的必要样本量要小。 式中n0是重复抽样时的必要样本容量。,中央财经大学统计学院 35,样本量的确定(实例1),需要多大规模的样本才能在 90% 的置信水平上保证均值的误差在 5 之内? 前期研究表明总体标准差为 45.,中央财经大学统计学院 36,样本量的确定(实例2),一家市场调研公司想估计某地区有电脑的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)?,解: 已知E=0.05,=0.05,Z/2=1.96,当未知时取为0.5。,中央财经大学

12、统计学院 37,实例3,你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。 你希望有 95% 置信度使得样本均值的误差在$50 以内。 过去的研究表明 约为 $400。需要多大的样本容量?,中央财经大学统计学院,4.2 假设检验,4.2.1 假设检验的基本问题 4.2.2 单个总体参数的检验 4.2.3 两个总体参数的检验,中央财经大学统计学院 39,4.2.1 假设检验的基本问题,基本原理 零假设和备择假设 检验统计量和拒绝域 两类错误与显著性水平,中央财经大学统计学院 40,实际中的假设检验问题,假设检验: 事先作出关于总体参数、分布形式、相互关系等的命题(

13、假设),然后通过样本信息来判断该命题是否成立(检验) 。,产品自动生产线工作是否正常? 某种新生产方法是否会降低产品成本? 治疗某疾病的新药是否比旧药疗效更高? 厂商声称产品质量符合标准,是否可信? ,中央财经大学统计学院 41,案例,美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平? 澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认

14、为Roy Morgan的结果显著高于统计局的数字吗?,中央财经大学统计学院 42,假设检验的基本原理,利用假设检验进行推断的基本原理是: 小概率事件在一次试验中几乎不会发生。 如果对总体的某种假设是真实的(例如学生上课平均出勤率95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55% )在一次试验中几乎不可能发生的; 要是在一次试验中A竟然发生了(样本出勤率=55% ),就有理由怀疑该假设的真实性,拒绝提出的假设。,中央财经大学统计学院 43,假设检验的步骤,根据实际问题提出一对假设(零假设和备择假设); 构造某个适当的检验统计量,并确定其在零假设成立时的分布; 根据

15、观测的样本计算检验统计量的值; 根据犯第一类错误的损失规定显著性水平; 确定决策规则:根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等; 下结论:根据决策规则得出拒绝或不能拒绝零假设的结论。注意“不能拒绝零假设”不同于“接受零假设”。,中央财经大学统计学院 44,1、零假设和备择假设的选择,零假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在零假设中; 最常用的有三种情况:双侧检验、左侧检验和右侧检验。 检验以“假定零假设为真”开始,如果得到矛盾(小概率事件发生了)说明备择假设正确。,中央财经大学统计学院 45,单侧检验时零假设和备择假设的选择,把现状(Status Quo)

16、作为原假设; 将所作出的声明作为原假设; 把不能轻易否定的假设作为原假设; 把研究者要证明的假设作为备择假设;,中央财经大学统计学院 46,零假设和备择假设:把研究者要证明的假设作为备择假设,某种汽车原来平均每加仑汽油可以行驶24英里。研究小组提出了一种新工艺来提高每加仑汽油的行驶里程。为了检验新的工艺是否有效需要生产了一些产品进行测试。该测试中的零假设和备择假设该如何选取? 要证明的结论是24,因此零假设和备择假设的选择为: 24 24,中央财经大学统计学院 47,零假设和备择假设:检验一种声明是否正确,某种减肥产品的广告中声称使用其产品平均每周可减轻体重8公斤以上。要检验这种声明是否正确你

17、会如何设定零假设和备择假设?,没有充分的证据不能轻易否定厂家的声明,因此一般将所作出的声明作为原假设。 零假设和备择假设的一般选择为: 8 8,中央财经大学统计学院 48,2 检验统计量和拒绝域,检验统计量:我们用来决策(拒绝或不能拒绝零假设)时依据的样本统计量。不同的总体参数适用的检验统计量不同。,拒绝域:检验统计量取值的集合,当根据样本得到的检验统计量的值属于该集合时,拒绝零假设。 不能拒绝零假设的检验统计量取值的集合称为接受域; 划分拒绝域和接受域的数值称为临界值。,中央财经大学统计学院 49,3、假设检验中的两类错误与显著性水平,中央财经大学统计学院 50,两类错误的概率,两类错误不可

18、避免;要减小其中的一种错误,通常只能通过增加另一种错误的方法做到。 假设检验中通常首先控制第一类错误的概率不超过某个小概率水平,在满足该条件的要求下使犯第二类错误的概率尽量小。 允许犯第一类错误的概率称为显著性水平。 通常取为0.01,0.05,0.1。 根据可以确定检验统计量的临界值,并根据统计量的样本观测值和临界值得出检验结论。,中央财经大学统计学院 51,假设检验的主要应用,假设检验的方法可以用于检验: 一个总体的均值、比例、方差或分布 两个总体的均值、比例、方差或分布是否一致 多个总体的均值、方差、分布等是否一致 这一节要求掌握的内容: 一个总体均值、比例的假设检验 两个总体均值的比较

19、,中央财经大学统计学院 52,4.2.2 单个总体的假设检验,总体均值的假设检验 总体比例的假设检验,中央财经大学统计学院 53,均值检验中检验统计量的选择,总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因而这是应用最多的公式。大样本时t值可以用z值来近似。,根据中心极限定理得到的近似结果。 未知时用s来估计。,增大n; 数学变换等。,中央财经大学统计学院 54,1、均值的双边检验问题,双侧检验和单侧检验中决策规则的确定方法有一定差异,下面我们通过几个例子加以说明。 某厂生产的铁丝抗拉力服从正态分布,其平均抗拉力为570kg,标准差为8kg。由于更换原材料,

20、标准差不会变,但不知其抗拉力是否不变,从中抽取10个样品,得平均抗拉力575kg,能否认为平均抗拉力无显著变化?(=0.05),中央财经大学统计学院 55,例,1、提出零假设和备择假设 2、选择检验统计量:根据题意 3、检验统计量的观测值 4、显著性水平等于0.05。,(1)根据z值(或t值)进行双侧检验,决策规则:|Z obs| Z /2时拒绝零假设,否则不能拒绝零假设。 本例中统计量的观测值等于1.976,因此结论是拒绝零假设,认为平均抗拉力有显著变化。,统计量的观测值等于1.976,中央财经大学统计学院 57,p值也称为观测到的显著性水平, 是能拒绝H0 的的最小值,,(2)根据p值进行

21、假设检验:双侧检验, /2,拒绝,拒绝,0,1.96,-1.96,Z,1/2 p-值,1/2 p-值,1.976,-1.976,决策规则: p值 时 拒绝 H0。 使用统计软件进行假设检验时通常会给出p值。 本例中p值等于0.04815(Excel计算)。,中央财经大学统计学院 58,(3)利用置信区间进行双侧检验,求出双侧检验均值的置信区间若总体的假设值0在置信区间外,拒绝H0 。 或,x,m0,置信区间,m 0,本例中平均抗拉力95%的置信区间为(570.04, 580.96 ),570,中央财经大学统计学院 59,2、右侧检验问题,平均说来,一个有丈夫和两个孩子的家庭主妇每周用于与家庭有

22、关活动的时间不超过55h。抽取8个家庭主妇的每周工作时间作为样本,得到数据:58,52,64,63,59,62,62,55。有妇联组织认为每周平均工作时间超过55小时,你的结论是什么?(假设总体为正态分布),中央财经大学统计学院 60,右侧检验问题,解: 根据题意, 观测到的统计量的值等于,中央财经大学统计学院 61,0,t ,Z, t,拒绝域,接受域,1 - ,置信水平,统计量的观测值等于2.94,决策规则:t obst 时拒绝零假设,否则不能拒绝零假设。 本例中统计量的观测值等于2.94,拒绝零假设。,(1)根据z值(或t值)进行右侧检验,中央财经大学统计学院 62,(2)根据p值进行假设

23、检验:右侧检验,0,t,拒绝,p-值,2.94,决策规则: p值 时 拒绝 H0。 例中p值等于0.01083 (Excel计算)。,t ,中央财经大学统计学院 63,左侧检验问题,一家公司付给生产一线雇员的平均工资是每小时20.0元。公司最近准备选一个新的城市建子公司,备选的城市有几个,能获得每小时工资低于20.0元的劳动力是公司选择城市的主要因素。从备选的某城市抽取40名工人,样本数据的结果是:平均工资是每小时19.0元,样本标准差是2.4元。请在0.10的显著性水平下分析样本数据是否说明该城市工人的平均每小时工资显著低于20.0元。,中央财经大学统计学院 64,3、左侧检验问题,解: 根

24、据题意(由于是大样本,本题也可以用Z统计量近似计算), 观测到的统计量的值等于,中央财经大学统计学院 65,0,-t ,Z, t,拒绝域,接受域,1 - ,统计量的观测值等于-2.64,决策规则:t obs-t 时拒绝零假设,否则不能拒绝零假设。 本例中统计量的观测值等于-2.64。,(1)根据z值(或t值)进行左侧检验,中央财经大学统计学院 66,(2)根据p值进行左侧检验,0,t,拒绝,p-值,-2.64,决策规则: p值 时 拒绝 H0。 本例中p值等于0.00593 (Excel计算)。,t ,中央财经大学统计学院 67,4 总体比例的检验,构造检验统计量(np0 5,n(1-p0)

25、5),决策规则:同均值的决策规则,可以使用Z值、p值或置信区间进行双侧、左侧或右侧检验。,中央财经大学统计学院 68,案例,澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?a=0.01.,中央财经大学统计学院 69,右侧检验,解: 根据题意,显然有np0 5,n(1-p0) 5. 观测到的z统计量的值等于 检验的结论是拒绝零假设。,中央财经大学统计学院 70,案例,美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费

26、城市市长的要求下进行的一项研究调查了50名失业者。根据调查结果能否认为费城的平均失业时间高于全国平均水平? =0.05。(用SPSS Statistics求解)【数据文件:失业时间.xls】,中央财经大学统计学院 71,描述统计结果(SPSS Statistics),中央财经大学统计学院 72,假设检验结果(SPSS Statistics),双侧检验的p值。如果需要做单侧检验,相应的p值一般等这一数值除以2。这里做右侧检验,p值等于0.253,因而不能拒绝原假设。,中央财经大学统计学院 73,4.2.3 两个总体均值差异的假设检验,1、独立样本的假设检验 2、两个匹配样本的假设检验,中央财经大

27、学统计学院 74,1、两个独立样本的假设检验,与一个总体的情况类似,两个总体均值假设检验中的备择假设一般有以下三种情况:,中央财经大学统计学院 75,两个总体均值的比较:检验统计量的选择,总体正态?,大样本?,方差已知?,否,是,是,否,否,是,增大n; 数学变换等。,方差相等?,否,是,中央财经大学统计学院 76,两个总体均值的比较,在应用中可能需根据样本数据对总体的正态性进行检验。(非参数检验一章讲解) 在实际应用中,总体方差一般是未知的,因而统计软件中普遍使用t检验。 两个总体方差相等和不相等时,t统计量的计算公式不同。因此,检验两个总体的均值是否相等时,需要先检验两个总体的方差是否相等

28、!,中央财经大学统计学院 77,(1)两个总体方差是否相等的检验,在SPSS Statistics 中,检验两个总体均值是否相等时,会同时检验两个总体的方差是否相等。 SPSS Statistics 使用的是Levene 检验。 根据F 统计量相应的p值进行决策:pa时拒绝零假设。 (原假设为两个总体方差相等),中央财经大学统计学院 78,检验统计量: 其中 决策规则与单个总体t检验的决策规则相同,可以使用t值、p值或置信区间进行双侧、左侧或右侧检验。,(2)两正态总体,方差未知但相等,中央财经大学统计学院 79,检验统计量: 自由度为 决策规则与单个总体t检验的决策规则相同,可以使用t值、p值或置信区间进行双侧、左侧或右侧检验。,(3)两正态总体,方差未知且不相等,中央财经大学统计学院 80,实例,某农业研究所研制出一种新的化肥,现要研究施肥土地的小麦产量是否比不施肥土地的小麦产量有显著提高,随机抽取几块土地进行试验。选10快试验田不施肥,结果最后的每亩产量数据为(单位:公斤):172、158、186、214、224、228、196、190、202、170。另选8块试验田施肥,结果最后的每亩产量数据为:252、204、234、246、222、210、244、212。试检验施肥和不施肥的平均亩产量有无显著差异(=0.05) 。,中央财经大学统计学院 81,解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论