城市规划系统工程学-4.5-4.6_第1页
城市规划系统工程学-4.5-4.6_第2页
城市规划系统工程学-4.5-4.6_第3页
城市规划系统工程学-4.5-4.6_第4页
城市规划系统工程学-4.5-4.6_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五节 参数估计与假设检验,统计推断是根据样本分布规律和概率理论,由样本结果去推断总体特征。它主要包括参数估计(parametric estimation)和假设检验 ( test of hypothesis)两部分内容。,参数估计有点估计(point estimation)、极大似然估计和区 间 估计(interval estimation) 假 设 检 验 又叫 显著性 检验 (test of significance)。显著性检验的方法很多 ,常用的有u检验、t 检验、F 检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。,点估计,1.矩估计法(数字特征法

2、):当样本容量增大时 ,用样本的数字特征去估计总体的数字特征。,例如,我们可以用样本平均数(或成数)和样本方差来估计总体的均值(或比率)和方差。,2.极大似然估计法:根据样本的似然函数对总体参数进行估计的一种方法 。,实质就是根据样本观测值发生的可能性达到最大这一原则来选取未知参数的估计量,其理论依据就是概率最大的事件最可能出现。,区间估计: 估计未知参数所在的可能的区间。,随机区间,置信度,包含,(即可靠程度)越大越好。,的概率,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程;,基本思想,小概率原理:,如

3、果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。,总 体 (某种假设),抽样,样 本 (观察结果),检验,(接受),(拒绝),小概率事件 未发生,小概率事件 发生,举一例子,箱子中有黑球和白球,总数100个,但不知黑球白球各多少个。现提出假设H0:“箱子中有99个白球”,暂时设H0正确,那么从箱子中任取一球,得黑球的概率为0.01,是一小概率事件。今取球一次,如果居然取到了黑球,那么,自然会使人对H0的正确性产生怀疑,从而否定H0。也就是说箱中不止1个黑球。,1、

4、提出原假设(null hypothesis)和备择假设(alternative hypothesis) 原假设为正待检验的假设:H0; 备择假设为可供选择的假设:H1 一般地,假设有三种形式: (1)双侧检验: H0 : 0; H1 :0 (2)左侧检验: H0 : 0; H1 :0,假设检验的步骤,2. 在原假设成立的前提下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。,构造统计量:, N(0,1),在统计学上 ,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。,3. 根据“小概率事件实际不可能性原理”否定或接受原假设.,【例】某机床厂加

5、工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,H0: = 0.081 H1: 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,左侧检验【例】 某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯

6、泡的使用寿命服从正态分布,标准差为20小时,在总体中抽取100个灯泡,测得样本平均值为960小时,批发商是否应该购进这批产品?,解:批发商关心的问题是灯泡寿命的下限时间,因此检验问题可为:H0: 1000, H1: 1000,1-=0.95,=0.05,拒绝域,右侧检验【例】某大量生产的袋装食品,按规定重量不得少于250克。今从一批该食品中随机地抽取50袋,发现有6袋重量低于250克。若规定不符合标准的比例达到5%,食品就不得出厂.问该批食品能否出厂?分析:关心的主要是次品率的上限,检验的形式可表示为:H0:5% H1:5%,总体均值的检验 (大样本),1. 假定条件 正态总体或非正态总体大样

7、本(n30) 使用U检验 2 已知: 2 未知:,总体均值的检验 (小样本),1. 假定条件 总体服从正态分布 小样本(n 30) 2 已知: U检验 2 未知:t检验,一、U检验 如果总体XN(,2),在方差已知的情况下,对总体均 值进行假设检验。 由于,注意: 如果总体方差未知,总体方差需用样本方差 s 替代。,因此,可通过构造Z统计量来进行假设检验:,例:根据以往的资料,某厂生产的产品的使用寿命服从正态分布N(1020, 1002)。现从最近生产的一批产品中随机抽取16件,测得样本平均寿命为1080小时。问这批产品的使用寿命是否有显著提高(显著性水平:5%)?(注意:右侧检验),由=0.

8、05,查表得临界值:Z=Z 0.05=1.645,提出假设:H0:1020 检验统计量:,比较:计算的Z=2.4 Z =1.645 判断:拒绝H0 ,接受H1 ,即这批产品的寿命确有提高。,注意:在不同的显著性水平下,结论有可能相反。,【例】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?,由题意知,样本服从正态分布,总体方差2 64,符合u检验应用条件。由于当日装罐机的每罐平均净重可能高于或低于正常工作状

9、态下的标准净重,故需作两尾检验。其方法如下:,(1) 提出假设。无效假设H0:0 500 g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。 备择假设HA:0,即罐装机工作不正常。,(2)确定显著水平。0.05(两尾概率),(3)构造统计量,并计算样本统计量值。,均数标准误:,样本平均数:,统计量u值:,(4)统计推断。由显著水平0.05,查附表,得临界值u0.051.96。实际计算出的 表明,试验表面效应仅由误差引起的概率P0.05,故不能否定H0 ,所以,当日装罐机工作正常。,(二)t检验:总体方差未知,正态总体,小样本,注: 如果总体分布也未知,则没有适当的统计量进行假设检验,

10、唯一的解决办法是增大样本,以使样本均值趋向于正态分布,从而再采用Z统计量。,例 用山楂加工果冻,传统工艺平均每100 g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为 520g,标准差S12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异? 本例总体方差未知,又是小样本,采用双侧t检验。 (1)提出无效假设与备择假设 ,即新老工艺没有差异。 ,新老工艺有差异。,(2)确定显著水平0.01 (3)计算t值,=520g,S=12g,所以,(4)查临界t值,作出统计推断 由 =15,查t值表得t0.01(15)=2.947,因为|t|t0.01, P0.01

11、, 故应否定H0,接受HA, 表明新老工艺的每100g加工出的果冻量差异显著。,(三)F检验:两个总体方差之比的检验,条件,检验条件量,拒绝域,H0、H1,总体服从正态分布,F,F,F,方差分析 对于多于两个的正态总体,采用方差分析进行检验。 条件: (1)m个总体都是正态分布的; (2)总体的样本是相互独立的随机样本; (3)各总体的方差都相等(方差齐性),方差分析,问题的提出 实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。,什么是方差分析(ANOVA)?(analysis of variance),检验多个总体均值是否相等 通过分析数据的误差判断

12、各总体均值是否相等 有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量,什么是方差分析? (例题分析),【 例 】为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共23家企业投诉的次数如下表,什么是方差分析? (例题分析),分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响 作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等 若它们的均值相等,则意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;若均值不全相等

13、,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异,使用方差分析的条件:,每一总体均为正态总体,记为 N(i , i 2), i1, 2, r ; 各总体的方差相同: 1 2= 22= r2 = 2 ;(即,具有方差齐次性) 从每一总体中抽取的样本是相互独立的, 即所有的试验结果 yij 都相互独立。,方差分析中的有关术语,因素或因子(factor) 所要检验的对象 要分析行业对投诉次数是否有影响,行业是要检验的因素或因子 水平或处理(treatment) 因子的不同表现 零售业、旅游业、航空公司、家电制造业就是因子的水平 观察值 在每个因素的水平下得到的样本数据 每个行业被

14、投诉的次数就是观察值,方差分析中的有关术语,4、变量 分类型变量:即自变量,如上例中的行业。 数值型变量:即因变量,如上例中的被投诉次数 当研究分类型自变量对数值型因变量的影响时,所用的方法就是方差分析法,上例中也就是“行业”对“被投诉次数”的影响。,方差分析的基本思想和原理(两类误差),组内误差 因素的同一水平(总体)下,样本各观察值之间的差异 比如,同一行业下不同企业被投诉次数是不同的 这种差异可以看成是随机因素的影响,称为随机误差,或组内误差 组间误差 因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同行业之间的被投诉次数之间的差异 这种差异可能是由于抽样的随机性所造成的,也可

15、能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差,或组间误差。,1.比较两类误差,以检验均值是否相等 2.如果组间误差明显地不同于组内误差,则均值就是不相等的;反之,均值就是相等的,比如行业之间的组间误差明显大于行业内部的组内误差,即认为行业之间的投诉次数的均值是不相等的,行业之间的服务质量有显著性差异,方差分析的基本思想和原理,总误差平方和 SST,全部观察值 与总平均值 的离差平方和 反映全部观察值的离散状况,又称为误差总平方和 其计算公式为,总平均值,全部观察值的总和除以观察值的总个数 计算公式为,组内误差SSE,每个水平或组的各样本数据与其组平均值的离差平方

16、和 该平方和反映的是随机误差的大小 计算公式为,水平的均值,假定从第i个水平中抽取一个容量为ni的简单随机样本,第i个水平下的样本均值为该水平的全部观察值总和除以观察值的个数 计算公式为,式中: ni为第 i 个水平下的样本观察值个数 xij 为第 i 个水平的第 j 个观察值,组间误差SSA,各组平均值 与总平均值 的离差平方和 该平方和既包括随机误差,也包括系统误差 计算公式为,三个平方和的关系,总误差平方和(SST)、组内误差(SSE)、组间误差(SSA) 之间的关系,SST = SSA + SSE,构造检验的统计量(三个平方和的作用),SST反映全部数据总的误差程度;SSE反映随机误差

17、的大小;SSA反映随机误差和系统误差的大小 如果原假设成立,则表明没有系统误差,组间误差SSA除以自由度后的均方与组内误差SSE除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差。 SST 的自由度为n-1,其中n为全部观察值的个数 SSA的自由度为k-1,其中k为因素水平(总体)的个数 SSE 的自由度为n-k 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响。,方差分析中基本假定, 如果原假设成立,即H0 : m1 = m2 = m3 = m4 四个行业被投诉次数的均值都相等 意

18、味着每个样本都来自均值为、方差为 2的同一正态总体,X,f(X),1 2 3 4,方差分析中基本假定,若备择假设成立,即H1 : mi (i=1,2,3,4)不全相等 至少有一个总体的均值是不同的 四个样本分别来自均值不同的四个正态总体,提出假设,一般提法 H0 : m1 = m2 = mk 自变量对因变量没有显著影响 H1 : m1 ,m2 , ,mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等,构造检验的统计量(例题分析),构造检验的统计量(计算总误差平方和 SST),全部观察值 与总平均值 的误差平方和 反映全部观察值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论