R语言统计推断S.ppt_第1页
R语言统计推断S.ppt_第2页
R语言统计推断S.ppt_第3页
R语言统计推断S.ppt_第4页
R语言统计推断S.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计推断,从数据得到对现实世界的结论的过程,估计,总体代表我们所关心的那部分世界。 而在利用样本中的信息来对总体进行推断之前人们往往对代表总体的变量假定了分布族。(描述数据时不用假定) 比如假定人们的身高属于正态分布族;在抽样调查时假定了二项分布族等等(这些假定可能有风险!)。 这些模型基本上是根据“经验”来假定的,仅仅是对现实世界的一个近似。,估计,在假定了总体分布族之后,进一步对总体的认识就是要在这个分布族中选择一个适合于我们问题的成员 由于分布族成员是由参数确定的,如果参数能够估计,对总体的具体分布就知道得差不多了。,估计量是用来估计的统计量,我们知道,统计量是样本的不包含未知参数的函数。样本均值、样本标准差都是统计量。 由于样本是随机的,统计量也是随机变量。 用于估计总体参数的统计量称为估计量;样本均值和标准差都是总体均值和标准差的常用估计量。,点估计和区间估计,点估计(point estimation)就是用估计量的实现值来近似相应的总体参数。 区间估计(interval estimation) 是包括估计量在内(有时是以估计量为中心)的一个区间;被认为很可能包含总体参数。 点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不象点估计那么绝对。 无偏估计(大样本性质),区间估计,注意置信区间的论述是由区间和置信度两部分组成。 置信区间是对参数给出的一个范围 置信度为其可信程度(大样本意义) 有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),比如 “收视率为53%3%”; 不给出置信度,也不给出被调查的人数 这是不负责的表现。,区间估计的意义,置信度的概念大量重复抽样时的一个渐近概念。 类似于“我们目前得到的置信度为95%的置信区间(比如上面的75%3%)以概率0.95覆盖真正的比例p”的说法是错误的。 实际上应该说“重复类似的抽样所得到的大量区间中有大约95%的覆 盖真实比例(其值可能永远未知)。,均值m的区间估计 (正态分布),总体标准差s已知,总体标准差s未知,区间估计的例子(1),例5.1 (数据:noodle.txt, noodle.sav, noodle.sas7bdat)某厂家生产的挂面包装上写明“净含量450克”。在用天平称量了商场中的48包挂面之后,得到样本量为48的关于挂面重量(单位:克)的一个样本(我们假定,挂面重量所代表的总体分布服从正态分布。 ):,w=scan(“D:/booktj1/data/noodle.txt“);hist(w,10),summary(w) Min. 1st Qu. Median Mean 3rd Qu. Max. 439.6 444.6 448.9 449.0 452.6 461.1,假设检验,在假设检验中,一般要设立一个原假设; 而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和现实的矛盾,从而否定这个假设。,假设检验,在多数统计教科书中(除了理论探讨之外),假设检验都是以否定原假设为目标。 如否定不了,那就说明证据不足,无法否定原假设。但这不能说明原假设正确。 很多教科书在这个问题上不适当地用“接受原假设”的说法,犯了明显的低级逻辑错误。 ,假设检验的过程和逻辑,首先要提出一个原假设,比如某正态总体的均值等于5(m=5)。这种原假设也称为零假设(null hypothesis),记为H0 与此同时必须提出对立假设,比如总体均值大于5(m5)。对立假设又称为备选假设或备择假设(alternative hypothesis)记为记为H1或Ha,假设检验的过程和逻辑,根据零假设(不是备选假设!),我们可以得到该检验统计量的分布; 然后再看这个统计量的数据实现值(realization)属不属于小概率事件。也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴 如果的确是小概率事件,那么我们就有可能拒绝零假设,否则我们说没有足够证据拒绝零假设。,假设检验的过程和逻辑,注意:零假设和备选假设在我们涉及的假设检验中并不对称。检验统计量的分布是从零假设导出的, 因此, 如果有矛盾, 当然就不利于零假设了。 不发生矛盾也不说明备选假有问题。,假设检验的过程和逻辑,检验统计量在零假设下,等于这个样本的数据实现值或更加极端值的概率称为p-值(p-value)。 显然得到很小p-值意味着小概率事件发生了。如果小概率事件发生,是相信零假设,还是相信数据呢? 当然是相信数据。于是就拒绝零假设。但事件概率小并不意味着不会发生,仅仅发生的概率很小罢了。 拒绝正确零假设的错误常被称为第一类错误(type I error)。,假设检验的过程和逻辑,不仅有第一类错误,还有第二类错误;那是备选零假设正确时反而说零假设正确的错误,称为第二类错误(type II error)。 如要“接受零假设”就必须给出第二类错误的概率. 但对于目前面对的问题, 无法计算它.,假设检验的过程和逻辑,零假设和备选假设哪一个正确,这是确定性的,没有概率可言。 而可能犯错误的是人。涉及假设检验的犯错误的概率就是犯第一类错误的概率和犯第二类错误的概率。 负责的态度是无论做出什么决策,都应该给出犯错误的概率。,假设检验的过程和逻辑,到底p-值是多小才能够拒绝零假设呢?也就是说,需要有什么是小概率的标准。 这要看具体应用的需要。 但在一般的统计书和软件中,使用最多的标准是在零假设下(或零假设正确时)抽样所得的数据拒绝零假设的概率应小于0.05(也可能是0.01,0.005,0.001等等)。,假设检验的过程和逻辑,这种事先规定的概率称为显著性水平(significant level),用字母a来表示。 当p-值小于或等于a时,就拒绝零假设。 所以,a是所允许的犯第一类错误概率的最大值。当p-值小于或等于a时,我们说这个检验是显著的(significant)。,假设检验的过程和逻辑,归纳起来,假设检验的逻辑步骤为: 第一: 写出零假设和备选假设; 第二: 确定检验统计量; 第三: 确定显著性水平a; 第四: 根据数据计算检验统计量的实现值; 第五: 根据这个实现值计算p-值; 第六: 进行判断:如果p-值小于或等于a,就拒绝零假设,这时犯错误的概率最多为a;如果p-值大于a,就不拒绝零假设,因为证据不足。,假设检验的过程和逻辑,实际上,计算机软件仅仅给出p-值,而不给出a。这有很多方便之处。比如a=0.05,而假定我们得到的p-值等于0.001。这时我们如果如果采用p-值作为新的显著性水平,即a=0.001,于是可以说,我们拒绝零假设,显著性水平为0.001。拒绝零假设时犯错误的概率实际只是千分之一而不是百分之五。在这个意义上,p-值又称为观测的显著性水平(observed significant level)。在统计软件输出p-值的位置,有的用“p-value”,有的用significant的缩写“Sig”就是这个道理。,假设检验的过程和逻辑,关于“临界值”的注:作为概率的显著性水平a实际上相应于一个检验统计量取值范围的一个临界值(critical value), 它定义为,统计量取该值或更极端的值的概率等于a。也就是说,“统计量的实现值比临界值更极端”等价于“p-值小于a”。 使用临界值的概念进行的检验不计算p-值。只比较统计量的取值和临界值的大小。,假设检验的例子,汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。在抽查了10台发动机之后,得到下面的排放数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论