




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统 计 推 断 从从 数数 据据 得得 到到 对对 现现 实实 世世 界界 的的 结结 论论 的的 过过 程程 估计估计 ? 总体它代表我们所关心的那部分现实世界。 而在利用样本中的信息来对总体进行推断 之前人们一般对代表总体的变量假定了分 布族。比如假定人们的身高属于正态分布 族;对抽样调查假定了二项分布族等等。 这些模型基本上是根据经验来假定的,所 以仅仅是对现实世界的一个近似。在假定 了总体分布族之后,进一步对总体的认识 就是要在这个分布族中选择一个适合于我 们问题的分布;由于分布族成员是由参数 确定的,如果参数能够估计,对总体的具 体分布就知道得差不多了。 估计估计 ? 一种是点估计(
2、point estimation) ,也就是用 估计量的实现值来近似相应的总体参数。 ? 另一种是区间估计(interval estimation) ;它 是包括估计量在内(有时是以估计量为中 心)的一个区间;该区间被认为很可能包 含总体参数。 ? 点估计给出一个数字,用起来很方便;而 区间估计给出一个区间,说起来留有余地; 不象点估计那么绝对。 ? 无偏估计(大样本性质) ? 区间估计的置信度(大样本性质) 估计估计 ? 注意置信区间的论述是由区间和置信 度两部分组成。有些新闻媒体报道一 些调查结果只给出百分比和误差(即 置信区间),并不说明置信度,也不 给出被调查的人数,这是不负责的表 现
3、。因为降低置信度可以使置信区间 变窄(显得“精确”),有误导读者 之嫌。如果给出被调查的人数,则内 行可以由推算出置信度(由后面给出 的公式),反之亦然。 一个描述性例子一个描述性例子 ? 一个有10000个人回答的调查显示,同意某 种观点的人的比例为70% (有7000人同 意),可以算出总体中同意该观点的比例 的95%置信区间为(0.691,0.709);另一 个调查声称有 70% 的比例反对该种观点, 还说总体中反对该观点的置信区间也是 (0.691,0.709)。到底相信谁呢?实际上, 第二个调查隐瞒了置信度(等价于隐瞒了 样本量)。如果第二个调查仅仅调查了50 个人,有 35个人反对
4、该观点。根据后面的 公式可以算出,第二个调查的置信区间的 置信度仅有11% 。 假设检验假设检验 ? 在假设检验中,一般要设立一个原假设; 而设立该假设的动机主要是企图利用人们 掌握的反映现实世界的数据来找出假设和 现实的矛盾,从而否定这个假设。在多数 统计教科书中(除了理论探讨之外)的假 设检验都是以否定原假设为目标。 ? 如果否定不了,那就说明证据不足,无法 否定原假设。但这不能说明原假设正确。 很多教科书在这个问题上不适当地用“接 受原假设”的说法,犯了明显的低级逻辑 假设检验的过程和逻辑假设检验的过程和逻辑 ? 首先要提出一个原假设,比如某正态 总体的均值等于5(m=5)。这种原假 设
5、也称为零假设(设也称为零假设(null hypothesis ), 记为H 0。 。 ? 与此同时必须提出对立假设,比如总 体均值大于5(m5)。对立假设又称)。对立假设又称 为备选假设或备择假设( alternative hypothesis )记为记为H 1或 或H a。 。 假设检验的过程和逻辑假设检验的过程和逻辑 ?根据零假设(不是备选假设!),我(不是备选假设!),我 们可以得到该检验统计量的分布; ? 然后再看这个统计量的数据实现值然后再看这个统计量的数据实现值 (realization )属不属于小概率事件。 也就是说把数据代入检验统计量,看 其值是否落入零假设下的小概率范畴;其
6、值是否落入零假设下的小概率范畴; ? 如果的确是小概率事件,那么我们就 有可能拒绝零假设,否则我们说没有 足够证据拒绝零假设。 假设检验的过程和逻辑假设检验的过程和逻辑 ? 注意:零假设和备选假设在假设检验 中并不对称。因检验统计量的分布是 从零假设导出的,因此,如果发生矛 盾,当然就对零假设不利了。 ? 不发生矛盾也不说明备选假设有问题 (因为和备选假设无关)。 假设检验的过程和逻辑假设检验的过程和逻辑 ? 检验统计量在零假设下等于这个样本的数 据实现值或更加极端值的概率称为p-值(p- value)。 ? 显然得到很小 p-值意味着小概率事件发生 了。如果小概率事件发生,是相信零假设, 还
7、是相信数据呢? ? 当然是相信数据。于是就拒绝零假设。但 小概率并不能说明不会发生,仅仅发生的 概率很小罢了。 ? 拒绝正确零假设的错误常被称为第一类错 误(type I error )。 假设检验的过程和逻辑假设检验的过程和逻辑 ? 有第一类错误,就有第二类错误;那是备 选零假设正确时反而说零假设正确的错误, 称为第二类错误(type II error )。 ? 零假设和备选假设哪一个正确,这是确定 性的,没有概率可言。 ? 而可能犯错误的是人。涉及假设检验的犯 错误的概率就是犯第一类错误的概率和犯 第二类错误的概率。 ? 负责的态度是无论做出什么决策,都应该 给出犯错误的概率。 假设检验的
8、过程和逻辑假设检验的过程和逻辑 ? 到底p-值是多小才能够拒绝零假设呢?也 就是说,需要有什么是小概率的标准。这 要看具体应用的需要。但在一般的统计书 和软件中,使用最多的标准是在零假设下 (或零假设正确时)抽样所得的数据拒绝 零假设的概率应小于 0.05(也可能是0.01, 0.005,0.001等等)。这种事先规定的概率 称为显著性水平(significant level),用字母 a来表示。当 p-值小于或等于 a时,就拒绝 零假设。所以,a是所允许的犯第一类错误 概率的最大值。当p-值小于或等于a时,我 们说这个检验是显著的(significant) 。 假设检验的过程和逻辑假设检验的
9、过程和逻辑 ? 归纳起来,假设检验的逻辑步骤为: ? 第一,写出零假设和备选假设; ? 第二,确定检验统计量; ? 第三,确定显著性水平a a; ? 第四,根据数据计算检验统计量的实现值; ? 第五,根据这个实现值计算p-值; ? 第六,进行判断:如果p-值小于或等于a, 就拒绝零假设,这时犯错误的概率最多为 a a; 如果p-值大于a a,就不拒绝零假设,因为证 据不足。 假设检验的过程和逻辑假设检验的过程和逻辑 ? 实际上,计算机软件仅仅给出 p-值,而不 给出a。这有很多方便之处。比如a=0.05, 而假定我们得到的 p-值等于0.001。这时我 们如果如果采用 p-值作为新的显著性水平
10、, 即a=0.001,于是可以说,我们拒绝零假设, 显著性水平为 0.001。拒绝零假设时犯错误 的概率实际只是千分之一而不是百分之五。 在这个意义上, p-值又称为观测的显著性 水平(observed significant level )。在统计 软件输出p-值的位置,有的用“ p-value” , 有的用significant 的缩写“Sig” 就是这个道 理。 假设检验的过程和逻辑假设检验的过程和逻辑 ?展示结果的精确性(根据数据减少 a的 值)总是没有害处的。这好比一个身 高180厘米的男生,可能愿意被认为高 于或等于180厘米,而不愿意说他高于 或等于155厘米,虽然这第二种说法数
11、 学上没有丝毫错误。 假设检验的过程和逻辑假设检验的过程和逻辑 ? 关于“临界值”的注:作为概率的显著性水平a实际上 相应于一个检验统计量取值范围的一个 临界值(critical value ),它定义为,统计量取 该值或更极端的值 的概 率等于a。也就是说,“统计量的实现值比临界值更极 端”等价于“ p-值小于a” 。使用临界值的概念进行的检 验不计算p-值。只比较统计量的取值和临界值的大小。 ? 使用临界值而不是 p-值来判断拒绝与否 是前计算机时代 的产物。当时计算p-值不易,只有采用临界值的概念。 但从给定的 a求临界值同样也不容易,好在习惯上仅仅 在教科书中列出相应于特定分布的几个有
12、限的a临界值 (比如 a=0.05,a=0.025,a=0.01,a=0.005,a=0.001 等等),或者根据分布表反过来查临界值(很不方便也 很粗糙)。 ? 现在计算机软件都不给出 a和临界值,但都给出 p-值和 统计量实现值,让用户自己决定显著性水平是多少。 假设检验的例子假设检验的例子 ? 汽车厂商声称其发动机排放标准的一个指标平均 低于20个单位。在抽查了10台发动机之后,得到 下面的排放数据: 17.0、21.7、17.9、22.9、20.7、 22.4、17.3、21.8、24.2、25.4。该样本均值为 21.13。究竟能否由此认为该指标均值超过20? 这次我们的假设检验问题就是 01 :20:20HH? 假设检验的例子假设检验的例子 ? 检验统计量为 ? 我们可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学一年级诗歌作品散集1000字12篇范文
- 员工培训计划与实施手册范本
- 企业客户服务质量标准及评价体系
- 爸爸真好300字10篇
- 汉字书写规范与练习:汉字教学与记忆方法研究
- 供应商信息管理表格供应商资质与评价版
- 农村电商平台服务运营合同书
- 理石养护培训课件
- 品牌授权合作协议及市场准入协议
- 化工仪表培训课件模板
- 2025年人教版PEP英语三年级上册教学计划
- 2025年高一上学期英语开学第一课课件
- 新老物业交接流程
- 全球视野下劳动报酬占GDP份额的比较与影响因素探究
- 【高中】【政治】2025【秋季】开学第一课:你好高中政治(课件)
- 2024年秋季新人教版八年级上册物理全册教案
- 小学五年级上册生命.生态.安全全册教案
- 成年女性压力性尿失禁护理干预试题及答案
- 质量三检制培训课件
- 简单娱乐yy频道设计模板
- 《汉语史》-课程教学大纲
评论
0/150
提交评论