统计学复习.ppt_第1页
统计学复习.ppt_第2页
统计学复习.ppt_第3页
统计学复习.ppt_第4页
统计学复习.ppt_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学复习 统计学的主要原理如下 我们感兴趣的研究对象的全体为 总体 population 其中的每个研究对象为 个体 由于总体包含的个体可能很多 无法进行 普查 故需要从总体中抽取部分个体 称为 样本 sample 而样本中包含个体的数目称为 样本容量 samplesize 抽取样本的过程称为 抽样 通常希望样本为 随机样本 randomsample 即总体中的每个个体都有相同的概率被抽中 而且被抽中的概率相互独立 即满足 独立同分布 independentlyidenticallydistributed 简记i i d 的假定 由于样本来自总体 必然带有总体的信息 统计学的关键因素是如何使得样本抽样信息最大程度反映出总体信息 因此 统计学是根据样本数据对总体性质进行推断的科学 估计量的优良性准则 重复抽样 评价一个估计量的好坏 不能仅仅依据一次试验的结果 而必须由多次试验结果来衡量 这是因为估计量是样本的函数 是随机变量 因此 由不同的观测结果 就会求得不同的参数估计值 因此一个好的估计 应在多次试验中体现出优良性 总体均值的估计 如何估计出总体均值 方法1 利用样本均值 作为总体均值 方法2 取第一个观测值Y1 作为总体均值 在众多可能的估计量中如何评价一个估计量比另外一个 更好 由于估计量是随机变量 因而这个问题可以更准确地描述为估计量的抽样分布有哪些优良性质 一般而言 我们喜欢估计量与未知真值至少在某种平均意义下尽可能靠近 换言之 我们喜欢估计量的抽样分布尽可能紧密地集中在未知值周围 由此可得估计量的三个特殊优良特性 无偏性 没有偏差 相合性 一致性 和有效性 无偏性 假设你利用重复随机样本多次计算估计量的值 自然希望 平均而言你会得到正确答案 于是估计量的一个优良性质是其抽样分布的均值等于uY 如果满足这一点 则我们称这个估计量是无偏的 即 估计量抽样分布的数学期望等于被估计的总体参数 估计量是随机变量 对于不同的样本值会得到不同的估计值 我们希望估计值在未知参数真值附近摆动 而它的期望值等于未知参数的真值 这就导致无偏性这个标准 无偏性 则称为的无偏估计 相合性 一致性 则称为的相合估计 若 依概率收敛于 即 相合性 一致性 估计量的另一个优良性质是当样本容量较大时 由于样本随机变化引起的值的不确定性很小 更准确地描述是当样本容量增大时 落入真值uY小区间内的概率接近于1 即与uY相合 即 随着样本量的增大 估计量的值越来越接近被估计的总体参数 有效性 Var Var 则称较有效 都是参数的无偏估计量 若有 设 和 在统计中常用到最小方差估计 最小方差无偏估计的定义 也称最佳无偏估计 若满足 1 即为的无偏估计 2 是的任一无偏估计 则称为的最小方差无偏估计 是否满足上述特性 根据第二章样本均值的抽样分布 可以得出 无偏性 相合性 有效性 可以证明该方差为最小方差 满足无偏性 相合性和有效性 样本均值的抽样分布 样本均值的分布 例题分析 例 设一个总体 含有4个元素 个体 即总体单位数N 4 4个个体分别为x1 1 x2 2 x3 3 x4 4 总体的均值 方差及分布如下 均值和方差 现从总体中抽取n 2的简单随机样本 在重复抽样条件下 共有42 16个样本 所有样本的结果为 样本均值的分布 例题分析 计算出各样本的均值 如下表 并给出样本均值的抽样分布 样本均值的分布与总体分布的比较 例题分析 2 5 2 1 25 总体分布 样本均值分布 当总体服从正态分布N 2 时 来自该总体的所有容量为n的样本的均值 x也服从正态分布 x的期望值为 方差为 2 n 即 x N 2 n 可以证明 当m 时上式达到最小 高斯 马尔可夫定理 Gauss Markovtheorem 在给定经典线性回归的假定下 最小二乘估计量是具有最小方差的线性无偏估计量 随机抽样的重要性 例子 抽样的不随机性会导致结果有偏 例子 总统选举预测的失败 假设检验 正常人的平均体温是37oC吗 当问起健康的成年人体温是多少时 多数人的回答是37oC 这似乎已经成了一种共识 下面是一个研究人员测量的50个健康成年人的体温数据 根据样本数据计算的平均值是36 8oC 我们能不能认为健康的成年人体温37oC的提法是错误的 下面的内容就将提供一套标准统计程序来检验这样的观点 在确立一个判断或者检验一个参数之前 首先要提出假设 什么是假设 如何提出假设 什么是假设检验 假设是在在参数检验中 对总体参数的具体数值所作的陈述 就一个总体而言 总体参数包括总体均值 比例 方差等数值 陈述一定发生在分析之前 什么是假设检验 hypothesistest 1 先对总体的参数 或分布形式 提出某种假设 然后利用样本信息判断假设是否成立的统计方法 2 逻辑上运用反证法 统计上依据小概率原理小概率是在一次试验中 一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设 中心思想 1 我们不能轻易地 拒绝 某个假设事件 除非有极为充分的理由 2 宁可接受了错误的假设 也不能拒绝正确的假设 原假设 原假设又称 0假设 表示研究者想收集证据予以反对的假设 用H0表示所表达的含义总是指参数没有变化或变量之间没有关系 最初被假设是成立的 之后根据样本数据确定是否有足够的证据拒绝它 原假设的形式一般包含符号 或 H0 某一数值H0 某一数值H0 某一数值 备择假设也称 研究假设 研究者想收集证据予以支持的假设 用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系 备择假设通常用于表达研究者自己倾向于支持的看法 然后就是想办法收集证据拒绝原假设 以支持备择假设 总是有符号 或 H0 某一数值H1 某一数值H0 某一数值H1 某一数值 备择假设 备择假设没有特定的方向性 并含有符号 的假设检验 称为双侧检验或双尾检验 two tailedtest 备择假设具有特定的方向性 并含有符号 或 称为右侧检验 双侧检验与单侧检验 双侧检验与单侧检验 假设的形式 以总体均值的检验为例 一种零件的生产标准是直径应为10cm 为对生产过程进行控制 质量监测人员定期对一台加工机床检查 确定这台机床生产的零件是否符合标准要求 如果零件的平均直径大于或小于10cm 则表明生产过程不正常 必须进行调整 试陈述用来检验生产过程是否正常的原假设和被择假设 例一 解 研究者想收集证据予以证明的假设应该是 生产过程不正常 建立的原假设和备择假设为H0 10cmH1 10cm 某品牌洗涤剂在它的产品说明书中声称 平均净含量不少于500克 从消费者的利益出发 有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实 试陈述用于检验的原假设与备择假设 例二 解 研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 建立的原假设和备择假设为H0 500H1 500 一家研究机构估计 某城市中家庭拥有汽车的比例超过30 为验证这一估计是否正确 该研究机构随机抽取了一个样本进行检验 试陈述用于检验的原假设与备择假设 例三 解 研究者想收集证据予以支持的假设是 该城市中家庭拥有汽车的比例超过30 建立的原假设和备择假设为H0 30 H1 30 原假设和备择假设是一个完备事件组 而且相互对立 在一项假设检验中 原假设和备择假设必有一个成立 而且只有一个成立 原假设总是包含 备则假设总是包含 假设检验利用反证法 即如意图证明备则假设成立 必须有充分的根据拒绝原假设 结论 假设检验的基本思想 因此我们拒绝假设 50 样本均值 m 50 抽样分布 H0 10 两类错误与显著性水平 研究者总是希望能做出正确的决策 但由于决策是建立在样本信息的基础之上 而样本又是随机的 因而就有可能犯错误 原假设和备择假设不能同时成立 决策的结果要么拒绝H0 要么不拒绝H0 决策时总是希望当原假设正确时没有拒绝它 当原假设不正确时拒绝它 但实际上很难保证不犯错误 第 类错误 错误 弃真错误 原假设为正确时拒绝原假设第 类错误的概率记为 被称为显著性水平2 第 类错误 错误 取伪错误 原假设为错误时未拒绝原假设第 类错误的概率记为 Beta 两类错误的控制 一般来说 对于一个给定的样本 往往认为第 类错误的严重性要远远大于第 类错误 因此 一般来说 将犯第 类错误的概率定得低些较为合理 在默认情况下 通常取显著性水平 0 05 如果严格一些 取 0 01 放松一些 取 0 1 显著性水平 significantlevel 显著性水平 表示事先确定的用于拒绝原假设H0时所必须的证据 同时也是能够容忍的犯第 类错误的最大概率 上限值 它表示原假设为真时 拒绝原假设的概率 通常取0 05 也可取0 01或者0 10 例一 研发了某种新产品 准备推出 原假设 新产品不优于老产品 备则假设 新产品优于老产品 第一类错误 新产品本身并不优于老产品而我们认为它比老产品好 第二类错误 新产品本身优于老产品而我们认为它不如老产品好 结论 第一类错误 代价是盲目推出新产品 但其不受消费者欢迎 损失了经济效益 同时也损失了企业形象 产品好 第二类错误 代价是不敢推出新产品 损失了前期投入和该有的利润 很多时候我们认为 企业形象 部分利润 例二 对于一个嫌疑犯进行审判 原假设 该犯无罪 备则假设 该犯有罪 第一类错误 本身无罪 而判其有罪 其财产 自由 人权受到威胁或者剥夺 第二类错误 本身有罪 而判其无罪 司法系统白辛苦一番 便宜了他 用统计量决策 双侧检验 用统计量决策 左侧检验 抽样分布 H0 临界值 a 拒绝H0 1 置信水平 RegionofRejection RegionofNonrejection 用统计量决策 右侧检验 抽样分布 H0 临界值 拒绝H0 1 置信水平 RegionofNonrejection RegionofRejection 假设检验的步骤 计算检验统计量 标准化的检验统计量的公式为 给定显著性水平 查表得出相应的临界值z 或z 2 t 或t 2 3 作出决策双侧检验 统计量 临界值 拒绝H0左侧检验 统计量临界值 拒绝H0 传统上 做出决策所依据的是样本统计量 然后查表求临界值 比较统计量 和临界值的大小 现代检验中人们直接使用由统计量算出的犯第 类错误的概率 即所谓的P值 用P值决策 P value P值告诉我们 如果原假设是正确的话 我们得到目前这个样本数据结论的可能性有多大 如果这个可能性很小 就应该拒绝原假设 被称为观察到的 或实测的 显著性水平决策规则 若p值 拒绝H0 双侧检验的P值 P值是关于数据的概率 举例说明 比如 要检验全校学生的平均生活费支出是否等于500元 检验的假设为H0 500 H1 500 假定抽出一组样本算出的样本均值600元 假设得到的值为p 0 02 这个0 02是指如果平均生活费支出真的是500元的话 那么 从该总体中抽出一个均值为600的样本的概率仅为0 02 如果你认为这个概率太小了 就可以拒绝原假设 因为如果原假设正确的话 几乎不可能抓到这样的一个样本 既然抓到了 就表明这样的样本不在少数 所以原假设是不对的 因此 p值越小 你拒绝原假设的理由就越充分 如果H0是对的 那么衡量差异大小的某个统计量落入区域W 拒绝域 是个小概率事件 如果该统计量的实测值落入W 也就是说 H0成立下的小概率事件发生了 那么就认为H0不可信而否定它 否则我们就不能否定H0 只好接受它 这里所依据的逻辑是 相比传统方法 P值提供了更多的信息 它让我们可以选择任意水平来评估结果是否具有统计上的显著性 从而可根据我们的需要来决定是否要拒绝原假设 P值提供了拒绝原假设的实际的显著性水平 p值越小 拒绝原假设的可能性就越大 P值代表拒绝域的面积或概率 传统的显著性水平 如1 5 10 等等 已经被人们普遍接受为 拒绝原假设足够证据 的标准 我们大概可以说 10 代表有 一些证据 不利于原假设 5 代表有 适度证据 不利于原假设 1 代表有 很强证据 不利于原假设一般在计量经济学中 只要p 0 05 即可认为落入拒绝域 拒绝原假设 拒绝H0 P值决策与统计量的比较 拒绝H0的两个统计量的不同显著性 Z 拒绝H0 0 统计量1 P1值 统计量2 P2值 拒绝H0 临界值 注意一点 假设检验不能证明原假设正确 假设检验只提供不利于原假设的证据 因此 当拒绝原假设时 表明样本提供的证据证明它是错误的 当没有拒绝原假设时 我们只能说 暂时没有办法证明原假设是错误的 只能接受它 但没法证明它是正确的 因为假设检验的程序没有提供它正确的证据 这与法庭上对被告的定罪类似 先假定被告是无罪的 直到你有足够的证据证明他是有罪的 否则法庭就不能认定被告有罪 当证据不足时 法庭的裁决是 被告无罪 但这里也没有证明被告就是清白的 p值 也称为显著性概率 是在原假设成立的情况下 抽到的统计量与原假设之间的距离至少等于其样本计算值与原假设之间距离的概率 举例来说 p值是抽到的与原假设下分布尾部的距离至少等于实际计算出的样本均值与原假设下这个分布尾部的距离的概率 P值的计算 例如 假设一刚毕业大学生的样本的平均工资为22 24美元 时 p值是在假定原假设为真条件下观测到的Y均值和20美元 时 原假设下的总体均值 的差距至少等于仅仅由于随机样本变化观测到的22 24美元 时和20美元 时间的差距的概率 如果这个p值很小 比方说0 5 则说明原假设成立时不太可能会抽到这种样本 因此认为原假设不成立是合理的 反之 如果p值较大 如40 则原假设成立时 很可能仅仅是由于随机抽样使我们观测到的样本均值为22 24美元 时 因此 反对原假设的证据从概率上讲是不牢靠的 故不能拒绝原假设是合理的 P值的计算 以Y的均值的标准化形式为例 暂时假设标准差已知且为大样本 大样本下总体均值的检验 一般利用使用z检验统计量 查标准正态分布表 2已知 书末附有标准正态分布函数数值表 有了它 可以解决一般正态分布的概率计算查表 表中给的是x 0时 x 的值 P X x x 注意以下 x 的特性 2 若 3 P X x x P X x 1 P X x 1 P x X x 1 x x 2 1 x 2 x 如果方差未知怎么办 经常用样本方差sy2来代替 样本方差 标准差和标准误差 t统计量的构造 在统计和计量中 几乎不可能求出总体方差 因此 这种情况会广泛出现 方便起见 我们构造t统计量 t检验的方法 单边备则假设 假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围 如是否为零 但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多 近 要判断样本参数的估计值在多大程度上可以 近似 地替代总体参数的真值 往往需要通过构造一个以样本参数的估计值为中心的 区间 来考察它以多大的可能性 概率 包含着真实的参数值 这种方法就是参数检验的置信区间估计 总体均值的置信区间 一个例子 调查大学生的收入 假设刚毕业大学生的一个容量为200的随机样本Y 其中Y的均值为22 64美元 时 Y均值的标准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论