统计学复习.ppt

上传人：q*** IP属地：河南上传时间：2020-02-21 格式：PPT 页数：95 大小：1.91MB 积分：24 举报 版权申诉

已阅读5页，还剩90页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

统计学复习统计学的主要原理如下我们感兴趣的研究对象的全体为总体 population 其中的每个研究对象为个体由于总体包含的个体可能很多无法进行普查故需要从总体中抽取部分个体称为样本 sample 而样本中包含个体的数目称为样本容量 samplesize 抽取样本的过程称为抽样通常希望样本为随机样本 randomsample 即总体中的每个个体都有相同的概率被抽中而且被抽中的概率相互独立即满足独立同分布 independentlyidenticallydistributed 简记i i d 的假定由于样本来自总体必然带有总体的信息统计学的关键因素是如何使得样本抽样信息最大程度反映出总体信息因此统计学是根据样本数据对总体性质进行推断的科学估计量的优良性准则重复抽样评价一个估计量的好坏不能仅仅依据一次试验的结果而必须由多次试验结果来衡量这是因为估计量是样本的函数是随机变量因此由不同的观测结果就会求得不同的参数估计值因此一个好的估计应在多次试验中体现出优良性总体均值的估计如何估计出总体均值方法1 利用样本均值作为总体均值方法2 取第一个观测值Y1 作为总体均值在众多可能的估计量中如何评价一个估计量比另外一个更好由于估计量是随机变量因而这个问题可以更准确地描述为估计量的抽样分布有哪些优良性质一般而言我们喜欢估计量与未知真值至少在某种平均意义下尽可能靠近换言之我们喜欢估计量的抽样分布尽可能紧密地集中在未知值周围由此可得估计量的三个特殊优良特性无偏性没有偏差相合性一致性和有效性无偏性假设你利用重复随机样本多次计算估计量的值自然希望平均而言你会得到正确答案于是估计量的一个优良性质是其抽样分布的均值等于uY 如果满足这一点则我们称这个估计量是无偏的即估计量抽样分布的数学期望等于被估计的总体参数估计量是随机变量对于不同的样本值会得到不同的估计值我们希望估计值在未知参数真值附近摆动而它的期望值等于未知参数的真值这就导致无偏性这个标准无偏性则称为的无偏估计相合性一致性则称为的相合估计若依概率收敛于即相合性一致性估计量的另一个优良性质是当样本容量较大时由于样本随机变化引起的值的不确定性很小更准确地描述是当样本容量增大时落入真值uY小区间内的概率接近于1 即与uY相合即随着样本量的增大估计量的值越来越接近被估计的总体参数有效性 Var Var 则称较有效都是参数的无偏估计量若有设和在统计中常用到最小方差估计最小方差无偏估计的定义也称最佳无偏估计若满足 1 即为的无偏估计 2 是的任一无偏估计则称为的最小方差无偏估计是否满足上述特性根据第二章样本均值的抽样分布可以得出无偏性相合性有效性可以证明该方差为最小方差满足无偏性相合性和有效性样本均值的抽样分布样本均值的分布例题分析例设一个总体含有4个元素个体即总体单位数N 4 4个个体分别为x1 1 x2 2 x3 3 x4 4 总体的均值方差及分布如下均值和方差现从总体中抽取n 2的简单随机样本在重复抽样条件下共有42 16个样本所有样本的结果为样本均值的分布例题分析计算出各样本的均值如下表并给出样本均值的抽样分布样本均值的分布与总体分布的比较例题分析 2 5 2 1 25 总体分布样本均值分布当总体服从正态分布N 2 时来自该总体的所有容量为n的样本的均值 x也服从正态分布 x的期望值为方差为 2 n 即 x N 2 n 可以证明当m 时上式达到最小高斯马尔可夫定理 Gauss Markovtheorem 在给定经典线性回归的假定下最小二乘估计量是具有最小方差的线性无偏估计量随机抽样的重要性例子抽样的不随机性会导致结果有偏例子总统选举预测的失败假设检验正常人的平均体温是37oC吗当问起健康的成年人体温是多少时多数人的回答是37oC 这似乎已经成了一种共识下面是一个研究人员测量的50个健康成年人的体温数据根据样本数据计算的平均值是36 8oC 我们能不能认为健康的成年人体温37oC的提法是错误的下面的内容就将提供一套标准统计程序来检验这样的观点在确立一个判断或者检验一个参数之前首先要提出假设什么是假设如何提出假设什么是假设检验假设是在在参数检验中对总体参数的具体数值所作的陈述就一个总体而言总体参数包括总体均值比例方差等数值陈述一定发生在分析之前什么是假设检验 hypothesistest 1 先对总体的参数或分布形式提出某种假设然后利用样本信息判断假设是否成立的统计方法 2 逻辑上运用反证法统计上依据小概率原理小概率是在一次试验中一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生我们就有理由拒绝原假设中心思想 1 我们不能轻易地拒绝某个假设事件除非有极为充分的理由 2 宁可接受了错误的假设也不能拒绝正确的假设原假设原假设又称 0假设表示研究者想收集证据予以反对的假设用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初被假设是成立的之后根据样本数据确定是否有足够的证据拒绝它原假设的形式一般包含符号或 H0 某一数值H0 某一数值H0 某一数值备择假设也称研究假设研究者想收集证据予以支持的假设用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法然后就是想办法收集证据拒绝原假设以支持备择假设总是有符号或 H0 某一数值H1 某一数值H0 某一数值H1 某一数值备择假设备择假设没有特定的方向性并含有符号的假设检验称为双侧检验或双尾检验 two tailedtest 备择假设具有特定的方向性并含有符号或称为右侧检验双侧检验与单侧检验双侧检验与单侧检验假设的形式以总体均值的检验为例一种零件的生产标准是直径应为10cm 为对生产过程进行控制质量监测人员定期对一台加工机床检查确定这台机床生产的零件是否符合标准要求如果零件的平均直径大于或小于10cm 则表明生产过程不正常必须进行调整试陈述用来检验生产过程是否正常的原假设和被择假设例一解研究者想收集证据予以证明的假设应该是生产过程不正常建立的原假设和备择假设为H0 10cmH1 10cm 某品牌洗涤剂在它的产品说明书中声称平均净含量不少于500克从消费者的利益出发有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实试陈述用于检验的原假设与备择假设例二解研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述建立的原假设和备择假设为H0 500H1 500 一家研究机构估计某城市中家庭拥有汽车的比例超过30 为验证这一估计是否正确该研究机构随机抽取了一个样本进行检验试陈述用于检验的原假设与备择假设例三解研究者想收集证据予以支持的假设是该城市中家庭拥有汽车的比例超过30 建立的原假设和备择假设为H0 30 H1 30 原假设和备择假设是一个完备事件组而且相互对立在一项假设检验中原假设和备择假设必有一个成立而且只有一个成立原假设总是包含备则假设总是包含假设检验利用反证法即如意图证明备则假设成立必须有充分的根据拒绝原假设结论假设检验的基本思想因此我们拒绝假设 50 样本均值 m 50 抽样分布 H0 10 两类错误与显著性水平研究者总是希望能做出正确的决策但由于决策是建立在样本信息的基础之上而样本又是随机的因而就有可能犯错误原假设和备择假设不能同时成立决策的结果要么拒绝H0 要么不拒绝H0 决策时总是希望当原假设正确时没有拒绝它当原假设不正确时拒绝它但实际上很难保证不犯错误第类错误错误弃真错误原假设为正确时拒绝原假设第类错误的概率记为被称为显著性水平2 第类错误错误取伪错误原假设为错误时未拒绝原假设第类错误的概率记为 Beta 两类错误的控制一般来说对于一个给定的样本往往认为第类错误的严重性要远远大于第类错误因此一般来说将犯第类错误的概率定得低些较为合理在默认情况下通常取显著性水平 0 05 如果严格一些取 0 01 放松一些取 0 1 显著性水平 significantlevel 显著性水平表示事先确定的用于拒绝原假设H0时所必须的证据同时也是能够容忍的犯第类错误的最大概率上限值它表示原假设为真时拒绝原假设的概率通常取0 05 也可取0 01或者0 10 例一研发了某种新产品准备推出原假设新产品不优于老产品备则假设新产品优于老产品第一类错误新产品本身并不优于老产品而我们认为它比老产品好第二类错误新产品本身优于老产品而我们认为它不如老产品好结论第一类错误代价是盲目推出新产品但其不受消费者欢迎损失了经济效益同时也损失了企业形象产品好第二类错误代价是不敢推出新产品损失了前期投入和该有的利润很多时候我们认为企业形象部分利润例二对于一个嫌疑犯进行审判原假设该犯无罪备则假设该犯有罪第一类错误本身无罪而判其有罪其财产自由人权受到威胁或者剥夺第二类错误本身有罪而判其无罪司法系统白辛苦一番便宜了他用统计量决策双侧检验用统计量决策左侧检验抽样分布 H0 临界值 a 拒绝H0 1 置信水平 RegionofRejection RegionofNonrejection 用统计量决策右侧检验抽样分布 H0 临界值拒绝H0 1 置信水平 RegionofNonrejection RegionofRejection 假设检验的步骤计算检验统计量标准化的检验统计量的公式为给定显著性水平查表得出相应的临界值z 或z 2 t 或t 2 3 作出决策双侧检验统计量临界值拒绝H0左侧检验统计量临界值拒绝H0 传统上做出决策所依据的是样本统计量然后查表求临界值比较统计量和临界值的大小现代检验中人们直接使用由统计量算出的犯第类错误的概率即所谓的P值用P值决策 P value P值告诉我们如果原假设是正确的话我们得到目前这个样本数据结论的可能性有多大如果这个可能性很小就应该拒绝原假设被称为观察到的或实测的显著性水平决策规则若p值拒绝H0 双侧检验的P值 P值是关于数据的概率举例说明比如要检验全校学生的平均生活费支出是否等于500元检验的假设为H0 500 H1 500 假定抽出一组样本算出的样本均值600元假设得到的值为p 0 02 这个0 02是指如果平均生活费支出真的是500元的话那么从该总体中抽出一个均值为600的样本的概率仅为0 02 如果你认为这个概率太小了就可以拒绝原假设因为如果原假设正确的话几乎不可能抓到这样的一个样本既然抓到了就表明这样的样本不在少数所以原假设是不对的因此 p值越小你拒绝原假设的理由就越充分如果H0是对的那么衡量差异大小的某个统计量落入区域W 拒绝域是个小概率事件如果该统计量的实测值落入W 也就是说 H0成立下的小概率事件发生了那么就认为H0不可信而否定它否则我们就不能否定H0 只好接受它这里所依据的逻辑是相比传统方法 P值提供了更多的信息它让我们可以选择任意水平来评估结果是否具有统计上的显著性从而可根据我们的需要来决定是否要拒绝原假设 P值提供了拒绝原假设的实际的显著性水平 p值越小拒绝原假设的可能性就越大 P值代表拒绝域的面积或概率传统的显著性水平如1 5 10 等等已经被人们普遍接受为拒绝原假设足够证据的标准我们大概可以说 10 代表有一些证据不利于原假设 5 代表有适度证据不利于原假设 1 代表有很强证据不利于原假设一般在计量经济学中只要p 0 05 即可认为落入拒绝域拒绝原假设拒绝H0 P值决策与统计量的比较拒绝H0的两个统计量的不同显著性 Z 拒绝H0 0 统计量1 P1值统计量2 P2值拒绝H0 临界值注意一点假设检验不能证明原假设正确假设检验只提供不利于原假设的证据因此当拒绝原假设时表明样本提供的证据证明它是错误的当没有拒绝原假设时我们只能说暂时没有办法证明原假设是错误的只能接受它但没法证明它是正确的因为假设检验的程序没有提供它正确的证据这与法庭上对被告的定罪类似先假定被告是无罪的直到你有足够的证据证明他是有罪的否则法庭就不能认定被告有罪当证据不足时法庭的裁决是被告无罪但这里也没有证明被告就是清白的 p值也称为显著性概率是在原假设成立的情况下抽到的统计量与原假设之间的距离至少等于其样本计算值与原假设之间距离的概率举例来说 p值是抽到的与原假设下分布尾部的距离至少等于实际计算出的样本均值与原假设下这个分布尾部的距离的概率 P值的计算例如假设一刚毕业大学生的样本的平均工资为22 24美元时 p值是在假定原假设为真条件下观测到的Y均值和20美元时原假设下的总体均值的差距至少等于仅仅由于随机样本变化观测到的22 24美元时和20美元时间的差距的概率如果这个p值很小比方说0 5 则说明原假设成立时不太可能会抽到这种样本因此认为原假设不成立是合理的反之如果p值较大如40 则原假设成立时很可能仅仅是由于随机抽样使我们观测到的样本均值为22 24美元时因此反对原假设的证据从概率上讲是不牢靠的故不能拒绝原假设是合理的 P值的计算以Y的均值的标准化形式为例暂时假设标准差已知且为大样本大样本下总体均值的检验一般利用使用z检验统计量查标准正态分布表 2已知书末附有标准正态分布函数数值表有了它可以解决一般正态分布的概率计算查表表中给的是x 0时 x 的值 P X x x 注意以下 x 的特性 2 若 3 P X x x P X x 1 P X x 1 P x X x 1 x x 2 1 x 2 x 如果方差未知怎么办经常用样本方差sy2来代替样本方差标准差和标准误差 t统计量的构造在统计和计量中几乎不可能求出总体方差因此这种情况会广泛出现方便起见我们构造t统计量 t检验的方法单边备则假设假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围如是否为零但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多近要判断样本参数的估计值在多大程度上可以近似地替代总体参数的真值往往需要通过构造一个以样本参数的估计值为中心的区间来考察它以多大的可能性概率包含着真实的参数值这种方法就是参数检验的置信区间估计总体均值的置信区间一个例子调查大学生的收入假设刚毕业大学生的一个容量为200的随机样本Y 其中Y的均值为22 64美元时 Y均值的标准

人人文库> 全部分类> 专业文献 > 金融证券

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

统计学复习.ppt

文档简介

温馨提示

最新文档

评论

统计学复习.ppt

文档简介

温馨提示

最新文档

评论

相关文档