第五章-统计推断原理与步骤

上传人：龙*** IP属地：山东上传时间：2020-04-12 格式：PPT 页数：66 大小：501.05KB 积分：20 举报 版权申诉

已阅读5页，还剩61页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第五章统计推断原理和步骤本章主要介绍统计推断的意义原理统计推断与抽样分布的关系统计推断的思路和一般步骤两尾检验和一尾检验统计推断可能犯的两类错误及防止方法生物统计学的一个重要任务是要知道所研究总体的特征值参数但是总体特征值一般难以知道一方面是由于总体很大即N大有时是无限的无限总体 N 因此不可能逐一调查清楚另一方面有时所要研究的总体目前并不存在或者只能说是虚拟存在总体是虚的无法进行调查作某一试验时更是如此但不管是何种类型的总体我们总是可以通过随机抽样抽样调查的方法获得该总体的随机样本通过统计推断来定性或定量地分析所研究总体的特征值统计推断就是用样本的特征值统计量在一定的概率保证下推断相应总体的特征值参数即随机抽样随机样本试验或调查随机样本特征值总体特征值统计量参数计算估计概率保证第一节统计推断的意义和内容所谓统计推断 statisticalinference 就是根据统计量的分布和概率理论由样本统计量来推断总体的参数实际工作中一次试验或一次调查所获得的数据资料通常是一个样本的结果而我们真正需要知道的是抽取样本的总体特征即统计分析的结论是针对总体参数而言的因此统计推断是科研工作中一个十分重要的工具对试验设计也有很大的指导意义统计推断包括统计假设检验 hypothesistest 参数估计 parametricestimation 这样两部分内容统计假设检验又称显著性检验 significancetest 其原理和过程是对未知的或不完全知道的总体参数提出一些假设 hypothesis这些假设通常构成完全事件系然后在某一基本假设的基础上计算样本的统计量并分析这一统计量的分布规律最后根据这一统计量作出在一定概率意义下应当接受何种假设的结论这里有一个定量转化为定性的过程经计算所得到的统计量一般是呈连续分布的定量但最后的检验结论只有两种接受何种假设定性即存在一个临界值统计量未达到临界值应当接受一种假设统计量超过临界值应当接受另一种假设参数估计包括两部分内容参数的点估计 pointestimation 参数的区间估计 intervalestimation 第二节统计量的抽样分布与统计推断的关系前面已经讲过由样本的统计量组成的总体分布抽样分布其参数与原总体的相应参数有着很密切的关系同时抽样的结果还告诉我们样本统计量与总体相应参数之间存在着一定的抽样误差因此用样本来推断总体的准确性与抽样误差的大小有关抽样误差的大小用标准误来衡量标准误不仅反映了抽样误差的大小而且反映了样本统计量与总体相应参数间的差异程度也反映了用某个样本统计量来估计总体参数的准确程度第三节统计假设检验一统计假设检验的基本思路为了说明问题我们举几个例子进行讨论例1 随机抽取一批小鼠随机分为两组一组注射催产素一组作为对照即不注射催产素半小时后检查这两组小鼠的血糖含量得注射催产素组为 106 88对照组平均值为 109 17同时我们也发现同一组内的小鼠其血糖含量也是不同的两组小鼠的平均血糖含量之间有个差那么我们是否可以认为这个差值就是由于催产素注射与否的结果显然仅凭这一差值 2 29是不能说明问题的例2 比较不同日龄 d 正常白化小鼠血浆含N量得如下一批数据日龄血浆含N量35d 0 980 830 940 900 990 920 870 860 8190d 1 001 080 970 931 030 941 111 10对这两组数据进行计算得 35d组小鼠的90d组小鼠的发现两组小鼠的血浆含N量有差异那么我们能否仅凭这一差异就认为日龄的不同其血浆含N量就有差异呢 35d的小鼠中也有含N量高的如0 990 980 94 90d的小鼠中也有含N量低的如0 930 94 即同一组内的小鼠其血浆含N量之间也是有差异的例3 某孵化场宣传说该场孵化的鸡苗成活率为90 我们能轻易相信吗是否需要做一个试验如果试验结果是100羽苗鸡仅成活了88羽 p 0 88 我们就能否定该场的宣传效果吗如果我们再做一次呢我们能一直不断地做下去吗例4 试验某种治疗鸡白痢病的新药将其与常规药物相比较对400羽鸡施用常规药物康复了340羽康复率相应的对500羽鸡施用新药有435羽康复了康复率我们是否就可以认为新药一定好于常规药物以上几个例题提醒我们有以下几个问题是需要我们加以注意的 a 我们不可能用总体来做试验各方面的条件不许可我们这样做也没有必要这样做b 我们只能用样本来做试验且由于时间经费人力等因素的限制一般同一个试验只能做一次通过一次试验就希望能得到一个比较可靠的结果c 试验结束以后用什么来作为检验的对象那就是样本的平均值用样本的平均值来检验总体平均值用两个样本平均值的差异来检验相应两个总体平均值的差异用样本平均值作为检验对象的理由是 1 我们已经证明了为最小这说明样本平均值与各变量的差异最小因此是样本资料最好的代表2 在抽样分布中我们已经证明了样本平均值是总体平均值的无偏估计量即的数学期望是 3 中心极限定理告诉我们样本平均值服从或近似服从正态分布上述三点说明样本平均值可以作为检验的对象但是我们又不能仅凭样本平均值的大小就贸然下结论认为试验有效或试验无效我们必须通过检验 test 为什么因为任何一次试验都存在误差即同一组内的观测值都不会完全相同在正常试验条件下同一组内的数据之间的差异一般就是误差每一个观测值都是试验的表观效应每一个数据都可以分成两个部分即试验处理效应和误差各种偶然因素引起的差异同一总体中的个体所受到的各种偶然因素是不等的每一个数据中所包含的偶然因素是独立的就总体而言这种偶然因素的影响是相互抵消的用统计学自己的语言来讲就是每一个观测值都有自己独立的试验误差因此我们有以下公式存在观测值表观效应处理效应误差效应即进行样本平均得同样两个样本平均值的差异也可以这样分解实际上我们感兴趣的即我们关心的重点是我们试验所得到的表观效应主要是由处理效应所引起还是由抽样误差所引起应当进行权衡结合上面的实例两组小鼠的平均血糖含量之间的差异是否由催产素的注射与否所引起不同日龄正常白化小鼠血浆含N量的差异是否由于小鼠的日龄不同而引起实际试验中苗鸡的成活率与孵化场宣传之间的差异是真实差异吗即孵化场是否真的言过其实了还是试验时的抽样误差新药和常规药物之间的差异是否由偶然因素引起为了使得这种比较和权衡所得到的结论更可靠更科学更合理更可信更正确必须对试验和统计分析提出如下要求 1 合理地进行试验设计正确地进行试验操作无误地进行抽样仔细地进行记录认真地进行校对以有效地降低试验误差尽可能避免系统误差杜绝人为错误使样本真正代表总体对试验效应和试验误差作出无偏的估计2 合理地正确地分析试验结果以得出有关总体参数假设的统计推断二统计假设检验的一般步骤我们以大样本资料或样本虽小但总体方差为已知的情况 u test 来说明统计假设检验的一般步骤统计假设检验的基本原理和思路是这样的首先根据具体的试验目的提出一个假设 hypothesis 然后在假定这一假设成立或正确的前提下进行试验并取得数据然后同样在这一假设成立或正确的前提下对这些数据或资料进行统计分析获得该假设成立或正确的概率值最后根据所获得概率的大小判断所作假设是否成立 a 如果所得概率较大就表明我们没有足够的理由来否定所作的假设即我们必须接受这一假设 b 如果所得概率很小就表示这一假设不大可能成立应予以否定从而接受这一假设的对立假设即接受备择假设上面的a和b必有一条被否定另一条被接受尽管所计算的概率值是连续变化的但我们往往设定一个概率临界值如p 0 05 p 0 01等等根据所得概率值是大于p 0 05 还是小于p 0 05来决定所作假设是否成立或正确因此概率值是连续分布的定量但假设的接受与否只有两类定性这里我们首先复习一下u的概念在这一式子中显然与的距离越小 u值就越小查标准正态分布表得到的概率值越大表明出现的概率越大反之与的距离越大 u值就越大查标准正态分布表得到的概率值就越小表明出现的概率就越小当这一概率小到一定程度时我们就可以认为这一似乎不大可能在一次试验中出现亦即这一所在总体的平均值与设定总体的平均值不等即两个总体不是同一个总体反之我们就没有理由认为所在总体与所设定的总体不是同一个总体在统计检验中所设定的用以作为资料分析和最终判断基础的假设称为无效假设无效假设又称为解消假设 nullhypothesis 用表示所谓无效假设可以这样理解我们的试验是无效的即试验结束以后所得到的样本平均值并没有超出设定的总体范围即试验后得到的样本平均值其效果不见得好于原定的效果即样本平均值所在总体与原设定的总体其实是同一个总体两者的平均值和并没有本质的差异两者之间的差异是由抽样误差引起的无效假设的写法无效假设的含义就是试验后所得到的样本平均值与原设定的已知总体的平均值之间的差异是由误差所引起的即样本平均值所在总体与已知总体是同一总体无效假设在统计分析后有可能被接受也有可能被否定为了在无效假设被否定后有可以被接受的假设我们还应当在无效假设设立的同时设立一个后备假设这一后备假设称为备择假设用表示即备择假设是无效假设被否定后必须被接受的一个假设下标A是alternative之意备择假设和无效假设是一对对立的假设两者构成了一个完全事件系在根据所得到的概率值进行判断时接受了无效假设就自然摒弃了备择假设否定无效假设的同时就必须接受备择假设备择假设的含义是样本所在总体与已知总体不是同一个总体即所得样本并不来自于这一已知总体将两个假设写完全既可以是也可以是在设立假设以后研究样本平均数的抽样分布分析试验或调查所得样本平均值出现的概率我们会发现样本平均值一般不会刚好等于已知总体的平均值两者之间会有一定的差异这一差异有可能是抽样误差也有可能是真实性差异对此我们需要借助概率原理来进行判断进行这种判断可以从两个角度即有两种方法一是假定是正确的在此前提下计算出现的概率值我们可以通过查表的方式来完成如果所得u值出现的概率较大我们就必须接受如果所得u值出现的概率较小我们就应当放弃而接受这里的概率大小以 0 05和 0 01作为两个临界值二是在假定为正确的前提下对的抽样划出一个区间这一区间称为接受区间这一区间是有一定的概率保证的这一区间之外的部分称为否定区间倘若落在接受区间内我们就接受反之倘若落在接受区间外我们就否定而接受下面的是接受区间示意图设这一接受区间的概率保证为95 由于而即将其变换得为接受区间其概率为95 而和为否定区间其概率之和为5 同样为99 接受区间而和为1 的否定区间在u test中以为水平上否定无效假设的两个界限以为水平上否定无效假设的两个界限最后根据小概率事件实际不可能性原理接受或否定无效假设小概率事件实际不可能性原理是指在一次试验中概率很小的事件实际上是不可能发生的因此当与之间的差异其概率小于时我们以作为小概率的第一临界值就可以认为这不是抽样误差而是实质性差异从而否定无效假设现在我们将假设检验的几个步骤归纳一下提出假设进行试验并计算样本平均数抽样分布的离差u值查相关附表查出所得u值出现的概率值并考察其是否大于预先设定的值由小概率原理作出接受或否定无效假设的推断并结合专业知识给出合理科学的解释需要注意的是当所得概率小于 0 05以后还需根据具体情况继续考察其是否小于 0 01 我们以一个实例来系统地说明假设检验的步骤某品种正常仔猪每45min红细胞沉降速度为 mm 今抽查某猪场20头2月龄仔猪的红细胞沉降速度得如下数据 2221201825192126232419212319182320222126试问这批仔猪的红细胞沉降速度是否正常由于该例中已有总体方差因此虽然样本较小但应使用u test进行检验该例的核心问题是希望知道这批仔猪在红细胞沉降速度这一性状上是否正常或这批仔猪与正常仔猪在红细胞沉降速度这一性状上是否有所区别或这批仔猪在红细胞沉降速度这一性状上是否属于这一猪品种因此需要知道这批仔猪的红细胞平均沉降速度与总体猪之间是否有区别即应检查样本仔猪群的红细胞沉降速度与总体猪群之间的差异是由抽样误差所引起还是属于真实性差异需要注意的是样本越小抽样就越要有代表性否则所得到的结论就可能发生很大的偏差首先设立无效假设即设样本所在的总体仔猪群与原总体无差异vs 样本所在的总体仔猪群与原总体不是一个总体即设该假设可以简化为其次在无效假设已设立的基础上计算样本平均值并计算u值当然我们也可以计算样本的标准差但这一标准差在本例中不起作用因此可以不予考虑经计算得查附表1 即标准正态分布的分布函数表得 u 1 49的概率为这一概率值大于即因此我们应当接受无效假设即接受在接受无效假设的同时就自动放弃了备择假设这表示这一仔猪样本其红细胞沉降速度是正常的对这一结果我们可以从专业的角度进行合理的解释下面我们将这一例题系统归置一下某品种正常2月龄仔猪每45min红细胞沉降速度 mm 为今抽查某猪场20头2月龄仔猪的红细胞沉降速度得如下数据 2221201825192126232419212319182320222126试问这批仔猪的红细胞沉降速度是否正常经计算得设查附表1 u 1 49的概率为p 0 14 0 05接受无效假设即这批仔猪的红细胞沉降速度属正常范围该题也可以这样完成设立无效假设同前计算接受区间由于处于这一接受区间内因此应接受无效假设即这批仔猪的红细胞沉降速度在正常范围内接受无效假设时就说样本平均数与已知总体平均数间差异不显著如果在水平上否定了无效假设而接受备择假设我们就说差异显著如果在水平上否定了无效假设而接受备择假设就说差异极显著三一尾检验和两尾检验从上面的例子我们可以看出仔猪红细胞沉降速度的样本平均值有可能大于总体平均值也有可能小于总体平均值即所得u值可能会是负值在左边判断是接受或否定无效假设这u值也有可能是正值在右边判断是接受或否定无效假设这种既要考虑左边否定区又要考虑右边否定区即须考虑分布曲线两边即两尾的检验称为两尾检验这是由于事先我们并不知道所得样本平均数是否肯定大于总体平均值还是肯定小于总体平均值在大多数情况下一种措施有可能其效应是正向的也有可能是负向的即事先我们并不知道抽样或试验的结果会朝向哪个方向因此我们的备择假设只能是这里的HA 既包含了又包含了这种两尾检验是应用最广泛的一种检验方法但有的时候我们的目的非常明确即所抽样本只可能是大于总体平均值或只可能是小于总体平均值例如某种新型饲料添加剂只可能好于常规添加剂某些有毒物质只能对被试动物产生毒害作用等等这一类试验的数据假设检验其备择假设只有一种情况即只有一个否定区间一尾这样的假设检验就称为一尾检验一尾检验比两尾检验更容易否定无效假设因此应用一尾检验必须有非常充分的理由在常用的假设检验中我们一般总采用两尾检验而对一尾检验应谨慎使用两尾检验和一尾检验的比较四假设检验的两类错误在假设检验中接受或否定无效假设的理论依据是小概率事件的实际不可能性原理因此所得结论并不是百分之百的正确的事实上统计假设检验有可能犯两类错误如果是正确的即为真但检验的结论由于差异显著而被我们否定掉了此时我们须冒5 下错结论的风险或由于差异极显著而被我们否定掉

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第五章-统计推断原理与步骤

文档简介

温馨提示

最新文档

评论

第五章-统计推断原理与步骤

文档简介

温馨提示

最新文档

评论

相关文档