生物统计学复习资料(ppt 70页).ppt

上传人：朱*** IP属地：江西上传时间：2020-03-05 格式：PPT 页数：69 大小：518KB 积分：12 举报 版权申诉

已阅读5页，还剩64页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

本资料来源生物统计学复习串讲常用统计学术语试验是一个综合条件的实现或实施假定这种综合条件可以任意地重复实现很多次事件是试验的结果和现象必然事件不可能事件随机事件样本容量 n 样本中包含个体的数目小样本 n 30大样本 n 30参数总体的特征数是指由总体的全部观察值计算所得到的特征数如总体平均数总体方差 2 总体标准差等均为参数总体参数是一个固定的值通常是未知的统计量样本的特征数是指由样本中计算所得到的特征数如样本平均数样本方差 s2 样本标准差 s 等均为统计量统计量是样本的已知函数试验误差指试验中因无法控制的随机因素所引起的差异误差不可避免准确性准确度指在试验过程中某一试验指标和性状的观察值与真值接近的程度即统计量接近参数真值的程度说明测定值对真值符合程度的大小精确性精确度指在试验过程中同一试验指标和性状的重复观察值彼此接近的程度即样本中各个变数间的变异程度的大小说明多次测定值的变异程度数据资料根据观察和测量对象的性质可分为数量性状资料计量资料用度量衡等计量工具测量后而得到的资料也称为连续性变数资料计数资料由计数的方式而得到的资料也称为间断性变数资料质量性状资料属性性状资料计数资料的整理与分组基本上采用单项式分组法特点用样本变数的自然值进行分组每组均用一个或几个变数值来表示计量资料的整理方法采用组距式分组法步骤分6步进行确定全距确定组数确定组距确定组中值确定各组上下限按观测值大小归组并制作次数分布表质量性状的分析先将质量性状数量化常采用统计次数法常用的次数分布图包括直方图多边形图以上两个用于连续性资料的分布条形图用于表示计数资料和质量性状资料的分布变量的特征集中性离散性平均数变异数算术平均数中位数众数几何平均数极差方差标准差变异系数调和平均数特征数平方平均数算术平均数的性质离均差之和为零离均差平方和为最小方差是度量资料变异的常用指标在统计分析中有较广泛的应用 s2是 2的最好估计值方差虽能反映变量的变异程度但由于离均差取了平方值使得它与原始数据的数值和单位都不相适应方差的平方根值就是标准差各观测数加上或减去一个常数其标准差不变各观测数乘以或除以一个常数a 其标准差扩大或缩小a倍标准差的作用表示变量分布的离散程度估计平均数的标准误进行平均数的区间估计和变异系数计算可以概括估计出变量的次数分布及各类观测数在总体中所占的比例自由度的统计意义 DF是指样本内独立且能自由变动的观测值的个数在统计学中自由度等于样本变数的总个数减去计算过程中使用的条件的个数如果受到k个条件的限制则自由度为df n k变异系数是样本的标准差相对于其平均数的百分数变异系数是一种相对指标既能反映样本的离散程度 s 又能表示出集中趋势因而是一项表示相对离散度的指标用变异系数可以比较不同样本相对变异程度的大小概率的定义事件A在一次试验中出现的可能性大小的量度p 称为事件A的概率概率是频率的稳定值小概率原理实际推断原理原理概率很小的事件小概率事件在一次试验中常被认为实际上是几乎不可能发生的这就是小概率原理应用它是显著性检验的基本依据理论分布定义通俗地讲是指多种事物相似分布规律的一种理想化的数学模型即观测数据在一定变异基础上所服从的有一定规律的法则常见的理论分布二项分布泊松分布正态分布二项分布间断性离散型随机变量的一种理论分布是一种离散型的分布假定某事件A在n次独立试验中每次试验都具有相同的出现概率p 其不出现或对立事件的概率为q 1 p 则做n次独立试验该事件A出现x次的概率为 P x Cnxpxqn x x 0 1 2 3 nP x 叫做随机变量x的二项概率分布记作 B n p 二项成数百分数分布的参数二项分布的极限分布当n较大 30 而np及nq均大于5时 p q均不趋于0 二项分布接近于正态分布当n 时二项分布的极限分布就是正态分布正态分布 X服从正态分布记作 X N 2 只有一个峰当x 时 f x 值最大正态分布曲线是以平均数为中心的分布图形关于直线x 对称当x 的绝对值相等时 f x 值也相等正态分布的概率密度曲线与渐进线x轴所围成的全部面积等于1 正态分布曲线完全由参数和来决定确定其在x轴上的中心位置决定图形的形状越大图形显得矮和宽越小图形显得高和窄正态分布曲线在x 处各有一个拐点标准正态分布在x 1处各有一个拐点标准正态分布的概率计算一般正态分布的标准化及概率计算两尾概率与单尾概率双侧分位数和单侧分位数概率一定时两尾概率的总大于一尾概率的抽样分布从一个总体按一定的样本容量随机地抽出所有可能的样本由这些样本计算出的统计量如和s2 必然形成一种分布亦即一个新的总体这种分布称为该统计量的随机抽样分布或抽样分布样本平均数的抽样分布t分布F分布卡方分布正态总体抽得的样本平均数的分布定理若随机变量X N 2 x1 x2 x3 xn 是X的随机样本则样本平均数 xi n服从平均数为方差为 2 n的正态分布即 N 2 n 任意样本平均数的极限分布中心极限定理如果被抽样总体不是正态总体但具有一定的平均数和方差 2 则随样本容量n的不断增大样本平均数的分布越来越趋近于正态分布且具有平均数和方差 2 n 这称为中心极限定理中心极限定理的应用这一定理对于连续性变量或非连续性变量都能适用不论总体为何种分布一般只要样本容量n 30 属于大样本就可以应用中心极限定理认为样本平均数的分布是正态分布样本平均数差数的分布假设X1 N 1 12 随机抽得样本X2 N 2 22 随机抽得样本则从两个独立正态总体中抽出的独立样本平均数差数的分布也是正态分布即 N 1 2 12 n1 22 n2 假设X1 N 1 12 随机抽得样本X2 N 2 22 随机抽得样本则从两个独立正态总体中抽出的独立样本平均数差数的分布也是正态分布即 N 1 2 12 n1 22 n2 分布 1 定义设是来自总体的一个样本则称统计量所服从的分布是自由度为n的分布记作若 X1 X2 Xn 是正态总体N 2 的一个样本和S2分别是样本均值和样本方差则与S2相互独立 5t分布为服从自由度为n的t Student 分布记作t t n 1 定义设X N 0 1 Y n 且X与Y相互独立则称随机变量近似从正态总体N 2 抽样或以足够大的样本容量从非正态总体抽样所得的样本平均数 N 2 n 如果总体 2已知可用下式将标准化如果总体 2未知时能否用的估计值s代入上式代入上式后有无偏差若样本容量相当大 n 30 总体未知可以用样本的标准差s直接估计总体的时上式近似服从正态分布可以应用即 N 0 1 且u N 0 1 但是当样本容量n 30且未知时如以样本标准差s估计总体则偏差较大且标准化值不服从正态分布定理1 设x1 x2 xn n 2 相互独立且都服从N 2 则服从自由度df n 1的t分布记为 t t n 1 定理2设 X1 X2 Xn1 和 Y1 Y2 Yn2 分别是从总体N 1 2 和N 2 2 中所抽取的样本它们相互独立则 t分布的性质t分布曲线是左右对称的单峰曲线围绕平均数 x 向两侧递降 t分布受自由度df n 1的制约每个自由度都有一条t分布曲线与正态分布相比 t分布的离散度较大顶部偏低尾部偏高尤其是自由度小的t分布更为明显当自由度df 30时 t分布曲线就比较接近正态分布曲线当df 时极限分布则和正态分布曲线重合 t分布的百分位点 t值表的使用除了要考虑自由度df外用法与正态分布的u值表相似在已知两尾的阴影面积和自由度df后可以从表心找到对应的值 F分布设从一正态总体N 2 中随机抽取样本容量为n1和n2的两个独立样本其样本方差为s12和s22则定义s12和s22的比值为FF s12 s22此F值具有s12的自由度df1 n1 1和s22的自由度df n 1 如果对一正态总体在特定的df1和df 进行一系列的随机独立抽样则所有可能的F值就构成一个F分布 F s12 s22 F df1 df 统计推断统计推断是根据带随机性的观测数据样本以及问题的条件和假定模型而对未知事物作出的以概率形式表述的推断主要内容假设检验亦即显著性检验参数估计假设检验就是根据总体的理论分布和小概率原理对未知或不完全知道的总体提出两种彼此对立的假设然后由样本的实际结果经过一定的计算作出在一定概率意义上应该接受的那种假设的推断如果抽样结果使小概率发生则拒绝假设如果抽样结果没有使小概率发生则接受假设生物统计学中一般认为小于0 05或0 01的概率为小概率通过假设检验可以正确分析处理效应和随机误差作出可靠的结论显著性检验的基本步骤 1 明确基本假设把欲考察的问题以基本假设的形式提出并且在作出最后的判断之前始终在假设成立的前提下进行分析 2 规定显著性水平 0 1 3 建立检验准则构建统计量 4 根据样本值作判断 1 双尾检验统计假设 H0 0 HA 0适用范围这种假设用在对抽样总体的平均数毫无所知即可能大于 0 也可能小于 0的情况否定域拒绝H0 0的区域上述假设检验的两个否定区分别位于分布的两尾左边一尾和右边一尾这类检验称为双尾检验给定显著性水平若检验统计量为u 则否定域为 u u 或 u u 右尾检验统计假设 H0 0 或 0 HA 0适应范围如果有较大的把握会超过 0 则备择假设取HA 0 零假设则应为H0 0 或 0 这时应将显著性水平全部取在右尾否定域若检验统计量为u 则否定域为 u u临界值左尾检验统计假设 H0 0 或 0 HA 0适用范围如果凭生产经验或某项科研成果有较大的把握不会超过则备择假设为HA 0 零假设应为H0 0 或 0 这时宜将显著性水平全部取在左尾否定域若检验统计量为u 则否定域为 u u临界值 1 5假设检验中的两类错误 1 定义在检验一个假设H0时可能犯两类错误第一类错误如果H0是真实的但假设检验却否定了它就犯了以真为假的错误这类错误叫第一类错误也可以叫型错误犯型错误的概率为第二类错误如果H0不是真实的但假设检验却接受了它就犯了以假为真的错误这类错误叫第二类错误也可以叫型错误犯型错误的概率为 2 与的关系及其控制与的关系在样本容量给定的情况下越小就会愈大反之越大就会越小两类错误的控制方法 1 在 0 05 或0 01 就满意的前提下越小越好 2 值的大小主要取决于样本容量的大小增加样本容量n 以减小标准误是减小两类错误的关键 2 1单个样本平均数的假设检验 u检验当总体方差 2已知时不论其样本容量n是否大于30 均可采用u检验法当总体方差 2未知时只要样本容量n 30 可用样本方差s2代替总体方差 2 仍可用u检验法 t检验当总体方差 2未知样本容量n 30时用t检验法两样本的总体方差 12和 22已知时用u检验假设则检验统计量两个样本平均数比较的假设检验两样本的总体方差 12和 22未知但两个样本均为大样本时即n1 30和n1 30 用u检验法 u test 检验统计量 TestingStatistic 两样本的总体方差 12和 22未知且两样本为小样本 n1 30 n2 30 时采用t检验法 t test 具体有以下2种类型EqualPopulationVariances 总体方差相等 UnequalPopulationVariances 总体方差不等判断 12 22是否成立 F检验 F test重要哦 12 22时相关统计量重要哦合并方差 pooledsamplevariance 平均数差数的标准误 StandardDeviation 检验统计量 TestingStatistic 两样本的总体方差 12和 22未知且 12 22 n1 n2时采用Apsin Welch检验配对样本平均数间的比较成对法假设HA d 0 H0 d 0显著水平为计算检验统计量对零假设进行判断很显然同一配对内两个体间的相关性要高于非对子间的相关性因此配对样本平均数的比较可视为两个相关样本平均数的比较配对设计的优点成对数据由于同一配对内两个个体的试验条件非常接近而不同配对间的条件差异又可以通过各配对数据的差数来消除因而配对试验可以控制试验误差具有较高的精确度样本频率百分率的假设检验参数的区间估计定义参数的区间估计是用区间 L1 L2 作为参数的可能取值范围的一种估计并以一定的概率保证所估计的总体参数在该区间内区间估计的基础是抽样分布可以弥补点估计的不足置信区间若参数满足P L1 L2 1 则 L1 L2 叫做参数的置信水平为1 的置信区间显著性水平为时置信度为1 适合性检验就是检验某一试验结果类别频数的划分是否符合某一理论比例独立性检验是研究两个或两个以上因子彼此之间是独立的还是相互影响的一类统计方法 2检验的原理与方法使用范围 2检验是与计数数据相关联的因而用于计数资料或间断性数据的检验基本原理应用实际观测值 O 与理论推算值 E 之间的偏离程度来计算 2值的大小根据 2的概率来检验观测值与理论值的差异程度和符合程度的大小检验方法按照假设检验的一般步骤对计数资料进行右尾检验如果有k组资料则检验统计量的计算公式为 2 Oi Ei 2 Ei 实际观测值理论推算值 2 理论推算值连续性矫正当自由度df 2时一般不作连续性矫正当自由度df 1时需进行连续性矫正统计量计算公式为 c2 Oi Ei 0 5 2 Ei 方差分析多个总体均值或多个平均数的比较方法能否直接采用2个总体均值比较的假设检验方法为什么 1 1基本概念1 1 1试验指标度量试验结果的标准它因试验的目的不同而异 1 1 2试验因子引起试验指标差异的大主要影响因素有两类一类为处于自然状态的客观因素另一类为试验因子即人们要了解和研究试验因素对试验指标有哪些影响而有意识给予和控制的影响因素 1 1 3因子水平水平一个试验因子的不同数量等级或不同状态方差分析是能够同时比较多个平均数的一种方法其主要用途是研究外界因素或试验条件对观测结果影响的显著性 1 1 4试验处理处理施加给试验单元的条件称为处理在单因子试验中因子的某一水平就是一种处理在多因子析因试验中不同因子的不同水平的组合叫做处理 1 1 5试验单元单元试验材料是试验人员施加处理的对象因而单元是材料的单位试验单元不完全等同于抽样单元抽样单元是试验单元的某个分段 1 1 6试验误差误差是对接受相同处理的试验单元上所得到的指标观测值之间差异的度量试验误差有2个主要来源试验单元本身所固有的变异试验单元在环境条件和操作过程中缺乏均匀性而产生的变异 1 2方差分析的基本依据观测值之间的变异来源试验处理试验误差方差分析的基本依据平方和的加和性各因素影响产生的平方和之和就是这组观测值的总平方和反之一组观测值的总平方和可以分解成不同影响因素造成的平方和之和即可以将总变异分解成不同来源的变异之和根据方差分析的基本思想可根据变异的来源将总平方和剖分为组间平方和处理间组内平方和处理内组内变异一个观察值和所在组的处理平均数的差异组间变异一个观察值所在组的处理平均数与总平均数的差异单因素方差分析的过程重要各平方和关系 SST SSt SSe 总自由度的分解 1 总自由度 dfT kn 1 2 处理间自由度 dft k 1 3 处理内自由度 dfe k n 1 显然地dfT dft dfe 根据各变异部分的平方和与自由度可计算出处理间和处理内均方 1 处理间均方 St2 或MSt SSt dft 2 处理内均方 Se2 或MSe SSe dfe 统计假设的显著性检验 F检验如果某因子的各水平之间没有差异即当H0 1 2 k成立时可以证明将检验统计量F的计算值与给定显著水平所对应的右侧分位数临界值 F 进行比较如果F F0 05 或F0 01 则否定H0 认为在这些平均数中至少有一个平均数不等于其他平均数说明处理间差异显著或极显著表示方法为F 或F 如果F F0 05 则接受H0 说明处理间差异不显著 F dft dfe 多重比较最小显著差数法 Leastsignificantdifference 简称LSD法此法的基本作法是在F检验显著的前提下先计算出显著水平为的最小显著差数然后将任意两个处理平均数的差数的绝对值与其比较若 LSD 时则与在水平上差异显著反之则在水平上差异不显著最小显著差数由下式计算式中为在F检验中误差自由度下显著水平为的临界t值为均数差异标准误最小显著极差法 Leastsignificantrange 简称LSR法针对LSD法的缺点为了对k个平均数的任何两个进行非独立性的多重比较人们提出了多范围检验的思想在同一显著性水平上两个平均数的最小显著差数随两个平均数所处范围的大小而不同即 LSR法的特点是把平均数的差数看成是平均数的极差根据极差范围内所包含的处理数称为秩次距 k的不同而采用不同的检验尺度以克服LSD法的不足这些在显著水平上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差LSR 邓肯氏 Duncan 新复极差检验 SSR检验重要 q检验 Newman Keuls检验 4 1方差分析的基本假定作为典型的参数方法方差分析模型是建立在一系列基本假定基础上的如果采集的数据不符合这些基本假定方差分析所得出的结论就不会正确分布正态性试验误差应当是服从正态分布的独立的随机变量方差同质性方差齐性要求各处理的误差方差具备齐性因子效应的加和性可加性即处理效应和误差效应是线性可加的服从方差分析的数学模型 4 2数据转换方法如果获得的数据不符合方差分析的基本假定在分析前可采取以下措施进行处理剔除某些特殊的异常值处理或重复将总的试验误差的方差分裂为几个较为同质的试验误差的方差进行数据变换

人人文库> 全部分类> 应用文书 > 合同范本

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

生物统计学复习资料(ppt 70页).ppt

文档简介

温馨提示

最新文档

评论

生物统计学复习资料(ppt 70页).ppt

文档简介

温馨提示

最新文档

评论

相关文档