生物统计学考试总结_第1页
生物统计学考试总结_第2页
生物统计学考试总结_第3页
生物统计学考试总结_第4页
生物统计学考试总结_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学考试总结生物统计学考试总结 第一章第一章 生物统计学:生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析 和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。 内容:内容:试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法 统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和 相关分析、协方差分析等 生物统计学的作用:生物统计学的作用: 1. 提供整理、描述数据资料的科学方法并确定其特征 2. 判断试验结果的可靠性 3. 提供由样本推断总体的方法 4. 试验设计的原则 相关概念相关概念:1.总体:研究对象的全体,是具有相同性质的个体所组成的集合 2.个体:组成总体的基本单元 3.样本:由总体中抽出的若干个体所构成的集合 n30 大样本; n t) = probability,即 P(|X| t) = P(X t) 2)单尾 t 值可通过用两倍概率替换概率而求得 eg:如果概率为 0.05 而自由度为 10 , TINV Probability 双尾学生双尾学生 t 分布的概率分布的概率 Degrees_freedo m 自由度自由度 1, 0 2 x u 双尾值由 TINV(0.05,10) 计算得到 2.28139; 而同样概率和自由度的单尾值由 TINV(2*0.05,10) 计算得到 1.812462。 5.卡方分布卡方分布 P45 6.F6.F 分布分布 1、概率抽样:根据已知的概率选取样本 简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层” ,然后在每一层内进行抽样 整群抽样:将一组被调查者(群)作为一个抽样单位 等距抽样:在样本框中每隔一定距离抽选一个被调查者 2、非概率抽样:不是完全按随机原则选取样本 非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选择被调查者 3、配额抽样:选择一群特定数目、满足特定条件的被调查者 抽样分布:抽样分布:从一个给定的总体中抽取(不论是否有放回)容量(或大小)为 n 的所有可能 的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本 得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布 1.所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布 2.是一种理论概率分布 3.随机变量是 样本统计量样本均值, 样本比例等 4 结果来自容量相同的所有可能样本 (符号) 样本平均数的基本性质样本平均数的基本性质: (1)样本均值的均值(数学期望)等于总体均值 x 定义: 一个参数 的估计量是 ,如果,则称 是 的无偏估计) (E (2)样本均值的方差等于总体方差的 1/n n x 2 2 (3)样本平均数的标准误差的定义 (4)当总体服从正态分布 N(, 2 )时,来自该总体的所有容量为 n 的样本的均值 也 服从正态分布, 的数学期望为,方差为2/n。即 N(, 2/n) 中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为 n 的样本,当 n 充 分大时,样本均值的抽样分布近似服从均值为、方差为2/n 的正态分布 两个独立样本平均数差数的分布两个独立样本平均数差数的分布 P44 第四章第四章 假设检验:假设检验:又称显著性检验:根据总体的理论分布和小概率原理,对未知或不完全知道的 总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概 率意义上应该接受的那种假设的推断。 如果抽样结果使小概率事件发生,则拒绝假设。 如果抽样结果没有使小概率事件发生,则接受假设 特点:特点:(1)采用逻辑上的反证法(2)依据统计学上的小概率原理 生物统计学上,一般认为:等于或小于 0.05 或 0.01 的概率为小概率 在一次试验中,一个几乎不可能发生的事件发生的概率。 假设检验的步骤:假设检验的步骤: 1、提出假设 2、确定适当的检验统计量 3、确定显著性水平 a 4、计算概率 5、推断是否接受假设 两类两类:1)弃真错误;2)取伪错误 一大样本平均数的假设检验一大样本平均数的假设检验u 检验检验 应用范围:应用范围:1)总体方差 已知 2 2)总体方差 未知,但样本为大样本( ), 用 s2来代替 2 30n 2 X XX 两个样本平均数比较的两个样本平均数比较的 u u 检验检验 二、小样本平均数的假设检验二、小样本平均数的假设检验t 检验检验 应用范围:应用范围: 总体方差 未知,且样本为小样本( ), 采用 t 检验 当总体方差 为未知时,当样本容量小于 30,检验一个样本平均数 是否属于平均 数为 的指定总体,其 遵循自由度为 dfn1 的 t 分布 T 分布的计算:分布的计算: 2 30n 2 0 x s x x x 2、成组数据平均数比较的、成组数据平均数比较的 t 检验检验 成组数据资料是两个样本的各个变量从各自总体中抽取的,即两个抽样样本彼此独立。 这样,不论两样本容量是否相同,所得数据皆为成组数据。 两个样本的总体方差相等,自由度 dfn1n22 两个样本的总体方差不相等,但抽样样本数相等,自由度 dfn1 3、成对数据平均数比较的、成对数据平均数比较的 t 检验检验 第五章第五章 统计假设:统计假设:H0:观测值与理论值的差异是由随机误差引起 HA:观测值与理论值之间有真实差异 所以卡方值是度量实际观测值与理论值偏南程度的一个统计量 卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大 卡方值为 0,表明 H0严格成立,且它不会有下侧否定区,只能进行右尾检验 连续性:连续性:由于离散型资料的卡方检验只是近似地服从连续型变量的卡方分布,所以在对离 散型资料进行卡方检验计算的时,结果常常偏低,特别是当自由度 df=1 时,有较大偏差, 为此需要进行矫正,当自由度 df1 时,与连续型随机变量卡方分相近似,这时可以不做连 续性矫正 注意:要求各个组内的理论次数不小于 5,如某组理论次数小于 5,则应把它与其相 邻的一组或几组合并,直到理论次数大于 5 为止 适合性检验(吻合性检验或拟合优度检验)步骤:适合性检验(吻合性检验或拟合优度检验)步骤: 1. 提出无效假设,即认为观测值和理论值之间没有差异 2. 规定显著性水平 3. 计算样本卡方值 4. 根据规定的显著水平和自由度计算出卡方值,再和实际计算的卡方值进行比较 独立性检验步骤:独立性检验步骤: 1. 提出无效假设,即认为所观测的各属性之间没有关联 2. 规定显著性水平 3. 根据无效假设计算出理论数 4. 根据规定的显著水平和自由度计算出卡方值,再和计算的卡方值进行比较。 如果接受假设,则说明因子之间无相关联,是相互独立的 如果拒绝假设,则说明因子之间的关联是显著的,不独立 第六章第六章 方差分析又称方差分析又称 F F 检验检验 (F F -test-test); ;方差分析是关于k(k3)个样本平均数的假设测验方 法,是将总变异按照来源分为处理效应和试验误差,并做出其数量估计。 发现各变异原因在总变异中相对重要程度的一种统计分析方法。 总变异分解为组间变异和组内变异。 组内变异是个体差异所致,是抽样误差。 组间变异可能由两种原因所致,一是抽样误差;二是处理不同。 在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原 因是否存在,需通过假设检验作出推断 方差分析基本思想:方差分析基本思想: 1、把 k 个总体当作一个整体看待 2、把观察值的总变异的平方和及自由度分解为不同来源的平方和及自由度 3、计算不同方差估计值的比值 4、检验各样本所属的平均数是否相等 实际上是观察值变异原因的数量分析 方差分析应用条件:方差分析应用条件: 1、各样本须是相互独立的随机样本 2、各样本来自正态分布总体 3、各总体方差相等,即方差齐 方差分析基本用途:方差分析基本用途: 1、多个样本平均数的比较 2、多个因素间的交互作用 3、回归方程的假设检验 4、方差的同质性检验 总平方和总平方和=处理间平方和处理内平方和处理间平方和处理内平方和 总自由度总自由度=处理间自由度处理内自由度处理间自由度处理内自由度 统计假设的显著性检验统计假设的显著性检验F 检验:检验:F 检验的目的:推断处理间的差异是否存在 方差分析中的 F 检验总是单尾检验,而且为右尾检验 F 越大,越说明组间方差是主要方差来源,因子影响越显著; F 越小,越说明随机方差是主要的方差来源, 因子的影响越不显著 F 检验如果否定了 H0,接受了 HA,表明试验的总变异主要来源于处理间的变异 多重比较:多重比较:多个平均数的相互比较 常用的:1、最小显著差数法(LSD 法) 2、最小显著极差法(LSR 法)新复极差检验(SSR 法)q 检验 总结:总结:差异不显著标同一字母,差异显著标不同字母 最小显著极差法(最小显著极差法(LSR 法)法) 把平均数的差异看成是平均数的极差(range) 根据极差范围内所包括的处理数(称为秩次距)k 的不同,而采用不同的检验尺度 叫做 最小显著极差 LSR 秩次距是指当平均数由大到小排序后,相比较的两个平均数之间(含这两个平均数) 包含的平均数个数 I 类错误下降、工作量加大 e e e t t t df SS s df SS s 2 2 处理内方差 处理间方差 新复极差法新复极差法 q q 检验法检验法 两因素方差分析:两因素方差分析: 互作:某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用, 简称互作。互作效应实际是由于两个或多个试验因素的相互作用而产生的效应 采用 EXCEL 计算重复观测值的二因素方差分析: 1、数据输入区域必须有标题 2、直接分析结果仅适用用固定模型 混合模型固定模型、随机模型和 可分为:的不同假定,数学模型根据对处理效应 i 第七章第七章 相关系数的显著性检验相关系数的显著性检验 上述根据实际观测值计算得来的相关系数 r 是样本相关系数, 它是双变量正态总体 中的总体相关系数 的估计值。样本相关系数 r 是否来自 0 的总体,还须对样本相关系 数 r 进行显著性检验。 此 时 无 效 假 设、备 择 假 设 为 HO:=0,HA:0。 与直线 回归关系显著性检验一样,可采用 t 检验法与 F 检验法对相关系数 r 的显著性进行检验。 第八章第八章 对于同一组实测数据,根据散点图的形状,可用若干相近的曲线拟合,同时建立若干曲线 回归方程,然后根据 R2的大小和生物学等相关专业知识,选择即符合生物学规律,拟合度 又较高的曲线回归方程来描述两个变量间的曲线回归关系 第九章第九章 样本容量的确定样本容量的确定 2 2 2 2 1 : yy yy R R曲线回归的相关指数 第十章第十章 实验设计的基本原则和作用实验设计的基本原则和作用 常用的试验设计的方法:常用的试验设计的方法:1、对比设计 2、随机区组设计 3、裂区组设计 4、正交设计 对比设计及其统计分析:对比设计及其统计分析: 对比设计试验结果的统计分析:对比设计试验结果的统计分析: 分析步骤:分析步骤: 3、试验结论分析:对邻近 CK 的百分数越高(大于 100) ,就越可能优于对照,但绝不 能认为超过 100的所有处理都显著地优于对照,因为将处理与相邻 CK 相比只是减少了 误差,实际误差仍然存在,要 判断某个处理确实优于对照,一般至少要超过对照 10; 凡仅超过对照 5的,均宜继续试验再做结论。 该判断方法由于不同试验的误差大小不同,仅是一种参考 随机区组设计及其统计分析:随机区组设计及其统计分析: 设计方法: 1、将试验单位按性质不同分成与重复数一样多的区组; 2、每个区组内非试验相对一致,并随机排列一套试验处理; 3、不同区组间非试验因素允许有所不同,将不同重复也随机排列于各个区组 4、最终使区组内非试验因素差异最小,而区组间非试验因素差异最大,每个区组均包括全 部处理 5、统计分析采用方差分析,将区组间误差分解出来,从而降低试验误差,提高试验精度 单因素随机区组:单因素随机区组: 把区组看作一个因素,和试验因素一起当作二因素试验,按照二因素无 重复观察值的方差分析进行,主要做区组间、处理间和试验误差 3 个方面的方差分析 二因素随机区组:二因素随机区组: 裂区设计及其统计分析:裂区设计及其统计分析: 统计分析采用方差分析:统计分析采用方差分析: 区组间、A 因素、B 因素、AB 互作、主区误差和副区误差的方差分析 正交设计及其统计分析:正交设计及其统计分析: 正交表:正交表:正交设计法中合理安排实验,并对数据进行统计分析的一种特殊表格。 正交设计的基本步骤:正交设计的基本步骤: (1)明确试验目的,确定试验指标 (2)挑选因素,选取水平,列出因素水平表 (3)选用正交表,进行表头设计 根据试验因素、水平数和是否需要估计因素间的相互作用来选择合适正交表。原则: 能安排下全部试验因素,又要使部分试验的水平组合尽可能小。 各因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论