生物统计学期末_第1页
生物统计学期末_第2页
生物统计学期末_第3页
生物统计学期末_第4页
生物统计学期末_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学复习资料生物统计学复习资料 ErxatErxat lovesloves munira,muniramunira,munira lovesloves erxat.erxat. 第一章第一章 生物统计学:生物统计学:是数理统计在生物学研究中的应用,它是 应用数理统计的原理和方法来分析和解释生物界各种现 象和试验调查资料的一门学科,属于应用统计学的一个 分支。 内容:内容:试验设计:试验设计的基本原则、试验设计方案 的制定和常用试验设计的方法 统计分析:数据资料的搜集、整理和特征数的计 算、统计推断、方差分析、回归和相关分析、协方差分析等 生物统计学的作用:生物统计学的作用: 1. 提供整理、描述数据资料的科学方法并确定其特征 2. 判断试验结果的可靠性 3. 提供由样本推断总体的方法 4. 试验设计的原则 生物统计学的研究包括了两个过程:生物统计学的研究包括了两个过程: 1. 从总体抽取样本的过程抽样过程 2. 从样本的统计数到总体参数的过程统计推断过程 第二章第二章 7 7样本标准差样本标准差: (1)标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,标准差就大 (2)在计算标准差的时候,如果对各个观测值加上或者减去一个常数a,其标准差不变;如果乘以或除以 一个常数a,则标准差扩大或者缩小a倍 STDEV:STDEV: 基于给定样本的标准偏差 STDEVPSTDEVP:基于给定样本总体的标准偏差 8 8 变异系数(变异系数(CVCV):样本标准差除以样本的平均数,得到百分比 (1)变异系数是样本变量的相对变量,是不带单位的纯数 (2)用变异系数可以比较不同样本相对变异程度的大小 1次数分布:在不同区间内变量出现的次数所构成的分布。 2.资料根据生物的形状特性,可分为数量性状和质量性状 3间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带 有小数的值存在。 4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间 可以有微量数值差异的第三个数值存在 5.质量性状资料的方法:统计次数法,评分法 统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别 及其次数或相对次数 给分法:给予每类性状以相对数量的方法。 6.试验资料搜集方法:调查和试验 7.资料调查方法:普查和抽样调查 抽样调查:根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行 统计处理,然后利用样本特征数对总体进行推断。 8.随机抽样满足条件:1)总体中每个个体被抽中的机会均相等;2)总体中任意一个个体是否被抽中是相 互独立的 9.统计表要求:1)标题:简明扼要,准确地说明表的内容,有时须注明时间、地点 2)标目:分横纵两项,横列在表的左侧,纵列表上端,须注明计算单位 3)数字:一律用阿拉伯数字,以小数点对齐,无数字用“/”表示 4)线条:多用三线条。上下两条边路略粗 10.统计图绘制的要求:统计图绘制的要求: 1) 标题简明扼要,列于图的下方 2) 横纵坐标两轴有刻度,注明单位 3) 横轴从左至右,纵轴由下而上,数值由小至大,图形长宽约为 5.4 或 6.5 4) 图中要不同颜色或线条代表不同的事物时,应有图例说明 11.计数资料基本采用单项式分组法进行整理 12.计量资料的整理一般采用组距式分组法 13.次数分布图分类:条形图、饼图、直方图、多边形图、散点图 14.14.变量的基本特征:变量的基本特征: 1) 集中性:变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。特征数是平均 值 2) 离散性:变量有着离中分散变异的性质。特征数是变异数,常用的指标是极差、方差、标准差和变异 系数 15.平均数的种类:算术平均数、中位数、纵数、几何平均数 17.标准差的作用; 1) 表示变量分布的离散度 2) 利用标准差的大小,可以概括的估计出变量的次数分布及各类观测值在总体中所占有的比例 3) 估计平均数的标准误 4) 进行平均数的区间估计和变异系数的计算 18.组距:根据极差分成若干组,每组的距离相等,称为组距。组距=极差/组数 19.自由度:样本内独立且能自由变动的离均差的个数。 20.变异系数:样本的标准差除以平均数的百分比 21. 平均数的用处:平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平; 作为样本或资料的代表数据与其他资料进行比较。 平均数的特征:离均差之和为零; 离均差平方和为最小。 21.标准差的用处: 标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异 大,离均差就越大; 在计算标准差是如果对观察值加上一个或减去一个 a,标准差不变;如果给各观测 值乘以或除以一个常数 a,所得的标准差就扩大或缩小 a 倍; 在正态分布中,X+-S 内的观测值个数占 总个数的 68.26%,X-+2s 内的观测值个数占总个数的 95.49%,x-+3s 内的观测值个数占总个数的 99.73%。 标准差的特征: 表示变量分布的离散程度; 标准差的大小可以估计出变量的次数分布及各类观测值 在总体中所占的比例; 估计平均数的标准差; 进行平均数区间估计和变异数的计算。 22.比较总体和样本的平均数、标准差: 总体平均数 =x/N,式中分母为总体观察个数 N; 样本平均数 x=x/n,公式中 n 是样本容量; 样本平 均数是总体平均数的无偏估计值。 总体和样本标准差都等于离均差的平方和除以样本容量; 而总体标准差 = ,分母上是总体观测 值个数 N; 而样本标准差是 s= ,分母上是样本自由度 n-1. 样本标准差 s 是总体 1n xx 2 )( 标准差 的无偏估计值。 第三章:第三章: 概率的计算法则:概率的计算法则: (1)乘法定理:如果 A 和 B 为独立事件,则事件 A 和 B 同时发生的概率等于各自事件的概率的乘积 (2)加法定理:互斥事件A和B的和的概率等于事件 A 和事件 B 的概率之和 加法定理推理 1: 如果A1、A2、An为n个互斥事件,则其和事件的概率为: P(A1A2An)=P(A1)+P(A2)P(An) 加法定理:如果A和B是任何两件事件,则 概率分布:概率分布: (1)离散型随机变量的概率分布 变量(x) x1 x2 x3 xn 概率(P) p1 p2 p3 pn P(x=xi)=pi (i=1,2, n) 离散随机变量的方差 (2)连续型随机变量的概率分布 连续型随机变量的概率分布连续型随机变量的概率分布 1. 连续型随机变量可以取某一区间或整个实数轴上的任意一个值 2. 它取任何一个特定的值的概率都等于 0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率 5. 用数学函数的形式和分布函数的形式来描述 概率密度函数:概率密度函数:(1)设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条 件 (2) ,f(x)不是概率 几种常见的概率分布:几种常见的概率分布:(适用范围,尾函数,自由度) )()()(BPAPBAP )()()(BPAPBAP 1.1. 二项分布的概率函数二项分布的概率函数 记作B(n,p)或者B(n,) (1)每次试验只有两个对立结果,分布记为A与 它们出现的概率分布为p与q(q1-p) (2)试验具有重复性和独立性 二项式分布的概率累积函数: 若随机变量x服从二项式分布,则有二项分布的总体平均数为 二项分布的总体标准差为: 二项成数(百分数)分布的平均数: 二项成数(百分数)分布的标准差: 例:例:假设年龄 6064 岁的 100 名男性在 1986 年注射了一种新的流感疫苗而在第二年内死亡 5 人,这 正常嘛?(注:1986 年,6064 岁的男性老人第二年的死亡率约为 0.02) 解:要知道 100 个男性的样本死亡 5 人是不是“异常”事件,这种估计的一个准则是寻找至少 5 人死 亡的概率。 注:通常是把概率值为 0.05 或者更小的概率事件识别为异常(稀有事件) 。 由于至少 5 人死亡的概率是 0.05,可见 100 人中至少死亡 5 人是稍微有点异常, 但不是很异常。 如果至少死亡 10 人,那么概率是 3.44*10-5,这就很不正常,因而,在没有其 他证据显示此疫苗有效前,应考虑停止使用。 2.2. 泊松分布泊松分布 二项式分布中,如果p值很小而n值很大( p1 时,与连续型随机变量卡方分相近似,这时可以不做连续性矫正 注意:要求各个组内的理论次数不小于 5,如某组理论次数小于 5,则应把它与其相邻的一组或几组 合并,直到理论次数大于 5 为止 适合性检验(吻合性检验或拟合优度检验)步骤:适合性检验(吻合性检验或拟合优度检验)步骤: 1. 提出无效假设,即认为观测值和理论值之间没有差异 2. 规定显著性水平 3. 计算样本卡方值 4. 根据规定的显著水平和自由度计算出卡方值,再和实际计算的卡方值进行比较 独立性检验步骤:独立性检验步骤: 1. 提出无效假设,即认为所观测的各属性之间没有关联 2. 规定显著性水平 3. 根据无效假设计算出理论数 4. 根据规定的显著水平和自由度计算出卡方值,再和计算的卡方值进行比较。 如果接受假设,则说明因子之间无相关联,是相互独立的 如果拒绝假设,则说明因子之间的关联是显著的,不独立 1. 检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同 质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论 值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。 检验用途:一个样本方差的同质性检验、适合性检验、独立性检验 1)适合性检验:比较观测值与理论值是否符合的假设检验。这种方法是对样本的理论值先通过一定的理 论分布推算出来,然后用实际观测值与理论观测值比较,从而得出实际观测值与理论观测值之间是否吻合 的结论,因此适合性检验也叫吻合性检验或拟合优度检验。 2)独立性检验:实验九两个或两个以上因子彼此之间的相互独立的还是相互影响的一类统计方法。 2.检验基本原理:应用理论推算值 E 与观测值 O 之间的偏离程度来决定的。理论推算值与实际观测值 之间偏差越大,越不符合;偏差越小,越趋于符合;若两值完全相等时,表明理论值与实际值完全符合。 3. 检验的步骤为: (1)提出无效假设 H0:观测值与理论值的差异由抽样误差引起即观测值=理论值 备择假设 HA:观测值与理论值的差值不等于 0,即观测值理论值 (2)确定显著水平 a.一般可确定为 0.05 或 0.01 (3)计算样本的 x2,求得各个理论次数 Ei,并根据各实际次数 Oi,代入公式,计算出样本的 x2。 (4)进行统计推断 4.在计算 是应注意: 1)任何一组的理论次数 Ei 都必须大于 5,如果 Ei5; 2)在自由度 df=1 时,需进行连续性矫正 公式: 对同一资料,进行矫正的值要比未校正的值小。当自由度 df=2 时,一般不需要矫正。 第六章第六章 方差分析又称方差分析又称 F F 检验检验 (F F -test-test); ;方差分析是关于k(k3)个样本平均数的假设测验方法,是将总变异 按照来源分为处理效应和试验误差,并做出其数量估计。 发现各变异原因在总变异中相对重要程度的一种统计分析方法。 总变异分解为组间变异和组内变异。 组内变异是个体差异所致,是抽样误差。 组间变异可能由两种原因所致,一是抽样误差;二是处理不同。 在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因是否存在,需 通过假设检验作出推断 方差分析基本思想:方差分析基本思想: 1、把k个总体当作一个整体看待 2、把观察值的总变异的平方和及自由度分解为不同来源的平方和及自由度 3、计算不同方差估计值的比值 4、检验各样本所属的平均数是否相等 实际上是观察值变异原因的数量分析 方差分析应用条件:方差分析应用条件: 1、各样本须是相互独立的随机样本 2、各样本来自正态分布总体 3、各总体方差相等,即方差齐 方差分析基本用途:方差分析基本用途: 1、多个样本平均数的比较 2、多个因素间的交互作用 3、回归方程的假设检验 4、方差的同质性检验 总平方和总平方和= =处理间平方和处理内平方和处理间平方和处理内平方和 总自由度总自由度= =处理间自由度处理内自由度处理间自由度处理内自由度 统计假设的显著性检验统计假设的显著性检验F F检验:检验:F 检验的目的:推断处理间的差异是否存在 方差分析中的F检验总是单尾检验,而且为右尾检验 F越大,越说明组间方差是主要方差来源,因子影响越显著; F越小,越说明随机方差是主要的方差来源, 因子的影响越不显著 F检验如果否定了H0,接受了HA,表明试验的总变异主要来源于处理间的变异 多重比较:多重比较:多个平均数的相互比较 常用的:1、最小显著差数法(LSD法) 2、最小显著极差法(LSR法)新复极差检验(SSR法)q 检验 总结:总结:差异不显著标同一字母,差异显著标不同字母 最小显著极差法(最小显著极差法(LSRLSR 法)法) 把平均数的差异看成是平均数的极差(range) 根据极差范围内所包括的处理数(称为秩次距)k的不同,而采用不同的检验尺度叫做 最小显著 极差LSR 秩次距是指当平均数由大到小排序后,相比较的 两个平均数之间(含这两个平均数)包含的平均 数个数 I 类错误下降、工作量加大 新复极差法新复极差法 q q 检验法检验法 两因素方差分析:两因素方差分析: 互作:某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用,简称互作。互作 效应实际是由于两个或多个试验因素的相互作用而产生的效应 采用 EXCEL 计算重复观测值的二因素方差分析: 1、数据输入区域必须有标题 2、直接分析结果仅适用用固定模型 1.试验因素:试验中所研究的影响试验指标的原因或原因组合,简称为因素或因子。 按照性质不同,因素可以分为可控因素和非可控因素。 2.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别) 。 3.试验处理:指对受试对象给予某种外部干预(或措施) ,是试验实施因子水平的一个组合。可分为单因 素处理和多因素处理。 4.试验单位:试验中能接受不同试验处理的独立的试验载体。实际上就是根据目的而确定的观测总体。 5.重复:是指在试验中,将一个处理实施在两个或两个以上的试验单位上。 6.方差分析基本原理:将所有处理的观测值作为一个整体,一次比较就对所有各组间样本平均数是否有差 异作出判断。 基本思想:将测量数据的总变异按照变异原因不同分解为处理效应和试验效应,并作出其数量估计。 7.方差分析避免的问题; 1)j 检验过程繁琐 2)无统一的试验误差,误差估计的精确性和检验的灵敏性低 3)推断的可靠性降低,犯 错误的概率增加 8.方差分析的基本假定:正态性、可加性、方差同质性 9.数据转换:平方根转换、对数转换、反正弦转换、倒数转 换 样本所来自的总体和方差分析基本假定相抵触,这些数据必 须进行适当的数据转换 10.方差分析的概念、基本思想、一般步骤 1)方差分析是对两个或多个样本平均数差异显著性检验的方 法。 (2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估 计,在一定显著水平下进行比较,从而检验处理效应是否显著。 (3)方差分析的基本步骤如下: a.将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。 b.列方差分析表进行 F 检验,分析各变异因素在总变异中的重要程度。 c.若 F 检验显著,对个处理平均数进行多重比较。 11.多重比较 (1)多个平均数两两间的相互比较称为多重比较。 (2)多重比较常用的方法有最小显著差数法和最小显著极差法,其中最小显著极差法又有新复极差检验 和 q 检验法。 (3)多重比较的结果常以标记字母法和梯形法表示。标记字母法是将全部平均数从大到小依次排列,然 后再最大的平均数上标字母 a,将该平均数与以下各平均数相比,凡相差不显著的都标上字母 a,直至某个 与之相差显著的则标以字母 b。再以该标有 b 的平均数为标准,与各个比它大的平均数比较,凡差数差异 不显著的在字母 a 的右边加标字母 b。然后再以标 b 的最大平均数为标准与以下未曾标有字母的平均数比 较,凡差数不显著的继续标以字母 b,直至差异显著的平均数标以字母 c,再与上面的平均数比较。如此 重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。这样各平均数间,凡有一个 相同标记的字母即为差异不显著,凡具不同标记的字母即为差异显著。差异极显著标记方法同上,用大写 字母标记。 梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。差数LSD(LSR)0.05 说明处理 平均数间的差异达到显著水平,在差数的右上角标上“*”号;差数LSD(LSR)0.01 说明处理平均数间的差 异达到极显著水平,在差数的右上角标上“*”号。差数 LSD(LSR)0.05,说明差异不显著。 第七章第七章 相关系数的显著性检验相关系数的显著性检验 上述根据实际观测值计算得来的相关系数r是样本相关系数, 它是双变量正态总体中的总体相关系 数 的估计值。样本相关系数r是否来自 0 的总体,还须对样本相关系数r 进行显著性检验。 此 时 无 效 假 设、备 择 假 设 为 HO:=0,HA:0。 与直线回归关系显著性检验一样,可采用t检 验法与 F 检验法对相关系数r的显著性进行检验。 1.回归分析:用来研究呈因果关系的相关变量间的关系的统计分析方法,其中表示原因的变量为自变量, 表示结果的变量为因变量。 2.回归截距是当自变量为零时,因变量的取值,即回归线在 y 轴上的截距; 3.回归系数是回归直线的斜率,其含义是自变量改变一个单位,因变量 y 平均增加或减少的单位数。 4.相关分析:相关分析是用来研究呈平行关系的相关变量之间的关系的统计方法。 5.相关系数表示变量 x 与变量 y 相关的程度和性质, 6.决定系数是相关系数的平方,表示变量 x 引起 y 变异的回归平方和和占 y 变异总平方和的比率,它只能 表示相关的程度而不能表示相关的性质。 第八章第八章 对于同一组实测数据,根据散点图的形状,可用若干相近的曲线拟合,同时建立若干曲线回归方程,然后 根据R2的大小和生物学等相关专业知识,选择即符合生物学规律,拟合度又较高的曲线回归方程来描述两 个变量间的曲线回归关系 第九章第九章 1.抽样调查中必须考虑的重点问题:抽样误差,样本容量以及抽样方法 2.生物学领域常用的抽样方法:随机抽样,顺序抽样,典型抽样 3.平均数资料样本容量的确定: 2 24 L s n n s tL05 . 0 样本容量的确定样本容量的确定 第十章第十章 1.区间实验:在田间条件下对作物品种选育及遗传规律与栽培 技术等方面进行的试验。 2.真值:一定时刻,一定位置,一定状态下某量得程度所体现 出来的客观值或实际值。 3.准确度:指在实验中某一实验指标或性状的观测值接近的程度。 4.精确度:指在实验中同一实验指标或性状的重复观测值很大接近的程度。 5因素:也叫供试因子,在试验中所研究的对试验指标有影响的各种技术措施。例如:品种、密度 6.水平:试验因素的质的不同状态或量得不同等级(因素内划分的不同等级) 7.处理:实际参加试验的试验因素水平或不同因素的实验水平组合。在单因素试验中指各个因素的试验的 水平。在所有因素试验中指不同因素水平的组合。 8 试验设计三个基本要素:包括处理因素、受试对象和处理效应 9.田间试验的类型: 一)按试验研究内容划分:品种、栽培、土壤肥料、病虫害防治 二)按试验因素划分:单因素试验、多因素试验、综合性试验 单因素试验:指在整个试验中只重复比较一个试验因素不同水平,其他作为试验条件的因素均应该严格控 制一致的试验。 多因素试验:指同一试验中包含两个或两个以上的试验因素,各因素又分为不同水平,其他试验条件均应 该严格控制一致的试验。 综合性试验:是在较大面积上运用成套的生产栽培技术措施,从中探索高产、稳产、低成本、综合栽培技 术的效应 三)按试验小区大小划分:小区试验、大区试验 小区:在田间试验中,安排一个处理的小块地段称为试验小区。 区组:将全部处理分配于具有相对同质的一块土地上,称为一个区组,包括完全区组和不完全区组。 10试验方案:按试验目的要求所拟定的进行比较的一组试验处理的总称。 11.试验指标:试验中用来衡量各种处理效果的好坏的指标,如产品的产量、品质。通常指作物产量经济 性状,包括定性指标和定量指标。 定量指标:可以直接用来表示数量的指标。 定性指标:不能直接用数量来表示,只能定性描述的指标。 12.均衡方案:方案内包含有全部的处理组的方案称为均衡方案;方案内只有部分处理组的方案则称为非 均衡方案。 13.对照:用来与试验处理进行比较的处理。 14.唯一差异原则:指除处理以外,其他条件应该完全一致。 15试验效应:试验因素的独立作用,即因素对试验指标所起的增加或减少的作用。 16.简单效应:同一因素不同水平之间试验效应的差异。 17.平均效应:(主效应):同一因素内各个简单效应的平均数。 18.互作(交互作用):两个或两个以上因素相互作用所引起的效应或两个因素简单效应间的差异。 19.三原则:重复、随机和局部控制 )重复:同一处理所放置的试验单元数,即同一处理种植的小区数 )随机:每一重复的每一处理都有同等的机会放在任何一个试验小区上。 )局部控制:将整个试验空间分成若干个各自相对均匀的局部(区组) 20.生物试验基本要求: 1)试验目的要明确 2)试验条件要有代表性 3)试验结果要可靠 4)试验结果要能重演 21.试验误差:试验中观测值与理论值之间的偏差,包括粗大误差、系统误差、随机误差。 粗大误差:由不正确的操作所引起的误差。 系统误差:由试验仪器、条件、设备、工具等原因所照成的各个观测值具有一定规律性变化的误差。 随机误差:由多种偶然的无法控制的因素所引起的误差。 试验误差来源:1)实验材料固有的差异 2)试验条件不一致 3)操作技术不一 4)偶然性因素影响 控制试验误差的途径:1)选择纯合一致的试验材料 2)改进操作管理制度,使之标准化 3)精心选择试验单位 4)采用合理的实验设计和统计分析 22.边际效应:小区两边或两端的植株因有较大的空间而表现出的生长优势 23生长竞争:由于相邻小区所加处理不同(如种植不同作物或施肥水平不同)造成边行植物与中间植株 生长发育不一致的现象。 24.保护行:为了使试验在较为均匀的环境下安全进行,在试验地周围种植同种作物品种的保护地段。 25.完全区组:重复和区组数目相等,每一区组或重复都安排全套处理 26.不完全区组:一个重复安排在几个区组上,每个区组只安排部分处理 27主区:按照处理划分的小区。 副区:主区内按各副区划分的小区。 28.试验设计:试验设计包括广义的试验设计和狭义的试验设计。广义的试验设计是指整个研究课题的设 计,包括试验方案的拟订,试验单位的选择,分组的排列,试验过程中试验指标的观察记载,试验资料的 整理,分析等内容;而狭义的试验设计则仅是指试验单位的选择,分组与排列方法。生物统计学中的试验 设计主要指狭义的试验设计。 29.名词解释:处理、处理效应、主效应、互作 处理:是指对受试对象给予的某种外部干预,是试验中实施的因子水平的一个组合,又称为处理因素。 处理因素:是指处理因素作用于受试对象的反应,是研究结果的最终体现。 主效应:是指由于因素水平的改变而造成因素效应的改变。 互作:是指两个或两个以上处理因素间的相互作用产生的效应。 实验设计的基本原则和作用实验设计的基本原则和作用 常用的试验设计的方法:常用的试验设计的方法:1、对比设计 2、随机区组设计 3、裂区组设计 4、正交设计 分析步骤:分析步骤: 3、试验结论分析:对邻近 CK 的百分数越高(大于 100) ,就越可能优于对照,但绝不能认为超过 100 的所有处理都显著地优于对照,因为将处理与相邻 CK 相比只是减少了误差,实际误差仍然存在,要 判断 某个处理确实优于对照,一般至少要超过对照 10;凡仅超过对照 5的,均宜继续试验再做结论。 该判断方法由于不同试验的误差大小不同,仅是一种参考 随机区组设计及其统计分析:随机区组设计及其统计分析: 设计方法: 1、将试验单位按性质不同分成与重复数一样多的区组; 2、每个区组内非试验相对一致,并随机排列一套试验处理; 3、不同区组间非试验因素允许有所不同,将不同重复也随机排列于各个区组 4、最终使区组内非试验因素差异最小,而区组间非试验因素差异最大,每个区组均包括全部处理 5、统计分析采用方差分析,将区组间误差分解出来,从而降低试验误差,提高试验精度 单因素随机区组:单因素随机区组: 把区组看作一个因素,和试验因素一起当作二因素试验,按照二因素无重复观察值的 方差分析进行,主要做区组间、处理间和试验误差 3 个方面的方差分析 二因素随机区组:二因素随机区组: 裂区设计及其统计分析:裂区设计及其统计分析: 统计分析采用方差分析:统计分析采用方差分析: 区组间、A 因素、B 因素、AB 互作、主区误差和副区误差的方差分析 正交设计及其统计分析:正交设计及其统计分析: 正交表:正交表:正交设计法中合理安排实验,并对数据进行统计分析的一种特殊表格。 正交设计的基本步骤:正交设计的基本步骤: (1)明确试验目的,确定试验指标 (2)挑选因素,选取水平,列出因素水平表 (3)选用正交表,进行表头设计 根据试验因素、水平数和是否需要估计因素间的相互作用来选择合适正交表。原则:能安排下全部试 验因素,又要使部分试验的水平组合尽可能小。 各因素的水平数减 1 之和加 1,即为所需的最少试验次数或处理组合数,若因素间有交互作用,需要再加 上交互的作用的自由度。 表头设计就是将试验因素安排到所选正交表相应的列中。表头设计就是将试验因素安排到所选正交表相应的列中。 表头设计原则:表头设计原则:1、不要让主效应间,主效应与交互作用间有混杂现象;2、存在交互作用,查交互作用表 (4)明确试验方案,进行试验,得到以试验指标形式表示的试验结果。 (5)对试验结果进行统计分析 通常采用两种方法:直观分析法、方差分析法。通过试验结果分析,可以得到因素主次顺序、最佳水 平组等有用信息。 (6)进行验证试验,做进一步分析。 一一名词名词 1.1.样本样本: :从总体中抽出的若干个体所构成的集合称为样本。 2.统计数:描述样本特征的数量 3.效应:由因素而引起试验差异的作用 4.互作:两个或两个以上处理因素间的相互作用产生的效应 5.变量:相同性质的事物间表现差异性的某项特征。按其性质分为连续变量和非连续变量。变量可以是 定量的,也可以是定性的。 6.连续变量:表示在变量范围内可抽出某一范围的所有值 7.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。 8.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过 程中是不变的。 9.误差:是试验中不可控因素所引起的观测值偏离真值的差异 10. 错误:是指在试验过程中,人为因素所引起的差错。 11. 准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度 12. 精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。 13.13. 总体总体: :指具有相同性质的个体所组成的集合称为总体。 14.14. 连续变量:连续变量:表示在不变量范围内可抽出某一范围的所有值。 15. 非连续变量非连续变量: :也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。 16. 准确性准确性: :指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。 17.17. 精确性:精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。 18. 资料:资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体体事务或现象观 察的结果。 19.19. 数量性状资料:数量性状资料:指一般是由计数和测量或度量得到的。 20. 质量性状资料:质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。 21.21. 计数资料计数资料; ;指由计数得到的数据。 22.22. 计量资料:计量资料:有测量或度量得到的数据。 23. 普查:普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。 24.24. 抽样调查:抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把 得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。 25. 全距(极差)全距(极差) :是指样本数据资料中最大观测值与最小观测值的差值。组中值:是指两个组限下线 和上限的中间值。 26. 算数平均数:算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。 特性特性:(1)样本中各观测值与平均数之差离均差的总和等于零 (2)样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平方和小, 即离均差平方和最小 27.27. 中位数:中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。 28. 众数:众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。 29. 几何平均数:几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。 30. 方差:方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。 31. 标准差:标准差:指方差的平方根和。 32. 变异系数变异系数: :指将样本标准差除以样本平均数得出的百分比。 33. 概率概率: :指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频 率 W(A) 概率 就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率. 34. 概率加法定理:概率加法定理: 指互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 的概率之和, P(A+B) =P(A)+P(B)。 35. 概率乘法定理:概率乘法定理:指事件 A 和事件 B 为独立事件,则事件 A 与 B 同时发生的概率等于事件 A 和事 件 B 各自概率乘法定理的乘积,即:P(A*B)=P(A)*P(B)。 36. 伯努利大数定律:伯努利大数定律:设 M 是 n 次独立试验中事件 A 出现的次数,而不是事件 A 在每次试验中出现的 概率,则对于任意小的正数 ,有如下关系:limpm/n-p =1 37. 辛钦大数定律辛钦大数定律: :是用来说明为什么可以用算术平均数来推断总体平均数 m 的。 38. 统计推断统计推断: :指从样本的统计数对总体参数做出的推断,包括参数估计和假设检验。 39. 假设检验:假设检验:指根据总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设, 然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。 40. 参数估计参数估计: :指由样本结果对总体参数在一定概率水平下所作出的估计。 点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,X X 拔不同的样本将会得到不拔不同的样本将会得到不 同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足 41. 小概率原理:小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算出事件 A 出现的概率 a 为很小, 则在假设条件下的 n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。 42.42. 显著水平:显著水平:指在无效假设和备择假设后,要确定一个否定 H0 的概率标准,这个概率称为显著水平。 43. 方差同质性:方差同质性:就是指各个总体的方差是相同的。 44. 错误错误 : :H0 是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称为 错误。 45. 错误:错误:指如果 H0 不是真实的,假设检验时却接受了 H0,否定了 HA 这样就犯了接受不真实假设 的错误,称为 错误。 46. 适合性检验:适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检验。 47. 独立性检验:独立性检验:指研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法。 48. 相关分析相关分析: :是研究现象之间是否存在某种依存关系, 并对具体有依存关系的现象探讨其相关方向以及 相关程度,是研究随机变量间的相关关系的一种统计方法。 49. 回归分析:回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。 50. 回归系数:回归系数:y=a+bx,自变量 x 改变一个单位,依变量 y 平均增加或减少的单位数,即回归直线的 斜率 b。 51. 回归截距:回归截距:y=a+bx,a 是当 x=0 时的 Y值,即直线在 y 轴上的截距,称为回归截距。 52. 离回归平方和:离回归平方和:它反映除去 x 与 y 相关程度和性质的统计数。 53. 回归平方和:回归平方和:它反映在 y 的总体变异种由于 x 与 y 的直线关系而产生 y 变异减小的部分。 54. 相关系数:相关系数:是指通过计算表示 x 和 y 相关程度和性质的统计数。 55. 决定系数:决定系数:是变量 x 引起 y 变异的回归平方和与 y 变异总平方和的比率。 56. 转换:转换:指估计总体相关系数 p 的置信区间时,需要将 r 转换成 z。 57. 试验设计:试验设计:广义的指整个研究课题的设计,包括实验方案的拟订,试验方案的拟订,试验单位的选择, 分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容。 58. 试验结果重演:试验结果重演:是指在相同的条件下,在进行实验或实践,应能重复获得与原试验结果相近的结果。 59. 处理因素:处理因素:一般指对受试对象给予的某种外部干预。 60. 主效应:主效应:多因素中试验中引起实验结果发生变化的主要。 61. 互作:互作:因素之间的交互作用。 62. 受试对象:受试对象:是处理因素的客体,实际上就是根据研究目的而确立的观测总体。 63. 处理效应:处理效应:是处理因素作用于受试对象的反应,是研究最终体现 64. 误差:误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离试验处理真值的差异。 65. 随机误差:随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差。 66. 系统误差系统误差: :由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏偏差 67. 重复:重复:在试验中,同一处理设置的试验单位数。 68. 随机随机: :是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见。 69. 均积:均积:是 x 与 y 的平均的离均差的乘积和,简称均积。 70. 协方差:协方差:与均积相应的总体参数。 71. 协方差分析:协方差分析:把回归分析与方差分析结合。 72. 试验控制:试验控制:要提高试验的精确度和灵敏度,必须严格控制试验条件的均匀性,使各处里处于尽可能一 致的条件下。 73. 统计控制统计控制: :是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产生的影 响。 74. 估计量:估计量:估计总体参数的统计量 75. 无偏估计量:无偏估计量:如果一个统计量的理论平均数(即数学期望)等于总体参数,这个统计量就叫无偏估计 量 76. 矩估计:矩估计:用样本矩作为总体矩的估计值 77. 矩估计法矩估计法(数字特征法、矩法)用样本矩作为相应总体矩的估计量,也可以用样本数字特征作为相应 的总体数字特征的估计量。用矩法获得的估计值,叫据估计值。据发的思想实质是用样本去替换总体 矩的原则,称之为替换原则 78. 有效估计量:有效估计量:设 a1,a2 是 A 的两个无偏估计量,若 var(a1)var(a2),则 a1 为有效估计量 79. 抽样误差:抽样误差:由抽样引起的样本值与总体值之间的差异成为抽样误差,直接原因:总体中各个体之间存 在差异,或重复试验中一些服从某种分布的偶然误差的存在 80. 标注误差(标准误):标注误差(标准误):描述样本平均数波动情况的统计量,就是 X 拔的方差或标准差,计均数抽样误 差为西格玛 X 拔,=西格玛/根号 n,西格玛 X 拔就是标准误(差) 81. 估计样本平均数方差:估计样本平均数方差:SX 拔平方,=S 平方/n 82. 估计标准误:估计标准误:SX 拔,=S/根号 n 83. 置信区间:置信区间:达到某一置信度(如 95)时,预报量可能出现的范围(如 E(y)1.96 西格玛,这里西格玛 是标准差) 置信区间的意义是:反复抽样多次,每次的样本容量相等,每次的样本值确定一个区间置信区间的意义是:反复抽样多次,每次的样本容量相等,每次的样本值确定一个区间a1,a2a1,a2,这个区,这个区 间包含间包含 a a 的概率是的概率是 100100(1-1-阿尔法)阿尔法)% %,不包含,不包含 a a 的概率是的概率是 100100 阿尔法阿尔法% % 84. 置信水平(置信度,置信系数,可靠度)是置信水平(置信度,置信系数,可靠度)是指总体参数值落在样本统计值某一区内的概率;而置信区 间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。 85. 拟合优度检验:拟合优度检验:对总体分布类型的检验,包括检验观测数与理论书之间的一致性,通过检验观测数与 理论书之间的一致性来判断事件之间的独立性 86. 皮尔逊定理:皮尔逊定理:若 n 充分大,则不论总体服从什么分布,卡平方总是近似服从自由度为 m-a-1 的卡平方 分布 87. 方差分析:方差分析:能同时判断多组数据平均数之间的差异显著性,能把随机变异从混杂状态中分离开来,从 而为判断因素对实验结果有无确实的影响提供依据 88. 方差分析的前提条件:方差分析的前提条件:等方差,正态性、独立性 89. 固定因素:固定因素:若因素的 a 个水平是经过特意选择的,则该因素为固定因素。发差分析所得到的结论只适 合于选定的几个水平,并不能将其结论扩展到未加考虑的水平上 90. 固定效应模型:固定效应模型:处理固定因素所用的模型称为固定效应模型或固定模型 91. 随机因素:随机因素:若因素的 a 个水平,是从该因素水平总体中随机抽出的样本,则该因素称为随机因素,从 随机因素 a 个水平所得到的结论,可以推广到这个因素的所有水平上 92.92. 处理随机因素所用的模型称为随机效应模型随机效应模型 93. 多重比较:多重比较:对各对均值之间的差异的显著性检验 94.94. LSDLSD 法在统计推断时犯第一类错误的概率大,而法在统计推断时犯第一类错误的概率大,而 DuncanDuncan 法犯第一类错误的概率小。法犯第一类错误的概率小。 95. 多个方差齐性检验(多个方差齐性检验(bartlettbartlett 检验,巴特氏卡平方检验):检验,巴特氏卡平方检验):当 a 个随机样本是从独立正态总体中抽取 时,可以计算出统计量 K 平方,当 n=min(nj)充分大时,K 平方的抽样分布非常接近于 a-1 自由度的 卡方分布。由此可对多个总体进行卡平方检验。 96.96. 两因素之间交互作用产生新效应的现象为交互作用交互作用 97.97. 由因素水平的改变而造成的因素效应的改变称为该因素的主效应主效应 98. 交叉分组设计:交叉分组设计:假设 A 药物有 a 水平,B 药物有 b 水平,共有 ab 个剂量组合,每一组重复 n 次。共有 abn 名病人参加实验,这样的实验设计称为交叉分组设计 99. 相关:相关:设有两个随机变量X 和 Y,对于任一随机变量的每一个可能的值,另一个随机变量都有一个 确定的分布与之相对应,则称这两个随机变量之间存在相关关系 100.100.如果变量之间的关系可以用函数关系来表达,就称它们之间的关系为确定性关系确定性关系 101.回归关系、相关关系:回归关系、相关关系:统计学上把变量之间的非确定性关系称为相关关系,也成为回归关系 102.102.如果对于一个普通变量 x 的每一个可能的值 xj 都有随机变量 Y 的一个分布与之对应,则称随见 变量 Y 的一个分布与之对应,则称随机变量随机变量 Y Y 对对 x x 存在回归关系存在回归关系 103.103.具有回归关系的两变量之间对于任一 xi 都不会有一个确切的 yi 与之对应,但为了描述两变量之 间的数量关系,可选当 x=xi 时 Y 的平均数谬角标 Y 乘 X=xi 与之相对应,则称谬角标谬角标 Y Y 乘乘 X X 是是 Y Y 的条的条 件平均数件平均数 104.104.Y1,y2ynY1,y2yn 这这 n n 个数据的离差平方和,记作个数据的离差平方和,记作 SYYSYY,称为总离差平方和,反映了,称为总离差平方和,反映了 n n 个个 yiyi 折的离散程折的离散程 度度 100.100.回归平方和(回归平方和(y y 折折-y-y 拔)平方求和,几座拔)平方求和,几座 SSRSSR。是。是 n n 个个 yiyi 折的离差平方和,反映了折的离差平方和,反映了 n n 个个 yiyi 折的离散折的离散 程度程度 101.101.剩余平方和(残差平方和)剩余平方和(残差平方和) (yi-yiyi-yi 拔)平方求和,记作拔)平方求和,记作 SSeSSe,是除了,是除了 x x 对对 Y Y 的线性影响之外的其他剩的线性影响之外的其他剩 余因素造成的平方和,这些因素中包括余因素造成的平方和,这些因素中包括 x x 对对 Y Y 的非线性影响及试验误差,观察误差等随机因素的非线性影响及试验误差,观察误差等随机因素 102.102.相关分析是对两个或两个以上随见变量之间相互关联程度进行分析的统计学方法相关分析是对两个或两个以上随见变量之间相互关联程度进行分析的统计学方法 103.103.存在于两个随机变量之间的相关关系称为简单相关或单相关,存在于三个或三个以上变量之间的相关存在于两个随机变量之间的相关关系称为简单相关或单相关,存在于三个或三个以上变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论