生物统计附试验设计(期末复习).pdf_第1页
生物统计附试验设计(期末复习).pdf_第2页
生物统计附试验设计(期末复习).pdf_第3页
生物统计附试验设计(期末复习).pdf_第4页
生物统计附试验设计(期末复习).pdf_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 1 生物统计学是数理统计数理统计的原理和方法在生物科学生物科学研究中的应用 是一门应用数学 2 作用 提供整理 分析资料的方法提供整理 分析资料的方法 提供试验提供试验设计设计的方法的方法 生物统计的两个特点 通过样本推断总体 基本特点 有很大的可靠性 但有一定的错误率 3 术语 总体总体 研究对象的全体 样本样本 从总体中抽取的一部分有代表性的个体 抽样 从总体中抽取样本的过程 随机抽样 总体中的每个个体都有相同的机会被抽取作为样本的抽样方式 变量 存在变异的某种可描述或可度量的特征 观测值 对变量的变现进行观察或测量所获得的数值 参数参数 描述总体特征的数 由样本来推断 描述整体随机变量的特性 希腊字母希腊字母 在群体内不变 统计数统计数 描述样本特征的量 由样本估计出 描述样本随机变量的特性 不同样本结果不同 拉丁字母拉丁字母 准确性准确性 度量值度量值与真实值真实值接近的程度 又叫准确度 精确性精确性 同一样品不同观察值不同观察值之间的接近程度 又称精确度 随机误差随机误差 无法控制无法控制的内在和外在因素引起的 也叫抽样误差 影响精确性 由偶然因素引起 不可预测 系统误差系统误差 试验条件引起 又称片面误差 可重复 影响实验的准确性 试验因子 被固定的因子在全试验中保持一致 构成了相对一致的试验条件 被变动变动并设有待比较待比较的一组处理的因子称为试验因素 水平水平 量量的不同级别级别或质质的不同状态状态 4 4 4 4 数据的分类 连续连续型型资料资料 离散离散型型资料资料 计数资料 分类资料 无序 公称尺度 毛色 性别 有序 等级尺度 难产 成绩 疗效 5 条形图 离散型 分类 直方图 连续型 饼图 分类 类别少 线形图 动态变化 散点图 变量间的关系 变化趋势 6 描述性统计量 集中趋势 算术离散趋势 极差 几何方差方差 离均差平方和 自由度 调和标准差标准差 中位数变异系数 众数 离散趋势之间的比较 全距 易计算 易受极端值影响 只利用 2 个值 随样本数增大而增大 方差 计算量 利用所有的观察值 随数据的离散程度变化而变化 但单位不直观 2 标准差 与观察值单位一致 称为平均离差 变异系数 可比较不同单位的数据之间的离散程度 但理论上其性质很复杂 7 小概率事件 小概率事件不发生原理 随机事件的概率表示了随机事件在一次试验中出现的可能性大小 若随机事件的概率很小 例如小 于 0 05 0 01 0 001 称之为小概率事件小概率事件 在统计学上 把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能小概率事件实际不可能 性原理性原理 亦称为小概率原理小概率原理 小概率原理是统计学上进行假设检验 显著性检验 的基本依据 8 dbinom k dbinom k dbinom k dbinom k n n n n p p p p 二项分布概率函数 pbinom k pbinom k pbinom k pbinom k n n n n p p p p 二项分布分布函数 例题 例题 评价两种疫苗 假设疫苗 A 完全无效 则 15 头家畜注射后无发病个体的概率 pbinom 0 15 0 2 假设疫苗B完全无效 则15头家畜注射后最多有1头发病的概率 pbinom 1 15 0 2 猪治疗后所有可能死亡头数所有可能死亡头数的概率 k qnorm 0 03 qnorm 0 03 qnorm 0 03 qnorm 0 03 1 1 880794 qnorm 0 03 1 33 12 86qnorm 0 03 1 33 12 86qnorm 0 03 1 33 12 86qnorm 0 03 1 33 12 86 1 10 35854 12 86 qnorm 0 03 1 3312 86 qnorm 0 03 1 3312 86 qnorm 0 03 1 3312 86 qnorm 0 03 1 33 1 15 36146 10 卡方分布 卡方分布 F F F F 分布 分布 t t t t 分布的概念及特点分布的概念及特点 卡方分布 特征 卡方值无负值 分布于区间 0 具有可加性 卡方分布是非对称分布 分布曲线随自由度大小而改变 自由度越大 分布越趋近对称 3 计算 dchisq u df 高度 pchisq u df 面积 qchisq p p p p df 横坐标 t 分布 特点 t 分布受自由度的制约 每一个自由度都有一条 t 分布密度曲线 t 分布密度曲线以纵轴为对称轴 左右对称 且在 t 0 时 分布密度函数取得最大值 与标准正态分布曲线相比 t 分布曲线顶部略低 两尾部稍高而平 df 越小这种趋势越明显 df 越大 t 分布越趋近于标准正态分布 当 n 30 时 t 分布与标准正态分布的区别很小 n 100 时 t 分布基本与标准正态分布相同 n 时 t 分布与标准正态分布完全一致 计算 dt u df 高度 pt u df 面积 qt p p p p df 横坐标 F 分布 特征 F 分布的平均数等于 1 取值区间为 0 F 分布曲线的形状仅决定于 df1 和 df2 当 df1 1 或 2 时 F 分布曲线呈严重倾斜的反向 J 形 当 df1 3 时 转为左偏曲线 计算 df u df1 df2 高度 pf u df1 df2 面积 qf p p p p df1 df2 横坐标 11 中心极限定理 若随机变量 x 服从平均数是 方差是 2的分布 不是正态分布 x1 x2 xn是由此总体的来的随机样本 则统计量nxx 的概率分布 当 n 相当大时逼近正态分布 N 2 n 12 观察值观察值的标准差与平均数平均数的标准误 标准差 SD 对观察值的离散程度的度量 显示观察值与平均数的接近程度 可 理解 为每个观察值与平均数的离差的平均 可以用于确定总体中大部分观察值所在的范围 正常值正常值 标准误 SE 测量用样本平均数估计总体平均数时的精确程度 用于估计抽样误差抽样误差 反映的是样本平均数抽样分布的离散程度 显示该样本平均数与总体平均数的接近程度接近程度 用于确定估计的总体平均数的置信区间置信区间 13 统计推断 根据样本样本和假定模型假定模型对总体做出的概率形式结论的过程 参数估计参数估计 用样本统计量估计总体参数 参数估计时 必须提供估计的准确度 用标准误和置信区间衡量 点估计点估计 用某样本统计量作为总体参数的估计 4 区间估计区间估计 对参数真值的可能取值范围可能取值范围进行估计 假设检验假设检验 计算样本统计量 以判定我们对总体分布特征的描述正确与否 14 备择假设陈述的是处理组与对照组有区别 但比对照组高还是低未知 双侧检验双侧检验 两尾检验两尾检验 备择假设陈述的是处理组与对照组之间单向的区别 单侧检验单侧检验 单尾检验单尾检验 15 检验统计量计算出的值与某一概率相联系 称为相伴概率相伴概率 P 值 16 I 型错误 正确错判 II 型错误 错误正判 I 型错误的概率 显著水平 易控制 在试验之初就定下来 II 型错误与 样本数 和处理效应大小等有关 不可能太小 n 不可能无限大 II 型错误用 表示 不易计算 理解为处理有效但推断为无效的概率 1 称为检验功效检验功效 指处理有效推断亦为有效 17 配对试验设计 根据实验要求将试验单位两两配对 然后将配成对子的两个试验单位随机分配到 两个处理中 目的 降低组内误差 自身配对自身配对 一个动物的两个部位 同一处理的前后 亲缘配对亲缘配对 全同胞 半同胞等 18 例题例题 单个样本平均数的假设检验P66 例 5 1 母猪的怀孕期为 114 天 今抽测 10 头母猪的怀孕期分别为 116 115 113 112 114 117 115 116 114 113 天 问抽测结果的平均数是否与总体平均数 114 天一致 days c 116 115 113 112 114 117 115 116 114 113 days c 116 115 113 112 114 117 115 116 114 113 days c 116 115 113 112 114 117 115 116 114 113 days t test days mu 114 t test days mu 114 t test days mu 114 t test days mu 114 One Sample t test data days t t t t 1 1 1 1 dfdfdfdf 9 9 9 9 p valuep valuep valuep value 0 34340 34340 34340 3434 alternative hypothesis true mean is not equal to 114 95 percent confidence interval 113 3689113 3689113 3689113 3689115 6311115 6311115 6311115 6311 sample estimates mean of x 114 5 两个样本的假设检验 非配对 P68 例 5 3 某种猪场测定长白和蓝塘后备种猪 90kg 时的背膘厚度 测定结果如表 5 3 所示 设两品种 90kg 时的背膘厚度服从正态分布 且方差相等 问该两品种后备种猪 90kg 时的背膘厚度有无显著差异 bf1bf1bf1bf1 c 1 2 c 1 2 c 1 2 c 1 2 1 32 1 1 1 28 1 35 1 08 1 18 1 25 1 3 1 12 1 19 1 05 1 32 1 1 1 28 1 35 1 08 1 18 1 25 1 3 1 12 1 19 1 05 1 32 1 1 1 28 1 35 1 08 1 18 1 25 1 3 1 12 1 19 1 05 1 32 1 1 1 28 1 35 1 08 1 18 1 25 1 3 1 12 1 19 1 05 bf2bf2bf2bf2 c 2 1 85 1 6 1 78 1 96 1 88 1 82 1 7 1 68 1 92 1 8 c 2 1 85 1 6 1 78 1 96 1 88 1 82 1 7 1 68 1 92 1 8 c 2 1 85 1 6 1 78 1 96 1 88 1 82 1 7 1 68 1 92 1 8 c 2 1 85 1 6 1 78 1 96 1 88 1 82 1 7 1 68 1 92 1 8 t test bf1 y bf2 var equal T t test bf1 y bf2 var equal T t test bf1 y bf2 var equal T t test bf1 y bf2 var equal T var test bf1 bf2 var test bf1 bf2 var test bf1 bf2 var test bf1 bf2 t test bf1 y bf2 var equal F t test bf1 y bf2 var equal F t test bf1 y bf2 var equal F t test bf1 y bf2 var equal F 95 置信区间 5 配对 P71P71P71P71 例例 5 55 55 55 5 用家兔 10 只试验某批注射液对体温的影响 测定每只家兔注射前后的体温 见表 5 6 设体温服 从正态分布 问注射前后体温有无显著差异 tmp1tmp1tmp1tmp1 c 37 8 38 2 38 0 37 6 37 9 38 1 38 2 37 5 38 5 37 9 c 37 8 38 2 38 0 37 6 37 9 38 1 38 2 37 5 38 5 37 9 c 37 8 38 2 38 0 37 6 37 9 38 1 38 2 37 5 38 5 37 9 c 37 8 38 2 38 0 37 6 37 9 38 1 38 2 37 5 38 5 37 9 tmp2tmp2tmp2tmp2 c 37 9 39 38 9 38 4 37 9 39 39 5 38 6 38 8 39 c 37 9 39 38 9 38 4 37 9 39 39 5 38 6 38 8 39 c 37 9 39 38 9 38 4 37 9 39 39 5 38 6 38 8 39 c 37 9 39 38 9 38 4 37 9 39 39 5 38 6 38 8 39 t test tmp1 y tmp2 paired TRUE t test tmp1 y tmp2 paired TRUE t test tmp1 y tmp2 paired TRUE t test tmp1 y tmp2 paired TRUE Paired t test data tmp1 and tmp2 t 5 1893 df 9 p value 0 0005722 alternative hypothesis true difference in means is not equal to 0 95 percent confidence interval 1 0482244 0 4117756 sample estimates meanmeanmeanmean ofofofofthethethethe differencesdifferencesdifferencesdifferences 0 73 19 多个处理平均数间的相互比较为什么不宜用 t 检验法 检验工作量大 若有 k 个处理 则要做 Ck2 次检验 无统一的试验误差 误差估计的精确性和检验的灵敏性低 推断的可靠性低 检验的 型错误率大 20 什么是方差分析 答 方差分析是将 k k k k 个处理个处理的观测值作为一个整体看待 把观测值总变异的平方和及自由度平方和及自由度分解为相 应的不同变异来源的平方和及自由度 进而进而获得不同变异来源总体方差估计值总体方差估计值 通过计算这些总体方 差的估计值的适当比值适当比值 检验各样本所属总体平均数是否相等 其实质上关于观测值变异原因的数量 分析 在科学研究中应用十分广泛 21 举例说明试验指标 试验因素 因素水平 试验处理 试验单位 重复等常用名词的含义 试验指标试验指标 试验测定的项目或者性状 衡量试验结果 好坏 或处理效应 高低 日增重 产仔数 试验因素试验因素 影响试验指标的因素 如温度 营养水平 试验水平试验水平 试验因素所处的特定状态状态或数量等级等级称为因素水平 简称水平 如日粮中粗蛋白质含量 试验处理试验处理 实施在试验单位上的具体项目 简称处理 比如 进行饲料比较试验 实施在某种畜禽的 具体项目 饲喂某种一种饲料 单因素试验 是试验因素的一个水平 多因素试验 是试验因素的一个水平组合 试验单位试验单位 试验载体 如一只家禽 一只鱼 重复重复 一个处理实施在两个或两个以上的试验单位上 称为处理有重复 试验的单位数称处理的重复 数 如用某种饲料喂 4 头奶牛 就是说这个处理有 4 次 22 方差分析的基本假定 效应的可加性效应的可加性 分布的正态性分布的正态性 方差的同质性方差的同质性 一般而言 具有了方差的同质性 同时就具有效应的可加性和分布的正态性 23 方差分析的基本步骤 1 计算各项平方和与自由度 2 列出方差分析表 进行 F 检验 6 3 若 F 检验显著 则进行多重比较 变异来源平方和自由度均方F 值 组间 处理 SSAdfAMAS SSA dfAMSA MSE 组内 误差 SSEdfEMAE SSE dfE 总变异SSTdfT 24 多重比较 方差分析差异显著或极显著时 进行多个平均数两两间的相互比较 最小显著差数法 LSD 最小显著极差法 LSR 25 例题 P96P96P96P96 例例 6 36 36 36 35 个品种若干头母猪的窝产仔数的差异是否显著 ls c 8 13 12 9 9 7 8 10 9 7 13 14 10 11 12 13 9 8 8 10 12 11 15 14 13 ls c 8 13 12 9 9 7 8 10 9 7 13 14 10 11 12 13 9 8 8 10 12 11 15 14 13 ls c 8 13 12 9 9 7 8 10 9 7 13 14 10 11 12 13 9 8 8 10 12 11 15 14 13 ls c 8 13 12 9 9 7 8 10 9 7 13 14 10 11 12 13 9 8 8 10 12 11 15 14 13 bred as factor rep 1 5 each 5 bred as factor rep 1 5 each 5 bred as factor rep 1 5 each 5 bred as factor rep 1 5 each 5 case1 aov ls bred case1 aov ls bred case1 aov ls bred case1F bred473 218 305 8285 8285 8285 8280 0028130 0028130 0028130 002813 Residuals2062 83 14 Signif codes 0 0 001 0 01 0 05 0 1 1 26 数据转换 分布的非正态性和方差的不同质性经常相伴出现 我们可以考虑利用某种数据转换 使得转换后的数据具有方差同质性 而非正态性的缺陷也同时得到改善 平方根转换平方根转换 适用范围 方差与平均数之间有某种比例关系 总体呈泊松分布 对数转换 适用范围 标准差或全距与平局数成比例 效应为相乘性或非加性 反正弦转换 适用范围 服从二项分布的资料 如 发病率 死亡率 倒数转换 适用范围 生存时间 27 两因素资料的分类 交叉分组交叉分组 系统分组系统分组 28 简单效应简单效应 在某因素同一水平上 另一因素不同水平对试验指标的影响 主效应主效应 由于因素水平的改变而引起的平均数的改变量 交互作用交互作用 在多因素试验中 一个因素的作用要受到另一个因素的影响 表现为某一因素在另一 因素的不同水平上所产生的效应不同 这种现象称为该两因素存在交互作用 29 对频率的检验 Z 检验 置信区间法 7 对频数的检验 卡方检验 单样本 适合性检验 多样本 独立性检验 适合性检验适合性检验 判断实际观察的属性类别分配属性类别分配是否符合已知属性类别分配理论或学说的假设检验 例题 P139 例 7 1 毛色 color matrix c 79 181 1 2 color matrix c 79 181 1 2 color matrix c 79 181 1 2 color matrix c 79 181 1 2 prop test color p 0 25 prop test color p 0 25 prop test color p 0 25 prop test color p 0 25 独立性检验 根据次数资料判断两类因子彼此相关或相互独立的假设检验 30 简单线性回归 用最能代表散点图中数据点的直线描述两随机变量两随机变量的关系 X 和 Y Y a bX x x x x c 80 86 98 90 120 102 95 83 113 105 110 100 c 80 86 98 90 120 102 95 83 113 105 110 100 c 80 86 98 90 120 102 95 83 113 105 110 100 c 80 86 98 90 120 102 95 83 113 105 110 100 y y y y c 2350 2400 2720 2500 3150 2680 2630 2400 3080 2920 2960 2860 c 2350 2400 2720 2500 3150 2680 2630 2400 3080 2920 2960 2860 c 2350 2400 2720 2500 3150 2680 2630 2400 3080 2920 296

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论