生物统计学总复习_第1页
生物统计学总复习_第2页
生物统计学总复习_第3页
生物统计学总复习_第4页
生物统计学总复习_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学总复习 生物统计学总复习 20112011 生物统计学是指导我们如何利用生命活动中表现出的数量现象 由样本信息推断总 体特征的方法论和技法 贯彻通篇的主线是 如何由样本推断总体 一切概念的引出 一切方法的建立都是为了实现 由样本推断总体 都是为了保证 由样本推断总体 的 过程过程经济有效 都是为了保证 由样本推断总体 的结果结果真实可靠 全面理解 样本 总体 推断 三者的概念 应用 联系是掌握生物统计学的 基础 是理解统计原理 统计方法的基础 是联系统计原理与统计方法的纽带 实验单位 抽样 总体参数 大数定律 中心极限定理 总体分布 抽样分布 无效假设推断 点估计 区间估计 置信区间 局部控制 正交设计 等等 有些是为了描述 定义 由样本推断总体 的过程过程 有些是为了实 现 由样本推断总体 而建立的方法方法 因此 在理解和掌握的过程中 只有与 由样本 推断总体 紧密联系 才能真正理解和掌握 第一章 绪论第一章 绪论 一 基本概念 一 基本概念 1 生物统计学 生物统计学 是应用数理统计的原理和方法来分析和解释生物界数量现象的科学 2 描述性统计 描述性统计 对原始资料进行整理并作基本分析 3 总体与样本 总体与样本 根据研究目的确定的 符合指定条件的全部观察对象称为总体 构成总体的每一个基 本单元 称为该总体的个体 4 总体和个体 举例 总体和个体 举例 把所研究的对象的全体称为总体 把总体中的每一个基本单位称为个体 参考举例 如考察某一地区冬小麦越冬前的苗高 则该地区所有小麦即为总体 每一株小麦苗即为 个体 5 随机抽样与随机样本 随机抽样与随机样本 所谓随机抽样是指抽样时 不搀杂人们的主观愿望 总体中每一个个体被抽 取的机会均等 由随机抽样而得的样本 称随机样本 6 样本和随机样本 样本和随机样本 从总体中抽取一部分个体称为样本 生物统计学就是要用样本的信息对总体作出 推断 为了保证样本信息能够真实 可靠地反映总体 在抽样时必须遵循样本抽取的随机性原则 即 要求每一个样本值与总体有相同的概率分布 且不同样本值之间相互独立 称这样的样本为 简单随 机样本 简称随机样本 7 参数与统计量 参数与统计量 从总体中计算所得的特征数值 如总体平均数 总体标准差称为参数 从样本中计 算所得的特征数值称为统计量 它是总体参数的估计值 8 试验误差 试验误差 由样本推断总体时 试验抽样中由非处理因素对观测指标产生的影响 可用误差平方和 误差军方来定量描述 试验误差试验误差的大小会影响对处理效应的判断 因此在由样本推断总体时 需要对 试验误差进行控制 根据实验误差的来源和可控性又可分为系统误差系统误差和随机误差随机误差 9 系统误差或错误 系统误差 系统误差或错误 系统误差是指在试验过程中 人为的作用所引起的差错 如试验人员粗心大意 使仪器矫正不准 药品配制比例不当 称量不准确等都是人为因素造成的 在试验中完全可以避免的 随机误差 随机误差 由于无法控制的随机因素所引起的差异是不可避免的 称之为机误或随机误差 试验中随 机误差只能设法减小 而不能完全消灭 增加抽样或试验次数 可以降低随机机误的数值 10 变异系数 变异系数 衡量不同样本间 或不同性状样本间变异程度的变异量数 为样本标准差对样本平均 数的百分比 CV S 11 效应 效应 效应是用于描述因子对观测指标的影响而建立的概念 其大小可用平方和或方差定量描述 即引起试验差异的作用称为效应 如不同饲料使动物的体重增加表现出差异 不同品种的玉米产量不同 等 12 互作 互作 是指两个或两个以上的因子同时存在时互相影响 不能各自独立地对观测指标产生影响 也 称连应 是指两个或两个以上处理因素间的相互作用产生的效应 如氮 磷肥并施会对作物产量产生互 作效应 如果氮 磷共施的产量效应大于氮 磷单施效应之和 说明氮 磷互作为正效应 如果氮 磷共 施的产量效应小于氮 磷单施效应之和 说明氮 磷互作为负效应 二 基本问题二 基本问题 1 生物统计学的研究内容包括统计哪些 统计原理 统计方法和试验设计 2 生物统计学核心内容是什么 如何从样本推断总体 3 生物统计学所研究的对象构成的总体有什么基本特征 是有变异的总体 既是在同质的对象中往往 也存在差异 4 生物统计与试验设计的关系是什么 是不可分割的统一整体 试验设计需要以统计的原理和方法 为基础 而正确设计的试验又为统计方法提供可靠的信息 5 统计方法的主要内容可分为哪三个主要方面 描述性统计 显著性检验 相关与回归 6 生物统计学基本功用包括哪些 科学地整理分析数据 判断试验结果的可靠性 确定事物之间的相 互关系 提供试验设计的原则 为学习相关学科提供基础 7 生物统计学的研究内容包括哪些 统计原理 统计方法和试验设计 统计原理阐述统计理论和有关 公式 以满足统计方法的需要 统计方法的应用 旨在对客观事物得出本质的和规律性的认识 试验设 计是试验工作前应用统计原理 制定科学的试验方案和方法 8 由样本的统计数来推断总体的参数时 要求统计数既有 准确性 又有 精确性 解释 准确性 和 精确性 的概念和二者的区别 统计工作是用样本的统计数来推断总体的参数 我们用统计数接 近参数真值的程度 来衡量统计数 准确性 高低 用样本中各个变数间变异程度的大小 来衡量该样本 精确性 的高低 因此 准确性就不等于精确性 准确性是说明测定值对真值的符合程度大小 而精确 性却是多次测定值的变异程度 9 举例说明效应与互作的概念 效应是用于描述因子对观测指标的影响力而建立的概念 其大小可用 平方和或方差定量描述 引起试验差异的作用称为效应 如不同饲料使动物的体重增加表现出差异 不 同品种的玉米产量不同等 互作是指两个或两个以上的因子同时存在时互相影响 不能各自独立地对观 测指标产生影响 也称连应 是指两个或两个以上处理因素间的相互作用产生的效应 如氮 磷肥并施 会对作物产量产生互作效应 如果氮 磷共施的产量效应大于氮 磷单施效应之和 说明氮 磷互作为正 效应 如果氮 磷共施的产量效应小于氮 磷单施效应之和 说明氮 磷互作为负效应 第二章 绪论第二章 绪论 一 基本概念 一 基本概念 1 数量性状 数量性状资资料 料 数量化的生物性状资料 简称数性资料 一般包括计量资料和计数资料两类 2 计计量量资资料 料 能够用度量衡等计量工具直接测定的数性资料 在一定取值范围内 可能取任何整数或小 数值 也称连续性变数资料 3 计计数数资资料 料 是指用计数方式而得来的数性资料 在这类资料中 每一个变数必须以整数来表示 两整 数间的数值是不连续的 因此不具有小数 也称间断性变数资料 答离散性变数资料或非连续性变数资 料均可 4 质质量性状量性状资资料 料 是指一些能观察到而不易直接测量的性状 如颜色 性别 生死 状态等 简称质性资 料 对于质量性状的分析 必须先将质量性状数量化 5 连续连续型型变变数数资资料 即料 即计计量量资资料 料 是指能够用度量衡等计量工具直接测定的数性资料 在一定取值范围 内 可能取任何整数或小数值 6 离散型 离散型变变数数资资料 料 是指计数资料和质量性状资料 即用计数方式而得来的数性资料 或数量化的质量 性状资料 在这类资料中 每一个变数必须以整数来表示 两整数间的数值是不连续的 因此不具有小 数 也称间断性变数资料 或非连续性变数资料 7 资资料的整理分析料的整理分析 就是要把大量复杂的数据进行整理归类 使其系统化 便于统计分析 从而得出正 确的科学结论 8 依次表 依次表 原始数据按数值的大小依次排列起来 由小到大以表格形式表示 称为依次表 9 频频次分布表 次分布表 将大样本的原始数据进行分组归类 用表格表示出来称为频次分布表 10 基本集中量数 基本集中量数 衡量样本或总体取值集中性的统计量 包括平均数 中位数 众数等 最重要的是平 均数 11 平均数 平均数 是最重要的基本集中量数 是衡量样本或总体取值集中性的统计量 12 变变异量数异量数 衡量样本或总体内个体间变异程度的统计量 有极差 平局差 平方和 变异系数 方差和 标准差 最重要的是方差和标准差 13 平方和 平方和 将样本 或总体 中每一个个体的取值与样本 或总体 平均数之差的平方求和 称之为离均 差平方和 简称平方和 14 方差 方差 是一种变异量数 对样本为 对于总体为 15 标标准差 准差 是一种变异量数 对样本为 对于总体为 16 变变异系数 异系数 衡量不同样本间 或不同性状样本间变异程度的变异量数 为样本标准差对样本平均数的 百分比 CV S 二 问题 二 问题 1 为什么要进行资料的分类 为什么要进行资料的分类 资料的分类是统计归纳的基础 若不进行分类 大量的原始资料就不能系统化 规格化 只有根据 科学原理来分类 才能使资料正确地反映出事务的本质和规律 2 原始数据在整理之前 首先要对全部数据进行检查和核对 最常见的数据差错原因有那些 原始数据在整理之前 首先要对全部数据进行检查和核对 最常见的数据差错原因有那些 3 简述数据整理的方法 简述数据整理的方法 答 首先是按照一定的标志 把记载的数据分门别类的分成若干部分 把同一现象 同一类型的数 据进行合并 使它们与其他现象 其他类型区别开来 另外 在数据整理时 要注意数据的完整性 真实性和准确性 对个别极大和极小的数值要反复核 实 力求确实可靠 原始数据的整理 其结果需要用数字来表明 可将整理的数据制成依次表 4 数据整理的作用 数据整理的作用 可以按不同的标志把数据的特征反映出来 以便于进一步运用各种统计方法进行计算 来研究它们 的规律性和相互关系 5 分组频次分布表和分组频次分布图 分组频次分布表和分组频次分布图 原始数据经整理 在依次表的基础上 根据数据的多少进行分组归类 统计各组变数的频数 制成 较有规律的分组频次分布表 并根据分组频次分布表作出分组频次分布图 频数分布表和分组频数分布 图可直观地反映变数的取值规律 同时便于进一步的统计分析 6 间断性变数资料的整理与分组 间断性变数资料的整理与分组 间断性变数资料的整理与分组通常采用单项式分组法 特点是用样本变数的自然值进行分组 将数 据中每个变数分别归入相应的组内 然后制成频次分布表 由整理所得的频次分布表 可以了解数据的集中和变异情况 便于进一步计算与分析 7 连续性变数资料的整理与分组 连续性变数资料的整理与分组 连续性变数资料的整理与分组是采用组距式分组法 在分组前需要确定全距 组数 组距 组 中值和组限 然后将每个变数分别归入相应的组内 然后制成频次分布表 由整理所得的频次分布表 可以了解数据的集中和变异情况 便于进一步计算与分析 8 依次表和频次分布表在什么时候使用 二者有什么区别 依次表和频次分布表在什么时候使用 二者有什么区别 在原始数据的整理分析时 通常使用依次表和频次分布表来表示对原始数据整理的结果 样本较小 时用依次表表示 样本较大时使用频次分布表表示 从依次表和频次分布表中可以初步看出样本取值的 规律 第三章 概率 随机变量及其分布第三章 概率 随机变量及其分布 一 基本概念 一 基本概念 1 随机抽样 随机抽样 在 由样本推断总体 中 获得有效样本的方法 即使得总体中每一个个体都有均等的被 抽到可能 2 随机试验 随机试验 用来描述随机抽样 及生物属性数量化的过程 即观察者 研究者 采取一定的手段和方 法 有目的地观察 记录随机现象的过程 3 随机现象 随机现象 用来描述随机抽样的结果 站在观察者 研究者 的角度 我们把有着多种变异结果的生 命现象 叫做随机现象 即在一定的条件下具有多种可能结果而究竟出现哪一种结果是事先不可预言的 现象叫做随机现象 4 随机事件 随机事件 用来描述一次随机抽样的结果 随机现象的每一个结果叫做一个随机事件 简称为事件 对于同一随机现象进行研究 讨论的范围不同 考虑问题的角度不同 就会产生不同的结果 因而得到 不同的随机事件 5 随机变量 随机变量 用来描述随机抽样的所有可能结果 随机事件 通常用一个变量 X 表示随机现象的所用 可能结果 X 取不同的数值就表示不同的事件发生 但 X 究竟取什么值预先是不知道的 它取任一值都 有确定的概率 其所有可能取值的概率之和为 1 将这样的变量定义为随机变量 或答 设随机试验的样本空间是 如果对于每一个 有一个实数 X 和它对应 这样就得到 一个定义在 上的实值单值函数 X 我们称之为随机变量 6 离散型随机变量 离散型随机变量 如果随机变量的取值是有限个或可数个 则称为离散型的随机变量 或答 描述离散性 间断性 变数资料的随机变量 7 连续型的随机变量 连续型的随机变量 如果随机变量的取值是无数个或不可数 不能按照一定的顺序一一列举出来 则称为非离散型的随机变量 非离散型的随机变量牵涉的范围很广 其中最重要的也是实际工作中经常 遇到的是连续型的随机变量 即描述连续性变数资料的随机变量 8 事件的概率 事件的概率 用来刻画随机事件发生可能性大小的数量指标 简称概率 事件的概率是客观存在的 是不依人的主观意志为转移的 事件 A 的概率用 P A 表示 并且规定 0 P A 1 9 概率分布 概率分布 用来描述针对随机现象的随机试验中全部可能的结果 事件 的概率 即用来描述随机变 量取值的概率的数学模型 由于它实质上是将 100 的可能性在各随机事件上进行分配 因此也称概率 分配 或答 将随机变量的一切可能取值以及取得这些值的概率全部表示出来 称为随机变量的概率分布 简 称概率分布 概率分布可以用函数式表示 也可以用表格或图来表示 10 概率函数 概率函数 离散型随机变量概率分布的函数表示 要了解离散型随机变量 x 的统计规律 就必须知 道它的一切可能值 xi及取每种可能值的概率 pi 如果我们将离散型随机变量 x 的一切可能取值 xi i 1 2 及其对应的概率 pi 记作 f x P X xi pi i 1 2 则称上式为离散型随机变量 x 的概率分 布 即概率函数 11 概率密度函数 概率密度函数 描述连续型随机变量在某个区间取值的概率的密度函数 连续型随机变量 如体长 体重 蛋重 的概率分布不能用分布列来表示 因为其可能取的值是不可数的 我们改用随机变量 x 在某个区间内取值的概率 P a x b 来表示 即用概率密度函数来表示 1 0 dxxfdxxf Xxxf的任一可能取值是 12 概率分布函数 概率分布函数 描述随机变量取值小于等于某值的概率的函数 也称累计分布函数 即可用于描述 离散型随机变量的概率分布 又可用于描述连续型随机变量的概率分布 离散型随机变量的概率分布函数 xy yfxXPxF 连续型随机变量的概率分布函数 ydyfxXPxF x 13 统计规律 统计规律 单独一次的不肯定性和累积结果的有规律性常常出现于科学实验之中 把这种规律性 称为统计规律 14 数学期望 数学期望 描述随机变量取值的平均状况的数字特征 设离散型随机变量 X 的概率分布是 P X xk pk k 1 2 若级数 xk pk收敛 则称级数 xk pk 的和为 X 的数学期望 记为 EX 即 EX xk pk 设 X 为连续型随机变量 分布密度为 p x 若积分 xp x dx 绝对收敛 则称该积分为连续型随机变 量 X 的数学期望 记作 EX 方差 方差 度量总体 或样本 各变量间变异程度的参数 总体 或统计量 样本 15 二点分布 二点分布 16 二项分布 二项分布 17 几何分布 几何分布 18 泊松分布 泊松分布 19 正态分布 正态分布 常用的随机抽常用的随机抽样样方法 方法 主要有纯随机抽样 分层抽样 系统抽样 整群抽样 多阶段抽样等 纯纯随机抽随机抽样样 又称简单随机抽样 是最基本的抽样方法 分为重复抽样和不重复抽样 在重复抽样中 每次抽中的 单位仍放回总体 样本中的单位可能不止一次被抽中 不重复抽样中 抽中的单位不再放回总体 样本 中的单位只能抽中一次 社会调查采用不重复抽样 纯随机抽样的具体作法有 抽签法 将总体的全部单位逐一作签 搅拌均匀后进行抽取 随机数 字表法 将总体所有单位编号 然后从随机数字表中一个随机起点 任一排或一列 开始从左向右或从 右向左 向上或向下抽取 直到达到所需的样本容量为止 纯随机抽样必须有一个完整的抽样框 即总体各单位的清单 总体太大时 制作这样的抽样框工作 量巨大 加之有许多情况 使总体名单根本无法得到 故在大规模社会调查中很少采用纯随机抽样 分分层层抽抽样样 先依据一种或几种特征将总体分为若干个子总体 每一子总体称作一个层 然后从每层中随机抽取一 个子样本 这些子样本合起来就是总体的样本 各层样本数的确定方法有 3 种 分层定比 即各层样 本数与该层总体数的比值相等 例如 样本大小 n 50 总体 N 500 则 n N 0 1 即为样本比例 每层均按 这个比例确定该层样本数 奈曼法 即各层应抽样本数与该层总体数及其标准差的积成正比 非比 例分配法 当某个层次包含的个案数在总体中所占比例太小时 为使该层的特征在样本中得到足够的反 映 可人为地适当增加该层样本数在总体样本中的比例 但这样做会增加推论的复杂性 总体中赖以进行分层的变量为分层变量 理想的分层变量是调查中要加以测量的变量或与其高度相 关的变量 分层的原则是增加层内的同质性和层间的异质性 常见的分层变量有性别 年龄 教育 职业 等 分层随机抽样在实际抽样调查中广泛使用 在同样样本容量的情况下 它比纯随机抽样的精度高 此外管理方便 费用少 效度高 系系统统抽抽样样 又称等距抽样 是纯随机抽样的变种 在系统抽样中 先将总体从 1 N 相继编号 并计算抽样距离 K N n 式中 N 为总体单位总数 n 为样本容量 然后在 1 K 中抽一随机数 k1 作为样本的第一个单位 接着取 k1 K k1 2K 直至抽够 n 个单位为止 系统抽样要防止周期性偏差 因为它会降低样本的代表性 例如 军队人员名单通常按班排列 10 人 一班 班长排第 1 名 若抽样距离也取 10 时 则样本或全由士兵组成或全由班长组成 整群抽整群抽样样 又称聚类抽样 先将总体按照某种标准分群 每个群为一个抽样单位 用随机的方法从中抽取若干 群 抽中的样本群中所有单位都要进行调查 与分层抽样相反 整群抽样的分类原则是使群间异质性小 群内异质性大 分层抽样时各群 层 都有样本 整群抽样时只有部分群有样本 整群抽样只需列出入样 群的单位 因此可节约大量财力 人力 整群抽样的代表性低于简单随机抽样 多多阶阶段抽段抽样样 又称多级抽样 前 4 种抽样方法均为一次性直接从总体中抽出样本 称为单阶段抽样 多阶段抽样 则是将抽样过程分为几个阶段 结合使用上述方法中的两种或数种 例如 先用整群抽样法从北京市某 中等学校中抽出样本学校 再用整群抽样法从样本学校抽选样本班级 最后用系统或纯随机抽样从样本 班级的学生中抽出样本学生 当研究总体广泛且分散时 多采用多阶段抽样 以降低调查费用 但由于 每级抽样都会产生误差 经多级抽样产生的样本 误差也相应增大 二 问题 二 问题 1 成为一个随机试验需要满足的三个特性是什么 成为一个随机试验需要满足的三个特性是什么 1 试验可以在相同条件下多次重复进行 2 每次试验的可能结果不止一个 并且事先知道会有哪些可能的结果 3 每次试验总是恰好出现这些可能结果中的一个 但在一次试验之前却不能肯定这次试验会出现哪一 个结果 2 刻画事件发生可能性大小的数量指标至少应该满足的两个要求 刻画事件发生可能性大小的数量指标至少应该满足的两个要求 它应该是事件本身所固有的 不依人的主观意志为转移的一种客观的度量 而且在相同条件下可以 通过大量的重复试验予以识别和检验 如果事件 B 包含事件 A 则事件 A 发生的可能性就不会大于事件 B 发生的可能性 必然事件的值应 该最大 不可能事件的值应该最小 3 简答离散型随机变量的概率分布和连续型随机变量的概率分布在表示方式 形式 上的区别和特点 简答离散型随机变量的概率分布和连续型随机变量的概率分布在表示方式 形式 上的区别和特点 答 离散型随机变量的概率分布可用函数式表示 因离散型随机变量结果的有限性或可数性 故常 用表格来表示 每一个结果对应着一个概率 连续型随机变量的概率分布也可用函数式表示 因连续型 随机变量结果的无限性和不可数性 其概率分布无法用表格表示 通常采用坐标曲线图来表示 不能显 示每一个结果和对应的概率 而是显示 a X b 的概率 4 统计学中常用的离散型随机变量的概率分布有哪些 说明它们各自的特征 统计学中常用的离散型随机变量的概率分布有哪些 说明它们各自的特征 答 统计学中常用的离散型随机变量的概率分布有二点分布 二项分布 几何分布和泊松分布 它 们各自的特征如下 二点分布 二点分布 随机变量的取值只有两个 且互为对立事件 概率常用 p 和 q 表示 p 1 q 两点分 布又称伯努利分布 为纪念瑞士科学家詹姆斯 伯努利 Jacob Bernoulli 或 James Bernoulli 而命名 二二项项分布 分布 是从二点分布总体中随机独立抽样的抽样分布 抽样结果的概率分布 从二项分布 总体中随机独立重复抽样 每次抽 n 个个体 抽样结果是观察某一事件 A 2 个对立事件之一 或 2 种 结果之一 发生的次数 则一切可能次数的概率是有规律的 这一规律可以用一个函数式表示 P A 发生的次数 Cnkpkqk 1 从同一个二点总体中随机抽样 不同的抽样方式 即 n 不同 则结果服从不同的二项分布 或者说 一个二点总体 因抽样方式 n 不同 而对应着许许多多个二项分布 几何分布 几何分布 是从二点分布总体中随机独立抽样的抽样分布 抽样结果的概率分布 从二项分布 总体中随机独立重复抽样 每次抽一个个体 抽样结果是观察某一事件 2 个对立事件之一 或 2 种结 果之一 首次发生在第几次 则所有可能结果的概率是有规律的 这一规律可以用一个函数式描述 P X k pqk 1 k 0 1 p 1 q 称为几何分布 一个二点总体对应着一个几何分布 泊松分布 泊松分布 是从已知生物平均密度的总体 面积 体积 时间等 中随机独立抽样的抽样分布 抽 样结果的概率分布 从已知生物平均密度的总体 面积 体积 时间等 中随机独立抽样 每次抽 n 个单 位 抽样结果是观察 n 个单位中生物个体的数目 则所有可能结果的概率是有规律的 这一规律可以用 一个函数式描述 Pk CkN D V k V D V N k 称为泊松分布 一个已知生物平均密度的总体 因抽样方式 n 不同 而对应着许许多多个泊松分布 5 简答正态分布和标准正态分布的特征 简答正态分布和标准正态分布的特征 答 正态分布是生物数量性状中常见的概率分布 用坐标曲线图表示时 有以下特点 曲线呈钟形 x 轴为渐进线 x 时 曲线关于直线 x 对称 在 x 处曲线达到最大值 在 x 处曲线有拐点 正态分布的密度曲线与 x 轴之间的面积等于 1 而且曲线下介于 x x1到 x x2之间的面积等 于随机变量落于区间 x1 x2 的概率 正态分布是依赖于两个参数 和 2的一族分布 定义 0 和 2 1 的正态分布为标准正态分布 或答 正态分布是具有两个参数 和 2的连续型随机变量的分布 第一参数 是遵从正态分布的随机变 量的均值 第二个参数 2是此随机变量的方差 所以正态分布记作 N 2 遵从正态分布的随机变 量的概率规律为取 邻近的值的概率大 而取离 越远的值的概率越小 越小 分布越集中在 附 近 越大 分布越分散 正态分布的密度函数的特点是 关于 对称 在 处达到最大值 在正 负 无 穷远处取值为 0 在 处有拐点 它的形状是中间高两边低 图像是一条位于 x 轴上方的钟形曲线 当 0 2 1 时 称为标准正态分布 记为 N 0 1 6 简答数学期望及其性质 简答数学期望及其性质 答 描述随机变量取值的平均状况的数字特征 有以下性质 对任意常数 C 来说 EC C 设 X 是随机变量 C 是常数 则 E CX C EX 设 X 和 Y 是任意两个随机变量 则有 E X Y EX EY 设 X 和 Y 是相互独立的两个随机变量 则有 E XY EX EY 7 利用标准正态分布的概率表可以查找标准正态总体中某一取值的累积概率 对于无穷多个非标准正标准正态分布的概率表可以查找标准正态总体中某一取值的累积概率 对于无穷多个非标准正 态总体 为什么也可以态总体 为什么也可以利用标准正态分布的概率表查找已知总体参数 总体期望和总体方差 的非标标准正态分布的概率表查找已知总体参数 总体期望和总体方差 的非标 准正态总体某一取值的累积概率 准正态总体某一取值的累积概率 答 因为对于非标准正态总体 只要已知其 总体期望和总体方差 即可利用标准化公式 将非 X U 标准正态总体的每一个取值 x 都转化为标准正态总体中的对应取值 u u 的累积概率等于 x 的累积概率 因此在一般的正态分布中某一区间的概率也可以转化成标准正态分布中相应范围内的概率 所以正态 分布的查表求概率只需要编制标准正态分布的概率表一个表即可 1 基本事件有一个重要的性质 就是在一次试验中只能发生基本事件中的一个 换句话说 在一次试 验中两个和两个以上的基本事件不可能同时发生 2 随机变量的数字特征中 最重要的两个是数学期望和方差 第四章 抽样分布及统计推断原理第四章 抽样分布及统计推断原理 一 基本概念 一 基本概念 1 样本统计量 样本统计量 由样本信息 资料 计算 或构造的用以估计总体参数 或反映总体取值规律的特征量 通过随机抽样研究总体时 研究的目的不同 观察的角度不同 抽样方式会不同 抽样结果的表示形式 也不同 我们将数量化的抽样结果统称为样本统计量 简称统计量 样本统计量也是随机变量 如样本 均数 方差 标准差 相关系数等 还可以有其它的形式 如 2 t F 等 其分布规律也可以是多样的 如 2 分布 t 分布 F 分布等 2 抽样分布 抽样分布 样本统计量的概率分布 3 假设检验 假设检验 是数理统计学中根据一定假设条件由样本推断总体的一种方法 具体作法是 根据问题 的需要对所研究的总体作某种假设 记作 H0 选取合适的统计量 这个统计量的选取要使得在假设 H0 成立时 其分布为已知 由实测的样本 计算出统计量的值 并根据预先给定的显著性水平进行检验 按 照 小概率原理 作出拒绝或接受假设 H0的判断 因为是基于小概率原理作出的推断 不能作出对假设 H0的无偏差推断 只能判断总体间的差异是否显著 但已能满足生物学研究 或生产实践中对总体推断 的需要 常用的假设检验方法有 u 检验法 t 检验法 X2检验法 F 检验法 秩和检验等 6 小概率原理 小概率原理 小概率事件在一次观测中可以认为基本上不会发生 如果一次观测就发生了小概率事 件 我们就认为这个现象是不合理的 7 大数定律 大数定律 随着样本容量 n 的增加 一个总体 X 的随机样本的平均数与总体的期望值的偏差小于任 给定的 很小的 数的概率将趋近于 1 8 中心极限定理 中心极限定理 无论一个总体的分布如何 只要它有有限的方差 那么当样本的容量 n 相当大时 样 本平均数将近似地服从正态分布 二 问题 1 简单阐述统计量 举例 简单阐述统计量 举例 答 由样本信息 资料 计算 或构造的用以估计总体参数 或反映总体取值规律的特征量 通过随机 抽样研究总体时 研究的目的不同 观察的角度不同 抽样方式会不同 抽样结果的表示形式也不同 我 们将数量化的抽样结果统称为样本统计量 简称统计量 因抽样的随机性 样本统计量也是随机变量 最基本的统计量是按一定样本容量进行抽样的样本平均数和样本方差 样本平均数统计量表示按一定 样本容量从一总体中进行随机抽样 所有可能的样本平均数取值 样本方差统计量则表示按一定样本容 量从一总体中进行随机抽样 所有可能的样本方差取值 统计量还可以有其它的形式 如 标准差 相关 系数 2 t F 等 其分布规律也可以是多样的 如 2 分布 t 分布 F 分布等 2 显著性检验中 最重要的三个抽样分布是什么 它们各自的基本特征是什么 显著性检验中 最重要的三个抽样分布是什么 它们各自的基本特征是什么 答 显著性检验中 最重要的三个抽样分布是 x2分布 t 分布 F 分布 均为从正态总体中进行随机 抽样的样本统计量的概率分布 x2分布的基本特征 分布在一象限内 呈正偏态 随着自由度的变化而形成一簇分布形态 且随着 自由度的增加而由正偏态分布趋于正态分布 平均取值和方差依自由度而变化 平均数等于自由度 方 差等于二倍自由度 t 分布 为一簇平均取值为零 方差大于 1 的正态分布 且随着自由度的增加而趋于标准正态分布 F 分布 F 分布在一象限内 呈正偏态 随着两个自由度的的增大 趋近于正态分布 一般情况下 F 分布的均值接近 1 方差一般都小于 1 且随两自由度的增大越来越小 3 大数定律告诉我们什么 大数定律告诉我们什么 答 大数定律 随着样本容量 n 的增加 一个总体 X 的随机样本的平均数与总体的期望值的偏差小 于任给定的 很小的 数的概率将趋近于 1 这个定律告诉我们 不管随机变量总体的分布如何 只要样本的容量充分大 样本平均数一般来说 总能够与总体的期望值相当接近 4 中心极限定理告诉我们什么 中心极限定理告诉我们什么 答 中心极限定理 无论一个总体的分布如何 只要它有有限的方差 那么当样本的容量 n 相当大时 样本平均数将近似地服从正态分布 这个定律告诉我们 对于来自任何具有有限方差和期望值的总体的随机样本的平均值 只要样本的 容量足够大 就可以认为它近似地服从期望值为 方差为 2 2 的正态分布 5 简述正态分布在生物统计中的重要性 简述正态分布在生物统计中的重要性 答 在生物统计的理论与实践中正态分布占有重要的地位 之所以如此 一方面在于许多生物现象 所形成的随机变量的总体都相当好地接近于正态分布 另一方面 由关正态分布的理论研究已经比较成 熟 使我们能够比较容易地实现对正态总体从样本到总体的推断 正因为如此 生物统计中的大量理论 和方法都是以正态总体及其抽样分布为基础展开的 6 在生物统计上最基本的问题是由样本观测值对总体的某些特征进行 为什么将这一推断称为统计推 在生物统计上最基本的问题是由样本观测值对总体的某些特征进行 为什么将这一推断称为统计推 断 断 答 由于样本的随机性 样本观测值不可避免地会出现抽样误差 这样一来 利用样本观测值来推 断总体时与通常的数学推理就不大一样 一般这种推断没有一个百分之百肯定的结论 是在一定概率下 成立的推断 且因抽样结果的随机性 重复抽样可能会有不同的结果 总是带有随机的特点 因此称这类 推断为统计推断 以区别于数学推理 7 统计推断原理 统计推断原理 统计推断即假设检验 是数理统计学中根据一定假设条件由样本推断总体的一种方 法 其基本的原理和方法是利用了反证法 小概率原理和抽样分布等完成推断 具体作法是 根据问题的 需要对所研究的总体作某种假设 记作 H0 选取合适的统计量 这个统计量的选取要使得在假设 H0成 立时 其分布为已知 由实测的样本 计算出统计量的值 并根据预先给定的显著性水平进行检验 按照 小概率原理 作出拒绝或接受假设 H0的判断 因为是基于小概率原理作出的推断 不能作出对假设 H0 的无偏差推断 只能判断总体间的差异是否显著 但已能满足生物学研究 或生产实践中对总体推断的 需要 常用的假设检验方法有 u 检验法 t 检验法 X2检验法 F 检验法 秩和检验等 8 统计推断步骤 统计推断步骤 统计推断是指利用样本信息对未知总体的取值规律做出推断 1 首先 对未知总体的取值规律做出结果相反的两种假设 即零假设和备择假设 通常是根据待解 答的问题 选择总体的某种参数作为假设对象 即对总体参数的确定 能够回答待解决的问题 2 第二步是根据待推断的参数 在零假设成立的前提下 选择 或构造一个样本统计量 这个统计 量的选取要使得在假设 H0成立时 其分布为已知 依样本统计量的要求进行一次抽样 并根据抽样结果 计算出一次样本统计量值 3 第三步 是将一次抽样结果的样本统计量值 放在零假设成立前提下的已知抽样分布中进行检 验 依小概率原理 判断抽样结果的合理性 4 第四步 根据抽样结果的合理性 对原假设进行推断 即对零假设和备择假设做出选择 从而完 成对总体参数的确定 进而能够回答待解决的问题 7 统计推断时 对无效假设 统计推断时 对无效假设 Ho有什么要求 有什么要求 答 首先必须与我们要分析的问题紧密地联系在一起 将来无论是拒绝这个假设还是不拒绝这个假 设都可能成为我们所讨论的问题的答案 其次 所做的假设也必须有利于我们构成和计算某个统计量 且在假设 H0成立时 其分布为已知 这样一来 我们就可以根据统计量的分布规律来判别观测值出现的 概率 8 简述假设检验的两类错误 简述假设检验的两类错误 答 在做统计推断时 由于是基于 小概率事件在一次观测中不会发生 这样一个认识来拒绝原来的 假设的 因此 推断结果必然在一定概率上可能是错误的 可能把原本正确的假设否定了 我们称这样的错误为第一类错误 如果假设 Ho是错误的 但在推断 时我们却不能否定它 称之为第二类错误 只要用抽样的方法进行判断 不管怎样选择否定域 总是要犯错误的 而且当样本的容量给定以后 否定域越小 犯第一类错误的概率越小 犯第二类错误的可能性就越大 反之 假设的否定域越大 犯第 一类错误的可能性越大 犯第二类错误的可能性就越小 9 用于估计总体参数的样本均值和方差的理想标准是什么 答 由于抽样指标是一个随机变量 随着抽取的样本不同 便有不同的估计值 因此 要判断一种估 计量的好环 仅从某一次试验的结果来衡量是不够的 而应从多次重复试验中 看这种估计量是否在某 种意义上最接近于被估计参数的真值 一般地说 用抽样指标估计总体指标应该有无偏性 有效性和相 合性 一致性 三项基本要求或标准 1 无偏性 是指由样本推断总体时样本估计值不受系统误差的约束程度 在待估总体参数的真值附 近摆动 对待估总体参数的真值无偏倚 从分析测试的观点看 无偏性意味着测定的准确度 2 有效性 是指由样本推断总体时样本估计值不受随机误差的约束程度 作为优良估计量的方差应 该比其他估计量的方差小 通俗地讲就是重复性好 从分析测试的观点看 有效性意味着测定的精确度 3 相合性 一致性 大样本准则 即在样本大小趋于无穷时的优良性准则 如果样本容量越大估计 值越接近真值 那么这种估计量是相合估计量 即当样本容量充分大时 抽样指标也充分地靠近总体指 标 三 填空题 1 用于估计总体参数的样本均值和方差的理想标准是无偏性和有效性 2 若 X N 2 从该总体中按容量为 n 抽取样本 则样本 N 2 2 x 第五章 第五章 t t 检验检验 一 基本概念 一 基本概念 1 T 检验 检验 亦称 student t 检验 Student s t test 主要用于样本含量较小 例如 n 0 在样本平均数的抽样分布中 否定区 域 位只能有一个 相应的检验也只能考虑一侧的概率 这种具有左尾和右尾一个否定区 域 的检验叫单位 检验 3 简要说明单样本频率的假设检验的定义 举出一个实例 不作检验 简要说明单样本频率的假设检验的定义 举出一个实例 不作检验 答 利用一个来自二点总体的样本频率与某一理论频率的差异对二点总体的基本概率做出推断 或答 检验一个样本百分数与已知的二项总体百分数差异是否显著的检验方法 举例 有一批蔬菜种子的平均发芽率 p0 0 85 现随机抽取 500 粒 用种衣剂进行浸种处理 结果有 445 粒发芽 试验种衣剂对种子发芽率有无效 或其它例子 4 要检验两个来自二点总体的样本频率 要检验两个来自二点总体的样本频率 p1的的 p2差异 应采用什么方法 举出一个实例 不作检验 差异 应采用什么方法 举出一个实例 不作检验 答 应采用两个样本频率的假设 t 检验进行检验 举例 某养猪场第一年养猪 225 头 死亡 23 头 第二年养猪 368 头 死亡 28 头 试检验这两年猪的 死亡率是否有显著差异 或其它例子 三 填空题 三 填空题 1 对平均数作检验时 总体 2未知 或小样本时 样本呈t分布 检验单个样本与总体的差异或两个样本间的差 异 作t检验 总体 2已知 或大样本时 样本呈正态分布 检验单个样本与总体的差异 或检验两个大样 本间平均数的差异 作U检验 2 当样本容量 n 30 且总体方差 2未知时 就无法使用U检验法对样本平均数进行假设检验 这 时 要检验样本与指定总体的平均数或两样本平均数间的差异显著性 就必须使用t检验法 第六章 第六章 x x2 2检验检验 一 基本概念 拟合优度 拟合优度检验 理论频数 独立性检验拟合优度 拟合优度检验 理论频数 独立性检验 1 拟合优度 拟合优度 指观察到的样本表现与某种理论模型吻合的程度 2 拟合优度检验 拟合优度检验 对观察的样本表现与所选某种理论模型的拟合程度作推断判决 或答 对观察到的样本各结果的实测频数与按某种理论分布进行分配的理论频数的拟合程度作出 判断 以推断样本所在总体的概率分布是否与某种理论分布相吻合 3 理论频数 理论频数 样本假如按照按某种理论分布进行分配时的频数 4 独立性检验 独立性检验 利用两种随机现象同时发生时的样本表现 检验两种随机现象是否相互独立 或答 考察两种分类 分组 方法是否相互独立的检验 第七章 方差分析第七章 方差分析 一 基本概念 处理效应 试验指标 试验因素 因素水平 试验处理 试验单位 重复 固定因素 随机因素 固处理效应 试验指标 试验因素 因素水平 试验处理 试验单位 重复 固定因素 随机因素 固 定模型 随机模型 混合模型 主效应 交互作用 多重比较 方差分析定模型 随机模型 混合模型 主效应 交互作用 多重比较 方差分析 1 处理效应 处理效应 在一个多处理试验中 因为因素处理的不同而引起的各组观测值的不同 称为处理效应 或条件变异 2 试验指标 试验指标 experimental index 为衡量试验结果的好坏和处理效应的高低 在实验中具体测定 的性状或观测的项目称为试验指标 常用的试验指标有 身高 体重 日增重 酶活性 DNA 含量等等 3 试验因素 试验因素 experimental factor 试验中所研究的影响试验指标的因素叫试验因素 当试验中 考察的因素只有一个时 称为单因素试验 若同时研究两个或两个以上因素对试验指标的影响时 则称 为两因素或多因素试验 4 因素水平 因素水平 level of factor 试验因素所处的某种特定状态或数量等级称为因素水平 简称水平 如研究 3 个品种奶牛产奶量的高低 这 3 个品种就是奶牛品种这个试验因素的 3 个水平 5 试验处理 试验处理 treatment 事先设计好的实施在实验单位上的具体项目就叫试验处理 如进行饲料 的比较试验时 实施在试验单位上的具体项目就是具体饲喂哪一种饲料 6 试验单位 试验单位 experimental unit 在实验中能接受不同试验处理的独立的试验载体叫试验单位 一只小白鼠 一条鱼 一定面积的小麦等都可以作为实验单位 7 重复 重复 repetition 在实验中 将一个处理实施在两个或两个以上的试验单位上 称为处理有重 复 一处理实施的试验单位数称为处理的重复数 例如 用某种饲料喂 4 头猪 就说这个处理 饲料 有 4 个重复 8 固定因素 固定因素 是指因素的水平可以严格地人为控制 水平固定后它的效应值也是固定的 试验重复时 可以得到相同的结果 对单个或多个固定因素作用的方差分析应采用固定模型 9 随机因素 随机因素 是指因素的水平是从总体全部水平中随机抽取的样本 水平不能严格人为控制 在水平 确定之后其效应值并不固定 重复试验时也很难得出相同的结果 这类试验通过样本对所属总体作出推 断时应采用随机模型 10 固定模型 固定模型 方差分析数学模型之一 是指各个处理的效应值是固定的 各个处理的平均效应是一 个常量 且各个处理的效应值之和为零 得出的结论只适合固定因素的这几个处理水平上 11 随机模型 随机模型 方差分析数学模型之一 是指各个处理的效应值不是固定的数值 而是由随机因素所 引起的效应 各个处理的效应值是一个随机变量 是从期望均值为 0 方差为 2的正态总体中得到的 随机变量 得出的结论可以推广到随机因素的所有处理水平上 12 混合模型 混合模型 在多因素试验中 若既有固定因素 又有随机因素存在时 方差分析所采用的模型称 为混合模型 13 主效应 主效应 方差分析中 各试验因素的相对独立作用称为该因素的主效应 14 交互作用 交互作用 方差分析中 某一因素在另一因素的不同水平上所产生的效应不同 称两因素间存在 交互作用 15 多重比较 多重比较 要明确不同处理平均数两两间差异的显著性 每个处理的平均数都要与其它的处理进 行比较 这种差异显著性的检验就叫多重比较多重比较 16 方差分析 方差分析 是检验单因素或多因素多水平 处理 效应值间平均数差异 以及各因素间的交互作 用的统计方法 它是对因素总体处理效应的显著性检验 在总体效应差异显著的前提下 因素内水平 间一对一的比较应采用多重比较 二 问题二 问题 1 方差分析的基本思想 方差分析的基本思想 答 是将测量数据的总变异按照变异原因不同分解为处理效应和试验误差 并作出其数量估计 通过方差比较以确定两种原因在总变异中所占的重要程度 如果处理效应和试验误差相差不大 说 明试验处理对指标影响不大 如果二者相差较大 处理效应比试验误差大得多 说明试验处理影响是很 大的 不可忽视 2 方差分析的步骤 方差分析的步骤 答 先作零假设和备择假设 设定显著性水平 根据实验设计 确定 各 因素是固定因素还是随机因素 以选取事宜所数学模型 将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度 列方差分析表进行 F 检验 以弄清各变异因素在总变异中的重要程度 依据设定的显著性水平 接受零假设或备择假设 对作用显著的因素各处理平均数进行多重比较 根据因素类型和显著性检验结果 作出正确的结论 固定因素的结论只限于所设计的那几个水 平 随机因素的结论适用于实验水平来源的总体所有水平 3 我们学过的多重比较方法有几种 在显著性尺度和适用性上有什么差别 我们学过的多重比较方法有几种 在显著性尺度和适用性上有什么差别 答 我们学过的三种多重比较方法中 在样本数 M 2 时 LSD 法 SSR 法和 q 检验法的显著性尺 度是相同的 当 M 3 时 三种方法的显著性尺度便不相同 LSD 法最低 SSR 法次之 q 检验法最高 因 此 在实际应用中 对于差异性要求较高的试验应该使用 q 检验法 一般试验可用 SSR 检验法 试验中 各个处理平均数皆与对照比较的可用 LSD 检验法 4 方差分析中 F 检验对于多重比较有什么意义 答 方差分析中 F 检验用于判断引起各平均数之间的差异主要是实验误差效应还是处理效应 只 有确定通过 F 检验判断引起各平均数之间的差异主要是处理效应时 基于试验目的 各平均数的多重比 较才有意义 才能真实地反映

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论