已阅读5页,还剩115页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8 2单因素方差分析 8 3双因素方差分析 8 4相关关系与回归关系的基本概念 8 1方差分析的概念与基本思想 8 5一元线性回归模型的建立与检验 8 6预测控制与残差分析 第八章方差分析与回归分析 数理统计 8 7可线性化的一元非线性回归 前言第六章和第七章主要讲述了一个正态总体和两个正态总体的有关参数估计和假设检验问题 然而 在生产实际和科学研究中 往往要进行三个或三个以上正态总体的有关参数估计和均值比较问题 所用的统计方法称为方差分析 analysisofvariance 另外 许多实际问题需要了解处于同一研究对象一些变量之间的关系 如输入变量与试验指标之间或试验指标之间往往存在着统计因果关系 研究这种关系的统计分析方法称为回归分析 analysisofregression 回归分析的任务是找出反映这种关系的模型 建立相应的经验方程 用于预测 优化和控制 方差分析和线性回归分析在统计模型上都可以统一在一个理论模型 线性模型之中 其参数估计的主要方法是最小二乘法 本章只是初步的介绍线性统计模型的统计思想和方法 概率统计教研室2012 问题的引入 例8 1为了比较四种单层皱纹海运集装箱的抗压强度 从每种集装箱中各随机选取6个进行最大抗压试验 获得试验数据如表8 1所示 假设集装箱的抗压强度服从正态分布 试问不同种类的海用集装箱的抗压强度是否有显著差别 若有差异 哪一种抗压强度最高 8 1方差分析的概念与基本思想 每种集装箱的平均抗压强度代表了该种集装箱的抗压水平 从表中数据可以看出 四种集装箱的平均抗压强度从大到小依次为第2种 第1种 第3种以及第4种 然而 仅凭平均值的差异进行比较是不够的 因为同一种集装箱的抗压强度之间也有差异 如何进行四种集装箱的抗压强度差异性检验 就是四个正态总体均值差异的检验问题 概率统计教研室2012 例8 2设有五种治疗某种疾病的方案 其中前四种为常规方案 第五种为新方案 为了比较它们的疗效 将30个病人随机分成5组 每组6人 同组的病人施行同一种治疗方案 表8 2记录了病人从开始治疗到痊愈所需的天数 假设病人从开始治疗到痊愈所需的天数服从正态分布 试问不同种类的治疗方案疗效是否有显著差别 若有差异 哪一种治疗方案所需天数最少 每种治疗方案的平均治愈所需天数长短代表了该种治疗方案的优劣水平 从表中数据可以看出 五种治疗方案的平均治愈所需天数从短到长依次为第5种 第3种 第1种 第2种以及第4种 然而 仅凭平均治愈所需天数的差异进行比较也是不够的 因为同一种治疗方案的平均治愈所需天数之间也有差异 例如 平均治愈所需天数最短的第5种中治愈所需最长天数6天 而平均治愈所需天数最长的第4种中治愈所需最短天数也为6天 如何进行五种治疗方案的平均治愈所需天数差异性检验 就是五个正态总体均值差异的检验问题 概率统计教研室2012 例8 3一位老师想要检查3种不同的教学方法的效果 为此随机的选取了水平相当的15位学生 把他们分为3组 每组5人 每一组用一种方法教学 一段时间以后 这位老师给这15位学生进行统考 统考成绩见下表 假设学生的考试成绩服从正态分布 试问不同的教学方法的效果是否有显著差别 若有差异 哪一种教学方法的效果最好 概率统计教研室2012 诸如此类的问题还可以举出很多 抛开其具体的实际背景不论 它们都可以概括和抽象为同一类型数理统计问题 由试验数据对三个或三个以上正态总体的有关参数估计和均值比较 如下图所示 从数理统计角度来看 其实质是判断这些试验数据是否来自同一总体 从实际应用来看就是判断三组或三组以上试验数据产生的背景条件是否一样 以上问题可以归结为同一类数理统计问题 三个或三个以上正态总体的有关参数估计和均值比较问题 其实质是判断这些样本是否来自同一总体 能否使用两个正态总体均值差的两两T检验 例如 对例1来说作四组均值比较 分别进行六次T检验来解决问题呢 答案是不可以 原因 统计学的结论都是在一定的概率意义下接受或者拒绝的 存在犯错误的可能 若要用6次T检验来考察4种集装箱的抗压强度是否存在差异 按照T检验的思想 假设抗压强度相同 对于某一次比较 犯第一类错误的概率为 那末连续6次的两两比较 犯第一类错误的概率就是 如果取 那末在连续6次检验中 犯第一类错误的概率将上升为0 2649 因此 多个均值比较时不宜采用检验作两两比较 如果沿用一个总体 两个总体均值检验中通过构造含有所检验样本均值的统计量分布的方法 来建立多总体均值的检验方法 一般说来是困难的 这里暂且不考虑是否能够建立这样的统计量的分布 即使可以建立含有所以样本均值的统计量分布 要满足解决一般实际问题的需要 就需要给出含有各种均值个数的统计量分布 不难想象 这样的统计量将随均值个数的增加而变得形式复杂 从而使其应用受到影响 更何况还不一定能够建立这种含有多样本均值的统计量的分布 三个或三个以上总体均值比较的问题 英国统计学家费希尔R A Fisher于1924年在罗桑斯特试验站 RothamstedExperimentalStation 的一系列研究成果给予很好的解答 提出所谓的方差分析法 AnalysisofVariance 简写为ANOVA 的理论基础 将样本的总变异分解为由研究因素所造成的部分和由随机误差所造成的部分 通过构造服从分布的检验统计量 比较来自于不同部分的变异对上述问题作出统计推断 概率统计教研室2012 1 试验指标 Experimentalindicators 用于反映试验效果的试验对象特征称为试验指标 这里所提到的试验指标都是定量的 2 因素 Factors 及其水平 Level 把影响一个试验的指标变化的原因称为因素 因素的不同等级称为水平 单因素试验 在试验中仅考察一个因素的试验 多因素试验 在试验中考察两个或两个以上的因素的试验 这类试验一般可用因素的数目来命名 如二因素试验 三因素试验等 3 处理 Treatment 在一个试验中 把所考察因素的不同水平的组合称为处理 即实施试验的条件 二 方差分析中的术语 在单因素试验中 因素的每一个水平称为一个处理 试验因素有几个水平 就相应的有几个处理 在多因素试验中 每个因素可设置若干个水平 各因素不同水平的组合称为处理 处理的数目为各因素水平的乘积 例8 4 表8 4所示为棉花品种 播期 密度三因素试验的处理设计 其目的是了解不同类型棉花在不同播期和密度下的生产力 表8 4棉花三因素试验处理设计 3 随机误差 RandomError 影响试验指标的原因 可控因素 随机因素 可控因素 试验中所考虑且加以控制的因素 随机因素 试验中未考虑或者未控制的因素 通常作为试验环境 在一个严格控制的试验中 对所有试验单元应该保持一致 但往往由于不可控制因素的影响做不到 处理效应 组间误差 可控因素的不同水平对试验指标的影响 用该因素的不同水平之间的差异来估计 随机误差 随机因素所造成的试验指标的变异称为随机误差 随机误差是指接受某个处理的试验单元的指标的观察值与其理论值之间的差异 在实际中 通过接受同一处理的不同试验单元的变异来估计 注意 在任何一个试验中随机误差是不可避免的 只能通过严格控制试验条件等手段 减少随机误差 使处理效应能更好的表现出来 三 方差分析的基本思想 以例8 1为例来说明方差分析的基本思想 由例8 1的试验以及对工业生产所具有的常识可以知道 不同类型的集装箱其试验指标 抗压强度存在差异 并且同一类型的不同集装箱其抗压强度也会有差异 这两种差异产生的原因 前者主要是由于不同类型的集装箱由于其生产条件 原材料 技术标准等等人为可控或者可辨识的因素的不同造成抗压强度的差异 这就是组间误差 可以通过表8 1中平均抗压强度来估计 后者是除类型外的各种人为不可控的随机因素作用造成的指标的差异 这就是随机误差 可以通过同一类型的不同集装箱的抗压强度之间的差异来度量 那么 如何判断不同种类的海用集装箱的抗压强度是否有差异 若有差异 哪一种抗压强度最高 R A Fisher创立的方差分析是解决该类问题的有力工具 其直观想法是 对试验数据所显示的差异进行分解 区分出组间误差和随机误差 利用 数理统计的相关原理建立适当的统计量 将组间误差与随机误差进行比较 如果组间误差比随机误差大得多 就认为试验数据的差异主要是由集装箱的类型不同所造成的 即不同类型的集装箱其抗压强度有显著差别 否则就认为试验数据的差异主要是由随机误差引起的 即不同类型的集装箱其抗压强度无显著差异 四 方差分析的基本假定1 不同因素对试验指标值的影响作用是加性效应 即试验指标值的变化是各种因素所起作用的累加 2 试验指标服从正态分布 3 试验数据是随机的 并且可控因素不同水平的试验数据方差齐性 8 2单因素方差分析 单因素方差分析 分析单因素对试验指标影响的统计方法称为单因素方差分析 单因素试验按处理的重复次数相等与不相等分为单因素等重复试验与单因素不等重复试验 相应的就有单因素等重复试验的方差分析与单因素不等重复试验的方差分析 1 数据结构 一 单因素等重复试验的方差分析 设单因素等重复试验经过实施得到下所示数据资料 其中为因素的第个水平的第次观察值 表8 5单因素等重复试验资料表 概率统计教研室2012 2 单因素方差分析的统计模型 概率统计教研室2012 这里仅讨论固定效应模型 在固定效应模型下 方差分析要解决的问题转化为下列假设检验问题 3 参数估计 概率统计教研室2012 4 离差平方和与自由度分解 总离差平方和 A离差平方和 e离差平方和 总自由度 A自由度 e自由度 概率统计教研室2012 概率统计教研室2012 5 方差分析的假设检验原理 概率统计教研室2012 方差分析结论为拒绝原假设H0 意味着控制因素A对试验指标的有影响 方差分析结论为不能拒绝H0 意味着现有试验数据不能证明控制因素A对试验指标的有影响 概率统计教研室2012 6 离差平方和的数学期望 概率统计教研室2012 概率统计教研室2012 例8 5试对例8 1的试验数据进行方差分析 解 建立统计假设 概率统计教研室2012 多重比较 MultipleComparisons 2 多重比较法 1 最小显著差数法 Leastsignificantdifference 简称LSD法 作业 P379习题8 5 概率统计教研室2012 例8 7对例8 1的试验数据利用LSD法进行多重比较 解 建立统计假设 概率统计教研室2012 将四种类型的集装箱抗压强度的均数由大到小排序 并将它们的差数算出来 再用LSD 检验 其结果如下表所示 例8 7LSD法多重比较表 概率统计教研室2012 2 最小显著极差法 LSR法 LSR法用的检验统计量有Duncan于1955年提出的新复极差法 SSR法 和Tukey于1949年提出的q法 概率统计教研室2012 概率统计教研室2012 例8 8对例8 1的试验数据利用SSR法和q法进行多重比较 解 建立统计假设 概率统计教研室2012 例8 8LSR法多重比较表 注意 在保护H0方面 一般来讲 LSR法比LSD法有效 即显著的少了 不显著的多了 q法与SSR法比较 q法更有效 可以说SSR法宽严适中 在实际应用较多中 概率统计教研室2012 3 多重比较法选择 1 试验事先确定比较的标准 凡是与对照相比较 或与预定要比较的对象比较 可选用最小显著差数法LSDa法 2 根据否定一个正确的H0与接受一个不正确的H0的相对重风险大小来决定 参考以下观点 根据试验的侧重点选择 三种方法显著性的尺度是不相同的 LSD法最低 基于q法的LSD法次之 基于SSR法的LSD法最高 也即对变异的灵敏性LSD法最高 基于q法的LSD法次之 基于SSR法的LSD法最差 故对于试验结论事关重大或有严格要求时用基于q法的LSD法 一般试验可采用基于SSR法的LSD法HSD法 概率统计教研室2012 3 多重比较结果的字母表示法 首先 将各处理的均值按由大到小 自上而下排列 其次 在最大均值后对应标记英文字母a 并将该均值与排在它下面的均值由上往下比较 直道出现差异显著的均值为止 凡差异不显著的均值后都对应写上a 差异显著均值后对应写上b 再次 将后面对应标有b的均值与排在它上比它大的均值比较 直道出现差异显著的均值为止 凡差异不显著的均值后都对应写上b 最后 将后面标有b的最大均值与排在它下面的还未标记字母的均值自上往下比较 直道出现第一个差异显著的均值为止 凡差异不显著的均值后都对应写上b 差异显著均值后对应写上c 如此重复 直至最小均值后面标上字母 检验水平0 05下 字母用小写 检验水平0 01下 字母用大写 概率统计教研室2012 单因素不等重复方差分析 1 单因素等重复试验数据的格式 概率统计教研室2012 2 离差平方和与自由度分解计算 概率统计教研室2012 2 离差平方和与自由度分解计算 概率统计教研室2012 方差分析结论为拒绝原假设H0 意味着控制因素A对试验指标的有影响 方差分析结论为接受H0 意味着现有试验数据不能证明控制因素A对试验指标的有影响 概率统计教研室2012 3 离差平方和的数学期望 概率统计教研室2012 概率统计教研室2012 例8 6为了比较三种饲料的增重效果 选取24头条件基本一致的小猪 每一头小猪只喂一种饲料 下表列出了每种饲料所喂养的小猪在试验期间的增重 kg 试分析饲料对小猪增重的差异显著性 解 建立统计假设 概率统计教研室2012 例8 6的方差分析表 概率统计教研室2012 例8 5的方差分析表 概率统计教研室2012 概率统计教研室2012 例8 9对例8 6的试验数据利用SSR法和q法进行多重比较 解 建立统计假设 概率统计教研室2012 例8 8LSR法多重比较表 结果表明 三种饲料所喂养的小猪在试验期间的增重有差异 但第一种与第二种的差异未达到极显著水平 而第三种与第一种及第二种的差异达到极显著 概率统计教研室2012 双因素方差分析 双因素方差分析背景与交互作用概念 在实际问题的研究中 有时需要考虑两个因素对实验结果的影响 并想选择合适的两因素水平的优化组合 以达到试验指标优化的目的 这时就遇到双因素方差分析问题 有人在研究油菜产量受氮肥与磷肥影响问题时 获得如下试验数据 显然 512 470 2 10 30既不是单纯氮肥引起的产量变化 也不是单纯磷肥引起的产量变化 这是由交互作用引起的 所谓交互作用是在指两个或两个以上因素不同水平搭配引起试验指标变化的能力 概率统计教研室2012 双因素方差分析的类型与统计模型 双因素方差分析的模型 概率统计教研室2012 概率统计教研室2012 1 不考虑交互作用双因素方差分析的数据结构不考虑互作双因素方差分析试验数据具有下列结构模式 这里仅讨论固定效应模型下数据的分析 不考虑交互作用的双因素方差分析 概率统计教研室2012 2 不考虑交互作用双因素方差分析的统计模型 概率统计教研室2012 在固定效应模型下 方差分析要解决的问题转化为下列假设检验问题 3 参数估计 概率统计教研室2012 4 离差平方和与自由度分解 总离差平方和 A离差平方和 e离差平方和 总自由度 A自由度 e自由度 B离差平方和 B自由度 概率统计教研室2012 概率统计教研室2012 5 方差分析的假设检验原理 概率统计教研室2012 概率统计教研室2012 不考虑交互作用双因素方差分析表 6 离差平方和的数学期望 类似于单因素离差平方和数学期望的证明 有以下结论 概率统计教研室2012 例8 10有一小麦品种试验 参试品种有A1 A2 A88个 其中A6为对照 在3个地区种植 每个地区计产面积为22 2平方米 试验数据如下表 单位 kg 试分析品种与地区对小麦产量是否存在显著影响 概率统计教研室2012 解 建立统计假设H01 品种间产量差异不显著 H11 品种间产量差异显著 H02 地区间产量差异不显著 H12 地区间产量差异显著 经计算得方差分析表如下 说明参试品种间差异已达到极显著水平 由于品种对比试验的目的是与对照品种比 因而 多重比较可用LSD法 分析表明 A5与对照有极显著差异 A2与对照有显著差异 A5的99 增产区间为2 67 2 08 A2的95 增产区间为1 54 1 50 概率统计教研室2012 考虑交互作用的双因素方差分析 1 考虑交互作用双因素方差分析的数据结构 概率统计教研室2012 2 考虑交互作用双因素方差分析的统计模型 概率统计教研室2012 在考虑交互作用双因素方差分析的固定效应模型下 方差分析要解决的问题转化为下列假设检验问题 概率统计教研室2012 3 参数估计 4 离差平方和与自由度分解 总离差平方和 A离差平方和 e离差平方和 总自由度 A自由度 e自由度 B离差平方和 B自由度 AXB离差平方和 AXB自由度 5 方差分析的假设检验原理 考虑交互作用双因素方差分析表 6 离差平方和的数学期望 类似于单因素离差平方和数学期望的证明 有以下结论 例8 10有一小麦丰产栽培试验 研究不同施肥与不同土壤类型对小麦产量的影响 选用三种施肥方式A1 A2 A3 三种土壤类型B1 B2 B3 设置3次重复进行试验 试验数据如下表 单位 kg 试分析肥料 土壤以及它们的交互作用对产量的影响 解 这是双因素等重复试验数据分析 建立统计假设H10 施肥间产量差异不显著 H11 施肥间产量差异显著 H20 土壤间产量差异不显著 H21 土壤间产量差异显著 H30 互作引起的差异不显著 H31 互作引起的差异显著 经计算得其方差分析结果如下表所示 方差分析的结果表明 施肥方式对小麦产量有极显著的影响 土壤类型对小麦产量的影响不显著 土壤与肥料的交互作用对小麦的产量有极显著的影响 对交互作用的影响进行多重比较 结果表明 采用施肥方式A1于土壤类型B1有更突出的增产效果 回归分析的基本概念 相关关系与回归关系1 相关关系 系统中变量之间的关系 因果关系 相关关系 回归分析 相关分析 如人的血压Y与年龄X之间的关系 一般来说 年龄越大血压越高 但年龄相同的两个人的血压不一定相等 又如某农作物的亩产量Y与施肥量X之间有一定的关系 但施肥量相同 亩产量却不一定相同 这样的例子在实际中举不甚举 相关关系是两个随机变量之间的平行关系 它们要么互为因果 要么具有共同的因 2 回归关系 在相关关系中 如果关心的是容易测定或控制变量X对变量Y的决定作用大小 将X看成一个普通变量 这时就称变量X与Y之间遵从回归关系 3 回归模型与回归方程 如果普通变量x与随机变量Y具有回归关系 则Y除过受变量x的作用以外 还受到控制不严格和未知因素的作用 所以 x与Y必满足关系式 对于回归模型 显然有 回归方程反映了因变量Y随自变量x的变化而变化的平 均变化情况 4 回归模型分类 5 回归分析 研究一个随机变量 应变量 与一个或几个可控变量 自变量或预报因子 之间回归关系 找出回归关系的模型 建立经验回归方程 用于预测 优化和控制 这种统计方法称为回归分析 回归分析主要涉及以下三个基本问题 1 提供建立具有回归关系的变量之间的数学关系式 称为经验公式 的一般方法 2 判别所建立的经验公式是否有效 并从影响随机变量的诸变量中判别哪些变量的影响是显著的 哪些是不显著的 优化经验公式 3 利用所得到的经验公式进行预测 控制和优化 回归分析根据所选模型的性质分为线性回归与非线性回归 根据涉及自变量的个数分为一元回归与多元回归 一元线性回归模型的建立与检验 一元线性回归模型 一元线性回归方程参数估计及其性质 1 最小二乘法 Theleastsquaremethod 2 最小二乘法估计量的统计性质 所以 由正态分布的性质有 又由于 进而有 例8 11为了解我国
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年制造业质量提升工程质量目标(如零缺陷)达成率评估合规考核试卷
- 2025年《刑事辩护规范》法律援助案件法律帮助与辩护区分考核试卷
- 113.2025年制造业智能制造供应链数字化平台认证考核试卷
- 2025年互联网与信息技术行业认证考试边缘计算技术应用(工业边缘计算供应链协同)考核试卷
- 山东省青岛第九中学选聘2026年应届高校毕业生(25人)考试笔试备考题库及答案解析
- 2025云南省科技投资管理有限公司招聘19人笔试考试参考题库及答案解析
- 2025四川乐山峨眉山市大学生乡村医生专项招聘3人笔试考试参考试题及答案解析
- 2025合肥市关井小学教师招聘补招1人笔试考试备考题库及答案解析
- 2025浙江富浙科技有限公司所属公司第四轮人才招聘3人笔试考试备考题库及答案解析
- 2026年中国铁路乌鲁木齐局集团有限公司招聘普通高校毕业生一(745人)笔试考试备考试题及答案解析
- GB/T 31326-2014植物饮料
- GB/T 30649-2014声屏障用橡胶件
- GB/T 18983-2017淬火-回火弹簧钢丝
- GB 30080-2013铜及铜合金熔铸安全生产规范
- FZ/T 51010-2014纤维级聚对苯二甲酸1,3-丙二醇酯切片(PTT)
- 国开电大-数学分析专题研究-形考任务1-3答案
- 串联和并联说课最终版
- 附表3临时工程验收记录表
- 道德与法治《我学习,我快乐》评课稿
- SC200施工升降机说明书
- 五年级下册音乐教案-7.5掀起你的盖头来 |湘艺版
评论
0/150
提交评论