食品实验分析与设计·第八章 直线回归与相关ppt课件.ppt_第1页
食品实验分析与设计·第八章 直线回归与相关ppt课件.ppt_第2页
食品实验分析与设计·第八章 直线回归与相关ppt课件.ppt_第3页
食品实验分析与设计·第八章 直线回归与相关ppt课件.ppt_第4页
食品实验分析与设计·第八章 直线回归与相关ppt课件.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章直线回归与相关 一类是变量间存在着完全确定性的关系 可以用精确的数学表达式来表示 如长方形的面积 S 与长 a 和宽 b S ab 它们之间的关系是确定性的 只要知道了其中两个变量的值就可以精确地计算出另一个变量的值 这类变量间的关系称为函数关系 变量间的关系 另一类是变量间不存在完全的确定性关系 不能用精确的数学公式来表示 如人的身高与体重的关系 作物种植密度与产量的关系 食品价格与需求量的关系等等特点 这些变量间都存在着十分密切的关系 但不能由一个或几个变量的值精确地求出另一个变量的值 像这样一类关系在生物界中是大量存在的 统计学中把这些变量间的关系称为相关关系 把存在相关关系的变量称为相关变量 相关变量间的关系一般分为两种 一种是因果关系 即一个变量的变化受另一个或几个变量的影响 如小麦的生长速度受遗传特性 营养水平 管理条件等因素的影响 子代的体高受亲本体高的影响 另一种是平行关系 它们互为因果或共同受到另外因素的影响 如人的身高和胸围之间的关系属于平行关系 同胞间的身高或体重 统计学上采用回归分析 regressionanalysis 研究呈因果关系的相关变量间的关系 表示原因的变量称为自变量 表示结果的变量称为依变量 回归分析的任务就是揭示出呈因果关系的相关变量间的联系形式 建立它们之间的回归方程 利用所建立的回归方程 由自变量 原因 来预测 控制依变量 结果 回归分析主要包括 找出回归方程 检验回归方程是否显著 通过回归方程来预测或控制另一变量 统计学上采用相关分析 correlationanalysis 研究呈平行关系的相关变量之间的关系 对两个变量间的直线关系进行相关分析称为简单相关分析 也叫直线相关分析 对多个变量进行相关分析时 研究一个变量与多个变量间的线性相关称为复相关分析 研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析 第一节直线回归 一 直线回归方程的建立对于两个相关变量 一个变量用x表示 另一个变量用y表示 如果通过试验或调查获得两个变量的n对观测值 x1 y1 x2 y2 xn yn 为了直观地看出x和y间的变化趋势 可将每一对观测值在平面直角坐标系描点 作出散点图 直线回归分析 二维散点图作为相关分析最直观的表达形式莫过于用两变量值绘制的散点分布图 从散点图可以看出 两个变量间直线关系的性质 是正相关还是负相关 和程度 是相关密切还是不密切 散点图直观地 定性地表示了两个变量之间的关系 为了探讨它们之间的规律性 还必须根据观测值将其内在关系定量地表达出来 两个变量间有关或无关 若有关 两个变量间关系类型 是直线型还是曲线型 如果把变量y与x内在联系的总体直线回归方程记为y x 依变量y的实际观测值总是带有随机误差 因而依变量y的实际观测值yi可用自变量x的实际观测值xi表示为 i 1 2 n 直线回归的数学模型 总体线性回归模型的图示 Y X 观察值 观察值 总体线性回归模型 依变量 自变量 参数 随机误差 y条件平均数 在x y直角坐标平面上可以作出无数条直线 我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系 这条直线称为回归直线 设回归直线的方程为 其中 是 的估计值 b是 的估计值 b应使回归估计值与实际观测值y的偏差平方和最小 即 总的离回归平方和 即剩余平方和 根据微积分学中的求极值的方法 令Q对a b的一阶偏导数等于0 即 最小 整理得关于 b的正规方程组 解正规方程组 得 分子是自变量x的离均差与依变量y的离均差的乘积和 简称乘积和 记作 分母是自变量x的离均差平方和 记作SSX b叫做样本回归系数 表示x改变一个单位 y平均改变的数量 b的符号反映了x影响y的性质 b的绝对值大小反映了x影响y的程度 叫做回归估计值 是当x在在其研究范围内取某一个值时y值平均数的估计值 叫做样本回归截距 是回归直线与y轴交点的纵坐标 当x 0时 回归方程的基本性质 如果将式代入式 得到回归方程的另一种形式 中心化形式 例8 1 食品感官评定时 测得食品甜度与蔗糖浓度的关系如表8 1所示 试建立y与x的直线回归方程 表8 1食品甜度与蔗糖浓度的关系 1 作散点图以蔗糖质量分数 x 为横坐标 甜度 y 为纵坐标作散点图 如图8 2所示 图8 2 2 计算回归截距a 回归系数b 建立直线回归方程 下一张 主页 退出 上一张 首先根据实际观测值计算出下列数据 所以 甜度y对蔗糖质量分数x的直线回归方程为 然后计算出b a 根据直线回归方程可作出回归直线 见图 从图看出 并不是所有的散点都恰好落在回归直线上 这说明用去估计y是有偏差的 下一张 主页 退出 上一张 附 直线回归的偏离度估计偏差平方和的大小表示了实测点与回归直线偏离的程度 因而此偏差平方和又称为离回归平方和 统计学证明 在直线回归分析中离回归平方和的自由度为n 2 那么 离回归均方为 离回归均方的平方根叫离回归标准误 记为 离回归标准误Syx的大小表示了回归直线与实测点偏差的程度 即回归估测值与实际观测值y偏离 差 的程度 所以 用离回归标准误Syx来表示回归方程的偏离度 下一张 主页 退出 上一张 对于 例8 1 有 所以 离回归标准误为 以后我们将证明 离回归平方和 由上式先计算出 然后求出离回归标准误Syx 二 直线回归的显著性检验 1 直线回归的变异来源 图8 4的分解图 从图8 4看到 上式两端平方 然后对所有的n点求和 则有 由于 所以 所以有 反映了由于y与x间存在直线关系所引起的y的变异程度 称为回归平方和 记为SSR 反映了y的总变异程度 称为y的总平方和 记为SSy 反映了除y与x存在直线关系以外的原因 包括随机误差所引起的y的变异程度 称为离回归平方和或剩余平方和 记为SSr 总变异又可表示为 y的总自由度dfy也划分为回归自由度dfR与离回归自由度dfr两部分 即 1 建立假设无效假设HO 0 备择假设HA 0 2 计算检验统计量3 显著性推断 2 回归关系显著性检验 F检验 根据df1 1 df2 n 2查表 得到临界F值 并作出显著性推断 例8 2 检验例8 1中求得的回归方程是否显著 a 005 方差分析 列出方差分析表进行回归关系显著性检验 下一张 主页 退出 上一张 表8 4蔗糖浓度与甜度回归关系方差分析表 因为 表明甜度与蔗糖浓度间存在着极显著的直线关系 3 回归系数的显著性检验 t检验1 建立假设HO 0 HA 0 回归系数标准误 t检验的计算公式为 离回归标准误 对于 例8 1 资料 已计算得故有 下一张 主页 退出 上一张 当 查t值表 得因 否定HO 0 接受HA 0 即直线回归系数b 1 2550是极显著的 表明蔗糖浓度与甜度大小存在极显著的直线关系 可用所建立的直线回归方程来进行预测和控制 在直线回归假设检验中 F检验的结果与t检验的结果是一致的 第二节直线相关 进行直线相关分析的基本任务在于根据x y的实际观测值 计算表示两个相关变量x y间线性相关程度和性质的统计量 相关系数r 并进行显著性检验 我们把叫做x对y的决定系数 coefficientofdetermination 记为r2 一 决定系数和相关系数 决定系数的大小表示了回归方程估测可靠程度的高低 或者说表示了回归直线拟合度的高低 显然有0 r2 1 因为 决定系数表示了两个互为因果关系的相关变量间直线相关的程度 统计学上把决定系数r2的平方根称为x与y的相关系数 coefficientofcorrelation 记为r 既可表示y与x的直线相关的程度 也可表示直线相关的性质 二 相关系数的计算 例8 2 计算10只绵羊的胸围 cm 和体重 kg 的相关系数 表8 310只绵羊胸围和体重资料 根据表8 3所列数据先计算出 代入 8 25 式得 即绵羊胸围与体重的相关系数为0 8475 根据实际观测值计算得来的相关系数r是样本相关系数 它是双变量正态总体中的总体相关系数 的估计值 样本相关系数r是否来自 0的总体 还须对样本相关系数r进行显著性检验 此时无效假设 备择假设为HO 0 HA 0 与直线回归关系显著性检验一样 可采用t检验法与F检验法对相关系数r的显著性进行检验 3 3相关系数的显著性检验 其中 叫做相关系数标准误 F检验 F df1 1 df2 n 2t检验 t df n 2 下一张 主页 退出 上一张 统计学家已根据相关系数r显著性t检验法计算出了临界r值并列出了表格 所以可以直接采用查表法对相关系数r进行显著性检验 具体作法是 先根据自由度n 2查临界r值 附表8 得 若 r P 0 05 则相关系数r不显著 在r的右上方标记 ns 若 0 01 P 0 05 则相关系数r显著 在r的右上方标记 若 r P 0 01 则相关系数r极显著 在r的右上方标记 而 r 0 8475 P 0 01 表明绵羊胸围与体重呈极显著正相关 下一张 主页 退出 上一张 对于 例8 2 因为df n 2 10 2 8 查附表8得 相关系数对样本相关关系的计量 表明直线相关分析与回归分析关系十分密切 它们的研究对象都是呈直线关系的相关变量 两种分析所进行的显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论