相关性、平均值、标准差、相关系数、回归线及最小二乘法概念_第1页
相关性、平均值、标准差、相关系数、回归线及最小二乘法概念_第2页
相关性、平均值、标准差、相关系数、回归线及最小二乘法概念_第3页
相关性、平均值、标准差、相关系数、回归线及最小二乘法概念_第4页
相关性、平均值、标准差、相关系数、回归线及最小二乘法概念_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

平均值 标准差 相关系数 回归线及最小二乘法 相关性相关性 线性相关 数据在一条直线附近波动 则变量间是线性相关 非线性相关 数据在一条曲线附近波动 则变量间是非线性相关 不相关 数据在图中没有显示任何关系 则不相关 平均平均值值 N 个数据 的平均平均值值计算公式 标标准差准差 标标准差准差表示了所有数据与平均值的平均距离 表示了数据的散度 如果标准差 小 表示数据集中在平均值附近 如果标准差大则表示数据离标准差比较远 比较分散 标准差计算公式 2 1 1 10uR N n i i x y 两个变量组成了笛卡尔坐标系中的一 个 坐标 x y 这个坐标标识了一个 点点的位置 各包含 n 个常量的 X Y 两组数据在笛卡尔坐标系中以 n 个点来进行表示 相关系数相关系数 相关系数用字母 r 来表示 表示两组数据线性相关的程度 同时增大或减小的 程度 从另一方面度量了点相对于标准差的散布情况 它没有单位 包含 n 个数值的 X Y 两组数据的相关系数 r 的计算方法 简单的说 就是 r 以标准单位表示的 x X 以标准单位表示的 y 的平均数 根据上面点的定义 将 X Y 两组数据的关系以点的形式在笛卡尔坐标系中画 出 SD 线线表示了经过中心点 以数据组 X Y 平均值为坐标的点 当 r 0 时 斜率 X 的标准差 Y 的标准差 当 r 0 时 斜率 X 的标准差 Y 的标准 差 的直线 通常用 SD 线来直观的表示数据的走向 1 当 r0 时 SD 线的斜率大于 0 时 则说明数据正相关 此时当 x 增大时 y 增大 3 相关系数 r 的范围在 1 1 之间 当 r 0 时表示数据相关系数为 0 不相 关 当 r 正负 1 时 表示数据负相关 此 x y 点数据都在 SD 线上 4 r 的值越接近正负 1 说明 x y 越靠拢 SD 线 说明数据相关性越强 r 的 值越接近 0 说明 x y 点到 SD 线的散度越大 越分散 数据相关性越小 回回归归方法方法主要描述一个变量如何依赖于另一个变量 y 对应于 x 的回回归线归线描述 了在不同的 x 值下 y 的平均值情况 它是这些平均值的光滑形式 如果这些平 均值刚好在一条直线上 则这些平均值刚好和回归线重合 通过回归线 我们 可以通过 x 值来预测 y 值 已知 x 值下 y 值的平均值 下面是 y 对应于 x 的 回归线方程 简单的说 就是当 x 每增加 1 个 SD 平均而言 相应的 y 增加 r 个 SD 从方程可以看出 1 回归线是一条经过点 斜率为 的直线 2 回归线的斜率比 SD 线小 当 r 1 或 1 时 回归线和 SD 线重合 当用回归线从 x 预测 y 时 实际值与预测值之间的差异叫预测误差 而均方根均方根 误误差差就是预测误差的均方根 它度量回归预测的精确程度 y 关于 x 的回归线 的均方根误差用下面的公式进行计算 由公式可以看出 当 r 越接近 1 或 1 时 点越聚集在回归线附近 均方根误 差越小 反之 r 越接近 0 时 点越分散 均方根误差越大 最小二乘法最小二乘法寻找一条直线来拟合所有的点 使得这条直线到所有的点之间的均 方根误差最小 可以看到 当求两个变量之间的关系时 最小二乘法求出的直 线实际上就是回归线 只不过表述的侧重点不同 1 最小二乘法强调求出所有点的最佳拟合直线 2 回归线则是在 SD 线的基础上求出的线 表示了样本中已知变量 x 的情况 下变量 y 的平均值 由以上可知 一个散点图可以用五个统计量来描述 1 所有点 x 值的平均数 描述了所有点在 x 轴上的中心点 2 所有点 x 值的 SD 描述了所有点距离 x 中心点的散度 3 所有点 y 值的平均数 描述了所有点在 y 轴上的中心点 4 所有点 y 值的 SD 描述了所有点距离 y 中心点的散度 5 相关系数 r 基于标准单位 描述了所有点 x 值和 y 值之间的关系 相关系数 r 将平均值 标准差 回归线这几个概念联系起来 1 r 描述了相对于标准差 点沿 SD 线的群集程度 2 r 说明了 y 的平均数如何的依赖于 x x 每增加 1 个 x 标准差 平均来 说 y 将只增加 r 个 y 标准差 3 r 通过均方根误差公式 确定了回归预测的精确度 注意注意 以上相关系数 回归线 最小二乘法的计算要在以下两个条件下才能成 立 1 x y 两组样本数据是线性的 如果不是线性的先要做转换 2 被研究的两组样本数据之间的关系必须有意义 R 平方值 回归平方和 总平方和 其中 回归平方和 总平方和 残差平方和 总平方和 y 的实际值的平方和 假设 实际测的值是 yi 拟合曲线计算出的值分别是 Yi 残差平方和 n i ii Yy 1 2 总平方和 n i i y 1 2 相关系数的平方为判定系数 n i i n i ii n i i y Yyy R 1 2 1 2 1 2 2 分布区间 0 1 越小说明拟合得越

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论