




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3课时变量间的相关关系及统计案例 1 两个变量的线性相关 1 正相关在散点图中 点散布在从到的区域 对于两个变量的这种相关关系 我们将它称为正相关 2 负相关在散点图中 点散布在从到的区域 两个变量的这种相关关系称为负相关 基础知识梳理 左上角 右上角 左下角 右下角 3 线性相关关系 回归直线如果散点图中点的分布从整体上看大致在 就称这两个变量之间具有线性相关关系 这条直线叫做回归直线 2 回归方程 1 最小二乘法求回归直线使得样本数据的点到回归直线的的方法叫做最小二乘法 基础知识梳理 一条直线附近 距离的平方和最小 2 回归方程系的变量的一组数据 x1 y1 x2 y2 xn yn 的回归方程 其中a b是待定参数 基础知识梳理 基础知识梳理 基础知识梳理 思考 相关关系与函数关系有什么异同点 思考 提示 相同点 两者均是指两个变量的关系 不同点 函数关系是一种确定的关系 相关关系是一种非确定的关系 函数关系是一种因果关系 而相关关系不一定是因果关系 也可能是伴随关系 3 回归分析 1 定义 对具有的两个变量进行统计分析的一种常用方法 2 样本点的中心在具有线性相关关系的数据 x1 y1 x2 y2 xn yn 中 回归方程的截距和斜率的最小二乘估计公式分别为 基础知识梳理 相关关系 基础知识梳理 基础知识梳理 正相关 负相关 越强 0 75 4 独立性检验 1 分类变量的定义如果某种变量的不同 值 表示个体所属的不同类别 像这样的变量称为 2 2 2列联表一般地 假设有两个分类变量x和y 它们的值域分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 基础知识梳理 分类变量 基础知识梳理 a c b d a b c d a b c d k2 用它的大小可以决定是否拒绝原来的统计假设h0 如果k2值较大 就拒绝h0 即拒绝 基础知识梳理 事件a与b无关 1 下列两个变量之间的关系哪个不是函数关系 a 角度和它的余弦值b 正方形的边长和它的面积c 正n边形的边数和顶点角度之和d 人的年龄和身高答案 d 三基能力强化 2 有关线性回归的说法 不正确的是 a 相关关系的两个变量是非确定关系b 散点图能直观地反映数据的相关程度c 回归直线最能代表线性相关的两个变量之间的关系d 散点图中的点越集中 两个变量的相关性越强答案 d 三基能力强化 3 教材习题改编 对于事件a和事件b 通过计算得到k2的观测值k 4 514 下列说法正确的是 a 有99 的把握说事件a和事件b有关b 有95 的把握说事件a和事件b有关c 有99 的把握说事件a和事件b无关d 有95 的把握说事件a和事件b无关答案 b 三基能力强化 4 下列关系 人的年龄与其拥有的财富之间的关系 曲线上的点与该点的坐标之间的关系 苹果的产量与气候之间的关系 森林中的同一树木 其截面直径与高度之间的关系 学生的身高与其学号之间的关系 其中有相关关系的是 答案 三基能力强化 答案 11 69 三基能力强化 判断两变量之间有无相关关系 一种常用的简便可行的方法是绘散点图 散点图是由数据点分布构成的 是分析研究两个变量相关关系的重要手段 从散点图中 如果发现点的分布从整体上看大致在一条直线附近 那么这两个变量是线性相关的 课堂互动讲练 课堂互动讲练 某棉业公司的科研人员在7块并排 形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验 得到如下表所示的一组数据 单位 kg 课堂互动讲练 1 画出散点图 2 判断是否具有相关关系 课堂互动讲练 思路点拨 用施化肥量x作为横轴 产量y为纵轴可作出散点图 由散点图即可分析是否具有线性相关关系 解 1 散点图如图所示 课堂互动讲练 2 由散点图知 各组数据对应点大致都在一条直线附近 所以施化肥量x与产量y具有线性相关关系 课堂互动讲练 名师点评 两变量具有相关关系但不一定是线性相关 所以当画出的点明显在一条曲线附近时 两变量也具有相关关系 但不是线性相关的 课堂互动讲练 利用最小二乘法求回归直线方程的一般步骤是 1 作出散点图 判断是否线性相关 2 如果是 则用公式求a b 写出回归方程 3 根据方程进行估计 课堂互动讲练 课堂互动讲练 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x 吨 与相应的生产能耗y 吨标准煤 的几组对照数据 1 请画出上表数据的散点图 2 请根据上表提供的数据 用最小二乘 参考数值 3 2 5 4 3 5 4 6 4 5 66 5 课堂互动讲练 思路点拨 课堂互动讲练 解 1 由题设所给数据 可得散点图如图所示 课堂互动讲练 所以 由最小二乘法确定的回归方程的系数为 课堂互动讲练 课堂互动讲练 名师点评 因本题中y对x的关系呈线性关系 故可用一元线性相关的方法解 课堂互动讲练 在本例条件下 若该厂技改前100吨甲产品的生产能耗为90吨标准煤 试根据 2 求出的线性回归方程 预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤 课堂互动讲练 互动探究 解 由 2 的回归方程及技改前生产100吨甲产品的生产能耗 得降低的生产能耗为90 0 7 100 0 35 19 65 吨标准煤 课堂互动讲练 建立回归模型的步骤 1 确定研究对象 明确哪个变量是解释变量 哪个变量是预报变量 2 画出确定好的解释变量和预报变量的散点图 观察它们之间的关系 如是否存在线性关系等 课堂互动讲练 3 由经验确定回归方程的类型 如我们观察到数据呈线性关系 则选用线性回归方 4 按一定规则估计回归方程中的参数 如最小二乘法 5 得出结果后分析残差是否有异常 个别数据对应残差过大 或残差呈现不随机的规律性等 若存在异常 则检查数据是否有误 或模型是否适合等 课堂互动讲练 课堂互动讲练 测得某国10对父子身高 单位 英寸 如下 1 对变量y与x进行相关性检验 2 如果y与x之间具有线性相关关系 求回归方程 3 如果父亲的身高为73英寸 估计儿子的身高 课堂互动讲练 思路点拨 1 先根据已知计算相关系数r 判断是否具有相关关系 2 再利用公式求出回归方程进行回归分析 课堂互动讲练 课堂互动讲练 课堂互动讲练 所以y与x之间具有很强的线性相关关系 课堂互动讲练 故所求的回归方程为 所以当父亲身高为73英寸时 估计儿子身高约为69 9英寸 课堂互动讲练 名师点评 求回归直线方程 一般先要考查y与x是否具有线性相关关系 若具有这样的关系 则可利用公式求解 否则求得的函数关系无实际意义 课堂互动讲练 利用图形来判断两个变量之间是否有关系 可以画出三维柱形图 二维条形图 仅从图形上只可以粗略地估计两个分类变量的关系 可以结合所求的数值来进行比较 作图时应注意单位统一 图形准确 但不能给我们两个分类变量有关或无关的精确的可信程度 只有利用独立性检验的有关计算 才能作出精确的判断 课堂互动讲练 课课堂互动讲练堂互动讲练 解题示范 本题满分12分 在调查的480名男人中有38名患有色盲 520名女人中有6名患有色盲 分别利用图形和独立性检验的方法来判断色盲与性别是否有关 你所得到的结论在什么范围内有效 思路点拨 本题应首先作出调查数据的列联表 再根据列联表画出二维条形图 并进行分析 最后利用独立性检验作出判断 课堂互动讲练 解 根据题目所给的数据作出如下的列联表 课堂互动讲练 根据列联表作出相应的二维条形图 6分 课堂互动讲练 因而 我们可以认为 患色盲与性别是有关的 8分根据列联表所给的数据可以有a 38 b 442 c 6 d 514 a b 480 c d 520 a c 44 b d 956 n 1000 课堂互动讲练 由k 27 1 10 828 所以我们有99 9 的把握认为患色盲与性别有关系 这个结论只对所调查的480名男人和520名女人有效 12分 课堂互动讲练 误区警示 在列联表中注意事件的对应及有关值的确定 避免混乱 课堂互动讲练 本题满分12分 在对人们的休闲方式的一次调查中 共调查了124人 其中女性70人 男性54人 女性中有43人主要的休闲方式是看电视 另外27人主要的休闲方式是运动 男性中有21人主要的休闲方式是看电视 另外33人主要的休闲方式是运动 课堂互动讲练 互动探究 1 根据以上数据建立一个2 2列联表 2 判断性别与休闲方式是否有关系 解 1 2 2列联表如下 6分 课堂互动讲练 课堂互动讲练 休闲方式 2 假设 休闲方式与性别无关 因为k 5 024 所以有理由认为假设 休闲方式与性别无关 是不合理的 即有97 5 的把握认为 休闲方式与性别有关 12分 课堂互动讲练 1 回归分析的理解回归分析是处理变量相关关系的一种数学方法 它主要解决三个问题 1 确定两个变量之间是否有相关关系 如果有就找出它们之间贴近的数学表达式 2 根据一组观测值 预测变量的取值及判断变量取值的变化趋势 3 求出回归直线方程 规律方法总结 2 最小二乘法的理解 1 最小二乘法是一种有效的求回归方程的方法 它保证了各点与此直线在整体上最接近 最能反映样本观测数据的规律 2 最小二乘法估计的一般步骤 作出散点图 判断是否线性相关 如果是 则用公式求a b 写出回归方程 根据方程进行估计 规律方法总结 3 线性相关关系强弱的分析与判断对于变量x与y随机抽取到的n对数据 x1 y1 x2 y2 xn yn 利用相关系数r来衡量两个变量之间线性相关关系的强弱 样本相关系数的具体计算公式为 规律方法总结 当r 0时 表明两个变量正相关 当r 0时 表明两个变量负相关 r 越接近于1 表明两个变量的线性相关性越强 r 越接近于0 表明两个变量之间几乎不存在线性相关关系 通常 当 r 大于0 75时 我们认为两个变量存在着很强的线性相关关系 规律方法总结 4 独立性检验的应用 1 利用独立性检验来考察两个分类变量是否有关系 并且能较为准确地给出这种判断的可靠程度 2 具体做法是 根据观测数据计算由公 规律方法总结 验随机变量的观测值k 并且k的值越大 说明 x与y有关系 成立的可能性越大 3 利用以下数据来确定 x与y有关系 的可信程度 如果k 10 828 就有99 9 的把
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论