




已阅读5页,还剩50页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五节变量间的相关关系 统计案例 第九章算法初步 统计与统计案例 概率 考纲要求 1 会作两个有关联变量的数据的散点图 会利用散点图认识变量间的相关关系 2 了解最小二乘法的思想 能根据给出的线性回归方程系数公式建立线性回归方程 3 了解下列两种常用的统计方法 并能应用这些方法解决一些实际问题 1 独立检验 了解独立性检验 只要求2 2列联表 的基本思想 方法及其简单应用 2 回归分析 了解回归分析的基本思想 方法及其简单应用 课前自修 知识梳理 1 散点图 1 将变量所对应的点描出来 就组成了变量之间的一个图 这种图为变量之间的 2 从散点图上可以看出 如果变量之间存在着某种关系 这些点会有一个集中的大致趋势 这种趋势可用一条光滑的曲线来近似 这种近似的过程称为曲线拟合 2 相关关系 1 从散点图上看 点散布在从左下角到右上角的区域内 对于两个变量的这种相关关系 我们将它称为 点散布在从左上角到右下角的区域内 两个变量的这种相关关系称为 散点图 正相关 负相关 2 线性相关 从散点图上看 如果这些点从整体上看大致分布在一条直线附近 则称这两个变量之间具有线性相关关系 这条直线叫做 3 若两个变量x和y的散点图中 所有点看上去都在某条曲线 不是一条直线 附近波动 则称此相关是 的 如果所有的点在散点图中没有显示任何关系 则称变量间是不相关的 3 回归直线 1 最小二乘法 如果有n个点 x1 y1 x2 y2 xn yn 可以用下面的表达式来刻画这些点与回归直线的接近程度 y1 a bx1 2 y2 a bx2 2 yn a bxn 2 使得上式达到最小值的就是我们要求的直线 这种方法称为最小二乘法 回归直线 非线性相关 1 当r 0时 表明两个变量 2 当r 0时 表明两个变量 3 r的绝对值越接近1 表明两个变量的线性相关性 r的绝对值越接近于0 表明两个变量之间几乎不存在线性相关关系 通常当 r 0 75时 认为两个变量有很强的线性相关关系 当 r 0 3 0 75 时 相关性一般 当 r 0 0 25 时 相关性较弱 正相关 负相关 越强 5 残差分析 1 线性回归模型 y bx a e中 a b称为模型的未知参数 e称为随机误差 2 残差平方和 对于样本点 xi yi i 1 2 n q 称为残差平方和 q值越小 说明线性回归模型的拟合效果越好 3 相关指数 用相关指数r2来刻画回归的效果 公式是r2 1 r2的值越大 说明残差平方和越小 也就是说模型拟合效果 越好 6 独立性检验 1 若变量的不同 值 表示个体所属的不同类型 则这类变量称为分类变量 2 列出两个分类变量的频数表 称为列联表 3 利用随机变量k2来确定在多大程度上可以认为 两个分类变量有关系 的方法称为两个分类变量的 独立性检验 2 2列联表 独立性检验公式k2 基础自测 1 下列命题 任何两个变量都具有相关关系 圆的周长与该圆的半径具有相关关系 某商品的需求与该商品的价格是一种非确定性关系 根据散点图求得的回归直线方程可能是没有意义的 两个变量间的相关关系可以通过回归直线 把非确定性问题转化为确定性问题进行研究 其中正确的命题为 a b c d 答案 c 2 用独立性检验来考察两个变量x与y是否有关系 当统计量k2的值 a 越大 x与y是有关系的 成立可能性越小b 越大 x与y是有关系的 成立可能性越大c 越小 x与y是没有关系的 成立可能性越小d 与 x与y有关系 成立的可能性无关 答案 b 3 2012 湛江市二模 通过随机询问110名大学生是否爱好某项运动 得到如下的列联表 由上表算得k 7 8 因此得到的正确结论是 a 在犯错误的概率不超过0 1 的前提下 认为 爱好该项运动与性别有关 b 在犯错误的概率不超过0 1 的前提下 认为 爱好该项运动与性别无关 c 有99 以上的把握认为 爱好该项运动与性别有关 d 有99 以上的把握认为 爱好该项运动与性别无关 解析 根据k2的临界值表和独立性检验的概念知 选项c正确 答案 c 4 2011 辽宁卷 调查了某地若干户家庭的年收入x 单位 万元 和年饮食支出y 单位 万元 调查显示年收入x与年饮食支出y具有线性相关关系 并由调查数据得到y对x的回归直线方程 0 254x 0 321 由回归直线方程可知 家庭年收入每增加1万元 年饮食支出平均增加 万元 解析 由题意得2 1 0 254 x 1 0 321 0 254x 0 321 0 254 即家庭年收入每增加1万元 年饮食支出平均增加0 254万元 答案 0 254 考点探究 考点一 利用散点图判断两个变量的相关关系 例1 1 观察下列各图形 其中两个变量x y具有相关关系的图形是 a b c d 2 下表是某地的年降雨量 单位 mm 与年平均气温 单位 的数据资料 两者是 a 正相关关系b 负相关关系c 非线性相关关系d 不具有相关关系 点评 1 在散点图中 如果所有的样本点都落在某一函数的曲线上 就用该函数来描述变量之间的关系 即变量之间具有函数关系 如果所有的样本点都落在某一函数的曲线附近 变量之间就有相关关系 如果所有的样本点都落在某一直线附近 变量之间就有线性相关关系 2 散点图的最大优点就是直观 并且制作散点图也较为方便 因此散点图在判断两个变量是否相关的过程中起着重要作用 散点图是判断两个变量是否相关的方法之一 至于相关性的强弱还要利用相关系数来判断 变式探究 1 1 有五组变量 汽车的重量和汽车每消耗1升汽油所行使的平均路程 平均日学习时间和平均学习成绩 某人每日吸烟量和身体健康情况 圆的半径与面积 汽车的重量和每公里耗油量 其中两个变量成正相关的是 a b c d 2 有10名同学高一 x 和高二 y 的数学成绩如下 则两个变量x和y a 没有相关关系b 有正相关关系c 有负相关关系d 无法判断 解析 1 由正相关与负相关的概念知 是正相关 是负相关 为函数关系 故选c 2 以高一成绩为x轴 高二成绩为y轴 画出散点图如图 可以看出 这些点在一条直线附近波动 且y随着x增加而增加 所以x与y有正相关关系 故选b 答案 1 c 2 b 考点二 求回归直线方程 例2 某工厂某产品产量与单位成本成线性相关关系 数据如下 根据以上数据求线性回归方程 点评 1 最小二乘法是一种有效地求回归方程的方法 它保证了各点与此直线在整体上最接近 最能反映样本观测数据的规律 2 用最小二乘法求回归直线方程的步骤 判断是否线性相关 可用散点图判断 也可以用残差分析 相关指数判断 如果是线性相关 先计算的值 再代入公式的值 写出直线回归方程 变式探究 如表 其提供了某厂节能降耗技术改造生产甲产品过程中记录的产量x 单位 吨 与相应的生产能耗y 单位 吨标准煤 的几组对应数据 1 请画出表中数据的散点图 2 请根据表中提供的数据 用最小二乘法求出y关于x的回归方程 bx a 解析 1 依题设所给数据 可得散点图如图 考点三 利用回归直线方程对总体进行估计 例3 营养学家为研究食物中蛋白质含量对婴幼儿生长的影响 调查了一批年龄在两个月到三岁的婴幼儿 将他们按食物中蛋白质含量的高低分为高蛋白食物组和低蛋白食物组两组 并测量身高 得到下面的数据 高蛋白食物组 低蛋白食物组 身高与年龄近似有线性关系 检验 不同食物的婴幼儿的身高有无差异 若存在 这种差异有何特点 对低蛋白食物组 设年龄为x 身高为y 同样可得线性回归方程 51 226 8 686x 通过对斜率 截距进行比较 可以看出不同食物对婴儿的身高有显著的差异 且高蛋白食物组同龄婴幼儿身高明显高些 点评 线性回归分析的主要作用是通过对两个变量已有数据的分析 来预测这两个变量的变化趋势 一般步骤是 进行线性相关性检验 如果具有线性相关性 求出线性回归方程 将观测值代入回归方程进行预测 变式探究 3 某班5名学生的数学和物理成绩如下表 1 画出散点图 2 求物理成绩y对数学成绩x的回归直线方程 3 一名学生的数学成绩是96 试预测他的物理成绩 解析 1 散点图如图 考点四 独立性检验 例4 某学校课题组为了研究学生的数学成绩与物理成绩之间的关系 随机抽取高二年级20名学生某次考试成绩 满分100分 如下表所示 若单科成绩85分以上 含85分 则该科成绩为优秀 1 根据上表完成下面的2 2列联表 单位 人 2 根据题 1 中表格的数据计算 有多大的把握 认为学生的数学成绩与物理成绩之间有关系 3 若从这20个人中抽出1人来了解有关情况 求抽到的学生数学成绩与物理成绩至少有一门不优秀的概率 参考数据 假设有两个分类变量x和y 它们的值域分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 则随机变量k2 其中n a b c d为样本容量 独立检验随机变量k2的临界值参考表 解析 1 2 2列联表为 单位 人 2 提出假设h0 学生数学成绩与物理成绩之间没有关系 根据列联表可以求得k2 8 802 7 879 当h0成立时 p k2 7 879 0 005 所以我们有99 5 的把握认为学生的数学成绩与物理成绩之间有关系 3 由 1 可知数学成绩与物理成绩都优秀的学生的人数为5人 则数学成绩与物理成绩至少有一门不优秀的学生人数为15人 故从20名学生中抽出1名 抽到的学生数学成绩与物理成绩至少有一门不优秀的概率为 点评 独立性检验的一般步骤 1 列出2 2列联表 假设两个变量无关系 2 根据公式k2 计算k2的值 3 比较k2与临界值的大小关系作出统计推断 变式探究 4 2012 罗定中学模拟 某研究小组为了研究中学生的身体发育情况 在某学校随机抽出20名15至16周岁的男生 将他们的身高和体重制成2 2的列联表 根据列联表的数据 可以有 的把握认为该学校15至16周岁的男生的身高和体重之间有关系 附 独立性检验临界值表 独立性检验随机变量k2值的计算公式 解析 k2 5 934 5 024 由k2的临界值表可知 有97 5 的把握认为该学校15至16周岁的男生的身高和体重之间有关系 答案 97 5 1 对两个变量的线性关系情况的判断有两个方法 一是根据散点图 这种方法是从图形上粗略地观察 比较直观 简单易行 但往往对相关程度刻画得不够准确 二是计算相关系数法 这种方法能比较准确地反映相关程度 相关系数的绝对值越接近1 相关性就越强 相关系数就是描述相关性强弱的 相关性有正相关和负相关 强相关和弱相关 2 建立回归模型的步骤 1 确定研究对象 明确解释变量和预报变量 2 画出散点图 观察它们之间的关系 如是否具有线性相关关系 3 由经验确定回归方程的类型 主要是线性回归模型 4 用最小二乘法求线性回归方程 5 最后是相关性检验 若存在异常 则检查数据是否有误 或模型是否合适 3 利用独立性检验可以考查两个分类变量是否有关系 并能较为准确地给出这种判断的可信度 具体做法是根据公式 计算随机变量的观测值k k值越大 说明 两个变量有关系 的可能性越大 感悟高考 品味高考 1 2012 湖南卷 设某大学的女生体重y 单位 kg 与身高x 单位 cm 具有线性相关关系 根据一组样本数据 xi yi i 1 2 n 用最小二乘法建立的回归方程为 0 85x 85 71 则下列结论中不正确的是 a y与x具有正的线性相关关系b 回归直线过样本点的中心 c 若该大学某女生身高增加1cm 则其体重约增加0 85kgd 若该大学某女生身高为170cm 则可断定其体重必为58 79kg 解析 根据回归方程的概念和性质知选项a b c三项均正确 选项d错误 线性回归方程只能预测学生的体重 选项d应改为 若该大学某女生身高为170cm 则估计其体重大约为58 79kg 答案 d 2 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中 随机抽取了100名电视观众 相关的数据如下表所示 1 由表中数据直观分析 收看新闻节目的观众是否与年龄有关 2 用分层抽样方法在收看新闻节目的观众中随机抽取5名大于40岁的观众应该抽取几名 3 在上述抽取的5名观众中任取2名 求恰有1名观众年龄为20至40岁的概率 解析 1 有关 收看新闻节目多为年龄大的 2 应抽取的人数为 5 3 人 3 由 2 知 抽取的5名观众中 有2名观众年龄处于20至40岁 3名观众的年龄大于40岁 记大于40岁的人为a1 a2 a3 20至40岁的人为b1 b2 则从5人中抽取2人的基本事件有 a1 a2 a1 a3 a2 a3 b1 b2 a1 b1 a1 b2 a2 b1 a2 b2 a3 b1 a3 b2 共10个 其中恰有1人为20至40岁的基本事件有 a1 b1 a1 b2 a2 b1 a2 b2 a3 b1 a3 b2 共6个 因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025年幼儿园保教体育活动计划
- 篮球校园文化建设计划
- 人教版八年级上册道德与法治教育创新计划
- 建筑装修安全文明施工管理体系与措施
- 财务承诺书范文及填写指南
- 服装店店长年度工作计划范文
- 油漆喷涂职业病危害防治措施
- 港口绿化带施工进度计划及工期保证措施
- 高一年级学生安全保障计划
- 初中道德与法治师资队伍建设计划
- CJ/T 340-2016绿化种植土壤
- 庐山市国有投资控股集团有限公司招聘笔试题库2025
- 2025年贵州省公务员录用考试《行测》真题及答案解析
- 第一单元:三视图的判断、确认与绘制专项练习-2023-2024学年五年级数学下册典型例题系列(原卷版)人教版
- 杨梅承包合同协议书
- 物理光学知到智慧树期末考试答案题库2025年山东理工大学
- 2024年新沪科版七年级上册数学教学课件 第1章 有理数 1.2 数轴、相反数和绝对值 第1课时 数轴
- 《高一物理力学进阶:动力学与能量学教学教案》
- 总监理工程师作业指导书
- GA/T 2160-2024法庭科学资金数据检验规程
- 2025年全国高压电工证(复审)理论考试试题(1000题)附答案
评论
0/150
提交评论