




已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节相关性 最小二乘估计 回归分析与独立性检验 三年13考高考指数 1 会作两个相关变量的数据的散点图 会利用散点图认识变量间的相关关系 2 了解最小二乘法的思想 能根据给出的线性回归方程系数公式建立线性回归方程 3 了解独立性检验 只要求2 2列联表 的基本思想 方法及其简单应用 4 了解回归分析的基本思想 方法及其简单应用 1 线性回归方程的建立及应用和独立性检验的应用是考查重点 2 题型以选择题和填空题为主 主要是求线性回归方程的系数或利用线性回归方程进行预测 在给出临界值的情况下判断两个变量是否有关 1 相关性 1 散点图 在考虑两个量的关系时 为了对 之间的关系有一个大致的了解 人们通常将 的点描出来 这些点就组成了变量之间的一个图 通常称这种图为变量之间的散点图 2 曲线拟合 从散点图上可以看出 如果变量之间 这些点会有一个 的大致趋势 这种趋势通常可以用一条 来近似 这种近似的过程称为曲线拟合 变量所对应 存在着某 种关系 光滑的曲线 变量 集中 3 线性相关 若在两个变量x和y的散点图中 所有点看上去都在 附近波动 则称变量间是线性相关的 此时 我们可以用 来近似 4 非线性相关 若散点图上所有点看上去都在 附近波动 则称此相关为非线性相关 此时 可以用 来拟合 5 不相关 如果所有的点在散点图中 则称变量间是不相关的 一条直线 一条直线 某条曲线 不是一条直线 一条曲线 没有显示任何关系 即时应用 1 思考 相关关系与函数关系有什么异同点 提示 相同点 两者均是指两个变量的关系 不同点 函数关系是一种确定的关系 相关关系是一种非确定的关系 函数关系是一种因果关系 而相关关系不一定是因果关系 也可能是伴随关系 2 判断下列各关系是否是相关关系 请在括号内填 是 或 否 路程与时间 速度的关系 加速度与力的关系 产品成本与产量的关系 圆周长与圆面积的关系 广告费支出与销售额的关系 解析 是确定的函数关系 成本与产量 广告费支出与销售额是相关关系 答案 否 否 是 否 是 2 回归直线方程与相关系数 1 最小二乘法如果有n个点 x1 y1 x2 y2 xn yn 可以用下面的表达式来刻画这些点与直线y a bx的接近程度 使得上式达到 的直线y a bx就是我们所要求的直线 这种方法称为最小二乘法 y1 a bx1 2 y2 a bx2 2 yn a bxn 2 最小值 2 线性回归方程假设样本点为 x1 y1 x2 y2 xn yn 则直线方程y a bx称为线性回归方程 a b是线性回归方程的 系数 3 相关系数r 当r 0时 称两个变量 当r 0时 称两个变量 当r 0时 称两个变量 r的绝对值越接近于1 表明两个变量之间的线性相关程度越高 r的绝对值越接近于0 表明两个变量之间的线性相关程度越低 正相关 负相关 线性不相关 即时应用 1 由一组样本数据 x1 y1 x2 y2 xn yn 得到回归直线方程y a bx 判断下面说法是否正确 请在括号内打 或 任何一组观测值都能得到具有代表意义的回归直线方程 直线y a bx至少经过点 x1 y1 x2 y2 xn yn 中的一个点 直线y a bx的斜率 直线y a bx和各点 x1 y1 x2 y2 xn yn 的偏差是该坐标平面上所有直线与这些点的偏差中最小的 2 已知回归方程y 4 4x 838 19 则可估计x与y的增长速度之比约为 解析 1 任何一组观测值都能利用公式得到直线方程 但这个方程可能无意义 不正确 回归直线方程y bx a经过样本点的中心可能不经过 x1 y1 x2 y2 xn yn 中的任何一点 这些点分布在这条直线附近 不正确 正确 正确 2 x与y的增长速度之比即约为回归方程的斜率的倒数答案 1 2 3 独立性检验 1 2 2列联表设a b为两个变量 每一个变量都可以取两个值 变量a a1 a2 变量b b1 b2 通过观察得到如表所示的数据 a b a b c d c d a c b d n a b c d 2 独立性判断方法选取统计量 用它的大小来检验变量之间是否独立 当 2 时 没有充分的证据判定变量a b有关联 可以认为变量a b是没有关联的 当 2 时 有90 的把握判定变量a b有关联 当 2 时 有95 的把握判定变量a b有关联 当 2 时 有99 的把握判定变量a b有关联 2 706 2 706 3 841 6 635 即时应用 1 下面是一个2 2列联表则表中a b处的值分别为 2 在一项打鼾与患心脏病的调查中 共调查了1671人 经过计算 2的观测值为27 63 根据这一数据分析 我们有理由认为打鼾与患心脏病是 的 填 有关 或 无关 解析 1 a 21 73 a 52 又 a 2 b b 54 2 27 63 6 635 有99 的把握认为 打鼾与患心脏病有关 答案 1 52 54 2 有关 相关关系的判断 方法点睛 利用散点图判断相关关系的技巧利用散点图判断两个变量是否有相关关系是比较简便的方法 1 在散点图中如果所有的样本点都落在某一函数的曲线上 就用该函数来描述变量之间的关系 即变量之间具有函数关系 2 如果所有的样本点都落在某一函数的曲线附近 变量之间就有相关关系 3 如果所有的样本点都落在某一直线附近 变量之间就有线性相关关系 例1 关于人体的脂肪含量 百分比 和年龄关系的研究中 得到如下一组数据 判断它们是否有相关关系 解题指南 判断有无相关关系 一种常用的简便方法就是绘制散点图 规范解答 本题涉及两个变量 年龄与脂肪含量 可以以年龄为自变量 考查脂肪含量的变化趋势 分析相关关系通常借助散点图 以年龄作为x轴 脂肪含量作为y轴 可得相应的散点图如图所示 由散点图可知 两者之间具有相关关系 反思 感悟 粗略判断相关性 可以观察一个变量随另一个变量变化而变化的情况 画出散点图能够更直观的判断是否相关 相关时是正相关还是负相关 变式训练 5个学生的数学和物理成绩如下表 画出散点图 并判断它们是否有相关关系 解析 把数学成绩作为横坐标 把相应的物理成绩作为纵坐标 在直角坐标系中描点 xi yi i 1 2 5 作出散点图如图 从图中可以直观地看出数学成绩和物理成绩具有相关关系 且当数学成绩增大时 物理成绩也在由小变大 即它们正相关 线性回归方程及其应用 方法点睛 求样本数据的线性回归方程的步骤第一步 计算平均数第二步 求和第三步 计算第四步 写出回归方程y bx a 提醒 对于任意一组样本数据 利用上述公式都可以求得 回归方程 如果这组数据不具有线性相关关系 即不存在回归直线 那么所得的 回归方程 是没有实际意义的 因此 对一组样本数据 应先作散点图 在具有线性相关关系的前提下再求回归方程 例2 1 2011 广东高考 某数学老师身高176cm 他爷爷 父亲和儿子的身高分别是173cm 170cm和182cm 因儿子的身高与父亲的身高有关 该老师用线性回归分析的方法预测他孙子的身高为 cm 2 测得某国10对父子身高 单位 英寸 如下 画出散点图 说明变量y与x的相关性 如果y与x之间具有线性相关关系 求线性回归方程 已知 4490 34 44794 44941 93 44842 4 解题指南 1 求出回归方程 代入相关数据求得 2 根据散点图判断相关性 根据已知数据和提示的公式数据求解 写出线性回归方程 规范解答 1 由题设知 设相对的父亲的身高为x 相对的儿子的身高为y 它们对应的取值如表所示于是有a 176 173 1 3 得回归方程为y x 3 所以当x 182时 y 185 答案 185 2 散点图如图所示 观察散点图中点的分布可以看出 这些点在一条直线的附近分布 所以变量y与x之间具有线性相关关系 设回归方程为y bx a 由 67 01 0 4646 66 8 35 9747 得所求的线性回归方程为y 0 4646x 35 9747 互动探究 若本例 2 题干不变 如果父亲的身高为73英寸 试估计儿子的身高 解析 由本例 2 可知回归方程为y 0 4646x 35 9747 当x 73时 y 0 4646 73 35 9747 69 9 英寸 所以当父亲身高为73英寸时 儿子的身高约为69 9英寸 反思 感悟 求线性回归方程 主要是利用公式 求出回归系数b a 求解过程中注意计算的准确性和简便性 利用回归方程预报 就是求函数值 变式训练 一般来说 一个人脚越长 他的身高就越高 现对10名成年人的脚长x与身高y进行测量 得如下数据 单位 cm 作出散点图后 发现散点在一条直线附近 经计算得到一些数据 某刑侦人员在某案发现场发现一对裸脚印 量得每个脚印长26 5cm 请你估计案发嫌疑人的身高为 cm 解析 由已知故y 7x 当x 26 5时 y 185 5 答案 185 5 独立性检验的基本思想及其应用 方法点睛 利用统计量 2进行独立性检验的步骤 1 根据数据列出2 2列联表 2 根据公式计算 2的值 3 比较 2与临界值的大小关系 作出统计推断 例3 某企业为了更好地了解设备改造前后与生产合格品的关系 随机抽取了180件产品进行分析 其中设备改造前的合格品有36件 不合格品有49件 设备改造后生产的合格品有65件 不合格品有30件 根据所给数据 1 写出2 2列联表 2 判断产品是否合格与设备改造是否有关 解题指南 列表后利用 2的值进行检验 规范解答 1 由已知数据得 2 12 38 由于12 38 6 635 所以有99 以上的把握认为产品是否合格与设备改造有关 反思 感悟 准确计算 2的值是关键 能有多大的把握认为两个变量有关 应熟悉常用的几个临界值 变式训练 为研究是否喜欢饮酒与性别之间的关系 在某地区随机抽取290人 得到如下列联表 利用列联表的独立性检验判断是否喜欢饮酒与性别是否有关 解析 由列联表中的数据得 2 11 953 6 635 所以有99 以上的把握认为是否喜欢饮酒与性别有关 变式备选 有两个分类变量x与y 其一组观测的2 2列联表如下表 其中a 15 a均为大于5的整数 则a取何值时有90 以上的把握认为x与y之间有关系 解析 要有90 以上的把握认为x与y之间有关系 则 2 2 706 而 2 解 2 2 706得a 7 19或a5且15 a 5 a z 所以a 8 9 故当a取8或9时有90 以上的把握认为x与y之间有关系 满分指导 线性回归方程解答题的规范解答 典例 12分 2011 安徽高考 某地最近十年粮食需求量逐年上升 下表是部分统计数据 1 利用所给数据求年需求量与年份之间的回归直线方程y bx a 2 利用 1 中所求出的直线方程预测该地2012年的粮食需求量 解题指南 将数据进行处理 把数据同时减去一个数代入公式计算 利用公式求回归直线方程 并进行预测 规范解答 1 由所给数据看出 年需求量与年份之间是近似直线上升 下面来求回归直线方程 先将数据预处理如下 2分 对预处理的数据 容易算得 4分 6分由上述计算结果 知所求回归直线方程为y 257 b x 2006 a 6 5 x 2006 3 2 8分即y 6 5 x 2006 260 2 10分 2 利用所求得的直线方程 可预测2012年的粮食需求量为6 5 2012 2006 260 2 6 5 6 260 2 299 2 万吨 12分 阅卷人点拨 通过高考中的阅卷数据分析与总结 我们可以得到以下失分警示和备考建议 1 2011 江西高考 为了解儿子身高与其父亲身高的关系 随机抽取5对父子身高数据如下则y对x的线性回归方程为 a y x 1 b y x 1 c y 88 x d y 176 解析 选c 由表中数据知回归直线是上升的 首先排除d 由线性回归性质知 点 176 176 一定在回归直线上 代入各选项检验 只有c符合 故选c 2 2011 陕西高考 设 x1 y1 x2 y2 xn yn 是变量x和y的n个样本点 直线l是由这些样本点通过最小二乘法得到的线性回归直线 如图 以下结论正确的是 a 直线l过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 车辆维修工安全知识培训课件
- 特称命题和全称命题课件
- 油墨印刷适应性测试报告修改工艺考核试卷及答案
- 柑橘种植果实采收后处理工艺考核试卷及答案
- 车辆安全带培训课件
- 2025年黑龙江省佳木斯市导游资格全国导游基础知识模拟题(附答案)
- 2025年黑龙江省大兴安岭地区导游资格全国导游基础知识模拟题(附答案)
- 压缩机壳体防锈涂层性能测试工艺考核试卷及答案
- 镜面镀膜层厚度控制工艺考核试卷及答案
- 2025年焊接工程师考试中的技术题与应用案例探讨试题及答案
- 泌尿外科手术分级管理制度
- 阿尔茨海默病药物治疗指南(2025)解读
- 报酬协议模板
- 《贵阳市公共交通场站设计导则》
- 新时代中小学教师职业行为十项准则
- 工业厂房独立基础土方开挖施工方案
- 职业指导师考试题库及答案(含各题型)
- 企业融资过程中的税务问题解析
- 足球俱乐部股权转让协议
- 电子商务在文化创意产业的应用与案例
- 课件:《科学社会主义概论(第二版)》第二章
评论
0/150
提交评论