已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五节相关性 最小二乘估计 回归分析与独立性检验 1 相关性 1 散点图 在考虑两个量的关系时 为了对 之间的关系有一个大致的了解 人们通常将 的点描出来 这些点就组成了变量之间的一个图 通常称这种图为变量之间的散点图 变量 变量所对应 2 曲线拟合 从散点图上可以看出 如果变量之间 这些点会有一个 的大致趋势 这种趋势通常可以用一条 来近似 这种近似的过程称为曲线拟合 3 线性相关 若两个变量x和y的散点图中 所有点看上去都在 附近波动 则称变量间是线性相关的 此时 我们可以用 来近似 存在着 某种关系 集中 光滑的曲线 一条直线 一条直线 4 非线性相关 若散点图上所有点看上去都在 附近波动 则称此相关为非线性相关 此时 可以用 来拟合 5 不相关 如果所有的点在散点图中 则称变量间是不相关的 某条曲线 不是一条直线 一条曲线 没有显示任何关系 2 回归直线方程与相关系数 1 最小二乘法如果有n个点 x1 y1 x2 y2 xn yn 可以用下面的表达式来刻画这些点与直线y a bx的接近程度 使得上式达到 的直线y a bx就是我们所要求的直线 这种方法称为最小二乘法 y1 a bx1 2 y2 a bx2 2 yn a bxn 2 最小值 2 线性回归方程假设样本点为 x1 y1 x2 y2 xn yn 则直线方程y a bx称为线性回归方程 a b是线性回归方程的 系数 3 相关系数r 当r 0时 称两个变量 当r 0时 称两个变量 当r 0时 称两个变量 r的绝对值越接近于1 表明两个变量之间的线性相关程度越高 r的绝对值越接近于0 表明两个变量之间的线性相关程度越低 正相关 负相关 线性不相关 3 独立性检验 1 2 2列联表设a b为两个变量 每一个变量都可以取两个值 变量a a1 a2 变量b b1 b2 通过观察得到如表所示的数据 2 独立性判断方法选取统计量 用它的大小来检验变量之间是否独立 当 2 时 没有充分的证据判定变量a b有关联 可以认为变量a b是没有关联的 当 2 时 有90 的把握判定变量a b有关联 当 2 时 有95 的把握判定变量a b有关联 当 2 时 有99 的把握判定变量a b有关联 2 706 2 706 3 841 6 635 判断下面结论是否正确 请在括号中打 或 1 线性回归分析就是由样本点去寻找一条直线 使之贴近这些样本点的方法 2 利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示 3 通过回归方程y a bx可以估计和观测变量的取值和变化趋势 4 因为由任何一组观测值都可以求得一个线性回归方程 所以没有必要进行相关性检验 5 任意两个变量之间都存在着线性相关关系 6 如果两个变量之间线性不相关 则这两个变量一定不存在线性回归方程 解析 1 正确 反映的是最小二乘法的思想 2 正确 反映的是散点图的作用 3 正确 解释的是回归方程y a bx的作用 4 错误 在求回归方程之前必须进行相关性检验 以体现两变量的关系 5 错误 变量之间还存在函数关系和非线性相关关系 6 错误 任意两个变量都可以利用公式求出线性回归方程 答案 1 2 3 4 5 6 1 利用统计量 2来判断 两个变量x y有关系 计算公式为 则下列说法正确的是 a ad bc越小 说明x与y关系越弱 b ad bc越大 说明x与y关系越强 c ad bc 2越大 说明x与y关系越强 d ad bc 2越接近于0 说明x与y关系越强 解析 选c 由 2的计算公式及其意义容易判断选c 2 某商品销售量y 件 与销售价格x 元 件 负相关 则其回归直线方程可能是 a y 200 10 x b y 200 10 x c y 200 10 x d y 200 10 x 解析 选a 商品销售量y 件 与销售价格x 元 件 负相关 b0 应选a 3 一位母亲记录了儿子3 9岁的身高 由此建立的身高与年龄的回归模型为y 73 93 7 19x 用这个模型预测这个孩子10岁时的身高 则正确的叙述是 a 身高一定是145 83cm b 身高在145 83cm以上 c 身高在145 83cm左右 d 身高在145 83cm以下 解析 选c 用回归模型y 73 93 7 19x 只能作预测 其结果只是一个估计值 4 给出下列关系 正方形的边长与面积之间的关系 某化妆品的销售量与广告宣传费之间的关系 人的身高与视力之间的关系 雾天的能见度与交通事故的发生率之间的关系 学生与其学号之间的关系 其中具有相关关系的是 解析 正方形的边长与面积之间的关系是函数关系 化妆品的销售量与广告宣传费之间的关系不是严格的函数关系 但是具有相关性 因而是相关关系 人的身高与视力之间的关系既不是函数关系 也不是相关关系 能见度与交通事故的发生率之间具有相关关系 学生与其学号之间的关系是一种确定的对应关系 综合以上可知 具有相关关系 而 是确定性的函数关系 两种关系都不具有 答案 5 某高校 统计初步 课程的教师随机调查了选该课程的一些学生的情况 具体数据如表 为了判断主修统计专业是否与性别有关系 根据表中的数据 得到因为 2 3 841 所以有 的把握判定主修统计专业与性别有关系 解析 2 4 844 3 841 有95 的把握认为主修统计专业与性别有关系 答案 95 考向1相关关系的判断 典例1 1 对变量x y有观测数据 xi yi i 1 2 10 得散点图 1 对变量u v有观测数据 ui vi i 1 2 10 得散点图 2 由这两个散点图可以判断 a 变量x与y正相关 u与v正相关 b 变量x与y正相关 u与v负相关 c 变量x与y负相关 u与v正相关 d 变量x与y负相关 u与v负相关 2 2012 新课标全国卷 在一组样本数据 x1 y1 x2 y2 xn yn n 2 x1 x2 xn不全相等 的散点图中 若所有样本点 xi yi i 1 2 n 都在直线y x 1上 则这组样本数据的样本相关系数为 a 1 b 0 c d 1 思路点拨 1 根据散点图的变化趋势判断 2 理清相关系数与相关性强弱的关系是解决本题的关键 规范解答 1 选c 由题图 1 可知 各点整体呈递减趋势 x与y负相关 由题图 2 可知 各点整体呈递增趋势 u与v正相关 2 选d 样本相关系数越接近1 相关性越强 现在所有的样本点都在直线y x 1上 样本的相关系数应为1 拓展提升 线性相关关系与函数关系的区别 1 函数关系中的两个变量间是一种确定性关系 例如 正方形面积s与边长x之间的关系s x2就是函数关系 2 相关关系是一种非确定性关系 即相关关系是非随机变量与随机变量之间的关系 例如 商品的销售额与广告费是相关关系 两个变量具有相关关系是回归分析的前提 变式训练 某公司的科研人员在7块并排 形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验 得到如表所示的一组数据 单位 kg 1 画出散点图 2 判断是否具有相关关系 解析 1 散点图如图所示 2 由散点图知 各组数据对应点大致都在一条直线附近 所以施化肥量x与产量y具有线性相关关系 考向2线性回归方程及其应用 典例2 1 2013 南昌模拟 下表提供了某厂节能降耗技术改造后在生产a产品过程中记录的产量x 吨 与相应的生产能耗y 吨 的几组对应数据 根据上表提供的数据 求出y关于x的回归直线方程为y 0 35 0 7x 那么表中t的值为 a 3 b 3 15 c 3 5 d 4 5 2 2012 福建高考 某工厂为了对新研发的一种产品进行合理定价 将该产品按事先拟定的价格进行试销 得到如下数据 求回归直线方程y a bx 其中b 20 预计在今后的销售中 销量与单价仍然服从 中的关系 且该产品的成本是4元 件 为使工厂获得最大利润 该产品的单价应定为多少元 利润 销售收入 成本 思路点拨 1 先求出再利用回归直线方程过求出t的值 2 先求出再利用求出a的值 利用 利润 销售收入 成本 列出函数关系式后再求解 规范解答 1 选a 依题意得 3 4 5 6 4 5 又回归直线方程y 0 35 0 7x过故0 35 0 7 4 5 解得t 3 2 由于所以从而回归直线方程为y 250 20 x 设工厂获得的利润为l元 依题意得l x 20 x 250 4 20 x 250 20 x2 330 x 1000 20 x 2 361 25 当且仅当x 8 25时 l取得最大值 故当单价定为8 25元时 工厂可获得最大利润 互动探究 本例题 2 中条件不变 预测当单价为10元时 销量是多少件 解析 将x 10代入y 250 20 x得 y 50 即销量大约是50件 拓展提升 最小二乘法估计的三个步骤 1 作出散点图 判断是否线性相关 2 如果是 则用公式求a b 写出回归方程 3 根据方程进行估计 提醒 回归直线方程恒过点 变式备选 某商场对每天进店人数和商品销售件数进行了统计对比 得到如下表格 其中i 1 2 3 4 5 6 7 1 以每天进店人数为横轴 每天商品销售件数为纵轴 画出散点图 2 求回归直线方程 结果保留到小数点后两位 参考数据 3 预测进店人数为80人时 商品销售的件数 结果保留整数 解析 1 散点图如图 2 易知所有点在一条直线附近 回归直线方程是y 4 07 0 78x 3 进店人数为80人时 商品销售的件数y 4 07 0 78 80 59 件 考向3独立性检验 典例3 为了比较注射a b两种药物后产生的皮肤疱疹的面积 选200只家兔做试验 将这200只家兔随机地分成两组 每组100只 其中一组注射药物a 另一组注射药物b 完成下面2 2列联表 并回答能否有99 的把握认为 注射药物a后的疱疹面积与注射药物b后的疱疹面积有差异 思路点拨 1 把握2 2列联表的意义 准确填入数据 2 将数据代入 2的公式进行计算 3 与临界值比较并得出结论 规范解答 2 2列联表如下 则由于 2 6 635 因此能有99 的把握认为 注射药物a后的疱疹面积与注射药物b后的疱疹面积有差异 拓展提升 解独立性检验的应用问题的关注点 1 两个明确 明确两类主体 如 吸烟者 不吸烟者 明确研究的两个问题 如 患肺癌 未患肺癌 2 解决问题的关键 准确画出2 2列联表 准确理解 2 3 统计的基本思维模式是归纳 它的特征之一是由部分数据的性质推断全部数据的性质 因此 由此推断所得结论可能是错误的 即从数据上体现的是统计关系 而不是因果关系 变式训练 冶炼某种金属可以用旧设备和改造后的新设备 为了检验用这两种设备生产的产品中所含杂质的关系 调查结果如表所示 根据以上数据 则 a 含杂质的高低与设备是否改造有关 b 含杂质的高低与设备是否改造无关 c 设备是否改造不能决定含杂质的高低 d 以上答案都不对 解析 选a 由已知数据得到如下2 2列联表 由公式得由于13 11 6 635 故有99 的把握认为含杂质的高低与设备是否改造有关 满分指导 解答独立性检验与概率相结合的综合题 典例 12分 2012 辽宁高考改编 电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况 随机抽取了100名观众进行调查 其中女性有55名 下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图 将日均收看该体育节目时间不低于40分钟的观众称为 体育迷 已知 体育迷 中有10名女性 1 根据已知条件完成下面的2 2列联表 并据此资料你是否认为 体育迷 与性别有关 2 将日均收看该体育节目不低于50分钟的观众称为 超级体育迷 已知 超级体育迷 中有2名女性 若从 超级体育迷 中任意选取2人 求至少有1名女性观众的概率 附 思路点拨 规范解答 1 由所给的频率分布直方图知 体育迷 人数为100 10 0 020 10 0 005 25 非体育迷 人数为75 则据题意完成2 2列联表 3分 将2 2列联表的数据代入公式计算 因为3 030 2 706 所以有90 的把握认为 体育迷 与性别有关 6分 2 由所给的频率分布直方图知 超级体育迷 人数为100 10 0 005 5 7分记ai i 1 2 3 表示男性 bj j 1 2 表示女性 所有可能结果构成的基本事件空间为 a1a2 a1a3 a2a3 a1b1 a2b1 a3b1 a1b2 a2b2 a3b2 b1b2 共由10个基本事件组成 且每个基本事件的出现是等可能的 10分 用a表示事件 任选2人 至少1名女性 则a a1b1 a2b1 a3b1 a1b2 a2b2 a3b2 b1b2 共由7个基本事件组成 故 任选2人 至少1名女性 的概率为 12分 失分警示 下文 见规范解答过程 1 2012 湖南高考 设某大学的女生体重y 单位 kg 与身高x 单位 cm 具有线性相关关系 根据一组样本数据 xi yi i 1 2 n 用最小二乘法建立的回归方程为y 0 85x 85 71 则下列结论中不正确的是 a y与x具有正的线性相关关系 b 回归直线过样本点的中心 c 若该大学某女生身高增加1cm 则其体重约增加0 85kg d 若该大学某女生身高为170cm 则可断定其体重必为58 79kg 解析 选d 2 2013 西安模拟 已知x y之间的数据如表所示 则回归直线过点 a 0 0 b 2 1 8 c 3 2 5 d 4 3 2 解析 选c 回归直线恒过定点故选c 3 2013 宁德模拟 某产品的广告费用x与销售额y的统计数据如下表 根据上表可得回归方程y a bx中的b为9 4 据此模型预报广告费用为6万元时销售额约为 a 63 6万元 b 65 5万元 c 67 7万元 d 72 0万元 解析 选b 由表可计算因为点 42 在回归直线y a bx上 且b为9 4 所以42 9 4 a 解得a 9 1 故回归方程为y 9 1 9 4x 令x 6得y 65 5 选b 4 2013 汕头模拟 以下四个命题 其中正确的是 从匀速传递的产品生产流水线上 质检员每20分钟从中抽取一件产品进行某项指标检测 这样的抽样是分层抽样 两个随机变量相关性越强 则相关系数的绝对值越接近于1 在回归直线方程y 12 0 2x中 当x每增加一个单位时 y平均增加0 2个单位 对变量x与y 它们的统计量 2来说 2越小 x与y有关系 的把握程度越大 a b c d 解析 选d 是系统抽样 正确 对于 统计量 2的值越小 说明两个变量有关系的把握程度越小 5 2013 汉中模拟 在吸烟与患肺病这两个分类变量的计算中 下列说法正确的是 a 若 2 6 6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校安全企业课件
- 安全管理课件标题
- 课件安全动画
- 土建质量员考试题库(含答案)
- 地方病考试题及答案
- 2025年度四川继续教育公需科目模拟考试题及答案
- 2025年度考核十八项医疗核心制度基础真题和答案
- 2001-2007年北大行政管理考研真题集
- 小学安全课件简介
- 医疗质量安全管理培训试题
- 2025年小学师德考试试题及答案
- 2025西藏华泰龙矿业开发有限公司招聘39人笔试历年典型考点题库附带答案详解试卷2套
- 2025年六西格玛绿带题库及答案
- 2025年河北石家庄市直事业单位公开选调工作人员173名考试笔试模拟试题及答案解析
- 公务接待礼仪及物资准备清单
- 2025年湖南娄底涟源市国家粮食储备有限责任公司招聘6名合同制员工笔试历年常考点试题专练附带答案详解试卷2套
- 2025年心理咨询师资格考试《心理咨询伦理规范》备考题库及答案解析
- 全国大学生职业规划大赛《道路工程检测技术》专业生涯发展展示【高职(专科)】
- 2025高中英语3500词汇默写本
- 2025-2026学年八年级数学上学期第一次月考(苏科版第1-2章高效培优提升卷)(考试版A4)
- 感恩教育:“心怀感恩向阳而行”-2025-2026学年高中主题班会
评论
0/150
提交评论