




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 2 相关系数相关系数 学习目标 了解相关系数的计算公式 会由 r 值的大小判断两随机变量线性相关程度的大 小 知识链接 当 r 1 或 1 时 两个变量的相关性如何 答 当 r 1 时 两个变量完全正相关 当 r 1 时 两个变量完全负相关 预习导引 1 相关系数 r 的计算 假设两个随机变量的数据分别为 x1 y1 x2 y2 xn yn 则变量间线 性相关系数 r 的计算公式为 r lxy lxxlyy n i 1 xi x yi y n i 1 xi x 2 n i 1 yi y 2 2 误差表达式 Q a b yi a bxi 2 lyy n a b 2 lxx b n i 1 y x lxy lxx Qmin lyy 1 r2 Q 0 3 相关系数 r 的性质 1 r 的取值范围为 1 1 2 r 值越大 误差 Q 越小 变量之间的线性相关程度越高 3 r 值越接近 0 Q 越大 变量之间的线性相关程度越低 要点一 利用相关系数检验两变量间的相关性 例 1 现随机抽取了某中学高一 10 名在校学生 他们入学时的数学成绩 x 与入 学后第一次考试的数学成绩 y 如下 学生号12345678910 x12010811710410311010410599108 y84648468696869465771 请问 这 10 名学生的两次数学成绩是否具有线性关系 解 120 108 99 108 107 8 x 1 10 84 64 57 71 68 y 1 10 x 1202 1082 992 1082 116 584 10 i 1 2i y 842 642 572 712 47 384 10 i 1 2i xiyi 120 84 108 64 99 57 108 71 73 796 10 i 1 所以相关系数为 r 73 796 10 107 8 68 116 584 10 107 82 47 384 10 682 0 750 6 由此可看出这 10 名学生的两次数学成绩具有较强的线性相关关系 规律方法 利用相关系数 r 进行判断相关关系 需要应用公式计算出 r 的值 由于数据较大 需要借助计算器 跟踪演练 1 假设关于某种设备的使用年限 x 年 与所支出的维修费用 y 万元 有 如下统计资料 x23456 y2 23 85 56 57 0 已知x 90 y 140 78 xiyi 112 3 5 i 1 2 i 5 i 1 2i 5 i 1 1 求 x y 2 对 x y 进行线性相关性检验 解 1 4 x 2 3 4 5 6 5 5 y 2 2 3 8 5 5 6 5 7 0 5 2 xiyi 5 112 3 5 4 5 12 3 5 i 1 x y x 5 2 90 5 42 10 5 i 1 2i x y 5 2 140 78 125 15 78 5 i 1 2i y 所以 r 0 979 12 3 10 15 78 r 0 979 0 75 所以 x 与 y 之间具有很强的线性相关关系 要点二 线性回归分析 例 2 已知某地每单位面积菜地年平均使用氮肥量 x kg 与每单位面积蔬菜年平 均产量 y t 之间的关系有如下数据 年份19851986198719881989199019911992 x kg7074807885929095 y t5 16 06 87 89 010 210 012 0 年份1993199419951996199719981999 x kg92108115123130138145 y t11 511 011 812 212 512 813 0 1 求 x 与 y 之间的相关系数 并检验是否线性相关 2 若线性相关 求蔬菜产量 y 与使用氮肥量 x 之间的线性回归直线方程 并估 计每单位面积施氮肥 150 kg 时 每单位面积蔬菜的年平均产量 解 1 列出下表 并用科学计算器进行相关计算 i12345678 xi7074807885929095 yi5 16 06 87 89 010 210 012 0 xiyi357444544608 4765938 49001 140 i9101112131415 xi92108115123130138145 yi11 511 011 812 212 512 813 0 xiyi1 0581 1881 3571 500 61 6251 766 41 885 101 10 11 x 1 515 15 y 151 7 15 x 161 125 y 1 628 55 xiyi 16 076 8 15 i 1 2i 15 i 1 2i 15 i 1 故蔬菜产量与施用氮肥量的相关系数 r 16 076 8 15 101 10 11 161 125 15 1012 1 628 55 15 10 112 0 864 3 所以蔬菜产量与施用氮肥量之间存在着线性相关关系 2 设所求的线性回归方程为 y a bx 则 b 0 093 7 16 076 8 15 101 10 11 161 125 15 1012 a b 10 11 0 093 7 101 0 646 3 y x 线性回归方程为 y 0 646 3 0 093 7x 当每单位面积施氮肥 150 kg 时 每单位面积蔬菜年平均产量为 0 646 3 0 093 7 150 14 701 t 规律方法 在研究两个变量之间的关系时 应先进行相关性检验 若具备线性 相关关系再求线性回归方程 如果本身两个变量不具备线性相关关系 即使求出线性回归方程也是毫无意义 的 而且用其估计和预测的量也是不可信的 跟踪演练 2 为分析学生初中升学的数学成绩对高一数学学习的影响 在高一 年级随机抽取 10 名学生 了解他们的入学成绩和高一期末考试数学成绩如下表 学生编号12345678910 入学成绩 x 63674588817152995876 高一期末成绩 y 65785282928973985675 1 画出散点图 2 对变量 x 与 y 进行相关性检验 如果 x 与 y 之间具有线性相关关系 求出线 性回归方程 3 若某学生入学的数学成绩为 80 分 试估计他在高一期末考试中的数学成 绩 解 1 散点图如图所示 2 由题可得 70 76 xi yi 1 894 x y 10 i 1 x y xi 2 2 474 10 i 1 x yi 2 2 056 n i 1 y 因此可得相关系数为 r 10 i 1 xi x yi y 10 i 1 xi x 2 10 i 1 yi y 2 0 839 8 0 75 1 894 2 474 2 056 所以入学数学成绩与高一期末考试数学成绩存在线性相关关系 设线性回归方程为 y a bx 则 b 0 765 56 10 i 1 xi x yi y 10 i 1 xi x 2 1 894 2 474 a b 76 0 765 56 70 22 410 8 y x 因此所求的线性回归方程是 y 22 410 8 0 765 56x 3 若某学生入学的数学成绩为 80 分 代入 2 中的方程可求得 y 22 410 8 0 765 56 80 84 即这名学生在高一期末考试中的数学成绩的预测值为 84 分 1 对于回归分析 下列说法错误的是 A 在回归分析中 变量间的关系若是非确定关系 那么因变量不能由自变量 唯一确定 B 线性相关系数可以是正的 也可以是负的 C 回归分析中 如果 r2 1 说明 x 与 y 之间完全相关 D 样本相关系数 r 1 1 答案 D 解析 相关系数 r 的范围是 1 1 2 一唱片公司欲知打歌费用 x 十万元 与唱片销售量 y 千张 之间的关系 从其 所发行的唱片中随机抽取了 10 张 得如下的资料 xi 28 x 303 4 10 i 1 10 i 1 2i yi 75 y 598 5 xiyi 237 则 y 与 x 的相关系数 r 的绝对值为 10 i 1 10 i 1 2i 10 i 1 答案 0 3 解析 由公式 r 得 r 0 3 3 若线性回归方程中的回归系数 b 0 则相关系数 r 答案 0 解析 相关系数 r 与 b 的分子相 n i 1 xi x yi y n i 1 xi x 2 n i 1 yi y 2 n i 1 xi x yi y n i 1 xi x 2 同 4 有 5 组数据如下 x123410 y3410512 将这组数据中的哪一组去掉后 另外的 4 组数据具有较强的线性相关性 解 作出散点图如图所示 观察散点图 可以发现 A B D E 四个点大致在某条直线附近 具有较强的 线性相关关系 故应将点 C 3 10 去掉 对相关系数 r 的理解 1 判断变量之间的线性相关关系 一般用散点图 但在作图中 由于存在误差 有时很难判断这些点是否分布在一条直线的附近 从而就很难判断两个变量之 间是否具 有线性相关关系 此时就必须利用线性相关系数来判断 2 r 越接近 1 它们的散点图越接近一条直线 这时用线性回归模型拟合这组 数据的效果就越好 3 相关系数 r 只能描述两个变量之间的变化方向及密切程度 不能揭示二者之 间的本质联系 4 相关系数 r 可以定量地反映出变量间的相关程度 明确的给出有无必要建立 两变量间的回归方程 一 基础达标 1 下列说法不正确的是 A 回归分析中 变量 x 和 y 都是普通变量 B 变量间的关系若是非确定性关系 那么因变量不能由自变量唯一确定 C 线性相关系数可能是正的 也可能是负的 D 如果线性相关系数是负的 y 随 x 的增大而减少 答案 A 解析 在回归分析中的两个变量是具有相关关系的两个变量 2 通过相关系数来判断两个变量相关关系的强弱时 相关系数的绝对值越大 用线性回归模型拟合样本数据的效果就越好 如果相关系数 r 0 75 1 则两 个变量 A 负相关很强 B 相关性一般 C 正相关很强 D 两变量之间几乎没有关系 答案 C 3 对四对变量 y 和 x 进行线性相关检验 已知 n 是观测值组数 r 是相关系数 且已知 n 7 r 0 953 3 n 15 r 0 301 2 n 17 r 0 499 1 n 3 r 0 995 0 则变量 y 和 x 具有线性相关关系的是 A 和 B 和 C 和 D 和 答案 B 解析 相关系数 r 的绝对值越大 变量 x y 的线性相关关系越强 故选 B 4 对变量 x y 有观测数据 xi yi i 1 2 10 得散点图 对变量 u v 有观测数据 ui vi i 1 2 10 得散点图 由这两个散点图可以判 断 A 变量 x 与 y 正相关 u 与 v 正相关 B 变量 x 与 y 正相关 u 与 v 负相关 C 变量 x 与 y 负相关 u 与 v 正相关 D 变量 x 与 y 负相关 u 与 v 负相关 答案 C 解析 在图 中 所有点都在一条直线的附近 且直线的斜率为负值 所以变 量 x 与 y 负相关 同理 变量 u 与 v 正相关 故选 C 5 设两个变量 x 和 y 之间具有线性相关关系 它们的相关系数是 r y 关于 x 的回归直线的斜率是 b 纵轴上的截距是 a 则下列说法正确的是 b 与 r 的符号相同 a 与 r 的符号相同 b 与 r 的符号相反 a 与 r 的符 号相反 答案 解析 因为 b 0 时 两变量正相关 此时 r 0 b 0 时 两变量负相关 此 时 r 0 6 部门所属的 10 个工业企业生产性固定资产价值与工业增加值资料如下表 单 位 百万元 固定资产价值33566789910 工业增加值15172528303637424045 根据上表资料计算的相关系数为 答案 0 991 8 解析 6 6 x 3 3 5 6 6 7 8 9 9 10 10 31 5 y 15 17 25 28 30 36 37 42 40 45 10 r 0 991 8 10 i 1 xi x yi y 10 i 1 xi x 2 10 i 1 yi y 2 7 维尼纶纤维的耐热水性能的好坏可以用指标 缩醛化度 y 来衡量 这个指 标越高 耐水性能也越好 而甲醛浓度是影响缩醛化度的重要因素 在生产中 常用甲醛浓度 x 克 升 去控制这一指标 为此必须找出它们之间的关系 现安 排一批实验 获得如下数据 甲醛浓度 克 升 18202224262830 缩醛化度 克分子 26 8628 3528 7528 8729 7530 0030 36 求相关系数 r 解 列表如下 ixiyix2ixiyi 11826 86324483 48 22028 35400567 32228 75484632 5 42428 87567692 88 52629 75676773 5 62830 00784840 73030 36900910 80 168202 944 1444 900 16 24 x 168 7 y 202 94 7 r lxy lxxlyy 0 96 4 900 16 7 24 202 94 7 4 144 7 242 5 892 7 202 94 7 2 由此可知 甲醛浓度与缩醛化度之间有很强的线性相关关系 二 能力提升 8 变量 X 与 Y 相对应的一组数据为 10 1 11 3 2 11 8 3 12 5 4 13 5 变量 U 与 V 相对应的一组数据为 10 5 11 3 4 11 8 3 12 5 2 13 1 r1表示变量 Y 与 X 之间的线性相关系数 r2表示变量 V 与 U 之间的线性相关系数 则 A r2 r1 0 B 0 r2 r1 C r2 0 r1 D r2 r1 答案 C 解析 由线性相关系数公式知 r n i 1 xi x yi y n i 1 xi x 2 n i 1 yi y 2 11 72 3 X U Y V Xi Ui i 1 2 5 Yi V6 i i 1 2 5 5 i 1 Xi X 2 5 i 1 Yi Y 2 5 i 1 Ui U 2 5 i 1 Vi V 2 令 Xi Yi A 5 i 1 X Y 10 1 11 3 2 11 8 3 12 5 4 X Y X Y X Y X Y 13 5 X Y Ui Vi B 5 i 1 U V 10 5 11 3 4 11 8 3 12 5 2 U V U V U V U V 13 1 U V A 0 B 0 r1 0 r2 0 9 相关系数是度量 A 两个变量之间线性相关关系的强度 B 散点图是否显示有意义的模型 C 两个变量之间是否存在因果关系 D 两个变量之间是否存在关系 答案 A 解析 系数来衡量两个变量之间线性相关关系的强弱 10 去年一轮又一轮的寒潮席卷全国 某商场为了了解某品牌羽绒服的月销售 量 y 件 与月平均气温 x 之间的关系 随机统计了某 4 个月的月销售量与当 月平均气温 数据如下表 月平均气温 x 171382 月销售量 y 件 24334055 由表中数据算出线性回归方程 y bx a 中的 b 2 气象部门预测下个月的平均气温约为 6 据此估计 该商场下个月羽绒服的 销售量的件数约为 答案 46 解析 10 38 a 38 2 10 58 x y 回归方程为 y 2x 58 当 x 6 时 y 46 11 5 个学生的数学和物理成绩如表 学生 学科 ABCDE 数学8075706560 物理7066686462 试用散点图和相关系数 r 判断它们是否有线性相关关系 若有 是正相关还是 负相关 解 法一 涉及两个变量 数学成绩与物理成绩 可以以数学成绩为自变量 考察因变量物理成绩的变化趋势 以 x 轴表示数学成绩 y 轴表示物理成绩 可得相应的散点图 由散点图可见 两者之间具有线性相关关系且是正相关 法二 列表 ixiyix2iy2ixiyi 180706 4004 9005 600 275665 6254 3564 950 370684 9004 6244 760 465644 2254 0964 160 560623 6003 8443 720 35033024 75021 82023 190 r 0 9 0 23 190 23 100 250 40 两变量具有相关关系且正相关 12 下列是水稻产量与施化肥量的一组观测数据 施化肥量15202530354045 水稻产量320330360410460470480 1 将上表中的数据制成散点图 并计算相关系数 r 2 你能从散点图中发现施化肥量与水稻产量近似成什么关系吗 该结论与相关 系数 r 的计算一致吗 解 1 散点图如下 列表 ixiyix2iy2ixiyi 115320225102 4004 800 220330400108 9006 600 325360625129 6009 000 430410900168 10012 300 5354601 225211 60016 100 6404701 600220 90018 800 7454802 025230 40021 600 2102 8307 0001 171 90089 200 r 0 975 4 300 700 27 771 43 2 从图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 19839-2025工业燃油燃气燃烧器通用技术条件
- 2025康复医学治疗技术副高级职称模拟试题附完整答案详解【典优】
- 2023年度医师定期考核练习题【预热题】附答案详解
- 特殊人群疫苗接种建议
- 中暑患者降温护理
- 2025年银行岗位考前冲刺测试卷及完整答案详解【网校专用】
- 房产收购合同(标准版)
- 房地产 -居住报告豪华住宅开发的全球视角 The Residence Report The global perspective on luxury residential development 2025 -2026
- 作文大赛获奖感言(31篇)
- 中科院心理咨询师理论知识考试题库及答案(1062题)
- 湿地巡护员培训课件
- 2025鄂尔多斯市城市建设投资集团招聘92人考试参考题库及答案解析
- 老年痴呆科普课件
- 汽车底盘安全培训课件
- 食品添加剂培训课件
- 儿童安全用电防范培训内容课件
- 一氧化碳试卷及答案
- 定向井井眼轨迹计算课件
- 石景山区语文一模试卷讲评分析
- 八年级上学期语文周周练
- 《青光眼手术新进展》ppt课件
评论
0/150
提交评论