




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、10.3相关性、最小二乘估计 与统计案例,2,考纲要求:1.会做两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).3.了解回归分析的思想、方法及其简单应用.4.了解独立性检验的思想、方法及其初步应用,3,1.相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系.与函数关系不同,相关关系是一种非确定性关系. 2.散点图:表示具有相关关系的两个变量的一组数据的图形叫作散点图,它可直观地判断两变量的关系是否可以用线性关系表示.若这些散点分布在
2、从左下角到右上角的区域,则称两个变量正相关;若这些散点分布在从左上角到右下角的区域,则称两个变量负相关. 3.回归分析:对具有相关关系的两个变量进行统计分析的方法叫作回归分析.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为解释变量,因变量y称为预报变量,4,5,5.相关系数: ,它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r0时表示两个变量正相关,当r0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性越强;当|r|接近0时,表明两个变量间几乎不存在线性相关性,6,6.独立
3、性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,22列联表,构造一个随机变量 ,其中n=a+b+c+d为样本容量,7,3)独立性检验:利用随机变量2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,8,2,3,4,1,5,1.下列结论正确的打“”,错误的打“”. (1)相关关系的两个变量是非确定性关系. ( ) (2)利用散点图可以直观判断两个变量的关系是否可以
4、用线性关系表示. ( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值. ( ) (4)对于分类变量X与Y,统计量2的值越小,“X与Y有关联”的把握程度越大. ( ) (5)通过回归方程y=bx+a可以估计和观测变量的取值和变化趋势. (,9,2,3,4,1,5,2.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y正相关,x与z负相关 D.x与y负相关,x与z正相关,答案,解析,10,2,3,4,1,5,答案,解析,11,2,3,4,1,5,3. (2015福建,理4)
5、为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: A.11.4万元B.11.8万元C.12.0万元D.12.2万元,12,2,3,4,1,5,4.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, (1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是; (2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是,答案,解析,13,2,3,4,1,5,5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算2=27.63,根据这一数
6、据分析,我们有理由认为打鼾与患心脏病是 的(填“有关”或“无关”,答案,解析,14,2,3,4,1,5,自测点评 1.散点图上的点大致分布在某条直线附近,整体上呈线性分布时,两个变量相关关系越强. 2. 2越大,“X与Y有关联”的把握程度越大. 3.注意回归分析时对应的结果均是估计值,不要误认为是真实值;对于独立性检验的结论需要在概率意义下来理解,避免在现实生活中错误应用. 4.要理解回归直线方程中的参数是用最小二乘法得出的,目的是使距离的平方和最小,不是看具体某一个距离的大小,这样使用求平方和也避免了讨论绝对值和正负问题,15,考点1,考点2,考点3,知识方法,易错易混,考点1相关关系的判断
7、 例1(1)对变量x,y有观测数据(xi,yi)(i=1,2,10),得散点图;对变量u,v有观测数据(ui,vi)(i=1,2,10),得散点图,由这两个散点图可以判断() A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关,答案,解析,16,考点1,考点2,考点3,知识方法,易错易混,2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表: 则哪位同学的试验结果体现A,B两变量有更强的线性相关性() A.甲B.乙C.丙D.丁,答案,解析
8、,17,考点1,考点2,考点3,知识方法,易错易混,思考:如何判断两个变量有无相关关系? 解题心得:判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的,18,考点1,考点2,考点3,知识方法,易错易混,对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是() A.r2r40r3r1B.r4r20r1r3 C.r4r20r3r1D.r2r40r1r3,答案,解析,19,考点1,考点2,考
9、点3,知识方法,易错易混,2)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论: y与x负相关,且y=2.347x-6.423; y与x负相关,且y=-3.476x+5.648; y与x正相关,且y=5.437x+8.493; y与x正相关,且y=-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.B.C.D,答案,解析,20,考点1,考点2,考点3,知识方法,易错易混,考点2回归方程的求法及回归分析 例2随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表,1)求y关于t的回归方程y=b
10、t+a; (2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款,21,考点1,考点2,考点3,知识方法,易错易混,解:(1)列表计算如下,22,考点1,考点2,考点3,知识方法,易错易混,2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y=1.26+3.6=10.8(千亿元,23,考点1,考点2,考点3,知识方法,易错易混,思考:对已知的两个变量的一组数据如何做回归分析? 解题心得:1.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系;若具有线性相关关系,则可通过线性回归方程来估计和预测. 2.线性回归方程恒过点,24,考点1
11、,考点2,考点3,知识方法,易错易混,对点训练2(2015石家庄模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据. (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:32.5+43+54+64.5=66.5,25,考点1,考点2,考点3,知识方法,易错易混,解:(1)由题意,作散点图如图,26,考点1,
12、考点2,考点3,知识方法,易错易混,2)由对照数据,计算得,所以回归方程为y=0.7x+0.35. (3)当x=100时,y=1000.7+0.35=70.35(吨标准煤),预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤,27,考点1,考点2,考点3,知识方法,易错易混,考点3独立性检验 例3为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下,28,考点1,考点2,考点3,知识方法,易错易混,1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老
13、年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由,29,考点1,考点2,考点3,知识方法,易错易混,由于9.9676.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好,30,考点1,考点2,考点3,知
14、识方法,易错易混,思考:独立性检验得出的结论是什么?它对我们日常生活有什么帮助,解题心得:独立性检验就是考察两个分类变量是否有关系,利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测,并能较为准确地给出这种判断的可信度;具体做法是根据公式 ,计算2,2值越大,说明“两个变量有关系”的可能性越大,31,考点1,考点2,考点3,知识方法,易错易混,对点训练3某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的 ,女生喜欢看NBA的人数占女生人数的,1)若被调查的男生人数为n,根据题意建立一个22列联表; (2)
15、若在犯错误的概率不超过0.05的前提下认为是否喜欢看NBA和性别有关,求男生至少有多少人,32,考点1,考点2,考点3,知识方法,易错易混,解:(1)由已知得,33,考点1,考点2,考点3,知识方法,易错易混,34,考点1,考点2,考点3,知识方法,易错易混,1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同.) 2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程. 3.根据2的值可以判断两个分类变量有关的可信程度,并用来指导科研和生活实际,35,考点1,考点2,考点3,知识方法,易错易混,1.相关关系与函数关系的区别 相关关系与函数关系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025设备租赁合同的市场分析
- VB编程工具使用试题及答案总结
- 项目合作协议范文
- 主管在危机沟通中的角色研究计划
- 网络连接优化策略试题及答案
- 数据库系统构架与应用考题及答案
- 提升工作灵活性的手段计划
- 2025关于陶瓷地砖销售合同书
- 行政法与经济法的交集试题及答案
- 行政管理与公共服务关系探讨试题及答案
- 自动生成的文档-2025040814-11
- (二模)济宁市2025年4月高三高考模拟考试生物试卷(含答案)
- DB32T 4772-2024自然资源基础调查技术规程
- 膝关节韧带损伤术后护理
- 雕像制作合同协议
- 2025年全国燃气安全生产管理主要负责人考试笔试试题(500题)附答案
- 列那狐测试题及答案
- 《酉阳杂俎》女性角色研究
- 浙江省嘉兴市2025届高三下学期4月教学测试物理+答案
- 婴幼儿照护 课件 2遗尿现象的干预
- 2025年广东省深圳市31校中考一模历史试题及答案
评论
0/150
提交评论