高考数学 常见题型解法归纳反馈训练 第65讲 回归分析和独立性检验_第1页
高考数学 常见题型解法归纳反馈训练 第65讲 回归分析和独立性检验_第2页
高考数学 常见题型解法归纳反馈训练 第65讲 回归分析和独立性检验_第3页
高考数学 常见题型解法归纳反馈训练 第65讲 回归分析和独立性检验_第4页
高考数学 常见题型解法归纳反馈训练 第65讲 回归分析和独立性检验_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第65讲 回归分析和独立性检验【知识要点】(一)变量间的相关关系、回归分析的基本思想及初步运用一、相关关系 1、概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系. 2、相关关系与函数关系的异同点. 相同点:两者均是指两个变量间的关系. 不同点:函数关系是一种确定关系,是一种因果系.如正方形的面积和边长的关系就是一种函数关系.相关关系是一种非确定的关系,也不一定是因果关系.如产品的销售额与广告费的投入的关系.二、散点图表示具有相关关系的两个变量的一组数据的图形叫做散点图.正相关:如果散点图中的点散布在从左小角到右上角的区域内,称为正相关.负相关:如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.注:如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不具有相关关系. 三、回归分析 1、对具有相关关系的两个变量进行统计分析的方法叫回归分析.回归分析的一般步骤为画散点图求回归直线方程用回归直线方程进行预报.2、回归直线方程回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线.回归直线方程:设所求的直线方程为,其中,称为样本点的中心,回归直线过样本点的中心.回归方程的截距和斜率是用最小二乘法计算出来的.3、相关系数两个变量之间线性相关关系的强弱用相关系数来衡量.相关系数: ,表示两个变量正相关;,表示两个变量负相关;的绝对值越接近1,表明两个变量的线性相关性越强.的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,的绝对值大于0.75时,表明两个变量的线性相关性很强.4、建立回归模型的基本步骤:确定研究对象,明确哪个是解释变量,哪个是预报变量;画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)按照公式计算回归方程中的参数(如最小二乘法)得出结果后检查数据模型是否合适检查数据模型拟合效果的好坏,一般有两种方法.方法一:通过残差分析,如果残差点比较均匀地落在水平的带状区域中,则说明选用的模型比较合适,反之,不合适) 方法二:用相关指数来刻画回归的效果,其计算公式是:其中=真实值-预报值=残差,值越大,说明残差的平方和越小,也就是说模型的拟合效果越好.(二)独立性检验的基本思想及其初步运用一、用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,是否患肺癌,国籍等二、独立性检验的方法1、列出两个分类变量的频数表(列联表),直观判断.2、画三维柱形图、二维条形图、等高条形图,直观判断.3、两个分类变量的独立性检验一般步骤:(1)2*2列联表 总计 +总计 + + (2)提出假设:设与没有关系(3)根据列联表中的数据计算的值(4)根据计算得到的随机变量的观测值作出判断0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如:因为4.232介于临界值3.841和5.024之间,=0.05,所以两个分类变量没有关系的概率是,即两个分类变量有关系的概率为.三、温馨提示(1)独立性检验的必要性:为什么不能只凭列联表和图形下结论?原因是列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此需要用列联表检验这个方法来确认所得得结论在多大程度上适用于总体.(2)独立性检验的思想来自于统计上的假设性检验,它与反证法类似.假设检验和反证法都是先假设结论不成立,然后根据是否能够推出矛盾来确定结论是否成立.但是二者的矛盾的含义不同,反证法中的矛盾是指不符合逻辑的事情发生;而假设检验中的矛盾是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生.(3)与的关系并不是,是的观测值,或者说是一个随机变量,它在取不同的值时,可能不同,而是取定一组数后的一个确定值.【方法讲评】统计案例一回归分析的基本思想及初步运用解题方法确定研究对象,明确哪个是解释变量,哪个是预报变量;画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)按照公式计算回归方程中的参数(如最小二乘法)得出结果后检查数据模型是否合适.【例1】【2017课标1,文19】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸995101299699610019929981004抽取次序910111213141516零件尺寸10269911013100292210041005995经计算得,其中为抽取的第个零件的尺寸,(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查()从这一天抽检的结果看,是否需对当天的生产过程进行检查?()在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到001)附:样本的相关系数,(2)(i)由于,由样本数据可以看出抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为10.02.因为 ,所以=,所以剩下数据的样本方差为 这条生产线当天生产的零件尺寸的标准差的估计值为.【点评】(1)统计概率的解答题一般阅读量信息量比较大,并且数据比较多,对考生的心理素质要求较高,如果学生急躁冒进,对解题的影响就大了. 遇到这样的题目,建议先绕过拦路虎,杀个回马枪.先把其它题目完成再回过头来解答. 不要硬碰硬. (2)前几年的高考,数据直接代进去就可以了,运算量比较小,最近几年的高考,有的数据不能直接代进去,还要把目标数据变形后才能代进去. 故近几年的高考统计概率题的数据分析处理能力要求更高了. 本题中要求,已知告诉的却是,所以要化简计算才能得到.本题中要求剩下的15个数的平均数,但是已知告诉的却是,所以要利用平均数的定义和求出剩下的15个数的平均数. 本题要求剩下的15个数的方差,但是已知告诉的却是16个数的标准差,所以要利用方差的定义结合求出剩下的15个数的方差. 这是本题的三个难点.【反馈检测1】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图()由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;()建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:,.参考公式:相关系数 回归方程 中斜率和截距的最小二乘估计公式分别为:【反馈检测2】经销商小王对其所经营的某一型号二手汽车的使用年数(010)与销售价格(单位:万元/辆)进行整理,得到如下的对应数据:使用年数246810售价16139.574.5()试求关于的回归直线方程;(附:回归方程中,()已知每辆该型号汽车的收购价格为万元,根据()中所求的回归方程,预测为何值时,小王销售一辆该型号汽车所获得的利润最大.统计案例二独立性检验的基本思想及其初步运用解题方法(1)2*2列联表;(2)提出假设:设与没有关系;(3)根据列联表中的数据计算的值;(4)根据计算得到的随机变量的观测值作出判断. 【例2】全国人大常委会会议于 2015年12月27日通过了关于修改人口与计划生育法的决定, “全面二孩”从2016年元旦起开始实施,市妇联为了解该市市民对“全面二孩”政策的态度,随机抽取了男性市民人、女性市民人进行调查, 得到以下的列联表:支持反对合计男性女性合计(1)根椐以上数据,能否有的把握认为市市民“支持全面二孩”与“性别”有关?(2)现从持“支持”态度的市民中再按分层抽样的方法选出名发放礼品,分别求所抽取的15人中男性市民和女性市民的人数;(3) 将上述调查所得到的频率视为概率,.现在从市所有市民中,采用随机抽样的方法抽取位市民进行长期跟踪调查, 记被抽取的位市民中持“支持”态度人数为.求的分布列;求的数学期望和方差.参考公式:,其中参考数据:(3)(i)由列联表可知,抽到持“支持”态度的市民的频率为,将频率视为概率,即从市市民中任意抽取到一名持“支持”态度的市民的概率为.由于总体容量很大,故可视作服从二项分布,即,所以.从而的分布列为:X0123(ii);. 【点评】第三小问中,由于总体容量很大,故可视作服从二项分布.【反馈检测3】【2017课标II,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg)某频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附: 高中数学常见题型解法归纳及反馈检测第65讲:回归分析和独立性检验参考答案【反馈检测1答案】(),说明与的线性相关程度相当高,从而可以用线性回归模型拟合与的关系;()1.82亿吨()由及()得,所以,关于的回归方程为:. 将2016年对应的代入回归方程得:.所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨. 【反馈检测2答案】(I);(II)预测当时,销售利润取得最大值【反馈检测2详细解析】()由已知得由解得,所以回归直线的方程为()所以预测当时,销售利润取得最大值【反馈检测3答案】(1);(2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论