版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11.4回归分析与独立性检验11.4回归分析与独立性检验1.变量间的相关关系(1)相关关系一个变量变化时,另一个变量也随之发生变化,但其取值带有一定的随机性,这样两个变量之间的关系叫做相关关系.1.变量间的相关关系(2)相关关系与函数关系的异同点相同点:两者均是指两个变量的关系.不同点:函数关系是一种确定的因果关系,是两个非随机变量的关系.相关关系是一种非确定的关系,是非随机变量与随机变量的关系或两个随机变量之间的关系.2.两个变量的线性相关(1)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.(2)相关关系与函数关系的异同点(2)正相关、负相关散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.114回归分析与独立性检验课件3.回归分析(1)回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.通俗地讲,回归分析是寻找具有相关关系的两个变量的非确定性关系的某种确定性,其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(2)回归直线方程的求法①回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归分析②回归直线方程的求法——最小二乘法.②回归直线方程的求法——最小二乘法.(2)利用回归直线可以对总体进行估计(3)线性相关强度的检验:(2)利用回归直线可以对总体进行估计r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.r>0表明两变量正相关,r<0表明两变量负相关.在含有一个解释变量的线性回归模型中,R2恰好等于相关系数r的平方.r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程度(5)建立回归模型的基本步骤:①确定研究对象,明确解释变量和预报变量.②画出散点图,观察它们是否存在相关关系.(如线性相关关系)④按一般规则估计回归方程中的参数.(如最小二乘法)⑤得出结果后分析残差图有否异常,若存在异常,则检查数据是否有误,模型是否恰当.(5)建立回归模型的基本步骤:4.独立性检验(1)变量的不同“值”表示个体所属的不同类别,这些变量称为分类变量.(2)两个分类变量X与Y的频数表,称作2×2列联表.y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d4.独立性检验y1y2合计x1aba+bx2cdc+d合计aP(k2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828P(k2≥k0)0.500.400.250.150.100.①当k>10.828时,有99.9%的把握认为“X与Y有关系”.②当k>7.879时,有99.5%的把握认为“X与Y有关系”.③当k≤3.841时,认为没有充分的证据显示“X与Y有关系”.(3)利用随机变量k2来确定是否能以一定把握认为“两个分类变量有关系”的方法,称作对这两个分类变量的独立性检验.①当k>10.828时,有99.9%的把握认为“X与Y有关系(4)独立性检验的步骤:①据实际问题需要的可信度确定临界值k0.②利用公式,由观测数据,求出k2的观测值k.③作判断,如果k≥k0,就以(1-P(k2≥k0))×100%的把握认为“X与Y有关系”,否则就说样本数据没有提供充分证据说明“X与Y有关系”.误区警示1.线性回归方程中的系数a、b及相关指数k2公式复杂莫记混用错.114回归分析与独立性检验课件[例1]下面是水稻产量与施化肥量的一组观测数据:(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?分析:描点可画出散点图,观察散点图中的点大致分布在一条直线附近,则线性相关.施化肥量15202530354045水稻产量320330360410460470480[例1]下面是水稻产量与施化肥量的一组观测数据:施化肥量1解析:(1)散点图如下:(2)从图中可以发现数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.解析:(1)散点图如下:(09·宁夏、海南)对变量x,y的观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v的观测数据(u1,v1)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断. ()114回归分析与独立性检验课件A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关.答案:C114回归分析与独立性检验课件[例2]下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与对应的生产能耗y(吨标准煤)的几组对应数据.x3456y2.5344.5x3456y2.5344.5(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解析:(1)由题设所给数据,可得散点图如下图.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,114回归分析与独立性检验课件(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).114回归分析与独立性检验课件例3例3114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件(2010·山东枣庄模考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864气温(℃)181310-1用电量(度)24343864答案:68答案:68114回归分析与独立性检验课件[例3]为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果试验列联表则有________%的把握认为药物有效?患病未患病总计服用药104555没有用药203050总计3075105患病未患病总计服用药104555没有用药203050总计30解析:首先判定表格中的数据是否都大于5这一点显然是满足的,可由公式直接求解,最后再与两个临界值相比较得出结论.答案:95点评:独立性检验是比较容易掌握的,高考不要求记忆公式,只要求会用公式进行计算,并依据计算结果作出判断.解析:首先判定表格中的数据是否都大于5这一点显然是满足的,可114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件(2010·辽宁文,18)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010疱疹面积[60,65)[65,70)[70,75)[75,8表2:注射药物B后皮肤疱疹面积的频数分布表(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,6114回归分析与独立性检验课件(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.(2)完成下面2×2列联表,并回答能否有99.9%的把握认为疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=b=注射药物Bc=d=合计n=疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物A[解析]
(1)[解析](1)可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.114回归分析与独立性检验课件(2)表3:由于k2>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=70b=30100注射药物Bc=35d=65100合计10595n=200(2)表3:疱疹面积小于70mm2疱疹面积不小于70mm2合11.4回归分析与独立性检验11.4回归分析与独立性检验1.变量间的相关关系(1)相关关系一个变量变化时,另一个变量也随之发生变化,但其取值带有一定的随机性,这样两个变量之间的关系叫做相关关系.1.变量间的相关关系(2)相关关系与函数关系的异同点相同点:两者均是指两个变量的关系.不同点:函数关系是一种确定的因果关系,是两个非随机变量的关系.相关关系是一种非确定的关系,是非随机变量与随机变量的关系或两个随机变量之间的关系.2.两个变量的线性相关(1)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.(2)相关关系与函数关系的异同点(2)正相关、负相关散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.114回归分析与独立性检验课件3.回归分析(1)回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.通俗地讲,回归分析是寻找具有相关关系的两个变量的非确定性关系的某种确定性,其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(2)回归直线方程的求法①回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归分析②回归直线方程的求法——最小二乘法.②回归直线方程的求法——最小二乘法.(2)利用回归直线可以对总体进行估计(3)线性相关强度的检验:(2)利用回归直线可以对总体进行估计r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.r>0表明两变量正相关,r<0表明两变量负相关.在含有一个解释变量的线性回归模型中,R2恰好等于相关系数r的平方.r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程度(5)建立回归模型的基本步骤:①确定研究对象,明确解释变量和预报变量.②画出散点图,观察它们是否存在相关关系.(如线性相关关系)④按一般规则估计回归方程中的参数.(如最小二乘法)⑤得出结果后分析残差图有否异常,若存在异常,则检查数据是否有误,模型是否恰当.(5)建立回归模型的基本步骤:4.独立性检验(1)变量的不同“值”表示个体所属的不同类别,这些变量称为分类变量.(2)两个分类变量X与Y的频数表,称作2×2列联表.y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d4.独立性检验y1y2合计x1aba+bx2cdc+d合计aP(k2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828P(k2≥k0)0.500.400.250.150.100.①当k>10.828时,有99.9%的把握认为“X与Y有关系”.②当k>7.879时,有99.5%的把握认为“X与Y有关系”.③当k≤3.841时,认为没有充分的证据显示“X与Y有关系”.(3)利用随机变量k2来确定是否能以一定把握认为“两个分类变量有关系”的方法,称作对这两个分类变量的独立性检验.①当k>10.828时,有99.9%的把握认为“X与Y有关系(4)独立性检验的步骤:①据实际问题需要的可信度确定临界值k0.②利用公式,由观测数据,求出k2的观测值k.③作判断,如果k≥k0,就以(1-P(k2≥k0))×100%的把握认为“X与Y有关系”,否则就说样本数据没有提供充分证据说明“X与Y有关系”.误区警示1.线性回归方程中的系数a、b及相关指数k2公式复杂莫记混用错.114回归分析与独立性检验课件[例1]下面是水稻产量与施化肥量的一组观测数据:(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?分析:描点可画出散点图,观察散点图中的点大致分布在一条直线附近,则线性相关.施化肥量15202530354045水稻产量320330360410460470480[例1]下面是水稻产量与施化肥量的一组观测数据:施化肥量1解析:(1)散点图如下:(2)从图中可以发现数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.解析:(1)散点图如下:(09·宁夏、海南)对变量x,y的观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v的观测数据(u1,v1)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断. ()114回归分析与独立性检验课件A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关.答案:C114回归分析与独立性检验课件[例2]下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与对应的生产能耗y(吨标准煤)的几组对应数据.x3456y2.5344.5x3456y2.5344.5(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解析:(1)由题设所给数据,可得散点图如下图.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,114回归分析与独立性检验课件(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).114回归分析与独立性检验课件例3例3114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件(2010·山东枣庄模考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864气温(℃)181310-1用电量(度)24343864答案:68答案:68114回归分析与独立性检验课件[例3]为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果试验列联表则有________%的把握认为药物有效?患病未患病总计服用药104555没有用药203050总计3075105患病未患病总计服用药104555没有用药203050总计30解析:首先判定表格中的数据是否都大于5这一点显然是满足的,可由公式直接求解,最后再与两个临界值相比较得出结论.答案:95点评:独立性检验是比较容易掌握的,高考不要求记忆公式,只要求会用公式进行计算,并依据计算结果作出判断.解析:首先判定表格中的数据是否都大于5这一点显然是满足的,可114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件114回归分析与独立性检验课件(2010·辽宁文,18)为了比较注射A,B两种药物后产生
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (完整版)绿色施工保障措施
- 2026年护理知识竞赛题库及答案
- 回复确认合同解除条款协议通知函5篇范本
- 电镀废水处理工程施工工艺及施工方法
- ICU病房应激性溃疡应急预案演练脚本
- 安置房地板采暖施工方案
- 初级消防设施操作员训练题库考试试题及答案
- 一年级撕页题目及答案
- 一年级抛球题目及答案
- 校园活动周:丰富课余生活小学主题班会课件
- 养老护理员行业前景
- 加速康复外科专科护士培养体系
- 美的空调KFR-72LWDY-LB(R2)说明书
- (高清版)DB31∕T 1490-2024 人工智能标准化工作导则
- 中考语文 名著基础知识速记清单
- 供应链管理货物保障措施
- 2025年公共文化服务保障法知识竞赛题库及答案
- 高中阅读理解万能答题公式
- 有创机械通气模式及参数2023
- 地表水自动监测运维理论考核试题及答案
- 《民事诉讼法》期末重点整理马工程版
评论
0/150
提交评论