




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选ppt精选ppt第第一一章章回归回归分析分析的基的基本思本思想及想及其初其初步应步应用用2 2 突破常突破常考题型考题型题型一题型一题型二题型二题型三题型三3 3 跨越高跨越高分障碍分障碍4 4 应用落应用落实体验实体验随堂即时演练随堂即时演练课时达标检测课时达标检测知识点一知识点一知识点知识点二二1 1 理解教理解教材新知材新知精选ppt精选ppt精选ppt线性回归方程线性回归方程 导入新知导入新知 1回归分析回归分析 (1)函数关系是一种函数关系是一种 关系,而相关关系是一种关系,而相关关系是一种 关系,即自变量取值一定时,因变量的取值带有一关系,即自变量取值一定时,因变量的取值带有一
2、定的随机性的两个变量之间的关系叫做定的随机性的两个变量之间的关系叫做 (2)回归分析是对具有回归分析是对具有 关系的两个变量进行统计分析的关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤一种常用方法,回归分析的基本步骤是是 , ,并用,并用 进行预报进行预报确定性确定性非确定性非确定性相关关系相关关系相关相关画出两个变量的散点图画出两个变量的散点图求回归直线方程求回归直线方程回归直线方程回归直线方程精选ppt 2线性回归模型线性回归模型 (1)线性回归模型线性回归模型y ,其中,其中 和和 是模型的是模型的未知参数,未知参数, 称为随机误差自变量称为随机误差自变量x称为称为 ,因变
3、,因变量量y称为称为 bxaeabe解释变量解释变量预报变量预报变量精选ppt中心中心 精选ppt精选ppt线性回归分析线性回归分析 精选ppt (3)残差分析:残差分析: 残差分析即通过残差发现原始数据中的可疑数据,判断所残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:计算残差建立模型的拟合效果,其步骤为:计算残差画残差图画残差图在残差图中分析残差特性在残差图中分析残差特性 残差点比较均匀地落在水平的带状区域中,说明选用的模残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精型比较合适,这样的带状区域的宽度越窄
4、,说明模型拟合精度度 ,回归方程的预报精度,回归方程的预报精度 越高越高越高越高精选ppt精选ppt 化解疑难化解疑难残差分析的注意点残差分析的注意点 在残差图中,可疑数据的特征表现为:在残差图中,可疑数据的特征表现为: (1)个别样本点的残差过大,即大多数的残差点比较均匀个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区域过于明显,地落在水平的带状区域中,而个别残差点偏离该区域过于明显,需要确认在采集这些样本点的过程中是否有人为的错误,如果需要确认在采集这些样本点的过程中是否有人为的错误,如果采集数据有错误,那么需要纠正,然后重新利用线性回归模型采集数
5、据有错误,那么需要纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,那么需要寻找其他原因拟合数据;如果数据采集没有错误,那么需要寻找其他原因 (2)残差图有异常,即残差呈现不随机的规律性,此时需残差图有异常,即残差呈现不随机的规律性,此时需要考虑所采用的线性回归模型是否合适要考虑所采用的线性回归模型是否合适精选ppt线性回归分析线性回归分析 例例1炼钢是一个氧化降碳的过程,钢水含碳量的多少炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时,钢水的含碳量时
6、间的关系如果已测得炉料熔化完毕时,钢水的含碳量x与与冶炼时间冶炼时间y(从炉料熔化完毕到出钢的时间从炉料熔化完毕到出钢的时间)的一列数据,如下的一列数据,如下表所示:表所示:精选pptx(0.01%)104180190177147134150191204121y(min)100200210185155135170205235125 (1)作出散点图,你能从散点图中发现含碳量与冶炼时间的作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?一般规律吗? (2)求回归方程;求回归方程; (3)预测当钢水含碳量为预测当钢水含碳量为160时,应冶炼多少分钟?时,应冶炼多少分钟? 解解(1)以以x
7、轴表示含碳量,轴表示含碳量,y轴表示冶炼时间,作散点图轴表示冶炼时间,作散点图如图所示:如图所示:精选ppt 从图中可以看出,各点散布在一条直线附近,即它们线性从图中可以看出,各点散布在一条直线附近,即它们线性相关相关 (2)列出下表,并用科学计算器进行计算:列出下表,并用科学计算器进行计算:精选ppt精选ppt精选ppt 活学活用活学活用某种产品的广告费支出某种产品的广告费支出x(单位:百万元单位:百万元)与销售额与销售额y(单位:百单位:百万元万元)之间有如下对应数据:之间有如下对应数据:x24568y3040605070 (1)试根据数据预报广告费支出试根据数据预报广告费支出1 000万
8、元的销售额;万元的销售额;(2)若广告费支出若广告费支出1 000万元的实际销售额为万元的实际销售额为8 500万元,求误万元,求误差差精选ppt精选ppt残差分析残差分析 例例2某车间为了规定工时定额,需要确定加工零件所某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了花费的时间,为此进行了10次试验,测得的数据如下:次试验,测得的数据如下:编号编号12345678910零件数零件数x/个个10 20 30 40 50 60708090100加工时间加工时间y/分分62 68 75 81 89 95102108115122 (1)建立零件数为解释变量,加工时间为预报变量的回归模
9、建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;型,并计算残差; (2)你认为这个模型能较好地刻画零件数和加工时间的关系你认为这个模型能较好地刻画零件数和加工时间的关系吗?吗?精选ppt 解解(1)根据表中数据画出散点图,如图所示根据表中数据画出散点图,如图所示精选ppt残差数据如下表:残差数据如下表:编号编号12345残差残差0.390.290.030.650.67编号编号678910残差残差0.010.310.370.050.27精选ppt (2)以零件数为横坐标,残差为纵坐标画出残差图如图所以零件数为横坐标,残差为纵坐标画出残差图如图所示示 由图可知,残差点分布较均匀,即
10、用上述回归模型拟合由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好但需注意,由残差图可以看出,第数据效果很好但需注意,由残差图可以看出,第4个样本点个样本点和第和第5个样本点的残差比较大,需要确认在采集这两个样本点个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误的过程中是否有人为的错误精选ppt精选ppt 活学活用活学活用 已知某种商品的价格已知某种商品的价格x(元元)与需求量与需求量y(件件)之间的关系有如下之间的关系有如下一组数据:一组数据:x1416182022y1210753求求y关于关于x的回归直线方程,并说明回归模型拟合效果的的回归直线方程,并说
11、明回归模型拟合效果的好坏好坏精选ppt精选ppt精选ppt非线性回归分析非线性回归分析 例例3在一次抽样调查中测得样本的在一次抽样调查中测得样本的5个样本点,数值个样本点,数值如下表:如下表:x0.250.5124y1612521试建立试建立y与与x之间的回归方程之间的回归方程精选ppt解解作出变量作出变量y与与x之间的散点图如图所示之间的散点图如图所示t4210.50.25y1612521精选ppt作出作出y与与t的散点图如图所示的散点图如图所示精选ppt精选ppt类题通法类题通法非线性回归分析的步骤非线性回归分析的步骤 非线性回归问题有时并不给出经验公式这时我们可以画非线性回归问题有时并不
12、给出经验公式这时我们可以画出已知数据的散点图,把它与学过的各种函数出已知数据的散点图,把它与学过的各种函数(幂函数、指数函幂函数、指数函数、对数函数等数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决其一般步骤为:问题,使之得到解决其一般步骤为:精选pptt/s012345678910U/V100755540302015101055试求:电压试求:电压U对时间对时间t的回归方程的回归方程(提示:对公式两边取自然提示:对公式两
13、边取自然对数,把问题转化为线性回归分析问题对数,把问题转化为线性回归分析问题)精选pptx012345678910y4.64.34.03.73.43.02.72.32.31.61.6精选ppt精选ppt精选ppt 典例典例下列现象的线性相关程度最高的是下列现象的线性相关程度最高的是() A某商店的职工人数与商品销售额之间的相关系数为某商店的职工人数与商品销售额之间的相关系数为 B流通费用率与商业利润率之间的相关系数为流通费用率与商业利润率之间的相关系数为 C商品销售额与商业利润率之间的相关系数为商品销售额与商业利润率之间的相关系数为 D商品销售额与流通费用率之间的相关系数为商品销售额与流通费用
14、率之间的相关系数为 解析解析|r|越接近于越接近于1,相关程度越高,相关程度越高 答案答案B精选ppt易错防范易错防范 1本题易错误地认为本题易错误地认为r越接近于越接近于1,相关程度越高,从而误,相关程度越高,从而误选选A. 2变量之间线性相关系数变量之间线性相关系数r具有如下性质:具有如下性质: (1)r21,故变量之间线性相关系数,故变量之间线性相关系数r的取值范围为的取值范围为1,1 (2)|r|越大,变量之间的线性相关程度越高;越大,变量之间的线性相关程度越高;|r|越接近越接近0,变,变量之间的线性相关程度越低量之间的线性相关程度越低 (3)当当r0时,两个变量的值总体上呈现出同时增减的趋势,时,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关;当此时称两个变量正相关;当r0时,一个变量增加,另一个变量时,一个变量增加,另一个变量有减少的趋势,称两个变量负相关;当有减少的趋势,称两个变量负相关;当r0时,称两个变量线性时,称两个变量线性不相关不相关精选ppt精选ppt答案:答案:C 精选ppt解析:解析:中中y与与x负相关而斜率为正,不正确;中负相关而斜率为正,不正确;中y与与x正相关而斜正相关而斜率为负,不正确率为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年传真保密机项目项目投资筹措计划书代可行性研究报告
- 2025年农业废弃物堆肥处理技术在农业废弃物处理中的应用前景报告
- 2025年中国跨端数据管理类软件行业市场运营现状及投资规划研究建议报告
- 2025年智能停车场系统车位预约与引导技术评估报告
- 中国锑原矿行业市场调查报告
- 2025年长租公寓行业盈利潜力与运营策略研究报告
- 中国拉铆枪市场竞争格局及投资战略规划报告
- 工业互联网平台云计算资源动态分配在智能供应链金融服务系统的创新实践报告
- 家具制造业2025年原材料价格波动应对策略与品牌建设报告
- 2025年中国蛙类饲料行业市场发展前景及发展趋势与投资战略研究报告
- 辽宁省鞍山市2024-2025学年八年级下学期期末质量检测语文试卷(含答案)
- 2025年老年教育课程设计:跨学科合作教学法的探索与成效报告
- 2025教师师德师风微整改自查报告范文
- 部队特种车辆培训课件
- 【公开课】发生在肺内的气体交换课件-2024-2025学年人教版生物七年级下册
- 新闻学概论马工程课件
- 入党积极分子考试试题及答案
- 小组互评活动方案
- 酒店与硬件公司合作协议
- 工业互联网基础 课程标准
- 养老护理员心理疏导培训
评论
0/150
提交评论