




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 统计案例 知识系统整合 规律方法收藏1两个基本思想(1)回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想注意理解以下几点:确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系判断是否线性相关的依据是样本点的散点图引起预报误差的因素对于线性回归模型ybxae,引起预报变量y的误差的因素有两个:一个是解释变量x,另一个是随机误差e.回归方程的预报精度判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值回归模型的拟合效果判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R2的大小判断(2)独立性检验的基本思想独立性检验的基本思想类似于反证法要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值很大在一定程度上说明两个分类变量有关系进行独立性检验要注意理解以下三个问题:独立性检验适用于两个分类变量两个分类变量是否有关系的直观判断:一是根据22列联表计算|adbc|,值越大关系越强;二是观察等高条形图,两个深色条的高度相差越大关系越强独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系2两个重要参数(1)相关指数R2相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好(2)随机变量K2随机变量K2是用来判断两个分类变量在多大程度上相关的变量独立性检验就是通过计算K2的观测值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关3两种重要图形(1)散点图散点图是进行线性回归分析的主要手段,其作用如下:一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,那么可以断定两个变量有较好的线性相关关系;二是判断样本中是否存在异常(2)残差图残差图可以用来判断模型的拟合效果,其作用如下:一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高 二是确认样本点在采集过程中是否有人为的错误 学科思想培优一线性回归分析对所抽取的样本的数据进行分析,分析两个变量之间的关系线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析回归分析的过程就是建立回归模型的过程具体步骤是:确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;画出散点图,观察它们是线性相关的,还是符合哪一种函数模型;由经验确定回归方程的类型(如线性回归方程,反比例函数模型,指数函数模型,对数函数模型等);用最小二乘法求回归方程的参数;检查回归模型的拟合程度,如分析残差图,求相关指数R2等例1一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:零件数x/个102030405060708090100加工时间y/min627275818595103108112127(1)画出散点图,并初步判断是否线性相关;(2)若线性相关,求回归直线方程;(3)求出相关指数;(4)作出残差图;(5)进行残差分析解(1)散点图,如图所示由图可知,x,y线性相关(2)x与y的关系可以用线性回归模型来拟合,不妨设回归模型为 x.将数据代入相应公式可得数据表:55,92, 0.670, 925555.133,回归直线方程为0.670x55.133.(3)利用所求回归方程求出下列数据R210.983.(4)iyii,利用上表中数据作出残差图,如图所示(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出回归效果很好由残差图也可观察到,第2,5,9,10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误拓展提升作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄二独立性检验独立性检验的基本思想:独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,与有关的临界值相比较,以确定可信程度例2随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:常饮酒不常饮酒合计患肝病2不患肝病18合计30已知在全部30人中随机抽取1人,抽到肝病患者的概率为.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解(1)设患肝病中常饮酒的人有x人,x6.常饮酒不常饮酒合计患肝病628不患肝病41822合计102030由已知数据可求得K28.5237.879,因此有99.5%的把握认为患肝病与常饮酒有关(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15种,且每种发生的概率是相等的其中一男一女有(A,E),(A,F),(B,E),(B,F),(C,E),(C,F),(D,E),(D,F),共8种故抽出一男一女的概率是P.拓展提升近几年高考中独立性检验与统计知识的综合考查已出现了多次,一般需要根据统计知识完成22列联表,然后考查利用独立性检验的方法解决问题,题目难度不大,但有一定的综合性三数形结合思想在独立性检验中的应用例3某机构为了了解患色盲是否与性别有关,随机抽取了1000名成年人进行调查在调查的480名男人中有38名患色盲,520名女人中有6名患色盲,分别利用图形和独立性检验的方法来判断患色盲与性别是否有关解根据题目所给的数据作出如下的列联表:患色盲未患色盲总计男38442480女6514520总计449561000根据列联表作出相应的等高条形图,如图所示:图中两个深色条的高分别表示男人和女人中患色盲的频率从图中可以看出,男人中患色盲的频率明显高于女人中患色盲的频率因此我们可以认为患色盲与性别有关根据列联表中所给的数据,得K2的观测值k27.139.因为27.13910.828,所以我们有99.9%的把握认为患色盲与性别有关系拓展提升 “数缺形时少直观,形缺数时难入微”恰当地应用数形是提高解题速度、优化解题过程的一种重要方法四化归与转化思想在非线性回归分析中的应用例4下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值解(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线yc1ec2x的周围,其中c1,c2为待定的参数(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1, bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为0.272x3.849,e0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于深度学习的变电站场景个人防护装备检测算法研究
- 高中美术色彩课
- 月季自育测试题及答案
- 2025新国家统一法律职业资格考试题库+答案
- 导尿操作安全注意事项
- 跌倒风险评估与防控策略
- 2025二建《建筑工程管理与实务》高分通关卷3带答案与解析
- 工贸行业课件
- 工程问题课件下载
- 社区合作农场管理服务协议
- 《提高利润的78个方法》
- 环境卫生学:公共场所卫生
- 街道、镇、区道路保洁及垃圾转运服务采购项目服务方案(投标方案)
- 亚克力uv施工方案
- 2024-2030年中国电解二氧化锰(EMD)行业市场发展趋势与前景展望战略分析报告
- 幼儿园卫生检查表
- 自建房水电安装承包合同协议书
- (正式版)HGT 3706-2024 工业用金属孔网管骨架聚乙烯复合管
- 中风病饮食指南
- 车险续保率分析报告
- 钢结构施工技术指导手册
评论
0/150
提交评论