




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末复习课 整合网络构建 警示易错提醒1线性回归方程中的系数及相关指数R2,独立性检验统计量K2公式复杂,莫记混用错2相关系数r是判断两随机变量相关强度的统计量,相关指数R2是判断线性回归模型拟合效果好坏的统计量,而K2是判断两分类变量相关程度的量,应注意区分3在独立性检验中,当K26.635时,我们有99.9%的把握认为两分类变量有关,是指“两分类变量有关”这一结论的可信度为99%而不是两分类变量有关系的概率为99%.专题一回归分析思想的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题例1下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量附注:参考数据:yi9.32,tiyi40.17,0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:,yt.解:(1)由折线图中数据和附注中参考数据得t4,(tit)228, 0.55,(tit)(yiy)tiyityi40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由y1.331及(1)得0.10,t1.3310.1040.93.所以y关于t的回归方程为0.930.10t.将2018年对应的t11代入回归方程得0.930.10112.03.所以预测2018年我国生活垃圾无害化处理量约为2.03亿吨归纳升华解决回归分析问题的一般步骤1画散点图根据已知数据画出散点图2判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系在此基础上,利用最小二乘法求回归系数,然后写出回归方程3实际应用依据求得的回归方程解决问题变式训练某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测该数学老师孙子的身高为_cm.解析:儿子和父亲的身高可列表如下:父亲身高(x)173170176儿子身高(y)170176182设回归直线方程x,由表中的三组数据可求得1,故1761733,故回归直线方程为3x,将x182代入得孙子的身高为185 cm.答案:185专题二独立性检验的应用独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法常用等高条形图来直观反映两个分类变量之间差异的大小;利用假设检验求随机变量K2的值能更精确地判断两个分类变量间的相关关系例2电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图,将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(1)根据已知条件完成下面的22列联表,并据此资料判断是否在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关性别非体育迷体育迷总计男女1055总计(2)将上述调查所得到的频率视为概率,现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X,若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X)解:(1)由频率分布直方图可知,在抽取的100人中“体育迷”有(0.0200.005)1010025(人)由独立性检验的知识得22列联表如下:性别非体育迷体育迷总计男301545女451055总计7525100将22列联表中的数据代入公式计算,得K2的观测值3.0302.706.所以在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关(2)由频率分布直方图知抽到“体育迷”的频率为(0.0200.005)100.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.由题意知XB,从而X的分布列为:X0123P由二项分布的期望与方差公式得E(X)np3,D(X)np(1p)3.归纳升华独立性检验问题的求解方法1等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性2K2统计量法:通过公式K2,先计算观测值k,再与临界值表进行比较,最后得出结论变式训练学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:分类不关注关注总计男生301545女生451055总计7525100根据表中数据,通过计算统计量K2并参考以下临界数据:P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过_解析:由题意可得K23.0302.706,所以P(K22.706)0.10,由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过0.10.答案:0.10专题三数形结合思想数形结合思想在统计中的应用主要是将收集到的数据利用图表的形式表示出来,直观地反映变量间的关系例3为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照组的尿棕色素阳性数有无差别?组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573解: 由上述列联表可知,在铅中毒病人中尿棕色素为阳性的占80.56%,而对照组仅占24.32%.说明他们之间有较大差别根据列联表作出等高条形图由图可知,铅中毒病人中与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在关联关系归纳升华收集数据、整理数据是统计知识处理问题的两个基本步骤,将收集到的数据利用图表的形式整理出来,能够直观地反映变量之间的关系在精确度要求不高的情况下,可以利用散点
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 惠崇春江晚景课件
- 情商课件教学课件
- 2026届云南省保山市昌宁一中化学高一上期中考试模拟试题含解析
- 校园足球工作实施方案
- 恶劣天气自我保护课件
- 恩施民族服饰课件
- 防汛培训活动方案
- 企业管理下半年的工作方案
- 生活道具测试题及答案
- 家电公司复印机使用管理办法
- 2025年高考语文全国一卷试题真题及答案详解(精校打印)
- GB/T 28406-2012农用地估价规程
- GB/T 25751-2010压缩气弹簧技术条件
- GB/T 19137-2003农药低温稳定性测定方法
- 《中风的中医辨证论治(论文)4000字》
- 学院绩效考核办法和考核细则
- DBJ41∕T 225-2019 建筑施工斜拉悬挑式卸料平台安全技术标准-(高清版)
- 宗族祠堂的当代文化价值
- 网店开设与运营实战教程教学ppt课件(完整版)
- GB∕T 3185-2016 氧化锌(间接法)
- 南京南站明挖隧道施工方案
评论
0/150
提交评论