




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 统计案例章末复习学习目标1.会求线性回归方程,并用回归直线进行预报.2.理解独立性检验的基本思想及实施步骤1最小二乘法对于一组数据(xi,yi),i1,2,n,如果它们线性相关,则线性回归方程为x,其中, .222列联表22列联表如表所示:B总计Aababcdcd总计acbdn其中nabcd为样本容量3独立性检验常用随机变量K2来检验两个变量是否有关系类型一回归分析例1(2016全国改编)如图是我国2008年到2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量附注:参考数据:i9.32,iyi40.17, 0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:, .考点线性回归分析题点线性回归方程的应用解(1)由折线图中数据和附注中参考数据得4,(ti)228, 0.55,(ti)(yi)iyii40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得0.103,1.3310.10340.92.所以y关于t的回归方程为0.920.10t.将2019年对应的t12代入回归方程得0.920.10122.12.所以预测2019年我国生活垃圾无害化处理量约为2.12亿吨反思与感悟解决回归分析问题的一般步骤(1)画散点图根据已知数据画出散点图(2)判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程(3)回归分析画残差图或计算R2,进行残差分析(4)实际应用依据求得的回归方程解决实际问题跟踪训练1经分析预测,美国通用汽车等10家大公司的销售总额xi(i1,2,10,单位:百万美元)与利润yi(i1,2,10,单位:百万美元)的近似线性关系为0.026x,经统计i623 090,i29 300.(1)求;(2)若通用汽车公司的销售总额x1126 974(百万美元),残差1387,估计通用汽车的利润;(3)福特公司的销售总额为96 933百万美元,利润为3 835,比较通用汽车公司与福特公司利润的解释变量对于预报变量变化的贡献率说明了什么?(以上答案精确到个位)考点残差分析与相关指数题点残差及相关指数的应用解(1)由i623 090,i29 300,得样本点中心为(62 309,2 930),所以2 9300.02662 3091 310.(2)由(1)知0.026x1 310,当x1126 974时,10.026126 9741 3104 611,所以y1114 611(387)4 224,估计通用汽车公司的利润为4 224百万美元(3)由(1)(2)可得通用汽车公司利润的解释变量对于预报变量变化的贡献率为R,则R110.91191.1%.设福特公司利润的解释变量对于预报变量变化的贡献率为R,由0.026x1 310得20.02696 9331 3103 830,则R110.999 9799.997%.由RR知,用0.026x1 310作为解释变量与预报变量的关系,预报通用汽车公司的效果没有预报福特公司的效果好,或者说预报通用汽车公司的精确度低于预报福特公司的精确度类型二独立性检验例2奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:是否愿意提供志愿者服务性别愿意不愿意男生2010女生1020(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?(2)你能否在犯错误的概率不超过0.01的前提下认为该校高中生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828独立性检验统计量K2,其中nabcd.考点独立性检验思想的应用题点分类变量与统计、概率的综合性问题解(1)由题意,男生抽取64(人)(2)K26.667,由于6.6676.635,所以能在犯错误的概率不超过0.01的前提下认为该校高中生是否愿意提供志愿者服务与性别有关反思与感悟独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性(2)通过公式K2先计算观测值k,再与临界值表作比较,最后得出结论跟踪训练2某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;(2)根据以上数据完成下列22列联表;主食蔬菜主食肉类合计50岁以下50岁以上总计 (3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?考点独立性检验思想的应用题点独立性检验在分类变量中的应用解(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主(2)22列联表如表所示:主食蔬菜主食肉类合计50岁以下481250岁以上16218总计 201030(3)K2106.635,故在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”1甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关检验,并用回归分析方法分别求得相关系数r如下表:甲乙丙丁r0.820.780.690.85则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是()A甲 B乙C丙 D丁考点线性相关系数题点线性相关系数的应用答案D解析由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强故选D.2为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k9.643,根据临界值表,以下说法正确的是()A没有充足的理由认为课外阅读量大与作文成绩优秀有关B有0.5%的把握认为课外阅读量大与作文成绩优秀有关C有99.9%的把握认为课外阅读量大与作文成绩优秀有关D有99.5%的把握认为课外阅读量大与作文成绩优秀有关考点独立性检验及其基本思想题点独立性检验的方法答案D解析根据临界值表,10.8289.6437.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关3某化妆品公司为了增加其商品的销售利润,调查了该商品投入的广告费用x与销售利润y的统计数据如下表:广告费用x(万元)2356销售利润y(万元)57911由表中数据,得线性回归方程l:x,则下列结论正确的是()A.0 B.0C直线l过点(4,8) D直线l过点(2,5)考点线性回归方程题点样本点中心的应用答案C解析因为1.40,81.442.40,所以排除A,B;因为1.4x2.4,所以1.422.45.25,所以点(2,5)不在直线l上,所以排除D;因为4,8,所以回归直线l过样本点的中心(4,8),故选C.4在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:感染未感染总计服用104050未服用203050总计3070100附表:P(K2k0)0.100.050.025k02.7063.8415.024参照附表,在犯错误的概率不超过_(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关”考点独立性检验及其基本思想题点独立性检验的方法答案5%解析K2的观测值k4.7623.841,所以在犯错误的概率不超过5%的前提下,认为“小鼠是否被感染与服用疫苗有关”5对于线性回归方程x,当x3时,对应的y的估计值是17,当x8时,对应的y的估计值是22,那么,该线性回归方程是_,根据线性回归方程判断当x_时,y的估计值是38.考点线性回归分析题点线性回归方程的应用答案x1424解析首先把两组值代入线性回归方程,得解得所以线性回归方程是x14.令x1438,可得x24,即当x24时,y的估计值是38.1.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出散点图,观察它们之间的关系(3)由经验确定回归方程的类型(4)按照一定的规则估计回归方程中的参数(5)得出结果后分析残差图是否有异常2独立性检验是利用随机变量K2来判断两个分类变量间是否存在相关关系的方法,常用的直观方法为等高条形图,等高条形图由于是等高的,因此它能直观地反映两个分类变量之间的差异的大小,而利用假设的思想方法,计算出某一个随机变量K2的值来判断更精确些一、选择题1有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如表:平均气温()2356销售额(万元)20232730则该商品销售额与平均气温有()A确定性关系 B正相关关系C负相关关系 D函数关系考点回归分析题点回归分析的概念和意义答案C解析根据春节期间平均气温x与某取暖商品销售额y的有关数据知,y随x的减小而增大,是负相关关系,故选C.2如果K2的观测值为8.654,可以认为“x与y无关”的可信度为()A99.5% B0.5%C99% D1%考点独立性检验及其基本思想题点独立性检验的方法答案B解析8.6547.879,x与y无关的可信度为0.5%.3下面的等高条形图可以说明的问题是()A“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C此等高条形图看不出两种手术有什么不同的地方D“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握考点定性分析的两类方法题点利用图形定性分析答案D解析由等高条形图可知选项D正确4为了了解疾病A是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:患疾病A不患疾病A总计男20525女101525总计302050则认为疾病A与性别有关的把握约为()A95% B99%C99.5% D99.9%考点独立性检验及其基本思想题点独立性检验的方法答案C解析由公式得K28.3337.879,故有(10.005)100%99.5%的把握认为疾病A与性别有关5某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查,y与x具有线性相关关系,回归方程为0.66x1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A83% B72%C67% D66%考点线性相关系数题点线性相关系数的应用答案A解析将y7.675代入回归方程,可计算得x9.26,所以该城市人均消费额占人均工资收入的百分比约为7.6759.260.83,即约为83%.6考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据可得出()A种子是否经过处理与是否生病有关B种子是否经过处理与是否生病无关C种子是否经过处理决定是否生病D有90%的把握认为种子经过处理与生病有关考点独立性检验及其基本思想题点独立性检验的方法答案B解析k0.1640.455,即没有充足的理由认为种子是否经过处理跟生病有关7为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值计算知i52,i228,478,iyi1 849,则y关于x的回归方程是()A.11.472.62xB.11.472.62xC.2.6211.47xD.11.472.62x考点线性回归分析题点线性回归方程的应用答案A解析由, ,直接计算得2.62,11.47,所以线性回归方程为2.62x11.47.8若对于变量y与x的10组统计数据的回归模型中,相关指数R20.95,又知残差平方和为120.53,那么(yi)2的值为()A241.06 B2 410.6C253.08 D2 530.8考点残差分析与相关指数题点残差及相关指数的应用答案B解析设总偏差平方和为x,根据公式R21,有0.951,x2 410.6,故选B.二、填空题9在研究气温和热茶销售杯数的关系时,若求得相关指数R20.85,则表明气温解释了_的热茶销售杯数变化,而随机误差贡献了剩余的_,所以气温对热茶销售杯数的效应比随机误差的效应大得多考点残差分析与相关指数题点残差及相关指数的应用答案85%15%解析由相关指数R2的意义可知,R20.85表明气温解释了85%,而随机误差贡献了剩余的15%.10为了规定工时定额,需要确定加工零件所花费的时间,为此进行5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)根据收集到的数据可知x1x2x3x4x5150,由最小二乘法求得线性回归方程为0.67x54.9,则y1y2y3y4y5的值为_考点线性回归方程题点样本点中心的应用答案375解析由题意,得(x1x2x3x4x5)30,且回归直线0.67x54.9恒过点(,),则0.673054.975,所以y1y2y3y4y55375.11在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是_若K2的观测值k6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误考点独立性检验及其基本思想题点独立性检验的思想答案解析K2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填.三、解答题12如表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出如表数据的散点图;(2)请根据如表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?考点线性回归分析题点线性回归方程的应用解(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 清炒法与炒炭法精要
- 离婚协议书翻译及海外法律文件认证合同
- 商业综合体物业租赁及配套设施服务合同
- 网络直播平台合同中多元化收入模式下的价格确定
- 农户耕地杂地租赁及农产品加工销售合同
- 数学光盘配套课件
- 汉字互动游戏课件
- 脑梗死教学课件
- 六职技术测试题及答案
- 建设银行2025丹东市秋招笔试热点题型专练及答案
- 政法干警执纪监督心得体会
- DB45∕T 2952-2024 高标准农田耕地质量评价技术规程
- 安全生产合规管理
- 肩袖损伤护理常规
- 宠物嘉年华活动方案
- 2025至2030中国超高温热泵行业发展趋势分析与未来投资战略咨询研究报告
- 电梯设备监测方案(3篇)
- 秋季安全教育
- 药剂专业教学标准(中等职业教育)2025修订
- 急救担架员培训
- 2025年秋三年级上册语文同步教案 4 古诗三首
评论
0/150
提交评论