线性回归、独立检验-_第1页
线性回归、独立检验-_第2页
线性回归、独立检验-_第3页
线性回归、独立检验-_第4页
线性回归、独立检验-_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

线性回归、独立检验未命名一、解答题1中华人民共和国道路交通安全法第47条规定:机动车行经人行横道时,应当减速慢行;遇到行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”.下表是某十字路口监控设备所抓拍的6个月内驾驶员不“礼让斑马线”行为的统计数据:月份123456不“礼让斑马线”驾驶员人数120105100859080()请根据表中所给前5个月的数据,求不“礼让斑马线”的驾驶员人数y与月份x之间的回归直线方程y=bx+a;()若该十字路口某月不“礼让斑马线”驾驶员人数的实际人数与预测人数之差小于5,则称该十字路口“礼让斑马线”情况达到“理想状态”.试根据()中的回归直线方程,判断6月份该十字路口“礼让斑马线”情况是否达到“理想状态”?()若从表中3、4月份分别选取4人和2人,再从所选取的6人中任意抽取2人进行交规调查,求抽取的两人恰好来自同一月份的概率.参考公式:b=i=1nxiyinxyi=1nxi2nx2 =i=1n(xix)(yiy)i=1n(xix)2,a=ybx.2新能源汽车的春天来了!2018年3月5日上午,李克强总理做政府工作报告时表示,将新能源汽车车辆购置税优惠政策再延长三年,自2018年1月1日至2020年12月31日,对购置的新能源汽车免征车辆购置税.某人计划于2018年5月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如下表:(1)经分析发现,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程y=bt+a,并预测2018年5月份当地该品牌新能源汽车的销量;(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程(新能源汽车的最大续航里程是指理论上新能源汽车所装的燃料或电池所能够提供给车跑的最远里程)对购车补贴进行新一轮调整.已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到如下一份频数表:(i)求这200位拟购买新能源汽车的消费者对补贴金额的心理预期值X的样本方差s2及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);(ii)将对补贴金额的心理预期值在1,2)(万元)和6,7(万元)的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,求抽出的3人中至少有1名“欲望膨胀型”消费者的概率.参考公式及数据:回归方程y=bx+a,其中b=i=1ntiyintyi=1nti2nt2,a=ybt;i=15tiyi=18.8.3近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数, y表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示:根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内, y=a+bx与cdx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表1中的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的 人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有16的概率享受7折优惠,有13的概率享受8折优惠,有12的概率享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要nnNn年才能开始盈利,求n的值.参考数据:其中其中i=1gyi,=17i=17i参考公式:对于一组数据ui,i,u2,2,un,n,其回归直线=a+u的斜率和截距的最小二乘估计公式分别为: =i=1nuiinui=1nui2nu2, a=u.4习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明理念,这将进一步推动新能源汽车产业的迅速发展,以下是近几年我国新能源乘用车的年销售量数据及其散点图:(1)请根据散点图判断,y=ax+b与y=cx2+d中哪一个更适宜作为年销售量y关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2018年我国新能源乘用车的销售量(精确到0.1)附:最小二乘估计公式:b=i=1n(tit)(yiy)i=1n(tit)2,a=ybt参考数据:yi=15(wiw)2i=15(xit)(yiy)i=15(wiw)(yiy)22.72374135.2851.2其中wi=xi25近年来,随着我国汽车消费水平的提高,二手车流通行业得到迅猛发展某汽车交易市场对2017年成交的二手车交易前的使用时间(以下简称“使用时间”)进行统计,得到频率分布直方图如图1 图1 图2(1)记“在2017年成交的二手车中随机选取一辆,该车的使用年限在(8,16”为事件A,试估计A的概率;(2)根据该汽车交易市场的历史资料,得到散点图如图2,其中x(单位:年)表示二手车的使用时间,y(单位:万元)表示相应的二手车的平均交易价格由散点图看出,可采用y=ea+bx作为二手车平均交易价格y关于其使用年限x的回归方程,相关数据如下表(表中Yi=lnyi,Y=110i=110Yi): xyYi=110xiyii=110xiYii=110xi25.58.71.9301.479.75385根据回归方程类型及表中数据,建立y关于x的回归方程;该汽车交易市场对使用8年以内(含8年)的二手车收取成交价格4%的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格10%的佣金在图1对使用时间的分组中,以各组的区间中点值代表该组的各个值若以2017年的数据作为决策依据,计算该汽车交易市场对成交的每辆车收取的平均佣金附注:对于一组数据u1,v1,u2,v2,un,vn,其回归直线v=+u的斜率和截距的最小二乘估计分别为=i=1nuivi-nuvi=1nui2-nu2,=v-u;参考数据:e2.9519.1,e1.755.75,e0.551.73,e-0.650.52,e-1.850.166某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(adbc)2(a+b)(c+d)(a+c)(b+d),P(K2k)k0.0503.8410.0106.6350.00110.8287某机构为了了解2017年当地居民网购消费情况,随机抽取了100人,对其2017年全年网购消费金额(单位:千元)进行了统计,所统计的金额均在区间内,并按分成6组,制成如图所示的频率分布直方图.(1)求图中的值;(2)若将全年网购消费金额在20千元及以上者称为网购迷.结合图表数据,补全列联表,并判断是否有99%的把握认为样本数据中的网购迷与性别有关系?说明理由.男女合计网购迷20非网购迷45合计 (3)己知所有网购迷中使用甲软件支付的用户占了 (非网购迷不使用甲软件),现要从甲软件用户中随机抽取2人进行调查,问恰好抽到1男1女的概率为多少?下面的临界值表仅供参考:0.100.050.0100.0050.0012.7063.8416.6357.87910.828附: 82018年6月14日,第二十一届世界杯足球赛将在俄罗斯拉开帷幕.为了了解喜爱足球运动是否与性别有关,某体育台随机抽取100名观众进行统计,得到如下22列联表.(1)将22列联表补充完整,并判断能否在犯错误的概率不超过0.001的前提下认为喜爱足球运动与性别有关?(2)在不喜爱足球运动的观众中,按性别分别用分层抽样的方式抽取6人,再从这6人中随机抽取2人参加一台访谈节目,求这2人至少有一位男性的概率.参考答案1()y=8x+124;()见解析;()715【解析】试题分析:()依题意x=3,y=100,根据公式求得b,a的值,即可得到回归直线方程;()由()得当x=6时,y=76,即可根据题意作出判断结论;()设3月份选取的4位驾驶的编号分别为:a1,a2,a3,a4,从4月份选取的2位驾驶员的编号分别为b1,b2,列出基本事件的总体,用古典概型及概率计算公式,即可求解概率.试题解析:()依题意x=3,y=100,b=i=15xiyi-5xyi=15xi2-5x2=-8,a=124,y关于x的线性回归方程为:y=-8x+124.()由()得y=-8x+124,当x=6时,y=76.80-76=40,解不等式即可.详解:(1)根据散点图判断,y=cdx适宜作为扫码支付的人数y关于活动推出天数x的回归方程类型;(2)y=cdx,两边同时取常用对数得:1gy=1gcdx =1gc+1gdx;设1gy=v, v=1gc+1gdxx=4,v=1.55, i=17Xi2=140,1gd=i=17xivi-7xvi=17xi2-7x2= 50.12-741.54140-742=728=0.25,把样本中心点4,1.54代入v=1gc+1gdx,得: 1gd=0.54,v=0.54+0.25x,1gy=0.54+0.25x,y关于x的回归方程式:y=100.54+0.25x=100.54100.54x=3.47100.54x;把x=8代入上式: y=100.54+0.258= 102.54=102100.54=347;活动推出第8天使用扫码支付的人次为3470;(3)记一名乘客乘车支付的费用为Z,则Z的取值可能为:2,1.8,1.6,1.4;PZ=2=0.1;PZ=1.8=0.312=0.15;PZ=1.6= 0.6+0.313=0.7;PZ=1.4=0.316=0.05,所以,一名乘客一次乘车的平均费用为:20.1+1.80.15+1.6 0.7+1.40.05=1.66(元)由题意可知:1.66112n- 0.6612n-800n203,所以,n取7;估计这批车大概需要7年才能开始盈利.点睛:求线性回归直线方程的步骤(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;(2)求系数b:公式有两种形式,即b=i=1nxixyiyi=1nxix2=i=1nxiyinxyi=1nxi2nx2。当数据较复杂时,题目一般会给出部分中间结果,观察这些中间结果来确定选用公式的哪种形式求b;(3)求a: a=ybx;(4)写出回归直线方程y=bx+a4(1)见解析;(2)79.7万辆.【解析】分析:第一问根据三点图中点的对应的位置,可以选择出比较适宜的回归方程,对于第二问,根据题中所给的有效数据,可以将回归方程求出,即y=2.28x22.36,从而将2018所对应的x=6代入回归方程,求得结果.详解:(1)根据散点图,y=cx2+d更适宜作为年销售量y关于年份代码x的回归方程(2)依题意,w=11c=i=15(wi-w)(yi-y)i=15(wi-w)2=851.23742.28d=y-cw=22.72-2.2811=-2.36y=2.28w-2.36=2.28x2-2.36令x=6,y=79.72,预测2018年我国新能源乘用车的销售量为79.7万辆.点睛:该题考查的是有关回归分析的问题,在求解的过程中,注意牢牢抓住题的条件,根据题中所给的散点图,从而可以判断出其应该落在某条抛物线的附近,而不是某个带状区域,从而正确选择回归类型,之后借助于题中所给的有效数据,将回归方程中有关系数求出,然后将相应的量代入,求得结果.5(1)0.40;(2)y=e3.550.3x,0.29万元.【解析】分析:(1)由频率分布直方图得,该汽车交易市场2017年成交的二手车使用时间在8,12的频率为0.28,在12,16的频率为0.12 ,则PA=0.40 (2)由y=ea+bx得lny=a+bx,即Y关于x的线性回归方程为Y=a+bx 其中b=-0.3,a=3.55 则Y关于x的线性回归方程为Y=3.55-0.3x,据此可得y=e3.55-0.3x 根据中的回归方程y=e3.55-0.3x和图1,对成交的二手车可预测:使用时间在0,4的平均成交价格为19.1,对应的频率为0.2;使用时间在4,8的平均成交价格为5.75,对应的频率为0.36;使用时间在8,12的平均成交价格为1.73,对应的频率为0.28;使用时间在12,16的平均成交价格为0.52,对应的频率为0.12;使用时间在16,20的平均成交价格为0.16,对应的频率为0.04,则该汽车交易市场对于成交的每辆车可获得的平均佣金为0.29万元.详解:(1)由频率分布直方图得,该汽车交易市场2017年成交的二手车使用时间在8,12的频率为0.074=0.28,在12,16的频率为0.034=0.12 所以PA=0.28+0.12=0.40 (2)由y=ea+bx得lny=a+bx,即Y关于x的线性回归方程为Y=a+bx 因为b=i=110xiYi-10xYi=110xi2-10x2=79.75-105.51.9385-105.52=-0.3,a=Y-bx=1.9-0.35.5=3.55 所以Y关于x的线性回归方程为Y=3.55-0.3x, 即y关于x的回归方程为y=e3.55-0.3x 根据中的回归方程y=e3.55-0.3x和图1,对成交的二手车可预测:使用时间在0,4的平均成交价格为e3.55-0.32=e2.9519.1,对应的频率为0.2;使用时间在4,8的平均成交价格为e3.55-0.36=e1.755.75,对应的频率为0.36;使用时间在8,12的平均成交价格为e3.55-0.310=e0.551.73,对应的频率为0.28;使用时间在12,16的平均成交价格为e3.55-0.314=e-0.650.52,对应的频率为0.12;使用时间在16,20的平均成交价格为e3.55-0.318=e-1.850.16,对应的频率为0.04所以该汽车交易市场对于成交的每辆车可获得的平均佣金为0.219.1+0.365.754%+0.281.73+0.120.52+0.040.1610% =0.290920.29万元. 点睛:本题主要考查非线性回归方程及其应用,离散型随机变量的分布列等知识,意在考查学生的转化能力和计算求解能力.6(1)第二种生产方式的效率更高理由见解析(2)m=79+812=80超过m不超过m第一种生产方式155第二种生产方式515(3)有【解析】分析:(1)计算两种生产方式的平均时间即可。(2)计算出中位数,再由茎叶图数据完成列联表。(3)由公式计算出k2,再与6.635比较可得结果。详解:(1)第二种生产方式的效率更高理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟因此第二种生产方式的效率更高(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟因此第二种生产方式的效率更高(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高学科%网以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分(2)由茎叶图知m=79+812=80列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2=40(1515-55)220202020=106.635,所以有99%的把握认为两种生产方式的效率有差异点睛:本题主要考查了茎叶图和独立性检验,考察学生的计算能力和分析问题的能力,贴近生活。7(1) .(2)列联表见解析,没有99%的把握认为样本数据中的网购迷与性別有关.(3) .【解析】分析:(1)根据频率分布直方图中,各个小矩形的面积和为1,可以求得的值。(2)根据所给数据列出列联表,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论