已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11.3 变量间的相关关系与统计案例,高考文数 (课标专用),考点一 变量间的相关关系,五年高考,A组 统一命题课标卷题组,1.(2018课标全国,18,12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元) 的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根 据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型: =-30.4+13.5t;根据 2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型: =99+17.5t.,(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.,解析 (1)利用模型,该地区2018年的环境基础设施投资额的预测值为 =-30.4+13.519= 226.1(亿元). 利用模型,该地区2018年的环境基础设施投资额的预测值为 =99+17.59=256.5(亿元). (2)利用模型得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上 下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资 额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据 对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性,方法总结 利用回归直线方程进行预测是对总体的估计,此估计值不是准确值,把自变量代入 回归直线方程即可对因变量进行估计,但需注意自变量的取值范围.,2.(2017课标全国,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的 16个零件的尺寸:,经计算得 = xi=9.97,s= = 0.212, 18.439, (xi- )(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,16. (1)求(xi,i)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过 程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统 地变大或变小); (2)一天内抽检零件中,如果出现了尺寸在( -3s, +3s)之外的零件,就认为这条生产线在这一天 的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (i)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ii)在( -3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸 的均值与标准差.(精确到0.01) 附:样本(xi,yi)(i=1,2,n)的相关系数,解析 (1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r= = -0.18. 由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)(i)由于 =9.97,s0.212,由样本数据可以看出抽取的第13个零件的尺寸在( -3s, +3s)以外, 因此需对当天的生产过程进行检查. (ii)剔除离群值,即第13个数据,剩下数据的平均数为 (169.97-9.22)=10.02, 这条生产线当天生产的零件尺寸的均值的估计值为10.02. =160.2122+169.9721 591.134, 剔除第13个数据,剩下数据的样本方差为 (1 591.134-9.222-1510.022)0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为 0.09.,方法总结 样本的数字特征. (1)样本数据的相关系数r, r= 反映样本数据的相关程度,|r|越大,则相关性越强. (2)样本数据的均值反映样本数据的平均水平;样本数据的方差反映样本数据的稳定性,方差越 小,数据越稳定;样本数据的标准差为方差的算术平方根.,3.(2015课标,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单 位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi (i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,表中wi= , = wi. (1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程 类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别 为 = , = - .,考点二 独立性检验 1.(2019课标全国,17,12分)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每 位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:,(1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2= .,解析 本题通过对概率与频率的关系、统计案例中两变量相关性检验考查学生的抽象概括 能力与数据处理能力,重点考查数学抽象、数据分析、数学运算的核心素养;倡导学生关注生 活,提高数学应用意识. (1)由调查数据,男顾客中对该商场服务满意的比率为 =0.8,因此男顾客对该商场服务满意的 概率的估计值为0.8. 女顾客中对该商场服务满意的比率为 =0.6,因此女顾客对该商场服务满意的概率的估计值 为0.6. (2)K2= 4.762. 由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.,思路分析 (1)计算频率,通过频率估计概率.(2)将数据代入公式计算K2,与附表中的k比较大小, 作出判断.,2.(2018课标全国,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产 任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组, 每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任 务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高,并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过 m的工人数填入下面的列联表;,(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2= , .,解析 (1)第二种生产方式的效率更高. 理由如下: (i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分 钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种 生产方式的效率更高. (ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第 二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效 率更高. (iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二 种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.,(3)由于 K2= =106.635,所以有99%的把握认为两种生产方式的效率有差异.,思路分析 (1)根据茎叶图中的数据大致集中在哪个茎,作出判断; (2)通过茎叶图确定数据的中位数,按要求完成22列联表; (3)根据(2)中22列联表,将有关数据代入公式计算得K2的值,借助临界值表作出统计推断.,方法总结 解决此类问题的步骤: (1)审清题意:弄清题意,理顺条件和结论; (2)找数量关系:把图形语言转化为数字,找关键数量关系; (3)建立解决方案:找准公式,将22列联表中的数值代入公式计算; (4)作出结论:依据数据,借助临界值表作出正确判断.,解后反思 独立性检验问题的常见类型及解题策略: (1)已知分类变量的数据,判断两个分类变量的相关性,可依据数据及公式计算K2,然后作出判 断; (2)独立性检验与概率统计的综合问题,关键是根据独立性检验的一般步骤,作出判断,再根据 概率统计的相关知识求解.,3.(2017课标全国,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收 获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;,(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附: , K2= .,解析 (1)旧养殖法的箱产量低于50 kg的频率为 (0.012+0.014+0.024+0.034+0.040)5=0.62. 因此,事件A的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表:,K2= 15.705. 由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间, 旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度 较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养 殖法优于旧养殖法.,解后反思 解独立性检验问题的关注点: (1)两个明确:明确两类主体;明确研究的两个问题. (2)两个关键:准确画出22列联表;准确求解K2.,B组 自主命题省(区、市)卷题组,1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是 ( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关,答案 C 由y=-0.1x+1,知x与y负相关, 即y随x的增大而减小, 又y与z正相关, 所以z随y的增大而增大,减小而减小, 所以z随x的增大而减小,x与z负相关,故选C.,2.(2015福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家 庭,得到如下统计数据表:,根据上表可得回归直线方程 = x+ ,其中 =0.76, = - . 据此估计,该社区一户年收入为15万元家庭的年支出为 ( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元,答案 B 由统计数据表可得 = =10.0, = =8.0, 则 =8.0-0.7610.0=0.4, 所以回归直线方程为 =0.76x+0.4, 当x=15时, =0.7615+0.4=11.8, 故估计年收入为15万元家庭的年支出为11.8万元.故选B.,3.(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民 币储蓄存款(年底余额)如下表:,(1)求y关于t的回归方程 = t+ ; (2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款. 附:回归方程 = t+ 中, = = - .,解析 (1)列表计算如下:,这里n=5, = ti= =3, = yi= =7.2. 又ltt= -n =55-532=10,lty= tiyi-n =120-537.2=12, 从而 = = =1.2, = - =7.2-1.23=3.6, 故所求回归方程为 =1.2t+3.6. (2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为 =1.26+3.6=10.8(千亿元).,C组 教师专用题组 考点一 变量间的相关关系,1.(2012课标全国,3,5分)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点 图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y= x+1上,则这组样本数据的样本相关系数为 ( ) A.-1 B.0 C. D.1,答案 D 所有点均在直线上,则样本相关系数最大即为1,故选D.,2.(2014课标,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据 如下表:,(1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况, 并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: = , = - .,解析 (1)由所给数据计算得 = (1+2+3+4+5+6+7)=4, = (2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti- )2=9+4+1+0+1+4+9=28, (ti- )(yi- )=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14, = = =0.5, = - =4.3-0.54=2.3,所求回归方程为 =0.5t+2.3. (2)由(1)知, =0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增 加0.5千元. 将2015年的年份代号t=9代入(1)中的回归方程,得 =0.59+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.,考点二 独立性检验 1.(2014安徽,17,12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学 生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时 间的样本数据(单位:小时). (1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其 中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动 时间超过4小时的概率; (3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动 时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性 别有关”. 附:K2=,解析 (1)300 =90,所以应收集90位女生的样本数据. (2)由频率分布直方图得1-2(0.100+0.025)=0.75, 所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. (3)由(2)知,300位学生中有3000.75=225人的每周平均体育运动时间超过4小时,75人的每周平 均体育运动时间不超过4小时. 又因为样本数据中有210份是关于男生的,90份是关于女生的, 所以每周平均体育运动时间与性别列联表如下: 每周平均体育运动时间与性别列联表,结合列联表可算得K2= = 4.7623.841. 所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.,2.(2010课标,19,12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从 该地区调查了500位老年人,结果如下:,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据()的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助 的老年人的比例? 说明理由. 附:,K2=,解析 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年 人的比例的估计值为 =14%. (2)K2= 9.967. 由于9.9676.635, 所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男 性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中 男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更 好.,评析 本题考查分层抽样和独立性检验,考查统计思想和运算求解能力、应用意识,分类与整 合思想.,考点一 变量间的相关关系,三年模拟,A组 20172019年高考模拟考点基础题组,1.(2019安徽马鞍山二模,4)在一组样本数据(x1,y1)、(x2,y2)、(xn,yn)(n2,x1、x2、xn互 不相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=-2x+100上,则这组样本数据的 样本相关系数为 ( ) A.-1 B.0 C. D.1,答案 A 因为所有样本点(xi,yi)(i=1,2,n)都在直线y=-2x+100上,所以这组样本数据呈负相 关,且相关系数为-1.故选A.,2.(2019广东深圳一模,4)已知某产品的销售额y(万元)与广告费用x(万元)之间的关系如下表:,若求得其线性回归方程为 =6.5x+ ,则预计当广告费用为6万元时的销售额为 ( ) A.42万元 B.45万元 C.48万元 D.51万元,答案 C 由题意得 = =2, = =22, =6.5x+ , =22-6.52=9,则 =6.5x+9, 当x=6时, =6.56+9=48.故选C.,3.(2018湖南张家界三模,4)已知变量x,y之间的线性回归方程为 =-0.7x+10.3,且变量x,y之间的 一组相关数据如下表所示,则下列说法错误的是 ( ),A.变量x,y之间呈负相关关系 B.可以预测,当x=20时, =-3.7 C.m=4 D.该回归直线必过点(9,4),答案 C 由-0.70,得变量x,y之间呈负相关关系,故A正确;当x=20时, =-0.720+10.3=-3.7,故 B正确; 由题中表格数据可知 = (6+8+10+12)=9, = (6+m+3+2)= ,则 =-0.79+10.3, 解得m=5,故C错; 由m=5,得 = =4,所以该回归直线必过点(9,4),故D正确.故选C.,4.(2017湖南益阳调研,4)某公司20102015年的年利润x(单位:百万元)与年支出y(单位:百万元) 的统计资料如下表所示:,根据统计资料,得 ( ) A.利润中位数是16,x与y有正线性相关关系 B.利润中位数是17,x与y有正线性相关关系 C.利润中位数是17,x与y有负线性相关关系 D.利润中位数是18,x与y有负线性相关关系,答案 B 利润的6个数的中间两个数为16,18,平均数为17,故利润的中位数为17.因为x增加 时,y也增加,因此x与y正相关.故选B.,5.(2018河北石家庄二中三模,13)如图是具有相关关系的两个变量的一组数据的散点图和回归 直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是 .,答案 E,解析 由于点越靠近回归直线,相关性越强,相关系数越大,又由于点E到回归直线的距离最大, 所以要去掉点E.,考点二 独立性检验 1.(2019广东湛江高考测试(二),5)有人认为在机动车驾驶技术上,男性优于女性.这是真的吗?某 社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故 或交通违法事件发生,得到下面的列联表:,附:K2=,据此表,可得 ( ) A.认为机动车驾驶技术与性别有关的可靠性不足50% B.认为机动车驾驶技术与性别有关的可靠性超过50% C.认为机动车驾驶技术与性别有关的可靠性不足60% D.认为机动车驾驶技术与性别有关的可靠性超过60%,答案 A 由题表中数据,计算得K2= 0.336 70.455, 认为机动车驾驶技术与性别有关的可靠性不足50%. 故选A.,解题关键 本题考查独立性检验的应用,关键是理解独立性检验的思路.,2.(2017湖南邵阳二模,3)假设有两个分类变量X和Y的22列联表如下:,对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为 ( ) A.a=45,c=15 B.a=40,c=20 C.a=35,c=25 D.a=30,c=30,答案 A 根据22列联表与独立性检验可知, 当|30a-10c|越大时,X与Y有关系的可能性越大, 故选A.,3.(2018全国统一考试第二次调研,5)某科研机构为了研究中年人秃头是否与患有心脏病有关, 随机调查了一些中年人的情况,具体数据如下表所示:,根据表中数据得K2= 15.968,由K210.828,断定秃头与患有心脏病有关, 那么这种判断出错的可能性为 ( ) 附表:,A.0.1 B.0.05 C.0.01 D.0.001,答案 D 由于K210.828,所以根据附表可得断定秃头与患有心脏病有关出错的可能性为0.001,故选D.,4.(2017安徽皖南一模,4)下列说法错误的是 ( ) A.回归直线过样本点的中心( , ) B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1 C.在回归直线方程 =0.2x+0.8中,当解释变量x每增加1个单位时,预报变量 平均增加0.2个单 位 D.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小,答案 D A.回归直线过样本点的中心( , ),正确; B.两个随机变量相关性越强,则相关系数的绝对值越接近1,正确; C.在回归直线方程 =0.2x+0.8中, 当解释变量x每增加1个单位时,预报量平均增加0.2个单位,正确; D.对分类变量X与Y的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大,因 此不正确.故选D.,B组 20172019年高考模拟专题综合题组 (时间:45分钟 分值:75分) 一、选择题(每题5分,共15分),1.(2019湖北七市(州)教科研协作体3月模拟,3)为了规定工时定额,需要确定加工零件所花费的 时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据收集到的数据可知 x1+x2+x3+x4+x5=100,由最小二乘法求得回归直线方程为 =0.67x+54.8,则y1+y2+y3+y4+y5的值为 ( ) A.68.2 B.341 C.355 D.366.2,答案 B 依题意可得 = =20,由样本点的中心( , )在回归直线 =0.67x+54.8上可得 = 0.6720+54.8=68.2,故y1+y2+y3+y4+y5=5 =568.2=341,故选B.,2.(2019湖北恩施2月教学质量检测,6)下列说法中正确的个数是( ) 相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱; 回归直线 = x+ 过样本点的中心( , ); 相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越不好. A.0 B.1 C.2 D.3,答案 C 相关系数r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量的线 性相关关系越强,|r|越接近于0,线性相关关系越弱,故错误; 回归直线 = x+ 过样本点的中心( , ),故正确; 用相关指数R2来刻画回归的效果,R2越大,说明模型的拟合效果越好;R2越小,说明模型的拟合 效果越不好,故正确. 综上,说法中正确的个数是2.故选C.,3.(2018江西南昌一模,10)已知具有线性相关的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6, 4),用最小二乘法得到回归直线方程l1: = x+ ,过点A1,A2的直线方程l2:y=mx+n,那么下列四个 命题中, m , n;直线l1过点A3; (yi- xi- )2 (yi-mxi-n)2; |yi- xi- | |yi-mxi-n|. 参考公式: = 正确的命题有 ( ) A.1个 B.2个 C.3个 D.4个,答案 B 由所给的数据计算可得 =3, =2,回归直线方程为 =0.6x+0.2, 过点A1,A2的直线方程为y=x. 所以m , n,正确; 直线l1过点A3,正确; (yi- xi- )2=0.8, (yi-mxi-n)2=9,错误; |yi- xi- |=1.6, |yi-mxi-n|=5,错误. 综上可得,正确的命题有2个. 选B.,4.(2019湖南郴州第三次质量检测,18)某市环保部门对该市市民进行了一次垃圾分类知识的网 络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满 分:100分)数据,统计结果如下表所示.,(1)若规定问卷得分不低于70分的市民称为“环保关注者”,请完成下面的22列联表,并判断 能否在犯错误概率不超过0.05的前提下,认为是不是“环保关注者”与性别有关;,(2)若问卷得分不低于80分的人称为“环保达人”.现在从本次调查的“环保达人”中利用分 层抽样的方法随机抽取5名市民参与环保知识问答,再从这5名市民中抽取2人参与座谈会,求 抽取的2名市民中,既有男“环保达人”又有女“环保达人”的概率. 附表及公式:K2= ,n=a+b+c+d,解析 (1)22列联表如下:,将22列联表中的数据代入公式计算得 K2= 3.033.841, 所以在犯错误的概率不超过0.05的前提下,不能认为是不是“环保关注者”与性别有关. (2)由题可知,利用分层抽样的方法抽得男“环保达人”3人,女“环保达人”2人. 设3个男“环保达人”分别为A,B,C;2个女“环保达人”分别为D,E. 从中抽取2人的所有情况为(AB),(AC),(AD),(AE),(BC),(BD),(BE),(CD),(CE),(DE),共10种情况. 既有男“环保达人”又有“女环保达人”的情况有(AD),(AE),(BD),(BE),(CD),(CE),共6种情 况. 故所求概率P= = .,5.(2019广东深圳第二次调研,18)某网店经销某商品,为了解该商品的月销量y(单位:千件)与当 月售价x(单位:元/件)之间的关系,收集了5组数据进行了初步处理,得到如下表:,(1)统计学中用相关系数r来衡量两个变量之间线性相关关系的强弱,若|r|0.75,1,则认为相 关性很强;若|r|0.3,0.75),则认为相关性一般;若|r|0,0.25,则认为相关性较弱.请计算相关 系数r,并说明y与x之间的线性相关关系的强弱(精确到0.01); (2)求y关于x的线性回归方程; (3)根据(2)中的线性回归方程,估计当售价x定为多少时,月销售金额最大?(月销售金额=月销售 量当月售价) 附注: 参考数据: 12.85.参考公式:相关系数r= ,线性回归方程 = x+ 中, = , = - x.,6.(2019安徽黄山第二次质量检测,19)2019年全国“两会”,即中华人民共和国第十三届全国 人大二次会议和中国人民政治协商会议第十三届全国委员会第二次会议,分别于2019年3月5 日和3月3日在北京召开.为了了解哪些人更关注“两会”,某机构随机抽取了年龄在1575岁 之间的200人进行调查,并按年龄绘制的频率分布直方图如图所示,把年龄落在区间15,35)和 35,75内的人分别称为“青少年人”和“中老年人”.经统计“青少年人”和“中老年人”的 人数之比为1921.其中“青少年人”中有40人关注“两会”,“中老年人”中关注“两会” 和不关注“两会”的人数之比是21.,(1)求图中a,b的值; (2)现采用分层抽样的方法在25,35)和45,55)中随机抽取8名代表,从8人中任选2人,求2人中至 少有1个是“中老年人”的概率; (3)根据已知条件,完成下面的22列联表,并根据此统计结果判断:能否有99.9%的把握认为 “中老年人”比“青少年人”更加关注“两会”.,解析 (1)由题意得 解得 (2分) (2)由题意得在25,35)中抽取6人,记为A,B,C,D,E,F,在45,55)中抽取2人,记为1,2. 则从8人中任取2人的全部基本事件(共28种)列举如下: AB,AC,AD,AE,AF,A1,A2,BC,BD,BE,BF,B1,B2,CD,CE,CF,C1,C2,DE,DF,D1,D2,EF,E1,E2,F1,F2, 12, (4分) 记2人中至少有1个是“中老年人”为事件A,则P(A)= . (6分) (3)22列联表如下: (8分),K2= 12.15710.828, (10分) 所以有99.9%的把握认为“中老年人”比“青少年人”更加关注“两会”. (12分),7.(2019湖南百所重点名校大联考,19)近期,某公交公司分别推出支付宝和微信扫码支付乘车 活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用 扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活 动推出的天数,y(十人次)表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:,根据以上数据,绘制了如图所示的散点图. (1)根据散点图判断,在推广期内,y=a+bx与y=cdx(c,d均为大于零的常数)哪一个适宜作为扫码 支付的人次y关于活动推出天数x的回归方程类型?(说明理由) (2)根据(1)的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支 付的人次. 参考数据:,其中vi=lg yi, = vi. 参考公式: 对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线 = + u的斜率和截距的最小二乘估计公式分 别为: = , = - .,解析 (1)根据散点图判断,y=cdx适宜作为扫码支付的人次y关于活动推出天数x的回归方程类 型(理由略.合理即可). (4分) (2)将y=cdx两边同时取常用对数得lg y=lg(cdx)=lg c+lg dx. 设lg y=v,v=lg c+lg dx. (5分) =4, =1.54, =140, lg d= = = =0.25, (7分) 把样本点的中心(4,1.54)代入v=lg c+lg dx,得lg c=0.54, =0.54+0.25x,lg y=0.54+0.25x, (9分) y关于x的回归方程为 =100.54+0.25x=100.54(100.25)x=3.47100.25x, 把x=8代入得, =3.47102=347, (11分) 故活动推出第8天使用扫码支付的人次为3 470. (12分),8.(2019河南名校联盟尖子生第六次联合调研,19)随着智能手机的普及,手机计步软件迅速流 行开来,这类软件能自动记载每个人每日健步的步数,从而为科学健身提供一定的帮助.某市工 会为了解该市市民每日健步走的情况,从本市市民中随机抽取了2 000名市民(其中不超过40 岁的市民恰好有1 000名),利用手机计步软件统计了他们某天健步的步数,并将样本数据分为 3,5),5,7),7,9),9,11),11,13),13,15),15,17),17,19),19,21九组(单位:千步),将抽取的不超过4 0岁的市民的样本数据绘制成频率分布直方图如图,将40岁以上的市民的样本数据绘制成频数 分布表如下,并利用该样本的频率分布估计总体的概率分布.,(1)现规定,日健步步数不低于13 000步的为“健步达人”,填写下面列联表,并根据列联表判断 能否有99.9%的把握认为是不是“健步达人”与年龄有关;,(2)利用样本平均数和中位数估计该
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年县乡教师选调考试《教育学》考前冲刺练习题附答案详解(黄金题型)
- 2025年县乡教师选调考试《教育学》练习题包及答案详解(典优)
- 2026年县乡教师选调考试《教育学》练习题包及答案详解(必刷)
- 2025年注册岩土工程师之《岩土基础知识》练习题库包及参考答案详解(完整版)
- 巷道掘砌工操作评估模拟考核试卷含答案
- 塑料打火机制作工常识评优考核试卷含答案
- 耐火材料模具工安全管理水平考核试卷含答案
- 生活垃圾堆肥操作工岗前品质考核试卷含答案
- 2025年医院感染管理知识测试卷答案解析
- 2026年县乡教师选调考试《教育学》检测卷附答案详解(黄金题型)
- 婚内离婚协议电子版(2025年版)
- 工商企业管理实践报告1500字
- GB/T 16895.3-2024低压电气装置第5-54部分:电气设备的选择和安装接地配置和保护导体
- 八年级国测数学试卷
- 2024年全国甲卷高考历史试卷(真题+答案)
- 2023年重庆理工大学应届生招聘科研助理考试真题
- 中医养生中的药膳食疗的课件
- 《山东饮食介绍》课件
- 文旅局消防安全培训课件
- 角膜化学性烧伤护理查房课件
- 渣土公司运输车辆管理制度(3篇)
评论
0/150
提交评论