专题五 微专题3 统计与成对数据的统计分析 -大二轮数学专题复习_第1页
专题五 微专题3 统计与成对数据的统计分析 -大二轮数学专题复习_第2页
专题五 微专题3 统计与成对数据的统计分析 -大二轮数学专题复习_第3页
专题五 微专题3 统计与成对数据的统计分析 -大二轮数学专题复习_第4页
专题五 微专题3 统计与成对数据的统计分析 -大二轮数学专题复习_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

微专题3统计与成对数据的统计分析[考情分析]高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.考点一统计图表、数字特征1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×2.在频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例1(1)(多选)(2024·泰安模拟)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如图所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)()A.m=0.030B.样本质量指标值的平均数为75C.样本质量指标值的众数小于其平均数D.样本质量指标值的第75百分位数为85答案ACD解析对于A项,由题意知(0.010+0.015+m+0.035+0.010)×10=1,解得m=0.030,故A项正确;对于B项,样本质量指标值的平均数为55×0.1+65×0.15+75×0.35+85×0.3+95×0.1=76.5,故B项错误;对于C项,样本质量指标值的众数是70+802=75<76.5,故C对于D项,前3组的频率之和为(0.010+0.015+0.035)×10=0.60,前4组的频率之和为0.60+0.030×10=0.90,故第75百分位数位于第4组,设其为t,则(t-80)×0.030+0.60=0.75,解得t=85,即第75百分位数为85,故D项正确.(2)(多选)(2024·嘉兴模拟)已知一组数据1,3,5,7,9,其中位数为a,平均数为x,极差为b,方差为s2.现从中删去某一个数,得到一组新数据,其中位数为a',平均数为x',极差为b',方差为s'2,则下列说法中正确的是(A.若删去3,则a<a'B.若删去9,则x<x'C.无论删去哪个数,均有b≥b'D.若x=x',则s2<s'答案ACD解析A选项,若去掉3,根据中位数的定义,a=5,a'=5+72=6,满足a<a',AB选项,若删去9,根据平均数的定义,x=1+3+5+7+95=5x'=1+3+5+74=4x>x',BC选项,根据极差的定义,若去掉的数是3,5,7中的一个,显然去掉前后极差都是9-1=8,满足b=b',若去掉1,b'=9-3=6<b=8,若去掉9,b'=7-1=6<b=8,综上,b≥b',C选项正确;D选项,原数据平均数x=5,去掉一个数后平均数保持不变,即x'=5,则剩下的四个数之和为5×4=20,显然去掉的数只能是5,由方差的定义,s2=15×[(1-5)2+(3-5)2+(5-5)2+(7-5)2+(9-5)2]=8s'2=14×[(1-5)2+(3-5)2+(7-5)2+(9-5)2]=10满足s2<s'2,D选项正确.[易错提醒](1)对于给出的统计图表,一定要结合问题背景理解图表意义.(2)频率分布直方图中纵坐标不要误以为是频率.跟踪演练1(1)(多选)海口市始终坚持生态优先,绿色低碳发展,空气质量长期领“鲜”全国.数据显示,2023年海口市空气质量创历史最高水平,位居全国168个重点城市之首.生活中常用空气质量指数(AQI)描述空气质量,AQI越小,表示空气质量越好.下表为2024年3月18日~3月24日一周内海口市和同为空气质量排行榜前十的“某市”的空气质量指数(AQI),这组数据中,以下表述正确的是()A.海口市这一周AQI的平均数为22B.“某市”这一周AQI的中位数为40C.两市这一周AQI的方差或标准差可以反映出两市空气质量变化的稳定情况D.海口市这一周AQI的方差大于“某市”这一周AQI的方差答案AB解析对于A,根据散点图分析可知,海口市这一周AQI的平均数为22+26+33+31+23+9+107=22,A对于B,观察散点图知“某市”这一周的AQI按从小到大排列为31,35,36,40,42,50,74,可知中位数为40,B正确;对于C,两市这一周AQI的方差或标准差不能完全反映出两市空气质量变化的稳定情况,C错误;对于D,根据散点图观察海口市这一周AQI的波动小于“某市”这一周AQI的波动,所以海口市这一周AQI的方差小于“某市”这一周AQI的方差,D错误.(2)(多选)(2024·宿州模拟)已知样本数据x1,x2,x3,x4,x5(x1<0,x2,x3,x4,x5>0)的方差为s2,平均数x>0,则()A.数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的方差为9s2B.数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数大于0C.数据x2,x3,x4,x5的方差大于s2D.数据x2,x3,x4,x5的平均数大于x答案AD解析对于A,数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的方差为9s2,故A正确;对于B,数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3x-2,当0<x≤23时,3x-2≤0,对于C,去掉一个最小(特异值)的数据,剩下的数据的方差有可能更小,故C错误;对于D,因为x=x1+数据x2,x3,x4,x5的平均数x=54x因为x1<0,故数据x2,x3,x4,x5的平均数大于x,故D正确考点二回归分析求经验回归方程的步骤(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).(2)计算出x,(3)写出经验回归方程.例2(1)(多选)(2024·晋中模拟)下列有关回归分析的结论中,正确的有()A.在成对样本数据(xi,yi)(i=1,2,3,…,10)中,根据最小二乘法求得经验回归方程为y^=3x-1,去除一个样本点(x1,y1)后,B.具有相关关系的两个变量x,y的样本相关系数为r,那么r越大,x,y之间的线性相关程度越强C.若散点图中的散点均落在一条斜率非零的直线上,则决定系数R2=1D.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高答案CD解析对于A,若去除的点恰好在原经验回归直线上,则去除该点后,经验回归方程不会发生改变,故A错误;对于B,|r|越接近于1,则x,y之间的线性相关程度越强,故B错误;对于C,若散点图中的散点均落在一条斜率非零的直线上,则变量与变量之间满足线性函数关系,决定系数R2=1,故C正确;对于D,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故D正确.(2)(2024·温州模拟)2024年之前某淀粉厂只生产食品淀粉,下表为近几年年投入资金x(万元)与年收益y(万元)的8组数据:x1020304050607080y12.816.51920.921.521.92325.4①用y=blnx+a模拟生产食品淀粉年收益y与年投入资金x的关系,求出非线性经验回归方程;②为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的10%.2024年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值(精确到0.1万元).附:Ⅰ.经验回归直线u^=b^v+a^中斜率和截距的最小二乘估计公式分别为:b^=nⅡ.8Σi=18Σi=1ln88Σi=1(lnxi8Σi=1yiln1612920400109603Ⅲ.ln2≈0.7,ln5≈1.6.解①令t=lnx,b^=603-8×298a^=y-b^t=1618∴非线性经验回归方程为y^=5lnx②2024年设该企业投入食品淀粉生产m万元,预计收益w万元,w=5lnm+2+(200-m)·110,0<m≤w'=5m-110令w'>0得0<m<50;令w'<0得50<m≤200,∴函数w在(0,50)上单调递增,在(50,200]上单调递减.wmax=5ln50+2+15=5(2ln5+ln2)+17≈5×(2×1.6+0.7)+17=36.5.∴年收益的最大值为36.5万元.[易错提醒](1)样本点不一定在经验回归直线上,但点(x,y)(2)求b^时,灵活选择公式,注意公式的推导和记忆(3)利用样本相关系数判断线性相关程度强弱时,看|r|的大小,而不是r的大小.(4)区分样本相关系数r与决定系数R2.(5)通过经验回归方程求的都是估计值,而不是真实值.跟踪演练2(2024·石家庄模拟)在推动电子制造业高质量发展的大环境下,某企业统筹各类资源,进行了积极的改革探索.下表是该企业每月生产的一种核心产品的产量x(3≤x≤15)(件)与相应的生产总成本y(万元)的四组对照数据.x57911y200298431609企业研究人员建立了y与x的两种回归模型,利用计算机算得近似结果如下:经验回归方程①y^1=x33+173;经验回归方程②其中经验回归方程①的残差图如图所示(残差=观测值-预测值).(1)在下表中填写经验回归方程②的残差,根据残差分析,判断哪一个经验回归方程更适宜作为y关于x的经验回归方程,并说明理由;x57911y200298431609e(2)从该企业在过去几年生产的该产品中随机抽取100件,优等品有60件,合格品有40件.每件优等品利润为20万元,每件合格品利润为15万元.若视频率为概率,该企业某月计划生产12件该产品,记优等品件数为X,总利润为Y.①求Y与X的关系式,并求E(X)和E(Y);②记该月的成本利润率为p,在(1)中选择的经验回归方程下,求p的估计值.(结果保留2位小数)附:成本利润率=总利润总成本解(1)经验回归方程②的残差数据如表:x57911y200298431609e20-18-2121经验回归方程②的残差图如图所示:经验回归方程①更适宜作为y关于x的经验回归方程(以下理由或其他合理的理由,说出一条即可得分).理由1:经验回归方程①这4个样本点的残差的绝对值都比经验回归方程②的小.理由2:经验回归方程①这4个样本的残差点落在的带状区域比经验回归方程②的带状区域更窄.理由3:经验回归方程①这4个样本的残差点比经验回归方程②的残差点更贴近x轴.(2)①由题意知,每件产品为优等品的概率P=60100=0.6则X~B(12,0.6),因此E(X)=12×0.6=7.2,由Y=20X+15×(12-X)=5X+180,则E(Y)=5E(X)+180=216.②由①知总利润为216万元,总成本估计值y^1=1233+173=749则p=216749≈0.29考点三独立性检验独立性检验的一般步骤(1)根据样本数据列2×2列联表.(2)根据公式χ2=n(ad-bc)(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.例3(2024·温州模拟)某兴趣小组调查并统计了某班级学生期末统考中的数学成绩和建立个性化错题本的情况,用来研究这两者是否有关.若从该班级中随机抽取1名学生,设A=“抽取的学生期末统考中的数学成绩不及格”,B=“抽取的学生建立了个性化错题本”,且P(A|B)=23,P(B|A)=56,P(B(1)求P(A)和P(A|B);(2)若该班级共有36名学生,请完成列联表,并依据小概率值α=0.005的独立性检验,分析学生期末统考中的数学成绩与建立个性化错题本是否有关?个性化错题本期末统考中的数学成绩合计及格不及格建立未建立合计(3)为进一步验证(2)中的判断,该兴趣小组准备在其他班级中抽取一个容量为36k的样本(假设根据新样本数据建立的列联表中,所有的数据都扩大为(2)中列联表中数据的k倍,且新列联表中的数据都为整数).若要使得依据α=0.001的独立性检验可以肯定(2)中的判断,试确定k的最小值.参考公式及数据:χ2=nn=a+b+c+d.α0.010.0050.001xα6.6357.87910.828解(1)因为P(A|B)=23,P(B|A)P(B)=2所以P(A|B)=1-P(A|B)=1P(B|A)=1-P(B|A)=16,P(B)由于P(A|B)·P(B)=P(B|A)·P(A),解得P(A)=23,所以P(A)=P(A)=P(B)·P(A|B)+P(B)·P(A|B),解得P(A|B)=16(2)个性化错题本期末统考中的数学成绩合计及格不及格建立20424未建立4812合计241236零假设为H0:期末统考中的数学成绩与建立个性化错题本无关.根据列联表中的数据,经计算得到χ2=36×(20×8-4×4)224×12×12×24=9>7.879=x0根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为期末统考中的数学成绩与建立个性化错题本有关.(3)χ'2=k(a+b+c+d)(解得k≥10.8289要使新列联表中的数据都为整数,则需4k∈Z.又因为4k≥10.828×49≈4.8所以4k的最小值为5,故k的最小值是54[易错提醒](1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.跟踪演练3(2024·福州模拟)人的性格可以大体分为“外向型”和“内向型”两种,某中学为了了解这两种性格特征与人的性别是否存在关联,采用简单随机抽样的方法抽取90名学生,得到如下数据:外向型内向型男生4515女生2010(1)以上述统计结果的频率估计概率,从该校男生中随机抽取2人、女生中随机抽取1人担任志愿者.设这三人中性格外向型的人数为X,求X的数学期望;(2)对表格中的数据,依据α=0.1的独立性检验,可以得出独立性检验的结论是这两种性格特征与人的性别没有关联.如果将表格中的所有数据都扩大为原来10倍,在相同的检验标准下,再用独立性检验推断这两种性格特征与人的性别之间的关联性,得到的结论是否一致?请说明理由.参考公式与临界值表:χ2=n(α0.10.050.01xα2.7063.8416.635解(1)由统计结果可知,外向型男生在所有男生中占比为34,故从该校男生中随机抽取一人为外向型男生的概率是34,从该校女生中随机抽取一人为外向型女生的概率是方法一X的所有可能取值为0,1,2,3,则P(X=0)=142×1P(X=1)=C21×34×14×13+P(X=2)=342×13+C21×34P(X=3)=342×2所以E(X)=0×148+1×16+2×716+3×3方法二从该校男生中随机抽取2人,抽到性格外向型的人数记为Y1;从该校女生中随机抽取1人,抽到性格外向型的人数记为Y2,则Y1~B2,34,所以E(Y1)=2×34=E(Y2)=1×23=所以E(X)=E(Y1+Y2)=E(Y1)+E(Y2)=32+23=(2)零假设为H0:这两种性格特征与人的性别无关联.由所获得的所有数据都扩大为原来10倍,可知χ2=900×(450×100-150×200)2600×300×650×250=9013≈6.923>2.706=x依据α=0.1的独立性检验,可以推断这两种性格特征与人的性别有关联,与原来的结论不一致,原因是每个数据扩大为原来的10倍,相当于样本量变大为原来的10倍,导致推断结论发生了变化.专题强化练(分值:90分)一、单项选择题(每小题5分,共30分)1.(2024·南通模拟)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10 B.09 C.71 D.20答案B解析从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个样本的编号为09.2.(2024·张家口模拟)现有一组数据x1,x2,…,xn,将这组数据按照从小到大的顺序排列,则去掉第一个数和最后一个数后,下列统计量一定不变的是()A.平均数 B.中位数C.方差 D.极差答案B解析现有一组数据x1,x2,…,xn,将这组数据按照从小到大的顺序排列为y1,y2,…,yn,去掉第一个数和最后一个数后为y2,…,yn-1.原平均数为y1+y2+y3根据中位数的定义可知,中位数不会发生改变,故B正确;因为最小的数据变大,最大的数据变小,其余数据不变,方差的意义是新数据与新平均值的波动情况,不能确定不变,故C不正确;原极差为yn-y1,删除后极差为yn-1-y2,不一定相等,故D不正确.3.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表(单位:人):月收入文化程度月收入5000元以下月收入5000元及以上合计高中文化以上104555高中文化及以下203050合计3075105由上表中数据计算得χ2=105×(10×30-45×20)255×50×30×75≈6.109.如果认为文化程度与月收入有关系,那么犯错误的概率不会超过附表:α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828A.0.001 B.0.005 C.0.01 D.0.05答案D解析因为χ2≈6.109>3.841=x0.05,所以认为文化程度与月收入有关系,那么犯错误的概率不会超过0.05.4.(2024·临沂模拟)一组数据按从小到大的顺序排列为1,4,m,12,14,21,若该组数据的中位数是极差的25,则该组数据的第45百分位数是(A.4 B.6 C.8 D.12答案A解析根据中位数的定义,该组数据的中位数是m根据极差的定义,该组数据的极差是21-1=20,依题意得,m+122=20×25,解得m=4,6×0.45=2根据百分位数的定义,该组数据的第45百分位数是从小到大排列的第3个数,即4.5.(2024·新课标全国Ⅱ)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:亩产量[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200]频数61218302410根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1050kgB.100块稻田中亩产量低于1100kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200kg至300kg之间D.100块稻田亩产量的平均值介于900kg至1000kg之间答案C解析对于A,根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1050kg,故A错误;对于B,亩产量不低于1100kg的频数为24+10=34,所以低于1100kg的稻田占比为100-34100×100%=66%,故B对于C,因为1200-900=300,1150-950=200,故C正确;对于D,由频数分布表可得,平均值为1100×(6×925+12×975+18×1025+30×1075+24×1125+10×1175)=1067,故D错误6.(2024·秦皇岛模拟)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:身高x(单位:cm)167173175177178180181体重y(单位:kg)90545964677276由表格制作成如图所示的散点图:由最小二乘法计算得到经验回归直线l1的方程为y^=b^1x+a^1,其样本相关系数为r1;经过残差分析,点(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线l2的方程为y^=b^2x+A.b^1>b^2,a^B.b^1>b^2,a^C.b^1<b^2,a^D.b^1<b^2,a^答案D解析这7个身高的平均数x=167+173+175+177+178+180+1817≈176因为离群点(167,90)的横坐标167小于平均值176,纵坐标90相对过大,所以去掉离群点后经验回归直线的截距变小,而斜率变大,所以a^1>a^2去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,所以r1<r2.二、多项选择题(每小题6分,共12分)7.(2024·安阳模拟)某研究机构为了探究过量饮酒与患疾病A是否有关,调查了400人,得到如图所示的2×2列联表,其中b=12a,则()患疾病A不患疾病A合计过量饮酒3ab不过量饮酒a2b合计400参考公式与临界值表:χ2=n(α0.1000.0500.0100.001xα2.7063.8416.63510.828A.任意一人不患疾病A的概率为0.9B.任意一人不过量饮酒的概率为3C.任意一人在不过量饮酒的条件下不患疾病A的概率为24D.依据小概率值α=0.001的独立性检验,认为过量饮酒与患疾病A有关答案ACD解析由已知得4a+3b=400,又b=12a,所以a=10,b=120.任意一人不患疾病A的概率为3b400=0.9,所以任意一人不过量饮酒的概率为a+2b400=5任意一人在不过量饮酒的条件下不患疾病A的概率为2ba+2b=对于D,2×2列联表如下:患疾病A不患疾病A合计过量饮酒30120150不过量饮酒10240250合计40360400则χ2=400×(30×240-120×10)240×360×150×250=803≈26.67,由于26.依据小概率值α=0.001的独立性检验,认为过量饮酒与患疾病A有关,所以D正确.8.(2024·邢台模拟)下列命题为真命题的是()A.若样本数据x1,x2,x3,x4,x5,x6的方差为2,则数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3,2x6-3的方差为5B.一组数据8,9,10,11,12的第80百分位数是11.5C.用决定系数R2比较两个模型的拟合效果时,若R2越大,则相应模型的拟合效果越好D.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=lny,求得经验回归方程为z^=2x+0.4,则c,k的值分别是e0.4和答案BCD解析对于A,若样本数据x1,x2,…,x6的方差为2,则数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3,2x6-3的方差为22×2=8≠5,故A错误;对于B,5×80%=4,则其第80百分位数是11+122=11.5,故B对于C,根据决定系数的含义知R2越大,则相应模型的拟合效果越好,故C正确;对于D,以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=lny,则z=lny=lnc+lnekx=lnc+kx,由题知经验回归方程为z^=2x+0.4,则lnc=0.4,k=2,故c,k的值分别是e0.4和2,故D正确三、填空题(每小题5分,共10分)9.(2024·深圳模拟)已知样本x1,x2,x3的平均数为2,方差为1,则x12,x答案5解析由题意知x1+所以x1+x2+x3=6,由(x1得x12+x22+x3210.(2024·广州模拟)某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=lnWi,yi=lnfi,计算得x=8,y=5,8Σi=1yi2=214.由最小二乘法得经验回归方程为y^=b^x+7.4,则k的值为;为判断拟合效果,通过经验回归方程求得预测值y^i(i=1,2,…,8),若残差平方和答案-0.30.98解析因为f=cWk,两边取对数可得lnf=lnc+klnW,又xi=lnWi,yi=lnfi,依题意经验回归方程y^=b^x+7.4必过点(x所以5=8b^+7.4解得b^=-0.3,所以k=-0.3又R2=1-8Σi=1≈1-0.28214-8×四、解答题(共27分)11.(12分)(2024·开封模拟)某学校有A,B两家餐厅,A餐厅有2种套餐选择,B餐厅有4种套餐选择,且这6种套餐各不相同.A餐厅距离教学楼相比于B餐厅要近很多,经调查发现,100名不同性别的学生选择餐厅用餐的情况如下:男女在A餐厅用餐4020在B餐厅用餐1525(1)求某天甲、乙两名同学选择同一套餐用餐的概率;(6分)(2)依据α=0.005的独立性检验,能否认为性别与选择餐厅之间有关联?(6分)附:χ2=n(α0.050.010.0050.001xα3.8416.6357.87910.828解(1)由表中数据可得,选择A餐厅的概率为60100=35,选择B餐厅的概率为设事件A1为“甲乙去A餐厅用餐”,事件B1为“甲乙去B餐厅用餐”,事件A2为“甲乙选择同一种套餐”,事件A为“甲、乙两名同学选择同一套餐用餐”,P(A1)=352,P(B1)=252,P(A2P(A2|B1)=1则P(A)=P(A1)P(A2|A1)+P(B1)P(A2|B1)=352×12+25故甲、乙两名同学选择同一套餐用餐的概率为1150(2)根据数据可得2×2列联表为男女合计在A餐厅用餐402060在B餐厅用餐152540合计5545100零假设为H0:认为性别与选择餐厅之间无关.根据列联表中的数据,经计算得到χ2=100×(40×25-20×15)255×45×40×60≈8.249>7.879=x0依据小概率值α=0.005的独立性检验,可以推断H0不成立,即性别与选择餐厅之间有关.12.(15分)(2024·柳州模拟)某企业为了对一批新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据(xi,yi)(i=1,2,3,4,5,6),如表所示:试销单价x(百元)123456产品销量y(件)9186p787370参考公式:b^=nΣa^=y-b参考数据:y=166Σi=1yi=80,6Σi=1xiy(1)求p的值;(3分)(2)已知变量x,y具有线性相关关系,求产品销量y(件)关于试销单价x(百元)的经验回归方程y^=b^x+a^(计算结果精确到整数位);((3)y^i表示用正确的经验回归方程得到的与xi对应的产品销量的估计值.当销售数据(xi,yi)的残差的绝对值|y^i-yi|<1时,则将销售数据称为一个“有效数据”.现从这6组销售数据中任取2组,求“有效数据”个数ξ的分布列和期望.解(1)由y=166Σi=1得91+86+p+78+73+70解得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论