2023届高三专题之统计与概率含解析_第1页
2023届高三专题之统计与概率含解析_第2页
2023届高三专题之统计与概率含解析_第3页
2023届高三专题之统计与概率含解析_第4页
2023届高三专题之统计与概率含解析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023届高三专题之统计与概率含解析一、选择题(本大题共20小题,共100.0分)1.2023年5月12日,国家统计局公布了《2023年农民工监测调查报告》,报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.根据以上统计图来判断以下说法错误的是()A.2023年农民工人均月收入的增长率是10%B.2023年农民工人均月收入是2205元C.小明看了统计图后说:“农民工2023年的人均月收入比2023年的少了”D.2023年到2023年这五年中2023年农民工人均月收入最高2.某公司在销售某种环保材料过程中,记录了每日的销售量x(吨)与利润y(万元)的对应数据,下表是其中的几组对应数据,由此表中的数据得到了y关于x的线性回归方程=0.7x+a,若每日销售量达到10吨,则每日利润大约是()x3456y2.5344.5A.7.2万元

B.7.35万元

C.7.45万元

D.7.5万元3.一个学校高一、高二、高三的学生人数之比为2:3:5,若用分层抽样的方法抽取容量为200的样本,则应从高三学生中抽取的人数为()A.40

B.60

C.80

D.1004.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒肉夹谷56粒,则这批米内夹谷约为()A.1365石

B.338石

C.168石

D.134石5.佳佳同学在8次测试中,数学成绩的茎叶图如图,则这8次成绩的中位数是()6.某产品的广告费用x与销售额y的统计数据如表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程,据此模型预报广告费用为6万元时,销售额为()A.72.0万元

B.67.7万元

C.65.5万元

D.63.6万元7.将参加夏令营的600名学生编号为:001,002,…600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到200住在第Ⅰ营区,从201到500住在第Ⅱ营区,从501到600住在第Ⅲ营区,三个营区被抽中的人数依次为()A.16,26,8

B.17,24,9

C.16,25,9

D.17,25,88.若a1,a2,a3,…a20这20个数据的平均数为,方差为0.21,则a1,a2,a3,…a20,这21个数据的方差为()9.一个总体中有600个个体,随机编号为001,002,…,600,利用系统抽样方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为()A.056,080,104

B.054,078,102C.054,079,104

D.056,081,10610.已知某产品的广告费x(单位:万元)与销售额y(单位:万元)具有线性相关关系,其统计数据如下表:X3456Y25304045由上表可得线性回归方程y=x+a,据此模型预报广告费用为8万元时的销售额是()11.已知两组数据x,y的对应值如下表,若已知x,y是线性相关的且线性回归方程为:,经计算知:,则=()x45678y121098612.我国古代数学名著《九章算术》有“米谷粒分”题:发仓募粮,所募粒中秕不百三则收之(不超过3%),现抽样取米一把,取得235粒米中夹秕n粒,若这批米合格,则n不超过()A.6粒

B.7粒

C.8粒

D.9粒13.下表是降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为y=0.7x+0.35,则表中m的值为()x3.54.55.56.5y34m4514.为了解高中生对电视台某节目的态度,在某中学随机调查了110名学生,得到如下列联表:男女总计喜欢402060不喜欢203050总计6050110由算得.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别无关”C.有99%以上的把握认为“喜欢该节目与性别有关”D.有99%以上的把握认为“喜欢该节目与性别无关”15.下列命题错误的是()A.在回归分析模型中,残差平方和越大,说明模型的拟合效果越好B.线性相关系数|r|越大,两个变量的线性相关性越强;反之,线性相关性越弱C.由变量x和y的数据得到其回归直线方程l:=x+a,则l一定经过P(,)D.在回归直线方程=0.1x+1中,当解释变量x每增加一个单位时,预报变量增加0.1个单位.16.高考在即,某学校对2023届高三学生进行考前心理辅导,在高三甲班50名学生中,男生有30人,女生有20人,抽取5人,恰好2男3女,有下列说法:(1)男生抽到的概率比女生抽到的概大;(2)一定不是系统抽样;(3)不是分层抽样;(4)每个学生被抽取的概率相同.以上说法正确的是()A.(1)(2)

B.(2)(3)

C.(3)(4)

D.(2)(4)17.已知某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取20%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为()A.100,8

B.80,20

C.100,20

D.80,818.某班主任对班级90名学生进行了作业量多少的调查,结合数据建立了下列列联表:认为作业多认为作业少总计喜欢玩电脑游戏103545不喜欢玩玩电脑游戏73845总计177390利用独立性检验估计,你认为推断喜欢电脑游戏与认为作业多少有关系错误的概率介于(观测值表如下)()P(K2≥k0)0.500.400.250.15k00.4550.7081.3232.072A.0.15~0.25

B.0.4~0.5

C.0.5~0.6

D.0.75~0.8519.根据如下样本数据x234567y4.12.5-0.50.5-2.0-3.0得到的回归方程为,则()A.

B.

C.

D.20.在下列关于吸烟与患肺癌的2×2列联表中,d的值为()不患肺癌患肺癌总计不吸烟7775427817吸烟d总计98749965A.48

B.49

C.50

D.51二、填空题(本大题共20小题,共100.0分)21.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程和相关系数r,分别得到以下四个结论:①y=2.347x-6.423,且r=-0.9284;②y=-3.476x+5.648,且r=-0.9533;③y=5.437x+8.493,且r=0.9830;④y=-4.326x-4.578,且r=0.8997.其中一定不正确的结论的序号是______.22.某车间需要确定加工零件的加工时间,进行了若干次试验.根据收集到的数据(如表):零件数x(个)1020304050加工时间y(分钟)6268758189由最小二乘法求得回归直线方程,则的值为______.23.总体由编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取4个个体.选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为______7806657208026314294718219800

320492344935362348696938748124.在信息时代的今天,随着的发展,“微信”越来越成为人们交流的一种方式,某机构对“使用微信交流”的态度进行调查,随机抽取了100人,他们年龄的频数分布及对“使用微信交流”赞成的人数如下表:(注:年龄单位:岁)年龄[15,25)[25,35)[35,45)[45,55)[55,65)[65,75)频数1030302055赞成人数825241021(1)若以“年龄45岁为分界点”,由以上统计数据完成下面的2×2列联表,并通过计算判断是否在犯错误的概率不超过0.001的前提下认为“使用微信交流的态度与人的年龄有关”?年龄不低于45岁的人数年龄低于45岁的人数合计赞成不赞成合计(2)若从年龄在[55,65),[65,75)的别调查的人中各随机选取两人进行追踪调查,记选中的4人中赞成“使用微信交流”的人数为X,求随机变量X的分布列及数学期望.参考数据:P(K2≥k0)0.0250.0100.0050.001k03.8416.6357.87910.828参考公式:K2=,其中n=a+b+c+d.25.已知数据x,y的取值如表:x12345y13.2m14.215.416.4从散点图可知,y与x呈线性相关关系,已知第四组数据在回归直线上,则m的取值为______.26.某企业节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如表所示:x3456y2.534a若根据表中数据得出y关于x的线性回归方程为y=0.7x+0.35,则表中a的值为______.27.某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图).已知图中从左到右第一、第六小组的频率分别为0.16,0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生总数为______.28.如图所示是一次歌咏大赛上,七位评委为某选手打出的分数的茎叶图,则中位数是______.29.阅读如图伪代码,当a,b的输入值分别为2,3时,则输出的实数m的值是______.30.已知甲、乙、丙3类产品共1200件,且甲、乙、丙三类产品的数量之比为3:4:5,现采用分层抽样的方法抽取60件,则乙类产品抽取的件数是______.31.随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100),若该校的学生总人数为3000,则成绩不超过60分的学生人数大约为______.32.根据如图所示的等高条形图回答,吸烟与患肺病______关系.(“有”或“没有”)33.设样本数据x1,x2,…,x2023标准差为4,若yi=2xi-1(i=1,2,3,…,2023),则数据y1,y2,…,y2023的标准差为______.34.下表是某地银行连续五年的储蓄存款(年底余额),假设储蓄存款y关于年份x的线性回归方程为

,则=______.(,其中1×5+2×6+3×7+4×8+5×10=120,12+22+32+42+52=55)年份x12345储蓄存款y(千亿元)56781035.某班级共有学生54人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本.已知3号,29号,42号同学在样本中,那么样本中还有一个同学的学号是______.36.某设备的使用年限x与所支出的维修费用y的统计数据如表:使用年限x(单位:年)23456维修费用y(单位:万元)1.54.55.56.57.0根据表可得回归直线方程为=1.3x+,据此模型预测,若使用年限为14年,估计维修费用约为______万元.37.用线性回归模型求得甲、乙、丙3组不同的数据对应的R2的值分别为0.81,0.98,0.63,其中______(填甲、乙、丙中的一个)组数据的线性回归的效果最好.38.如图是甲、乙两名篮球运动员在五场比赛中所得分数的茎叶图,则在这五场比赛中得分较为稳定(方差较小)的那名运动员的得分的方差为______.39.某学员在一次射击测试中射靶9次,命中环数如下:8,7,9,5,4,9,10,7,4;则命中环数的方差为______.40.某中学高一(8)班共有学生56人,编号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知6,20,48号的同学已在样本中,那么还有一个同学的编号是______.三、解答题(本大题共20小题,共240.0分)41.某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.表1停车距离d(米)(10,20](20,30](30,40](40,50](50,60]频数26ab82表2平均每毫升血液酒精含量x毫克1030507090平均停车距离y米3050607090已知表1数据的中位数估计值为26,回答以下问题.(Ⅰ)求a,b的值,并估计驾驶员无酒状态下停车距离的平均数;(Ⅱ)根据最小二乘法,由表2的数据计算y关于x的回归方程;(Ⅲ)该测试团队认为:驾驶员酒后驾车的平均“停车距离”y大于(Ⅰ)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(Ⅱ)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?(附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线的斜率和截距的最小二乘估计分别为,.)42.某厂商推出一款6吋大屏,现对500名该使用者(200名女性,300名男性)进行调查,对进行打分,打分的频数分布表如表:女性用户:分值区间[50,60)[60,70)[70,80)[80,90)[90,100]频数2040805010男性用户分值区间[50,60)[60,70)[70,80)[80,90)[90,100]频数4575906030(Ⅰ)完成下列频率分布直方图,并比较女性用户和男性用户评分的波动大小(不要求计算具体值,给出结论即可);(Ⅱ)根据评分的不同,运用分层抽样从男性用户中抽取20名用户,再从这20名用户中满足评分不低于80分的用户中任意抽取2名用户,求2名用户评分都小于90分的概率.43.某学校为了解本校学生的身体素质情况,决定在全校的1000名男生和800名女生中按分层抽样的方法抽取45名学生对他们课余参加体育锻炼时间进行问卷调查,将学生课余参加体育锻炼时间的情况分三类:A类(课余参加体育锻炼且平均每周参加体育锻炼的时间超过3小时),B类(课余参加体育锻炼但平均每周参加体育锻炼的时间不超过3小时),C类(课余不参加体育锻炼),调查结果如表:A类B类C类男生18x3女生108y(1)求出表中x、y的值;(2)根据表格统计数据,完成下面的列联表,并判断是否有90%的把握认为课余参加体育锻炼且平均每周参加体育锻炼的时间超过3小时与性别有关;男生女生总计A类B类和C类总计(3)在抽取的样本中,从课余不参加体育锻炼学生中随机选取三人进一步了解情况,求选取三人中男女都有且男生比女生多的概率.附:K2=P(K2≥k0)0.100.050.01k02.7063.8416.63544.前不久,我市各街头开始出现“高庶葫芦岛”共享单车,满足了市民的出行需要和节能环保的要求,解决了最后一公里的出行难题,市运营中心为了对共享单车进行更好的监管,随机抽取了20位市民对共享单车的情况进行了问卷调查,并根据其满足度评分值制作了茎叶图如下:(1)分别计算男性打分的中位数和女性打分的平均数;(2)从打分在80分以下(不含80分)的市民中抽取3人,求有女性被抽中的概率.45.西部大开发给中国西部带来了绿色,人与环境日期和谐,群众生活条件和各项基础设施得到了极大的改善.西部地区2023年至2023年农村居民家庭人均纯收入y(单位:千元)的数据如表:年份2023202320232023202320232023年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于x的线性回归方程;(2)利用(1)中的回归方程,分析2023年至2023年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2023年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:=,=-(其中,为样本平均值).46.某单位委托一家网络调查公司对单位1000名职员进行了QQ运动数据调查,绘制了日均行走步数(千步)的频率分布直方图,如图所示(每个分组包括左端点,不包括右端点,如第一组表示运动量在[4,6)之间(单位:千步)).(1)求单位职员日均行走步数在[6,8)的人数.(2)根据频率分布直方图算出样本数据的中位数;(3)若将频率视为概率,从本单位随机抽取3位职员(看作有放回的抽样),求日均行走步数在[10,14)的职员数X的分布列和数学期望.47.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”,为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研,人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄[15,25)[25,35)[35,45)[45,55)[55,65]支持“延迟退休”的人数155152817(1)由以上统计数据填2×2列联表,并判断是否95%的把握认为以45岁为界点的不同人群对“延迟退休年龄政策”的支持有差异;45岁以下45岁以上总计支持不支持总计(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动,现从这8人中随机抽2人.①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率;②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828.48.某园林基地培育了一种新观赏植物,经过了一年的生长发育,技术人员从中抽取了部分植株的高度(单位:厘米)作为样本(样本容量为n)进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]分组做出频率分布直方图,并作出样本高度的茎叶图(图中仅列出了高度在[50,60),[90,100]的数据).(1)求样本容量n和频率分布直方图中的x,y(2)在选取的样本中,从高度在80厘米以上(含80厘米)的植株中随机抽取3株,设随机变量X表示所抽取的3株高度在[80,90)内的株数,求随机变量X的分布列及数学期望.49.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)试判断能否有97.5%的把握认为“休闲方式与性别有关”参考公式:1.独立性检验临界值P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.8282.(

其中n=a+b+c+d)50.节能减排以来,兰州市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)估计用电量落在[220,300)中的概率是多少?51.静宁县是甘肃苹果栽培第一大县,中国著名优质苹果基地和重要苹果出口基地.静宁县海拔高、光照充足、昼夜温差大、环境无污染,适合种植苹果.“静宁苹果”以色泽鲜艳、质细汁多,酸甜适度,口感脆甜、货架期长、极耐储藏和长途运输而著名.为检测一批静宁苹果,随机抽取50个,其重量(单位:克)的频数分布表如下:分组(重量)[80,85)[85,90)[90,95)[95,100)频数(个)5102015(1)根据频数分布表计算苹果的重量在[90,95)的频率;(2)用分层抽样的方法从重量在[80,85)和[95,100)的苹果中共抽取4个,其中重量在[80,85)的有几个?(3)在(2)中抽出的4个苹果中,任取2个,求重量在[80,85)和[95,100)中各有1个的概率.52.随着移动互联网的快速发展,基于互联网的共享单车应运而生.某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司最近六个月内的市场占有率进行了统计,并绘制了相应的折线图.(Ⅰ)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系.求y关于x的线性回归方程,并预测M公司2023年4月份的市场占有率;(Ⅱ)为进一步扩大市场,公司拟再采购一批单车.现有采购成本分别为1000元/辆和1200元/辆的A、B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致车辆报废年限各不相同.考虑到公司运营的经济效益,该公司决定先对两款车型的单车各100辆进行科学模拟测试,得到两款单车使用寿命频数表如下:

报废年限

车型1年2年3年4年总计A20353510100B10304020100经测算,平均每辆单车每年可以带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且以频率作为每辆单车使用寿命的概率.如果你是M公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?参考数据:,,=17.5.参考公式:回归直线方程为其中=,=-.53.如表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据x3456y2.5344.5(=,=-)(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;(2)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?54.2023年1月1日,我国实施“全面二孩”政策,中国社会科学院在某地随机抽取了150名已婚男性,其中愿意生育二孩的有100名,经统计,该100名男性的年龄情况对应的频率分布直方图如下:(1)根据频率分布直方图,估计这100名已婚男性的年龄平均值、众数、中位数和样本方差s2(同组数据用区间的中点值代替,结果精确到个位);(2)若在愿意生育二孩的且年龄在[30,34),[34,38),[38,42)的三组已婚男性中,用分层抽样的方法抽取19人,试估算每个年龄段应各抽取多少人?55.在对人们的休闲方式的一次调查中,共调查

了100人,其中女性55人,男性45人.女性中有40人主要的休闲方式是看电视,另外15人主要的休闲方式是运动;男性中有20人主要休闲方式是看电视,另外25人主要休闲方式是运动.(1)根据以上数据建立一个2×2的列联表.(2)是否有99%的把握认为性别与休闲方式有关系?p(k2≥k0)0.0500.0100.001k03.8416.63510.82856.某市对创“市级示范性学校”的甲、乙两所学校进行复查验收,对办学的社会满意度一项评价随机访问了20位市民,这20位市民对这两所学校的评分(评分越高表明市民的评价越好)的数据如下:甲校:58,66,71,58,67,72,82,92,83,86,67,59,86,72,78,59,68,69,73,81;乙校:90,80,73,65,67,69,81,85,82,88,89,86,86,78,98,95,96,91,76,69,.检查组将成绩分成了四个等级:成绩在区间[85,100]的为A等,在区间[70,85)的为B等,在区间[60,70)的为C等,在区间[0,60)为D等.(1)请用茎叶图表示上面的数据,并通过观察茎叶图,对两所学校办学的社会满意度进行比较,写出两个统计结论;(2)根据所给数据,以事件发生的频率作为相应事件发生的概率,求乙校得分的等级高于甲校得分的等级的概率.57.某校举行高二理科学生的数学与物理竞赛,并从中抽取72名学生进行成绩分析,所得学生的及格情况统计如表:物理及格物理不及格合计数学及格28836数学不及格162036合计442872(1)根据表中数据,判断是否是99%的把握认为“数学及格与物理及格有关”;(2)若以抽取样本的频率为概率,现在该校高二理科学生中,从数学及格的学生中随机抽取3人,记X为这3人中物理不及格的人数,从数学不及格学生中随机抽取2人,记Y为这2人中物理不及格的人数,记ξ=|X-Y|,求ξ的分布列及数学期望.附:x2=.P(X2≥k)0.1500.1000.0500.010k2.0722.7063.8416.63558.某班级数学兴趣小组为了研究人的脚的大小与身高的关系,随机抽测了20位同学,得到如下数据:序号12345678910身高x(厘米)192164172177176159171166182166脚长y(码)48384043443740394639序号11121314151617181920身高x(厘米)169178167174168179165170162170脚长y(码)43414043404438423941(Ⅰ)请根据“序号为5的倍数”的几组数据,求出y关于x的线性回归方程(Ⅱ)若“身高大于175厘米”为“高个”,“身高小于等于175厘米”的为“非高个”;“脚长大于42码”为“大码”,“脚长小于等于42码”的为“非大码”.请根据上表数据完成2×2列联表:并根据列联表中数据说明能有多大的可靠性认为脚的大小与身高之间有关系?(Ⅲ)若按下面的方法从这20人中抽取1人来核查测量数据的误差:将一个标有1,2,3,4,5,6的正六面体骰子连续投掷两次,记朝上的两个数字的乘积为被抽取人的序号,求:抽到“无效序号(超过20号)”的概率.附表及公式:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828K2=.59.网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如下的频数直方图.这10名市民中,年龄不超过40岁的有65人.将所抽样中周平均网购次数不小于4次的市民称为网购迷,且已知其中有5名市民的年龄超过40岁.(1)根据已知条件完成下面的2×2列联表,能否在犯错的概率不超过0.10的前提条件下认为网购迷与年龄不超过40岁有关?(2)现将所抽取样本中周平均网购次数不小于5次的市民称为超级网购迷,且已知超级网购迷中有2名年龄超过40岁,若从超级网购迷中任意挑选2名,求至少有1名市民年龄超过40岁的概率.附:K2=;网购迷非网购迷合计年龄不超过40岁年龄超过40岁合计60.根据微信同程旅游的调查统计显示,参与网上购票的1000位购票者的年龄(单位:岁)情况如图所示.(1)已知中间三个年龄段的网上购票人数成等差数列,求a,b的值;(2)为鼓励大家网上购票,该平台常采用购票就发放酒店入住代金券的方法进行促销,具体做法如下:年龄在[30,50)岁的每人发放20元,其余年龄段的每人发放50元,先按发放代金券的金额采用分层抽样的方式从参与调查的1000位网上购票者中抽取5人,并在这5人中随机抽取3人进行回访调查,求此3人获得代金券的金额总和为90元的概率.【答案】1.C

2.B

3.D

4.B

5.A

6.C

7.D

8.B

9.D

10.A

11.D

12.B

13.B

14.C

15.A

16.C

17.A

18.B

19.B

20.B

21.①④22.54.923.2924.解:(1)根据频数分布,填写2×2列联表如下;年龄不低于45岁的人数年龄低于45岁的人数合计赞成135770不赞成171330合计3070100计算观测值K2==≈14.512>10.828,对照临界值表知,在犯错误的概率不超过0.001的前提下认为“使用微信交流的态度与人的年龄有关”;(2)根据题意,X所有可能取值有0,1,2,3,P(X=0)=•=,P(X=1)=•+•=,P(X=2)=•+•=,P(X=3)=•=,所以X的分布列是X0123P所以X的期望值是EX=0×+1×+2×+3×=.25.13.826.4.527.40028.8629.330.2031.90032.有33.834.1.235.1636.1837.乙38.39.40.3441.解:(Ⅰ)依题意,得,解得a=40,(1分)又a+b+36=100,解得b=24;(2分)故停车距离的平均数为.(4分)(Ⅱ)依题意,可知,(5分)=,,所以回归直线为.(8分)(Ⅲ)由(I)知当y>81时认定驾驶员是“醉驾”.(9分)令,得0.7x+25>81,解得x>80,(11分)当每毫升血液酒精含量大于80毫克时认定为“醉驾”.(12分)42.解:(Ⅰ)对于女性用户,各小组的频率分别为:0.1,0.2,0.4,0.25,0.05,其相对应的小长方形的高为0.01,0.02,0.04,0.025,0.005,对于男性用户,各小组的频率分别为:0.15,0.25,0.30,0.20,0.10,其相对应的小长方形的高为0.015,0.025,0.03,0.02,0.01,直方图如图所示:,由直方图可以看出女性用户比男性用户评分的波动大.(Ⅱ)运用分层抽样从男性用户中抽取20名用户,评分不低于80分有6人,其中评分小于90分的人数为4,从6人人任取2人,则[80,90)分数段抽取4人,分别记为A,B,C,D,[90,100]分数段抽取1人,记为E,M.

则基本事件空间包含的基本事件有:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),(A,M),(B,M),(C,M),(D,M),(E,M)共15种.2名用户评分都小于90分的基本事件有:(A,B),(A,C),(A,D),(B,C),(B,D),(C,D)共6种.故2名用户评分都小于90分的概率P==43.解:(1)由题意,,21+x+18+y=45,∴x=4,y=2;(2)列联表

男生女生

总计

A类18

10

28

B类和C类

7

10

17

总计

25

2045

∴K2=≈2.288

2.706,∴有90%的把握认为课余参加体育锻炼且平均每周参加体育锻炼的时间超过3小时与性别有关;(3)在抽取的样本中,从课余不参加体育锻炼学生中随机选取三人进一步了解情况,有=10种情况,选取三人中男女都有且男生比女生多,有=6种情况,故所求概率为=0.6.44.解:(1)由茎叶图可知,男性打分的中位数为:=81分.女性打分的平均数为:=86.8分.(2)由茎叶图可知:80分以下的市民共有6人,其中男性4人,记作A,B,C,D,女性2人,记作a,b,从6人中抽取3人所构成的基本事件空间为:{ABC,ABD,ABa,ABb,ACD,ACa,ACb,ADa,ADb,Aab,BCD,BCa,BCb,BDa,BDb,Bab,CDa,CDb,Cab,Dab},共20个基本事件,其中“有女性被抽中“包含的基本事件有:{ABa,ABb,ACa,ACb,ADa,ADb,Aab,BCa,BCb,BDa,BDb,Bab,CDa,CDb,Cab,Dab},共16个基本事件,所以从打分在80分以下(不含80分)的市民中抽取3人,有女性被抽中的概率为p==.45.解:(1)由题意,计算=×(1+2+3+4+5+6+7)=4,=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3;所以回归系数为===0.5,=-=4.3-0.5×4=2.3,所以y关于x的线性回归方程为=0.5x+2.3;(2)由(1)中的线性回归方程=0.5x+2.3知,斜率k=0.5>0,所以2023年至2023年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元,当x=9时,=0.5×9+2.3=6.8,即预测该地区2023年农村居民家庭人均纯收入为6.8千元.46.解:(1)依题意及频率分布直方图知,单位职员日均行走步数在[6,8)的频率为0.100×2=0.2,则日均行走少数在[6,8)的人数为0.2×1000=200人.(2)根据频率分布直方图知,中位数在[8,10)内,设中位数为x,则0.05×2+0.1×2+0.125×(x-8)=0.5,解得x=9.6,∴样本数据的中位数为9.6.(3)单位职员日均行走步数在[10,14)的频率为(0.125+0.075)×2=0.4,由题意知X~B(3,0.4),P(X=0)=0.63=0.216,P(X=1)=,P(X=2)=,P(X=3)==0.064,∴X的分布列为:

X

0

1

2

3

P

0.216

0.432

0.288

0.064∴E(X)=0×0.216+1×0.432+2×0.288+3×0.064=1.2.47.解:(1)由统计数据填2×2列联表如下,45岁以下45岁以上总计支持354580不支持15520总计5050100计算观测值,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休政策”的支持度有差异;(2)①抽到1人是45岁以下的概率,抽到1人是45岁以上的概率是,故所求的概率是P=×=;②根据题意,X的可能取值是0,1,2;计算P(X=0)==,P(X=1)==,P(X=2)==,可得随机变量X的分布列为X012P故数学期望为E(X)=0×+1×+2×=.48.解:(1)由题意可知,样本容量,x=0.100-0.004-0.010-0.016-0.040=0.030.(4分)(2)由题意可知,高度在[80,90)内的株数为5,高度在[90,100]内的株数为2,共7株.抽取的3株中高度在[80,90)内的株数X的可能取值为1,2,3,(5分)则P(X=1)==,,,(8分)∴X的分布列为:X123P(10分)故E(X)==.(12分)49.解:(1)根据题中数据,填写2×2列联表如下;看电视运动总计女性432770男性213354总计6460124(2)计算=≈6.201>5.024,所以有97.5%的把握认为“休闲方式与性别有关”.50.解:(1)依题意,20×(0.002+0.009

5+0.011+0.012

5+x+0.005+0.002

5)=1,解得x=0.007

5.(2)由图可知,最高矩形的数据组为[220,240),∴众数为=230.∵[160,220)的频率之和为(0.002+0.009

5+0.011)×20=0.45,∴依题意,设中位数为y,∴0.45+(y-220)×0.012

5=0.5.解得y=224,∴中位数为224.(3)月平均用电量在[220,330)中的概率是p=1-(0.002+0.0095+0.011)×20=0.55.51.解:(1)苹果的重量在[90,95)的频率为=0.4.(2)重量在[80,85)的有=1个.(3)设这4个苹果中,重量在[80,85)段的有1个,编号为1.重量在[95,100)段的有3个,编号分别为2、3、4,从中任取两个,可能的情况有:(1,2)(1,3)(1,4)(2,3)(2,4)(3,4)共6种.设任取2个,重量在[80,85)和[95,100)中各有1个的事件为A,则事件A包含有(1,2)(1,3)(1,4)共3种,所以P(A)==.52.解:(Ⅰ)由题意,=3.5,=16,==2,=-•=16-2×3.5=9,∴=2x+9,x=7时,=2×7+9=23,即预测M公司2023年4月份(即x=7时)的市场占有率为23%;(Ⅱ)由频率估计概率,每辆A款车可使用1年,2年,3年、4年的概率分别为0.2,0.35,0.35,0.1,∴每辆A款车的利润数学期望为(500-1000)×0.2+(1000-1000)×0.35+(1500-1000)×0.35+(2000-1000)×0.1=175元;每辆B款车可使用1年,2年,3年、4年的概率分别为0.1,0.3,0.4,0.2,∴每辆B款车的利润数学期望为(500-1200)×0.1+(1000-1200)×0.3+(1500-1200)×0.4+(2000-1200)×0.2=150元;∵175>150,∴应该采购A款车.53.解:(1)由对照数据,计算=×(3+4+5+6)=4.5,=×(2.5+3+4+4.5)=3.5;且xi2=86,xiyi=66.5,∴回归方程的系数为==0.7,∴=-=3.5-0.7×4.5=0.35,∴所求线性回归方程为=0.7x+0.35;(2)由(1)求出的线性回归方程,计算x=100时=0.7×100+0.35=70.35,∴90-70.35=19.65(吨),预测生产100吨甲产品的生产能耗比技术改造前降低了19.65吨标准煤.54.(本题满分为12分)解:(1)位已婚男性的年龄平均值和样本方差s2分别为:=24×0.04+28×0.08+32×0.16+36×0.44+40×0.16+44×0.1+48×0.02=35.92≈36,…3分s2=(-12)2×0.04+(-8)2+0.08+(-4)2×0.16+02×0.44+42×0.16+82×0.1+122×0.02=25.28≈25,…6分可得:众数为36.…7分;中位数为(0.5-0.04-0.08-0.16)÷0.11+34=36,…9分(2)在年龄段[30,34),[34,38),[38,42)的频率分别为0.04×4=0.16,0.11×4=0.44,0.04×4=0.16,0.16:0.44:0.16=4:11:4,所以人数分别为4人,11人,4人…12分55.解:(1)由所给的数据得到列联表,休闲方式

性别看电视

运动

合计女

43

2770

21

3354

合计

64

60124(2)假设“休闲方式与性别无关”,计算K2的观测值为≈6.201<6.635;∵P(K2<6.635)=0.01,∴没有99%的把握认为性别与休闲方式有关系.56.解:(1)作出茎叶图,如下:由茎叶图得:①甲校得分的中位数为71.5,众数为58,59,67,72,86,乙校得分的中位数为83.5,众数为69和86,甲校得分的中位数小于乙校得分的中位数,甲校得分的众数大多数不大于乙校得分的众数;②甲校得分的平均数小于乙校得分的平均数;③甲校得分有居于内,而乙校得分全部居于内,对乙校的评分要高于甲校;④甲校得分的方差大于乙校的方差,说明对乙校的评分较集中,满意度较高,对甲校的评分较分散,满意度较低.(2)记事件A为:乙校A等,甲校B等或C等或D等;事件B为:乙校B等,甲校C等或D等;事件C为:乙校C等,甲校D等三种情况,则事件“乙校得分的等级高于甲校得分的等级”为A∪B∪C,又因为事件A,B,C两两互斥,故,即乙校得分的等级高于甲校得分的等级的概率为0.6.57.解:(1)根据题意,得:=≈12.587,∵12.587>6.635,∴有99%的把握认为“数学及格与物理及格有关”.(2)从数学及格的学生任抽取一人,抽到物理不及格的学生的频率为=,从数学不及格的学生任取一人,抽到物理不及格的学生的频率为=,X可能的取值为0,1,2,3,Y可能的取值为0,1,2,ξ的可能取值为0,1,2,3,P(ξ=0)=P(X=0)P(Y=0)+P(X=1)P(Y=1)+P(X=2)P(Y=2)=•++=,P(ξ=1)=P(X=0)P(Y=1)+P(X=1)P(Y=0)+P(X=1)P(Y=2)+P(X=2)P(Y=1)+P(X=3)P(Y=2)=++•++=,P(ξ=2)=P(X=0)P(Y=2)+P(X=2)P(Y=0)+P(X=3)P(Y=1)=++=,P(ξ=3)=P(X=3)P(Y=0)==,∴ξ的分布列为:

ξ

0

1

2

3

P

Eξ=+3×=.58.解:(Ⅰ)“序号为5的倍数”的几组数据:x1=176,x2=166,x3=168,x4=170,y1=44,y2=39,y3=40,y4=41,则,所以,从而y关于x的线性回归方程是.

…(6分)(Ⅱ)2×2列联表:高

个非高个合计大脚527非大脚11213合计61420,有99.5%的把握认为:人的脚的大小与身高之间有关系.…(10分)(Ⅲ).

…(12分)59.解:(1)根据已知条件完成2×2列联表,如下;网购迷非网购迷合计年龄不超过40岁204565年龄超过40岁53035合计2575100计算K2=≈3.297,因为3.297>2.706,所以据此列联表判断,在犯错误的概率不超过0.10的前提下,认为网购迷与年龄不超过40岁有关;(2)由频率分布直方图知,超级网购迷共有7人,记其中年龄超过40岁的2名市民为A、B,其余5名市民记为c、d、e、f、g,现从7人中任取2人,基本事件是AB、Ac、Ad、Ae、Af、Ag、Bc、Bd、Be、Bf、Bg、cd、ce、cf、cg、de、df、dg、ef、eg、fg共有21种,其中至少有1名市民年龄超过40岁的基本事件是AB、Ac、Ad、Ae、Af、Ag、Bc、Bd、Be、Bf、Bg共11种,故所求的概率为P=.60.解:(1)由题意可得,解得a=0.035,b=0.025;(2)利用分层抽样从样本中抽取5人,其中年龄在[30,50)为3人,其余年龄段的为2人;随机抽取3人,有=10种,此3人获得代金券的金额总和为90元,则需要2个20元和1个50元,有•=6种,所以此3人获得代金券的金额总和为90元的概率为P==0.6.【解析】1.解:A:由折现统计图可得出:2023年农民工人均月收入的增长率是:10%;故正确,B:由条形统计图可得出:2023年农民工人均月收入是:2205元;故正确C:∵2023年农民工人均月收入是:2205×(1+20%)=2646(元)>2205元,∴农民工2023年的人均月收入比2023年的少了,是错误的.故错误,D:由条形统计图可得出,2023年到2023年这五年中2023年农民工人均月收入最高,故选:C由直接利用折线统计图得出答案即可判断A;直接利用条形统计图得出答案即可判断B,D利用2023年农民工人均月收入增长率进而求出2023年的月平均收入,进而得出答案判断C.此题主要考查了条形统计图以及折线统计图的应用,利用图形获取正确信息是解题关键.2.解:由题意可知:=4.5,=3.5因为回归直线经过样本中心,所以3.5=0.7×4.5+a,解得a=0.35.∴=0.7x+0.35,x=10吨时,=7.35万元,故选:B.求出样本中心坐标,代入回归直线方程,求解即可.本题考查回归直线方程的应用,回归直线经过样本中心是解题的关键.3.解:∵高一、高二、高三的学生人数之比为2:3:5,∴若用分层抽样的方法抽取容量为200的样本,则应从高三学生中抽取的人数为==100,故选:D根据分层抽样的定义建立比例关系进行求解即可.本题主要考查分层抽样的应用,根据条件建立比例关系是解决本题的关键.比较基础.4.解:设这批米内夹谷约为x石,由题意得=,解得x≈338.∴这批米内夹谷约为338石.故选:B.设这批米内夹谷约为x石,由题意列出方程,由此能求出这批米内夹谷的数量.本题考查概率的应用,是基础题,解题时要认真审题,注意概率意义的合理运用.5.解:由茎叶图得到8个数的大小顺序依次是78,79,83,85,87,88,89,96,中间的两个数为85,87,所以中位数为;故选A.根据中位数的定义,8个数则是中间两个数的平均数.本题考查了中位数;明确中位数的定义是解答关键.6.解:∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5,故选:C把自变量为6代入线性回归方程是y=9.4x+9.1,预报出结果.本题考查了线性回归方程,属于基础题.7.解:依题意可知,在随机抽样中,首次抽到003号,以后每隔12个号抽到一个人,则分别是003、015、027、039构成以3为首项,12为公差的等差数列,故可分别求出在001到200中有17人,在201至500号中共有25人,则501到600中有8人.故选:D.依题意可知,在随机抽样中,首次抽到003号,以后每隔12个号抽到一个人,则构成以3为首项,12为公差的等差数列,从而得出三个营区被抽中的人数.本题考查系统抽样方法,本题解题的关键是看出每一个组里的人数,属于基础题.8.解:a1,a2,a3,…a20这20个数据的平均数为,方差为0.21,∴s2=×[+++…+]=0.21∴+++…+=4.2∴则a1,a2,a3,…a20,这21个数据的,方差为s′2=×[+++…++]=×4.2=0.20.故选:B.根据平均数与方差的概念,计算即可得出答案.本题考查了平均数与方差的概念与应用问题,是基础题.9.解:依题意可知,在随机抽样中,首次抽到006号,以后每隔=25个号抽到一个人,则以6为首项,25为公差的等差数列,即所抽取的编号为6,31,56,81,106,故选:D.根据系统抽样的方法的要求,先随机抽取第一数,再确定间隔.本题主要考查系统抽样方法的应用,解题时要认真审题,是基础题.10.解:由表中数据可得,=×(3+4+5+6)=4.5,=×(25+30+40+45)=35,回归系数===7,=-=35-7×4.5=3.5,∴线性回归方程为=7x+3.5,∴当x=8时,=7×8+3.5=59.5(万元).故选:A.计算、,求出回归系数、,写出线性回归方程,利用回归方程计算x=8时的值.本题考查了回归直线方程的求法与应用问题,是基础题.11.解:=,线性回归方程为:,必经过点(),即9=-1.4×6+,则=17.4故选:D求出、,线性回归方程为:,必经过点(),即得.本题考查了线性回归方程的性质,属于基础题.12.解:由题意得,≤3%,解得n≤7.05,所以若这批米合格,则n不超过7粒.故选:B.由题意列出不等式≤3%,求出n的值即可.本题考查了我国古代数学抽样方法的应用问题,是基础题.13.解:由题意得:=(3.5+4.5+5.5+6.5)=5,=(3+4m+4+5)=3+m,将(5,3+m)代入y=0.7x+0.35,得:3+m=3.5+0.35,解得:m=0.85,故选:B.根据已知表中数据,可计算出数据中心点(,)的坐标,根据数据中心点一定在回归直线上,将(,)的坐标代入回归直线方程y=0.7x+0.35,解方程可得t的值.本题考查的知识点是线性回归方程,其中数据中心点(,)一定在回归直线上是解答本题的关键.14.解:根据题意,计算>6.635,对照列联表知,在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”,即有99%以上的把握认为“喜欢该节目与性别有关”.故选:C.根据观测值,对照临界值即可得出正确的结论.本题考查了独立性检验的应用问题,是基础题.15.解:比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好,故A错误;线性相关系数|r|越大,两个变量的线性相关性越强;反之,线性相关性越弱,正确;回归直线方程l:=x+a,则l一定经过P(,),正确;在回归直线方程=0.1x+1中,当解释变量x每增加一个单位时,预报变量增加0.1个单位,正确.故选A.对4个选项分别进行判断,即可得出结论.本题考查了“残差”的意义、相关指数的意义,考查了回归方程,考查了理解能力和推理能力,属于中档题.16.解:总体中共有30+20=50名学生,抽取5人,每个学生被抽取的可能性相等,为=0.1;所以(1)“男生抽到的概率比女生抽到的概大”是错误的;(2)“一定不是系统抽样”是错误的;(3)“不是按男女生分层抽样”是正确的;(4)“每个学生被抽取的概率相同”是正确的.综上,正确的说法是(3)(4).故选:C.根据总体中的结构特征,结合抽样结果,对题目中的说法进行分析、判断即可.本题考查了抽样方法的应用问题,是基础题目.17.解:样本容量为:(150+250+100)×20%=100,∴抽取的户主对四居室满意的人数为:100×.故选:A.利用统计图结合分层抽样性质能求出样本容量,利用条形图能求出抽取的户主对四居室满意的人数.本题考查样本容量和抽取的户主对四居室满意的人数的求法,是基础题,解题时要认真审题,注意统计图的性质的合理运用.18.解:根据表中数据,计算观测值:K2=≈0.6527,对照临界值表知,0.455<0.6527<0.708,利用独立性检验估计,认为推断喜欢电脑游戏与认为作业多少有关系错误的概率介于0.40~0.50.故选:B.根据表中数据计算观测值K2,对照临界值表,即可得出正确的结论.本题考查了独立性检验的应用问题,是基础题.19.解:由题意可知x,y是负相关,可知<0,>0.故选:B.利用回归直线方程与x,y的关系,判断选项即可.本题考查回归直线方程的判断与应用,是基础题.20.解:在2×2列联表中,总计患肺癌的人数为9965-9874=91,则吸烟且患肺癌的人数是d=91-42=49.故选:B.根据列联表中各数据的关系,求出总计患肺癌的人数,再计算吸烟且患肺癌的人数.本题考查了2×2列联表的应用问题,是基础题.21.解:对于①,y=2.347x-6.423,且r=-0.9284;由线性回归方程知,此两变量的关系是正相关,r>0,∴①错误;对于②,y=-3.476x+5.648,且r=-0.9533;线性回归方程符合负相关的特征,r<0,∴②正确;对于③,y=5.437x+8.493,且r=0.9830;线性回归方程符合正相关的特征,r>0,∴③正确;对于④,y=-4.326x-4.578,且r=0.8997,线性回归方程符合负相关的特征,r<0,④正确.综上,①④错误.故答案为:①④.根据回归方程的一次项系数的正负与正相关或负相关的对应关系,作出判断即可.本题考查了线性回归方程与正相关还是负相关的判断问题,是基础题.22.解:计算=×(10+20+30+40+50)=30,=×(62+68+75+81+89)=75,回归直线方程过样本中心点(,),∴=-0.67=75-0.67×30=54.9.故答案为:54.9.计算、,根据回归直线方程过样本中心点(,),求出的值.本题考查了回归直线方程过样本中心点的应用问题,是基础题.23.解:按照随机数表的读法,所得样本编号依次为08,02,14,29.可知第4个个体的编号为29.故答案为:29.根据随机数表,依次进行选择即可得到结论.本题主要考查简单随机抽样的应用,正确理解随机数法是解决本题的关键,比较基础.24.(1)根据频数分布,填写2×2列联表,计算观测值K2,对照临界值得出结论;(2)根据题意知X所有可能取值,计算对应的概率值,写出X的分布列,计算期望值.本题考查了独立性检验与离散型随机变量的分布列和期望的问题,是综合题.25.解:第四组数据在回归直线上,可得15.4=0.8×4+,∴=12.2∵=3,=,∴代入得=2.4+12.2,解得:m=13.8,故答案为13.8.第四组数据在回归直线上,可得15.4=0.8×4+,求出=12.2,求出横标和纵标的平均数,写出样本中心点,把样本中心点代入求出m的值.本题考查数据的回归直线方程,利用回归直线方程恒过样本中心点是关键.26.解:由题意可知:产量x的平均值为=(3+4+5+6)=4.5,由线性回归方程为=0.7x+0.35,过样本中心点(,),则=0.7+0.35=0.7×4.5+0.35=3.5,解得:=3.5,由=(2.5+3+4+a)=3.5,解得:a=4.5,表中a的值为4.5,故答案为:4.5.由线性回归方程必过样本中心点(,),则=3.5,得到关于a的方程,解出即可.本题考查线性回归方程的应用,考查线性回归方程必过样本中心点(,),考查计算能力,属于基础题.27.解:设第三小组的频率为x,等比数列的公比为q,等差数列的公差为d则得q=1.25,x=0.25,因为第三小组的人数为100,所以该校高三年级的男生总数为=400人.故答案为:400.利用等差数列的通项公式及等比数列的通项公式,所有的频率和为1,列出方程组,求出第三小组的频率,利用频数除以频率等于样本容量,求出该校高三年级的男生总数.本题考查频率分布直方图.在频率分布直方图中纵坐标为;图中所有的频率和为1.28.解:由茎叶图可知,中位数为七个数据按从小到大的顺序排列,中间的一个数为86,即中位数是86.故答案为:86.根据茎叶图中的数据,结合中位数的定义即可得出结果.本题主要考查了茎叶图与中位数的应用问题,是基础题目.29.解:根据程序语言的功能是输出a,b中两个数中较大的数,∴输入数值分别为2,3时,则输出的实数m=3.故答案为:3.根据程序语言的功能,判断输入的数值分别为2,3时,输出的实数m值.本题考查了算法语言的语言问题,是基础题.30.解:∵甲、乙、丙三类产品,其数量之比为3:4:5,∴从中抽取120件产品进行质量检测,则乙类产品应抽取的件数为60×=20,故答案为:20.根据甲乙丙的数量之比,利用分层抽样的定义即可得到结论.本题主要考查分层抽样的定义和应用,比较基础.31.解:由频率分布直方图得成绩不超过60分的学生的频率为:(0.005+0.01)×20=0.3,∴成绩不超过60分的学生人数大约为:3000×0.3=900.故答案为:900.由频率分布直方图先求出成绩不超过60分的学生的频率,由此能求出成绩不超过60分的学生人数.本题考查频数的求法,考查频率分布直方图等基础知识,考查推理论证能力、运算求解能力,考查数形结合思想,是基础题.32.解:由图示可知等高条形图的差别较大,故认为吸烟与患肺病有关系.故答案为:有.根据条形图的高度差判断.本题考查了分类变量的相关关系,属于基础题.33.解:∵样本数据x1,x2,…,x2023标准差为4,∴样本数据x1,x2,…,x2023方差为16,∵yi=2xi-1(i=1,2,3,…,2023),∴数据y1,y2,…,y2023的方差为4×16=64,∴数据y1,y2,…,y2023的标准差为8.故答案为:8.先求出样本数据x1,x2,…,x2023方差为16,再求出数据y1,y2,…,y2023的方差为64,由此能求出数据y1,y2,…,y2023的标准差.本题考查方差、标准等基础知识,考查数据处理能力、运算求解能力,是基础题.34.解:由题意,=3,=7.2,∵1×5+2×6+3×7+4×8+5×10=120,12+22+32+42+52=55,∴==1.2,故答案为1.2.求出=3,=7.2,利用公式可得结论.本题考查线性回归方程,考查学生的计算能力,比较基础.35.解:从54个学生中用系统抽样抽取4个人的一个样本,分组时要先剔除两人后分成4个小组,每一个小组有13人,∵学号为3号,29号,42号的同学在样本中,即第一个学号是3,∴第二个抽取的学号是3+13=16,故答案为:16从54个学生中用系统抽样抽取4个人的一个样本,分组时要先剔除两人后分成4个小组,每一个小组有13人,第一个学号是3,第二个抽取的学号是3+13,可以依次写出所需要的学号.本题考查系统抽样方法,考查抽样过程中的分组环节,考查分组后选出的结果有什么特点,本题是一个基础题,若出现则是一个送分题目.36.解:根据题意,计算=×(2+3+4+5+6)=4,=×(1.5+4.5+5.5+6.5+7.0)=5,且回归直线方程=1.3x+过样本中心点(,),所以=-1.3=5-1.3×4=-0.2,所以回归方程为=1.3x-0.2,据此模型预测,当x=14时,=1.3×14-0.2=18(万元).故答案为:18.计算、,根据回归直线方程过样本中心点(,),求出回归系数,写出回归方程,利用回归方程计算x=14时的值即可.本题考查了线性回归方程过样本中心点的应用问题,是基础题.37.解:两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果就越好,在甲、乙、丙中,所给的数值中0.98是相关指数最大的值,即乙的拟合效果最好.故答案为:乙.根据两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果越好,由此得出答案.本题考查了相关指数的应用问题,解题的关键是理解相关指数越大其拟合效果越好.38.解:根据茎叶图中的数据,计算甲的平均数为=×(7+7+9+14+18)=11,乙的平均数为=×(8+9+10+13+15)=11;根据茎叶图中的数据知乙的成绩波动性小,较为稳定(方差较小),计算乙成绩的方差为:s2=×[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=.故答案为:.根据茎叶图中的数据求出甲、乙二人的平均数,再根据方差的定义得出乙的方差较小,求出乙的方差即可.本题考查了茎叶图、平均数与方差的应用问题,是基础题.39.解:命中环数的平均数为:=(8+7+9+5+4+9+10+7+4)=7,∴命中环数的方差为:S2=[(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=.故答案为:.先求出命中环数的平均数,由此能求出命中环数的方差.本题考查平均数、方差等基础知识,考查推理论证能力、运算求解能力、数据处理能力,是基础题.40.解:56人中抽取样本容量为4的样本,则样本组距为56÷4=14,则6+14×2=34,故另外一个同学的学号为34,故答案为:34.根据系统抽样的定义,求出对应的组距即可得到结论.本题主要考查系统抽样的定义,求出组距是解决本题的关键.41.(Ⅰ)根据中位数定义得,解得a,a+b+36=100,解得b.(Ⅱ)根据,.求出a,b即可.(Ⅲ)令,得0.7x+25>81,解得x>80.本小题主要考查统计、回归方程等基础知识;考查了数据处理能力、运算求解能力、属于中档题.42.(Ⅰ)求出各组的频率,划痕处频率分布直方图,再比较即可,(Ⅱ)先求出评分是80分以上的人数,再分别求得评分落在区间[80,90)、[90,100]上的人数,即可求得2名用户评分都小于90分的概率.本题主要考查频率分布直方图、用样本估计总体、等可能事件的概率,属于中档题.43.(1)由题意,,21+x+18+y=45,即可求出表中x、y的值;(2)完成列联表,计算K2,即可得出结论;(3)求出基本事件的个数,即可求出概率.本题考查概率的计算,考查独立性检验知识的运用,考查学生的计算能力,属于中档题.44.(1)由茎叶图能求出男性打分的中位数和女性打分的平均数.(2)由茎叶图可知:80分以下的市民共有6人,其中男性4人,记

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论