版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章成对数据的统计分析全章综合测试卷(提高篇)一.单选题1.下列变量之间的关系是相关关系的是()A.正方体的表面积与体积B.光照时间与果树的产量C.匀速行驶车辆的行驶距离与时间D.某运动会中某代表团的足球队的比赛成绩与乒乓球队的比赛成绩【解题思路】A与C是一种函数关系,D不具备相关关系,B满足相关关系.【解答过程】对于A,正方体的体积确定,则表面积随之确定,是一种确定性关系,A错误;对于B,光照时间越长,果树的产量相对越大,是一种线性相关关系,B正确;对于C,行驶速度与时间是一种确定的函数关系,C错误;对于D,足球比赛成绩与乒乓球比赛成绩没有关系,不具有相关关系,D错误.故选:B.2.根据最小二乘法由一组样本点xi,yi(其中A.至少有一个样本点落在回归直线y=B.若所有样本点都在回归直线y=C.对所有的解释变量xi(i=1,2,⋯,300),bxiD.若回归直线y=bx+a的斜率b>0【解题思路】对每一个选项逐一分析判断得解.【解答过程】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A错误;所有样本点都在回归直线y=bx+若所有的样本点都在回归直线y=bx+a上,则相关系数r与b符号相同,若回归直线y=bx+a的斜率b>0,则r>03.有下列说法:①若某商品的销售量y(件)关于销售价格x(元/件)的线性回归方程为y=−5x+350②线性回归直线y=bx+③若两个随机变量的线性相关性越强,则相关系数r的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,相关指数R2表示解释变量对于预报变量变化的贡献率,R其中正确的结论有()个A.1 B.2 C.3 D.4【解题思路】由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关时,线性相关性越强,相关系数r越接近−1,③错误;残差图中带状区域越窄,拟合度越高,④错误;R2越接近1,模型拟合度越高,⑤【解答过程】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;②由最小二乘法可知,回归直线必过x,y,③若两个随机变量为负相关,若线性相关性越强,相关系数r越接近−1,③错误;④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数R2越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤可知正确的结论为:②⑤,共2个,故选:B.4.下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型y=e1+at(a∈R)对y与t的关系进行拟合,则根据该回归模型,预测从第(
)个月开始该物种的繁殖数量超过5000只(参考数据:e3≈20.09,e4≈54.60)第t个月123繁殖数量yeeeA.4 B.5 C.6 D.7【解题思路】根据指数计算将回归模型两边取自然对数lny=1+at,并令u=lny,由此构建一个u与t的回归直线模型,根据回归直线必过t【解答过程】由题意,y=e1+at两边取自然对数得lny=1+at,令u=u=lny1+lny2+lny3×13=2,t=t1+t5.某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x元99.29.49.69.810销量y件1009493908578(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线y=bx+a的斜率的最小二乘估计值为b=i=1nxA.9.4元 B.9.5元 C.9.6元 D.9.7元【解题思路】由条件求出回归直线方程,然后设该产品的售价为x元,可得工厂的利润L=x−5【解答过程】由题意x=1y=16100+94+93+90+85+78所以a^=90+9.5×20=280,则设该产品的售价为x元,工厂的利润为L,则L=x−5由x−5−20x+280当且仅当x−5=14−x,即x=9.5时等号成立.所以x=9.5时,工厂的利润的最大为405元,故选:B.6.在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(N=100m,m∈N∗),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若有99.9%把握认为性别与是否喜欢该学科有关,则可以推测N的最小值为(P0.0500.0100.001k3.8416.63510.828A.400 B.300 C.200 D.100【解题思路】根据题目列出2×2列联表,再根据列联表的数据计算K2值,进而得到关于m【解答过程】由题可知,男女各50m人,列联表如下:喜欢不喜欢总计男30m20m50m女20m30m50m总计50m50m100mK2=100m∴4m>10.828,解得m>2.707,∵m∈N∗,∴m≥3,7.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:K2=nP(0.100.050.010.005k2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%C.有95%D.有99.5%【解题思路】根据题设收集的数据,得到男生学生的人数,进而得出2×2的列联表,利用计算公式,求解K2【解答过程】从5000人中,其中男生3500人,女生1500人,采用分层抽样抽取一个容量为300人的样本,其中男女各抽取的人数为300×35005000=210由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,∴在300人中每周体育锻炼时间超过4小时的人数为300×0.75=225人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,则男生有225−60=165人,可得如下的2×2的列联表:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2∴有95%8.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度,厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了A地区的100天日落和夜晚天气,得到如下2×2列联表.单位:天日落云里走夜晚天气下雨未下雨出现255未出现2545临界值表:P0.050.0100.001k3.8416.63510.828并计算得到K2≈19.05,下列小波对A地区天气的判断不正确的是(A.夜晚下雨的概率约为1B.未出现“日落云里走”,夜晚下雨的概率约为5C.在犯错误的概率不超过0.001的前提下认为“日落云里走”是否出现与夜晚天气有关D.若出现“日落云里走”,则有99.9%的把握认为夜晚一定会下雨【解题思路】根据已知数据计算概率可判断AB,计算K2【解答过程】根据列联表可知,100天中有50天下雨,50天未下雨,因此夜晚下雨的概率约为50100=12,A中判断正确;同样,未出现“日落云里走”,夜晚下雨的概率约为二.多选题9.如图,5个数据x,y,去掉点D3,10后,下列说法正确的是(
A.相关系数r变大B.残差平方和变大C.变量x与变量y呈正相关D.变量x与变量y的相关性变强【解题思路】根据图中的点,计算去掉D(3,10)前后的相关系数、残差平方和、R2【解答过程】由图,x−=1+2+3+4+105=4,y−=3+4+5+10+125=6.8,则令回归方程y=a+bx,则b=51.4∴a=6.8−1.028×4=2.688,即回归方程为y=1.028x+2.688,可得(xi,yi)为(1,3.716),(2,4.744),∴残差平方和i=15(yi−x−1=1+2+4+104=4.25,y−1=3+4+5+125=4.8,则i=1令回归方程y=m+nx,则n=49∴m=4.8−1.005×4.25≈0.5288,即回归方程为y=1.005x+0.5288,可得(xi,y1i)为(1,1.5338),∴残差平方和i=14(y1i−y故选:ACD.10.下列命题正确的是(
)A.若甲、乙两组数据的相关系数分别为0.66和−0.85,则乙组数据的线性相关性更强;B.在检验A与B是否有关的过程中,根据数据算得χ2=6.352,已知P(χ2≥5.024)=0.025,PC.已知随机变量X服从正态分布N1,σ2,若PD.在回归分析中,残差平方和与决定系数R2【解题思路】A比较相关系数的绝对值大小即可判断;B由独立检验基本思想,先判断χ2与5.024,6.635大小关系,进而确定相关性的把握程度;C由正态分布的对称性求概率;D根据残差平方和与决定系数R【解答过程】A:由|−0.85|>|0.66|知:乙组数据的线性相关性更强,正确;B:由5.024<χ2=6.352<6.635,即P(χ2C:由已知:随机变量X的分布曲线关于X=1对称,故PX<0D:残差平方和越小,模型的拟合效果越好,但决定系数R2故选:AC.11.北京冬奥会成功举办后,大众对冰雪运动关注度不断上升,为研究市民对冰雪运动的喜好是否和性别有关,某校学生社团对市民进行了一次抽样调查,得到列联表如下:冰雪运动的喜好性别合计男性女性喜欢140m140+m不喜欢n8080+n合计140+n80+m220+m+n若男性喜欢冰雪运动的人数占男性人数710,女性喜欢冰雪运动的人数占女性人数35,则(A.列联表中n的值为60,m的值为120B.随机对一位路人进行调查,有95%的可能性对方喜欢冰雪运动C.有95%的把握认为市民对冰雪运动的喜好和性别有关D.没有99%的把握认为市民对冰雪运动的喜好和性别有关【解题思路】根据题意分别计算m,n的值,填写列联表,计算观测值,对照临界值即可得出结论.【解答过程】解:因为男性喜欢冰雪运动的人数占男性人数的710,所以140140+n=又因为女性喜欢冰雪运动的人数占女性人数的35,所以b80+m=35计算260400=0.65,所以随机对一路人进行调查,有65%填写列联表为:冰雪运动的喜好性别合计男性女性喜欢140120260不喜欢6080140合计200200400由表中数据,计算K2所以有95%的把握认为市民性别和喜欢冰雪运动有关系,选项C因为K2≈4.396<6.635,所以没有99%故选:ACD.12.计算机显示的数字图像是由一个个小像素点组合而成的.处理图像时,常会通过批量调整各像素点的亮度,间接调整图像的对比度、饱和度等物理量,让图像更加美观.特别地,当图像像素点规模为1行n+1列时,设第i列像素点的亮度为xi,则该图像对比度计算公式为C{xi}=1ni=1n(xi−xA.使用方案①调整,当b=9时,yB.使用方案②调整,当c=9时,zC.使用方案①调整,当C{xD.使用方案②调整,当xi=9(i−1)n【解题思路】方案①:根据yi=axi+b的性质,将b=9、a>0及xi∈[0,9]代入判断A;利用对比度公式可得C{yi}=a【解答过程】使用方案①调整:当b=9时yi=axi+9且a>0C{xi当C{xi}<C{yi使用方案②调整:当c=9时zi=9lg(xzi=c⋅ln(xi+1)又xi=9(i−1)n(i=1,2,⋅⋅⋅,n+1)所以zi−zn=1时1−99i+n∈[110此时C{xi三.填空题13.x和y的散点图如图所示,则下列说法中所有正确命题的序号为①③.①x,y是负相关关系;②x,y之间不能建立线性回归方程;③在该相关关系中,若用y=c1ec2x拟合时的相关指数为R1【解题思路】由图可知,散点图呈整体下降趋势,据此判断①的正误;由试验数据得到的点将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,据此判断②的正误;根据散点图比较两个方程的拟合效果,比较那个拟合效果更好,据此判断③;.【解答过程】在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;由散点图知用y=c1ec2x拟合比用故答案为:①③.14.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x(单位:年)1234567失效费y(单位:万元)2.903.303.604.404.805.205.90由上表数据可知,y与x的相关系数为0.99.(精确到0.01,参考公式和数据:r=i=1nxi−xy【解题思路】分别求出x,y,i=17【解答过程】由题意,知x=1+2+3+4+5+6+77i=17所以r=14.0028×7.08=14.00198.2415.某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y(万元)的::数据如下:x12345y10.910.29.07.87.1根据上表可得y关于x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为5,6,7.(参考数据:i=15xi【解题思路】根据题意求出x、y,利用最小二乘法求出b,进而求出【解答过程】由题意可得,x=1+2+3+4+55i=15xi设线性回归方程为y=bx+a,则故线性回归方程为y=−x+12.根据题意,m12−m≥35,解得5≤m≤7所以m的所有可能取值为5,6,7.故答案为:5,6,7.16.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的13,男生追星的人数占男生人数的14,女生追星的人数占女生人数的12,若有95参考数据及公式如下:P(0.0500.0100.001k3.8416.63510.828χ2=n【解题思路】设男生人数为x,可得列联表,由此计算χ2的表达式,根据有95%的把握认为中学生追星与性别有关,可得不等式455【解答过程】设男生人数为x,则可得列联表如下:喜欢追星不喜欢追星合计男生143x女生111合计5114则计算χ2=43x⋅解得x>55×3.8414≈52.81,又x=12k即有95%四.解答题17.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销量y(单位:万件)之间的关系如表:x1234y12284256在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.附注:参考数据:i=14yi−y参考公式:相关系数r=【解题思路】由已知数据作出散点图,由图像可以看出推断x与y线性相关,再由公式计算可得结论.【解答过程】解:作出散点图如图:由散点图可知,各点大致分布在一条直线附近,由此推断x与y线性相关.由题中所给表格及参考数据得:x=52,y=692,i=14i=14r=i=1∵y与x的相关系数近似为0.9997,可以推断该公司的年销量y与第x年呈正线性相关,且线性相关程度很强.18.某统计部门依据《中国统计年鉴——2017》提供的数据,对我国1997-2016年的国内生产总值(GDP)进行统计研究,作出了两张散点图:图1表示1997-2016年我国的国内生产总值(GDP),图2表示2007-2016年我国的国内生产总值(GDP).(1)用rii=1,2表示第i张图中的年份与GDP的线性相关系数,ri(2)分别用线性回归模型和指数回归模型对两张散点图进行回归拟合,分别计算出统计数据——相关指数R2年份1997-20162007-2016线性回归模型0.9306指数回归模型0.98990.978①将上表中的数据补充完整(结果保留3位小数,直接写在答题卡上);②若估计2017年的GDP,结合数据说明采用哪张图中的哪种回归模型会更精准一些?若按此回归模型来估计,2020年的GDP能否突破100万亿元?事实上,2020年的GDP刚好突破了100万亿元,估计与事实是否吻合?结合散点图解释说明.【解题思路】(1)观察两图,根据ri(2)第一小问可根据第(1)问中确定的r2的值,通过R【解答过程】(1)由散点图可知,图2拟合效果更好、相关系数较大,所以r1=0.9647,(2)①0.996②由图2中的线性回归模型得到的相关指数为0.996,是所有回归模型的相关指数中数值最大的,而且2017年是最近的年份,因此选择图2中的线性回归模型来估计2017年的GDP,是比较精准的.按照图2中的线性回归模型来估计(延长回归直线可发现),2020年不能突破100万亿元.估计与事实不吻合.综合两张图来考虑,我国的GDP随年份的增长整体上呈现指数增长的趋势,而且2020年比2016年又多发展了4年,指数回归趋于明显,因此,按照线性回归模型得到的估计值与实际数据有偏差、不吻合,属于正常现象.19.近年来,学生职业生涯规划课程逐渐进入课堂,考生选择大学就读专业时不再盲目扎堆热门专业,报考专业分布更加广泛,之前较冷门的数学、物理、化学等专业报考的人数也逐年上升.下表是某高校数学专业近五年的录取平均分与当年该学校的最低提档线对照表:年份20172018201920202021年份代码t12345该校最低提档分数线510511520512526数学专业录取平均分522527540536554提档线与数学专业录取平均分之差y1216202428(1)根据上表数据可知,y与t之间存在线性相关关系,请用最小二乘法求y关于t的线性回归方程;(2)据以往数据可知,该大学每年数学专业的录取分数X服从正态分布Nμ,16,其中μ①若该大学2022年数学专业录取的学生成绩在584分以上的有3人,本专业2022年录取学生共多少人?进入本专业高考成绩前46名的学生可以获得一等奖学金,则一等奖学金分数线应该设定为多少分?②在①的条件下,若从该专业获得一等奖学金的学生中随机抽取3人,用ξ表示其中高考成绩在584分以上的人数,求随机变量ξ的分布列与数学期望.参考公式:b=i=1n参考数据:Pμ−σ<X≤μ+σ≈0.683,P【解题思路】(1)根据表中数据,分别求得t,y,b,(2)①由(1)中的线性回归方程求得t=6时的y,进而得到该大学2022年的数学专业录取平均分,然后利用3σ原则求解,再由584分以上的有3人可计算出本专业2022年录取学生共多少人;再由前46名占比计算出一等奖学金分数线应该设定为多少分;②若从该专业获得一等奖学金的学生中随机抽取3人,用ξ表示其中高考成绩在584分以上的人数,其中该专业获得一等奖学金的学生为46人,其中高考成绩在584分以上的有3人,则ξ的可能取值为0,1,2,3,再由超几何分布的概率求解计算出概率并列出分布列进而求得数学期望.【解答过程】(1)由题意知t=15i=1ni=1nti−t故所求线性回归方程为y=4t+8(2)①由(1)知,当t=6时,y=4×6+8=32故该大学2022年的数学专业录取平均分约为540+32=572.即μ=572,因为584=572+3×4=μ+3σ,又P(X≥584)=P(X≥572+3×4)=P(X≥μ+3σ)=121−P若该大学2022年数学专业录取的学生成绩在584分以上的有3人,则本专业2022年录取学生共30.0015进入本专业高考成绩前46名的学生占录取人数的462000设一等奖学金分数线应该设定为x0分,则P∴P1144−∴P572−2×4<X<572+2×4=1−2×0.023=0.954,故一等奖学金分数线应该设定为580分;②若从该专业获得一等奖学金的学生中随机抽取3人,用ξ表示其中高考成绩在584分以上的人数,其中该专业获得一等奖学金的学生为46人,其中高考成绩在584分以上的有3人,则ξ的可能取值为0,1,2,3;Pξ=0=CPξ=2=Cξ0123P1234127091291Eξ20.某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(Ⅰ)设消费者的年龄为x,对该款智能家电的评分为y.若根据统计数据,用最小二乘法得到y关于x的线性回归方程为y=1.2x+40,且年龄x的方差为sx2=14.4,评分y的方差为sy2=22.5(Ⅱ)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.好评差评青年816中老年206附:线性回归直线y=bx+a的斜率b=i=1nP(0.0500.0100.001k3.8416.63510.828【解题思路】(Ⅰ)由r的公式计算求解即可;(Ⅱ)由列联表计算K2【解答过程】(Ⅰ)相关系数r==b(Ⅱ)由列联表可得K2故有99%的把握认为对该智能家电的评价与年龄有关.21.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示:表1:x1234567y611213466101196根据以上数据,绘制了如图1所示的散点图.参考数据:yvi=1i=11062.141.54253550.123.47其中vi=lg对于一组数据(u1,v1),(u(1)根据散点图判断,在推广期内,y=a+bx与y=c⋅dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数(2)根据(1)的判断结果及表1中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次;【解题思路】(1)根据散点图判断y=c⋅dx适宜作为扫码支付的人数y关于活动推出天数【解答过程】(1)由于表中点的走势不在任何一条直线附近,因此应该是非线性的,故可判断y=c⋅dx适宜作为扫码支付的人数y关于活动推出天数(2)∵y=c⋅dx,两边同时取常用对数得:lg∵x=4,v把样本中心点4,1.54代入v=lgc+xlgd,得:∴y关于x的回归方程式:y=把x=8代入上式:y=3.47×10222.受疫情的影响,各实体商铺的销售额受到了不同程度的冲击,某小商
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数控磨工安全操作评优考核试卷含答案
- 工业气瓶防倾倒措施及其依据
- 河北省2026届高三年级上册一轮复习阶段性检测化学(A卷)试卷(含答案)
- 频率范围设定的技术指导
- 高效解耦控制算法开发实施规范
- 湖北省黄石市2025-2026学年九年级(上)10月月考化学试卷(含答案)
- 教育学毕业论文探析
- 教育领域研究剖析
- 揭秘光的行为
- 第十三章 三角形全章压轴题专项卷(必考点分类集训)(人教版2024)(解析版)
- 2025河北邯郸市产业投资集团有限公司下属企业专业人才招聘78人笔试考试备考试题及答案解析
- 学堂在线 研究生素养课-积极心理与情绪智慧 章节测试答案
- 改革开放与新时代知到智慧树章节测试课后答案2024年秋同济大学
- UT-2级超声波检测基本知识讲述
- 大连理工大学现代远程教育
- 薄膜干涉(课堂PPT)
- 耙式浓密机的计算方法及举例说明
- 初级长拳第三路现用图解
- 水土保持小流域综合治理项目实施方案编写提纲试行
- 道路施工保通方案
- SG519钢结构节点图集
评论
0/150
提交评论