版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4讲统计与成对数据的统计分析微点一统计图表与样本的数字特征例1(1)(多选)如图是2024年11月27日国家统计局发布的2023年1-10月到2024年1-10月的各月累计营业收入与利润总额同比增速的折线图,则()A.累计营业收入同比增速的方差大于累计利润总额同比增速的方差B.累计利润总额同比增速的极差为18C.累计营业收入同比增速的众数为2.9D.累计利润总额同比增速的40%分位数为-2.3答案BCD解析根据折线图得,累计利润总额同比增速的折线图波动程度明显大于累计营业收入同比增速折线图的波动程度,故累计营业收入同比增速的方差小于累计利润总额同比增速的方差,A错误;累计利润总额同比增速的最大值为10.2,最小值为-7.8,故极差为10.2-(-7.8)=18,B正确;观察累计营业收入同比增速的数据,2.9出现了3次,出现的次数最多,故累计营业收入同比增速的众数为2.9,C正确;将累计利润总额同比增速的数据从小到大排序为-7.8,-4.4,-4.3,-3.5,-2.3,0.5,3.4,3.5,3.6,4.3,4.3,10.2,因为12×40%=4.8,所以累计利润总额同比增速的40%分位数为-2.3,D正确.(2)(多选)(2025·攀枝花模拟)某校高三年级共有1000名学生,为了解学生的身体发育情况,随机抽取了100名学生的体重数据,将数据整理得到如图所示的频率分布直方图,则()A.a=0.04B.样本的众数估计值为55C.样本的第75百分位数约为61.25D.该校高三年级学生中体重高于65千克的学生大约为200人答案AC解析对于A,0.01×5+0.07×5+0.06×5+a×5+0.02×5=1,解得a=0.04,故A正确;对于B,由图可知体重在[50,55)的样本最多,则样本的众数估计值为52.5,故B错误;对于C,由0.01×5+0.07×5+0.06×5+0.04×5=0.9>0.75,0.01×5+0.07×5+0.06×5=0.7<0.75,则设第75百分位数为x,0.01×5+0.07×5+0.06×5+0.04×(x-60)=0.75,解得x=61.25,故C正确;对于D,由图可得学生体重高于65千克的概率P=0.02×5=0.1,则该校高三年级学生中体重高于65千克的学生大约为1000×0.1=100(人),故D错误.[规律方法](1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率(2)在频率分布直方图中各小长方形的面积之和为1.(3)利用频率分布直方图求众数、中位数与平均数①最高的小长方形底边中点的横坐标即众数.②中位数左边和右边的小长方形的面积和相等.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.跟踪演练1(1)(2025·萍乡模拟)已知一组数据为:123,117,117,121,122,120,116,114,120,119,则这组数据的75%分位数是()A.114 B.115 C.120.5 D.121答案D解析共10个数据,按从小到大的顺序排列为114,116,117,117,119,120,120,121,122,123,10×0.75=7.5,则75%分位数是第8个数据121.(2)(多选)(2025·江苏新高考基地联考)赋分是根据考生原始分数在全体考生中的排名比例进行转化的,在一次模拟考试中,某班5名同学的地理科目的原始分与赋分如表.学号12345原始分93857852x赋分10096927082记这5名同学在这次模拟考试中的地理科目的原始分为数据甲,赋分为数据乙,则()A.甲的平均数小于乙的平均数B.甲的中位数小于乙的中位数C.甲的极差小于乙的极差D.甲的方差小于乙的方差答案AB解析根据题意得,赋分后,学生成绩提高了,平均数和中位数都会增加,故A,B正确;根据赋分,知学号5的原始分满足78>x>52,则甲的极差为93-52=41,乙的极差为100-70=30,41>30,故C错误;赋分后,结合极差可知,数据乙更集中,方差更小,故D错误.微点二线性回归与非线性回归例2(1)(多选)(2025·皖豫联盟联考)2025年1月20日,DeepSeek发布并开源DeepSeek-R1模型,这是继ChatGPT之后人工智能技术的又一次突破,对人工智能市场的发展产生了巨大的推动作用.以下是收集到的2015年至2024年人工智能的市场规模(单位:十亿美元)的数据:年份2015201620172018201920202021202220232024年份代号x12345678910市场规模y6.49.513.820.12940.75880.4110150设z=lny,z与x的关系可以用线性回归模型z^=0.35x+1.57进行拟合,e0.35≈1.42,e1.57A.人工智能的市场规模与年份正相关B.人工智能的市场规模的90%分位数为110C.y关于x的经验回归方程为y^=e0.35xD.人工智能的市场规模的年增长率约为42%答案AD解析对于A,人工智能的市场规模随年份增大而增大,故是正相关关系,故A正确;对于B,因为10×0.9=9,所以90%分位数是从小到大排列的第9个和第10个数据的平均数,即110+1502=130,故B对于C,因为z=lny,即lny^=0.35xy^=e0.35x+1.57≈4.8e0.35x对于D,设x2=x1+1,则y^2=e0.35x2+1.57=e故市场规模的年增长率约为42%,故D正确.(2)(2025·聊城模拟)为了研究某市高中生的脚长x(单位:cm)和身高y(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的x=19.25,y=161,根据最小二乘法算得脚长和身高的经验回归方程为y^=4x+aA.1cm B.-1cmC.4cm D.-4cm答案D解析因为x=19.25,y=161,又经验回归方程y^=4x+a^必过点(所以161=4×19.25+a^解得a^=84,所以y^=4当x=25时,y^=4×所以该样本点的残差为180-184=-4(cm).[易错提醒](1)样本点不一定在经验回归直线上,但点(x,(2)求b^(3)利用样本相关系数判断线性相关程度强弱时,看|r|的大小,而不是r的大小.(4)区分样本相关系数r与决定系数R2.(5)通过经验回归方程求的都是估计值,而不是真实值.跟踪演练2(2025·齐鲁名校联考)下表是2020年至2024年中国出生人口数y(单位:十万人)的数据:年份20202021202220232024年份代码x12345出生人口数y120106969095(1)求2020年至2024年中国每年出生人口数的平均数;(2)某研究人员建立了y关于x的回归模型y^=120-6x(3)求(2)中回归模型的决定系数R2,并评价其拟合效果.(如果0.85≤R2≤1,就认为拟合效果好;如果0.7≤R2<0.85,就认为拟合效果一般;如果R2<0.7,就认为拟合效果差)附:R2=1-nΣ解(1)平均数为15×(120+106+96+90+95)=507(2)中国出生人口数低于700万,即y^y^=120-6x<70,解得x>253,x∈N当x=8时,y^=120-6×当x=9时,y^=120-6×x=9对应2028年,即预测从2028年开始中国出生人口数将低于700万.(3)当x=1时,y^=120-6×1=114,(y1-y^1)2当x=2时,y^=120-6×2=108,(y2-y^2)2当x=3时,y^=120-6×3=102,(y3-y^3)2当x=4时,y^=120-6×4=96,(y4-y^4)2当x=5时,y^=120-6×5=90,(y5-y^5)2所以R2=1-5≈1-36+4+36+36+25567=430因为0.7≤R2<0.85,所以这个模型的拟合效果一般.微点三独立性检验例3(1)(多选)(2025·新余模拟)某农科院研制出了一种防治玉米病虫害的新药.为了解该药的防治效果,科研人员选用了100粒玉米种子(其中一部分用该药做了处理)进行试验,从中任选1粒,发现此粒种子抗病虫害的概率为0.8.未填写完整的2×2列联表如下,则()抗病虫害不抗病虫害合计种子经过该药处理60种子未经过该药处理14合计100附:χ2=n(α0.10.010.0050.001xα2.7066.6357.87910.828A.这100粒玉米种子中经过该药处理且不抗病虫害的有6粒B.这100粒玉米种子中抗病虫害的有84粒C.χ2的观测值约为13.428D.根据小概率值α=0.001的独立性检验,可以认为该新药有效答案AD解析由题可将2×2列联表补充完整如表.抗病虫害不抗病虫害合计种子经过该药处理60666种子未经过该药处理201434合计8020100由表可知A正确,B错误;零假设为H0:种子抗病虫害与该新药无关,由表可知χ2=100×(60×14−20×6)266×34×80(2)(2025·全国Ⅰ卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:组别超声波检查结果合计正常不正常患该疾病20180200未患该疾病78020800合计8002001000①记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;②根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.附:χ2=n(α0.050.0100.001xα3.8416.63510.828解①根据表格可知,超声波检查结果不正常的200人中有180人患该疾病,所以p的估计值为180200=9②零假设为H0:超声波检查结果与患该疾病无关,根据表中数据可得,χ2=1000=765.625>10.828=x0.001,根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与患该疾病有关,此推断犯错误的概率不超过0.001.[易错提醒](1)χ2越大,两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.跟踪演练3(2025·华大新高考联盟质检)为了了解某地25~40岁居民的工资情况,研究人员随机抽取了部分居民进行调查,所得数据统计如表所示.工资超过3500工资不超过3500合计男性居民200180女性居民280240合计(1)完善上述表格并依据小概率值α=0.05的独立性检验,能否认为工资的多少与居民的性别具有相关性?(2)以频率估计概率,若在该地所有居民中随机抽取3人,求至少2人工资超过3500的概率.附:χ2=n(α0.050.010.001xα3.8416.63510.828解(1)完善表格如表所示.工资超过3500工资不超过3500合计男性居民200180380女性居民280240520合计480420900零假设为H0:工资的多少与居民的性别不具有相关性,则χ2=900×(200故依据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为假设成立,即不能认为工资的多少与居民的性别具有相关性.(2)由题意知,工资超过3500的概率为P=480900=8记至少2人工资超过3500为事件A,所以P(A)=C32×8152×715专题强化练[分值:80分]一、单项选择题(每小题5分,共30分)1.(2025·湖北九师联盟模拟)已知一组数据从小到大排列为4,6,7,8,9,10,14,15,17,则该组数据的40%分位数为()A.7 B.8 C.9 D.10答案B解析该组数据从小到大排列为4,6,7,8,9,10,14,15,17,因为9×40%=3.6,所以该组数据的40%分位数为第4个数据,即数据的40%分位数为8.2.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本的编号是()A.10 B.09 C.71 D.20答案B解析从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,20,所以选出来的第4个样本的编号为09.3.(2025·东三省四市教研联合体模拟)为了了解学校质量监测成绩,现随机抽取该校200名学生的成绩作为样本进行分析,并绘制频率分布直方图,若该频率分布直方图的组距为10,且样本中成绩在区间[92.5,102.5)这一组内的学生有40人,则在频率分布直方图中该组数据对应的矩形高度为()A.0.02 B.0.2 C.0.04 D.0.4答案A解析由题意成绩在区间[92.5,102.5)内学生的频率为40200=0.2,频率组距=0.024.(2025·安康联考)有一组样本数据x1,x2,…,xn,其平均数为x1,方差为s12,若样本数据-x1+1,-x2+1,…,-xn+1的平均数为xA.x2=x1-1 B.xC.s12=s22 答案C解析根据样本数据平均数公式可知,x2=-x1+1,方差s22=(-1)25.某在线平台利用技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台的学生进行打分,将收集到的分数按照[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分组,画出频率分布直方图如图所示,则这些数据的中位数约为()A.85 B.80 C.77.5 D.75答案C解析由于(0.005+0.005+0.010+0.015)×10=0.35,(0.005+0.005+0.010+0.015+0.020)×10=0.55,因此中位数落在区间[70,80)内,设中位数为x,由0.35+0.020×(x-70)=0.5,得x=77.5,因此,中位数约为77.5.6.某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:身高x(单位:cm)167173175177178180181体重y(单位:kg)90545964677276由表格制作成如图所示的散点图:由最小二乘法计算得到经验回归直线l1的方程为y^=b^1x+a^1,其样本相关系数为r1;经过残差分析,点(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线l2的方程为y^=b^2A.b^1>b^2,a^1B.b^1>b^2,a^1C.b^1<b^2,a^1D.b^1<b^2,a^1答案D解析这7个身高的平均数x=167+173+175+177+178+180+1817≈176因为点(167,90)的横坐标167小于平均值176,纵坐标90相对过大,所以去掉该点后经验回归直线的截距变小,而斜率变大,所以a^1>a^又r1>0,r2>0,且去掉点(167,90)后成对样本数据的线性相关程度更强,拟合效果会更好,所以r1<r2.二、多项选择题(每小题6分,共12分)7.(2025·济南模拟)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,并根据形成的2×2列联表,计算得到χ2≈2.727,根据小概率值为α的独立性检验,则()附:α0.1000.0500.010xα2.7063.8416.635A.若α=0.100,则认为“毛色”和“角”无关B.若α=0.100,则认为“毛色”和“角”有关,此推断犯错误的概率不超过0.100C.若α=0.010,则认为“毛色”和“角”无关D.若α=0.010,则认为“毛色”和“角”有关,此推断犯错误的概率不超过0.01答案BC解析对于A,B,若α=0.100,因为χ2≈2.727>2.706,则认为“毛色”和“角”有关,此推断犯错误的概率不超过0.100,故A错误,B正确;对于C,D,若α=0.010,因为χ2≈2.727<6.635,则认为“毛色”和“角”无关,故C正确,D错误.8.(2025·浙江R6联盟联考)下列结论中,正确的有()A.若随机变量ξ~N(2,σ2),P(ξ≤5)=0.81,则P(ξ≤-1)=0.19B.将一组样本中的每个数据都加上同一个非零常数后,均值与方差都变化C.已知经验回归方程为y^=b^x+2.8,且x=4,y=30,则D.在线性回归分析中,决定系数R2用来刻画拟合的效果,R2值越小,则模型的拟合效果越好答案AC解析对于A,因为随机变量ξ~N(2,σ2),P(ξ≤5)=0.81,所以P(ξ≤-1)=1-P(ξ≤5)=1-0.81=0.19,故A正确;对于B,将一组样本中的每个数据都加上同一个非零常数后,均值发生变化而方差不变,故B错误;对于C,因为经验回归方程为y^=b^x+2.8,且x=4,则30=4b^+2.8,即b对于D,在线性回归分析中,决定系数R2用来刻画拟合的效果,R2值越大,则模型的拟合效果越好,故D错误.三、填空题(每小题5分,共10分)9.(2025·湖南名校联合体模拟)高三某班第一组学生的数学期末考试成绩分别为138,130,120,122,120,130,110,130,则该组成绩的中位数与平均数之差的绝对值为.
答案1解析将成绩从小到大排列为110,120,120,122,130,130,130,138,所以该组成绩的中位数为122+1302=126平均数为138+130×3+122+120所以该组成绩的中位数与平均数之差的绝对值为|126-125|=1.10.某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=lnWi,yi=lnfi,计算得x=8,y=5,8Σi=1yi2=214.由最小二乘法得经验回归方程为y^=b^x+7.4,则k的值为;为判断拟合效果,通过经验回归方程求得预测值y^i(i=1,2,…,8),若残差平方和8答案-0.30.98解析因为f=cWk,两边取对数可得lnf=lnc+klnW,又xi=lnWi,yi=lnfi,依题意经验回归方程y^=b^x+7.4必过点(所以5=8b^解得b^=-0.3,所以k又R2=1-8Σi=1≈1-0.28214−8×四、解答题(共28分)11.(13分)(2025·湖南名校联考)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学的100名学生,整理得到如下列联表.男学生女学生合计喜欢跳绳353570不喜欢跳绳102030合计4555100(1)依据小概率值α=0.1的独立性检验,能否认为学生的性别和是否喜欢跳绳有关联?(5分)(2)已知该校学生每分钟的跳绳个数X~N(170,100),该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟的跳绳个数都增加10,该校有1000名学生,预估经过训练后该校每分钟的跳绳个数在[170,200]内的学生人数.(结果精确到整数)(8分)附:χ2=n(ad−bc)2(a+b)(α0.10.050.01xα2.7063.8416.635若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.解(1)零假设为H0:学生的性别和是否喜欢运动无关.χ2=100×(35所以根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即不能认为学生的性别与是否喜欢跳绳有关.(2)训练前该校学生每人每分钟的跳绳个数X~N(170,100),则μ=170,σ2=100,σ=10,又训练前学生每分钟的跳绳个数在[160,190]内,160=μ-σ,190=μ+2σ,所以P(160≤X≤190)=P(μ-σ≤X≤μ+2σ)=P(μ−σ≤X=0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动物园安全工作责任制度
- 社区药品工作责任制度
- 废气治理责任制度汇编范本
- 个人金融信息责任制度
- 落实精细化管理责任制度
- 商超全员安全责任制度
- 工会事业主体责任制度
- 文管员岗位责任制度范本
- 一建建设工程侵权责任制度
- 危险废物岗位责任制度
- 第六单元联读公开课一等奖创新教学设计统编版高中语文必修下册
- 2026国家统计局桐庐调查队招聘编外工作人员1人考试参考题库及答案解析
- 2025年河南林业职业学院单招职业适应性考试题库附答案解析
- 2026天津宏达投资控股有限公司及所属企业招聘工作人员16人备考题库附参考答案详解(考试直接用)
- 25-26第二学期初三年级历史备课组工作计划:研析中考真题优化复习策略提升历史学科应试能力
- 城市公共交通运营与服务规范
- 林业项目监理工作总结与报告
- 化工造粒工安全教育考核试卷含答案
- 制冷基础知识课件
- 放射科质控管理(技师组)
- 2026年江西单招新能源汽车技术专业基础经典题详解
评论
0/150
提交评论