2026高考数学二轮复习突破:统计与成对数据的统计分析_第1页
2026高考数学二轮复习突破:统计与成对数据的统计分析_第2页
2026高考数学二轮复习突破:统计与成对数据的统计分析_第3页
2026高考数学二轮复习突破:统计与成对数据的统计分析_第4页
2026高考数学二轮复习突破:统计与成对数据的统计分析_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3讲统计与成对数据的统计分析

r探究真题明确方向■

1.(2025•全国II卷,T1)样本数据2,8,14,16,20的平均数为()

A.8B.9C.12D.18

2.(2023•新课标H卷,T3)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样

调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,

则不同的抽样结果共有()

A.C瑞.C猛利।B.C瑞C乳种C.C瑞(瑞种D.C招种

3.(2025・天津,T5)下列说法中错误的是()

鼠若X~NQi,4),则尸(XW〃r尸

B.若以N(1,22),Y~NQ,22),则尸(X<l)<P(y<2)

C.H越接近1,相关性越强

DM越接近0,相关性越弱

4.(2025•全国【卷,T15)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1

000人,得到如下列联表:

超声波检查结果

组别合计

正常不正常

患该疾病20180200

未患该疾病78020800

合计8002001000

(I)记超声波检查结果不正常者患该疾病的概率为P,求〃的估计值;

(2)根据小概率值a=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.

附./=_____'(诵"_____

•八(a+b)(c+d)(a+c)(b+d)

a0.050.0100.001

Xa3.8416.63510.828

命题热度:

本讲是历年高考命题必考的内容,属于中低档题目,三种题型都有所考查,分值约为5~15分.

考查方向:

一是统计知识,如样本数据数字特征计算与频率分布直方图等相结合进行考看;二是一元线性回归模型的

分析,以社会实际生产生活问题为情境的回归直线方程的求解与应用;三是独立性检验,实际生活背景下

的两类变量之间的相关性检验.

1.答案C

解析样本数据2,8,14,16,20的平均数为少誓2=12.

2.答案D

解析根据比例分配的分层随机抽样的定义知,初中部共抽取60X浅=40(人),高中部共抽取

600

60X黑=20(人),根据组合公式和分步乘法计数原理知,不同的抽样结果共有C需。•第8。种.

bUU

3.答案B

解析根据正态分布的对称性可知,若X〜『),则户(XW"-o)二尸(X2〃+o),故A正确;若X~N(1,

22),卜M2,22),则P(X<l)=P(y<2)=0.5,故B错误;样本相关系数「的绝对值越接近0,相关性越弱,越

接近1,相关性越强,故C,D正稿.

4.解(1)根据表格可知,超声波检查结果不正常的200人中有18()人患该疾病,

所以p的估计值为探磊

(2)零汲设为超声波检查结果与患该疾病无关,

根据表中数据可得,

,10)0x(20x20-180x780)2

1一200X800X800X200

=765.625>lO.828=^,oou

根据小概率值即0.0。1的独立性检验,我们推断为不成立,即认为超声波检查结果与患该疾病有关,此推

断犯错误的概率不超过0.001.

考点一统计图表、数字特征

例1(1)(2025・绵阳模拟)某家电公司生产了A,8两种不同型号的空调,公司统计了某地区2024年的

前6个月这两种型号的空调的销售情况,得到销售量的折线图如图所示,分析这6个月的销售数据,

下列说法不正确的是()

万台

一A型号

5()

45--8型号

4()

35

3()

25

20

°一月二月三月四月五月六月月彳分

A.A型号空调月销售量的极差比B型号空调月销售量的极差大

B.A型号空调月平均销售量比B型号空调月平均销售量大

C.A型号空调月销售量的上四分位数比B型号空调销售量的上四分位数大

D.A型号空调月销售量的方差比8型号空调月销售量的方差小

答案D

解析由图可知,A型号空调月销售量的极差为50-25:25,

8型号空调月销售量的极差为45-22=23,故A正确;

A型号空调月平均销售量为(25+28+27+42+38+50)=35,

6

8型号空调月平均销售量为:X(22+25+30+37+40+45户33,故B正确;

将A型号空调月销售量数据从小到大排列为25,27,28,38,42,50,

由6X75%=4.5,则A型号空调月销售量的上四分位数为42,

将8型号空调月销售量数据从小到大排列为22,25,30,37,40,45,

由6X75%=4.5,则8型号空调月销售量的上四分位数为40,故C正确;

A型号空调月销售量的方差为

-6X[(25-35)2+(28-35)2+(27-35)2+(42-35)2+(38-35)2+(50-35)283,

5型号空调月销售量的方差约为

-X[(22-33)2+(25-33)2+(30-33)2+(37-33)2+(40-33)2+(45-33)2]^67,故D错误.

6

(2)(多选)(2025・攀枝花模拟)某校高三年级共有1000名学生,为了解学生的身体发育情况,随机抽取了

10()名学生的体重数据,将数据整理得到如图所示的频率分布直方图,贝族)

Aa=0.04

B.样本的众数估计值为55

C.样本的第75百分位数约为61.25

D.该校高三年级学生中体重高于65千克的学生大约为200人

答案AC

解析对于A,0.01X5+0.07X5+0.06X5+aX5+0.02X5=1,解得近0.04,故A正确;

对于B,由图可知体重在[50,55)的样本最多,则样本的众数估计值为52.5,故B错误;

对于C,由0.01X5+0.07X5+0.06X5+0.04X5=0.9>0.75,

0.01X5+0.07X5+0.06X5=0.7<0.75,则设第75百分位数为x,

0.01X5+0.07X5+0.06X5+0.04X(A-60)=0.75,解得x=61.25,故C正确;

对于D,由图可得学生体重高于65千克的概率P=0.02X5=0.1,

则该校高三年级学生中体重高于65千克的学生大约为1000X0.1=100(人),故D错误.

[规律方法J(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示牡,频率二组距X”.

组距组距

(2)在频率分布直方图中各小长方形的面积之和为1.

(3)利用频率分布直方图求众数、中位数与平均数

①最高的小长方形底边中点的横坐标即众数.

②中位数左边和右边的小长方形的面积和相等.

③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中

点的横坐标之和.

跟踪演练1(1)(2025•萍乡模拟)已知一组数据为:123,117,117,121,122,120,116,114,120,

119,则这组数据的75%分位数是()

A.114B.115C.120.5D.I21

答案D

解析共10个数据,按从小到大的顺序排列为114,116,117,117,119,120,120,121,122,123,

10X0.75=7.5,

则75%分位数是第8个数据121.

(2)(2024.新课标II卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的

亩产量(单位:kg)并整理得下表:

亩产量[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)

频数61218302410

根据表中数据,下列结论中正确的是()

A.100块稻田亩产量的中位数小于1050kg

B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%

C.100块稻田亩产量的极差介于200kg至300kg之间

D.100块稻田亩产量的平均值介于900kg至1000kg之间

答案C

解析对于A,根据频数分布表可知,

6+12+18=36<50,

所以亩产量的中位数不小于1050kg,故A错误;

对于B,亩产量不低于1100kg的频数为24+10=34,

所以低于11001^的稻田占比为吟彩乂100%=66%,故B错误;

对于C,因为1200-900=300,

1150-950=200,故C正确;

对于D,由频数分布表可得,

平均值为击X(6X925+12X975+18X1025+30X1075+24X1125+10X1175)=1067,故D错误.

考点二回归分析

例2(1)(多选)(2025•院豫联盟联考)2025年1月20日,DeepSeek发布并开源DeepSeek-Rl模型,这是

继ChatGPT之后人工智能技术的又一次突破,对人工智能市场的发展产生了巨人的推动作用.以下是收

集到的2015年至2024年人工智能的市场规模(单位:十亿美元)的数据:

年份2015201620172018201920202021202220232024

年份

12345678910

代号X

市场

6.49.513.820.12940.75880.4110150

规模y

设z=lny,z与x的关系可以用线性回归模型>0.35x+1.57进行拟合,c035^1.42,eL57^4.8,贝lj()

A.人工智能的市场规模与年份正相关

B.人二智能的市场规模的90%分位数为11()

C.y关于x的经验回归方程为,=e°3”+4.8

D.人工智能的市场规模的年增长率约为42%

答案AD

解析对于A,人工智能的市场规模随年份增大而增大,故是正相关关系,故A正确;

对于B,因为10x0.9=9,所以90%分位数是从小到大排列的第9个和第10个数据的平均数,即

号”=130,故B错误;

对于C,因为z=lny,即Iny=0.35.r+1.57,

y=c035x+1.57^4.8c035\故C错误;

对于D,设X2=X1+1,

则,2二e035%2+1.57=cO.35-e°・35%】+L57R42.i,

故市场规模的年增长率约为42%,故D正确.

(2)(2025・聊城模拟)为了研究某市高中生的脚长x(单位:cm)和身高M单位:cm)的关系,市卫健委从该市随

机抽取若干名高中生做调查,经统计,所调查数据的±=19.25,9=161,根据最小二乘法算得脚长和身高的

经验回归方程为,=4x+Z.已知被调查的某学生的脚长为25cm,身高180cm,则该样本点的残差为()

A.lcmB.-lcm

C.4cmD.-4cm

答案D

解析因为5=19.25,y=161,

又经验回归方程y=4x+a必过点收,y),

所以161=4X19.25+1,

解得2=84,所以,=4x+84,

当户25时,,=4X25+84=184,

所以该样本点的残差为180-184=-4(cm).

[易错提醒](1)样本点不一定在经脸回归直线上,但点Q,刃一定在经验回归直线上.

(2)求b时,灵活选择公式,注意公式的推导和记忆.

(3)利用样本相关系数判断线性相关程度强弱时,看IH的大小,而不是r的大小.

(4)区分样本相关系薮r与决定系数R2.

(5)通过经验回归方程求的都是估计值,而不是真实值.

跟踪演练2(2025•齐鲁名校联考)下表是2020年至2024年中国出生人口数),(单位:十万人)的数据:

年份20202021202220232024

年份代码X12345

出生人口数y120106969095

(1)求2020年至2024年中国每年出生人口数的平均数;

(2)某研究人员建立了),关于x的回归模型,=1206-用该回归模型预测从哪一年开始中国出生人口数将低

于700万;

(3)求⑵中回归模型的决定系数并评价其拟合效果.(如果O.85〈R2〈1,就认为拟合效果好;如果

0.7WR10.85,就认为拟合效果一般;如果网<0.7,就认为拟合效果差)

n八

x(yi-yt)25

附:R2=\-^------,2(%-历2^567.

z(yi-y)2i=1

1=1

解(1)平均数为:X(120+106+96+90+95)=^=101.4(十万人),

(2)中国出生人口数低于700万,艮4<70.

y=120-6^<70,解得拳

当户8时,y=120-6X8=72>70,

当户9时,y=\20-6X9=66<70,

入=9对应2028年,即预测从2028年开始中国出生人口数将低于700万.

(3)当时,y=i20-6Xl=114,⑶-入)2=(120-114)2=36,

22

当户2时,y=120-6X2=108,(jJ?-y2)=(106-1()8)=4,

22

当户3时,y=120-6X3=102,013-^3)=(96-102)=36,

22

当户4时,y=120-6X4=96,(3'4-y4)=(90-96)=36,

当上5时,y=120-6X5=90,(3-入户=(95-90户25,

5人

工(yf产

所以R2=l-T------

£(yi-y)2

i=l

,36+4+36+36+25430„”

-1-----------=—=0.76,

567567

因为O.7〈R2<O.85,所以这个模型的拟合效果一般.

考点三独立性检验

例3(多选)(2025・新余模拟)某农科院研制出了一种防治玉米病虫害的新药.为了解该药的防治效果,科

研人员选用了100粒玉米种子(其中一部分用该药做了处理)进行试验,从中任选1粒,发现此粒种子抗

病虫害的概率为0.8.未填写完整的2义2列联表如下,则()

抗病虫害不抗病虫害合计

种子经过该药处理60

种子未经过该药处理14

合计100

n(ad-bc')2

附:Z2二

(a+b)(c+d)(a+c)(b+d)・

a0.10.010.0050.001

x02.7066.6357.87910.828

A.这100粒玉米种子中经过该药处理且不抗病虫害的有6粒

B.这1()0粒玉米种子中抗病虫害的有84粒

C./的观测值约为13.428

D.根据小概率值a=0.001的独立性检验,可以认为该新药有效

答案AD

解析由题可将2X2列联表补充完整如表.

抗病虫害不抗病虫害合计

种子经过该药处理60666

种子未经过该药处

201434

合计8020100

由表可知A正确,B错误;

零假设为“°:种子抗病虫害与该新药无关,由表可知黑:;:黑岩也14.439>10.828,因此根据小概

率值2().()01的独立性检验,推断”。不成立,即可以认为该新药有效,故C错误,D正确.

[易错提醒](1)/越大,两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可

能性.

⑵在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.

跟踪演练3(2025•华大新高考联盟质检)为了了解某地25〜40岁居民的工资情况,研究人员随机抽取了

部分居民进行调查,所得数据统计如表所示.

工资超过3500工资不超过3500合计

男性居民200180

女性居民280240

合计

(1)完善上述表格并依据小概率值。=0.()5的独立性检验,能否认为工资的多少与居民的性别具有相关

性?

(2)以频率估计概率,若在该地所有居民中随机抽取3人,求至少2人工资超过3500的概率.

n(fld-bc)2

(a+b)(c+d)(a+c)(b+d)

a0.050.010.001

Xa3.8416.63510.828

解(I)完善表格如表所示.

工资超过3500工资不超过3500合计

男性居民200180380

女性居民280240520

合计480420900

零假设为"o:工资的多少与居民的性别不具有相关性,

则*900X(200X240-180X28。)1[3<3.841,

人380x520x480x420

故依据小概率值。=0.05的独立性检验,没有充分证据推断为不成立,因此可以认为假设成立,

即不能认为工资的多少与居民的性别具有相关性.

⑵由题意知,工资超过3500的概率为尸=爱=郎.

记至少2人工资超过3500为事件A,

所以3髭Y)鼠孑(凯提

专题强化练

[分值:90分]

一、单项选择题(每小题5分,共30分)

1.(2025・湖北九师联盟模拟)已知一组数据从小到大排列为4,6,7,8,9,10,14,15,17,则该组数据

的40%分位数为()

A.7B.8C.9D.10

答案B

解析该组数据从小到大排列为4,6,7,8,9,10,14,15,17,因为9X40%=3.6,所以该组数据的

40%分位数为第4个数据,即数据的40%分位数为&

2.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,

02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:

6667403714640571II0565

099586687683203790

5716031163149084452175

738805905223594310

若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本的编号是()

A.10B.09C.71D.20

答案B

解析从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编

号,符合条件的编号有14,05,11,09,20,所以选出来的第4个样本的编号为()9.

3.(2025•东三省四市教研联合体模拟)为了了解学校质量监测成绩,现随机抽取该校200名学生的成绩作为

样本进行分析,并绘制频率分布直方图,若该频率分布直方图的组距为10,且样本中成绩在区间[92.5,

102.5)这一组内的学生有40人,则在频率分布直方图中该组数据对应的矩形高度为()

A.0.02B.0.2C.0.04D.0.4

答案A

解析由题意成绩在区间192.5,102.5)内学生的频率为黑=0.2,舞=0.02,即所求矩形高度为0.02.

200组比

4.(2025•安康联考)有一组样本数据即,xz,•••»xfl,其平均数为h1,方差为s:,若样本数据-xi+l,-

足+1,…,-b+1的平均数为为,方差为黄,贝女)

A.X2=^1-1B.X2=^I

C.S:=S:D.sf>S2

答案C

解析根据样本数据平均数公式可知,为二焉+1,方差登=(-1归AsK

5.某在线平台利用技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台

的学生进行打分,将收集到的分数按照[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),

[90,100]分组,画出频率分布直方图如图所示,则这些数据的中位数约为()

答案C

解析由于(0.005+0.005+0.010+0.015)X10=0.35,(0.005+0.005+0.010+0.015+0.020)X10=0.55,

因此中位数落在区间[70,80)内,设中位数为x,

由0.35+0.020X。-70)=0.5,得%=77.5,因此,中位数约为77.5.

6.某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的

身高和体重得下表:

身高M单位:cm)16717317517717818()181

体重y(单位:kg)90545964677276

由表格制作成如图所示的散点图:

1(M)-

90・

20-

10-

166168170172174176178180182x

由最小二乘法计算得到经验回归直线人的方程为,=£计入,其样本相关系数为〃:经过残差分析,点

(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线/2的方程为展2,

样本相关系数为小则下列选项正确的是()

八八A

A.b1>b2»a1>a2»n</*2

AAAA

B.b1>b2^n>/*2

AAAA

C.b1<d2»«1<«2»n>/*2

AAAA

口.瓦<匕2,八<-2

答案D

解析这7个身高的平均数

—167+173+175+177+178+180+181…/

x=------------------------------176,

因为点(167,90)的横坐标167小于平均值176,纵坐标90相对过大,所以去掉该点后经验回归直线的截距

AA,A

变小,而斜率变大,所以为>。2,瓦<82,

又外>0,r2>0,且去掉点(167,90)后成对样本数据的线性相关程度更强,拟合效果会更好,所以门<卷.

二、多项选择题(每小题6分,共12分)

7.(2025.济南模拟)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行

了一次数据统计,并根据形成的2X2列联表,计算得到根据小概率值为a的独立性检验,则

()

附:

a0.1000.0500.010

2.7063.8416.635

A.若归0.100,则认为“毛色”和“角”无关

B.若(『0.100,则认为“毛色”和“角”有关,此推断犯错误的概率不超过0.100

C.若6=0.010,则认为“毛色”和“角”无关

D.若以=0.010,则认为“毛色”和“角”有关,此推断犯错误的概率不超过0.01

答案BC

解析对于A,B,若30.100,因为/。2.727>2.706,则认为“毛色”和“角”有关,此推断犯错误的概

率不超过0.100,故A错误,B正确;

对于C,D,若a=0.010,因为户2727<6.635,则认为“毛色”和“角”无关,故C正确,D错误.

8.(2025•浙江R6联盟联考)下列结论中,正确的有()

A.若随机变量。M2,『),PtW5)=0.8L则尸eW-l)=0.19

B.将一组样本中的每个数据都加上同一个非零常数后,均值与方差都变化

C.己知经验回归方程为,=匕户2.8,且石4,9=30,则6=6.8

D.在线性回归分析中,决定系数网用来刻画拟合的效果,配值越小,则模型的拟合效果越好

答案AC

解析对于A,因为随机变量。〜M2,/),PQ<5)=0.81,

所以P(^-1)=1-P(^5)=1-0.81=0.19,故A正确;

对于B,将一组样本中的每个数据都加上同一个非零常数后,均值发生变化而方差不变,故B错误;

AA

对于C,因为经验回归方程为y=/u+2.8,且H=4,y=30,

则30=46+2.8,即b=6.8,故C正确;

对于D,在线性回归分析中,决定系数R2用来刻画拟合的效果.网值越大,则模型的拟合效果越好,故D

错误.

三、填空题(每小题5分,共10分)

9.(2025・湖南名校联合体模拟)高三某班第一组学生的数学期末考试成绩分别为138,130,120,122,

120,130,110,130,则该组成绩的中位数与平均数之差的绝对值为.

答案1

解析将成绩从小到大排列为110,120,120,122,130,130,130,138,

所以该组成绩的中位数为垩詈=126,

b出山138+130X3+122+120X2+110

平均数为----------O-----------=125,

所以该组成绩的中位数与平均数之差的绝对值为1126-1251=1.

10.某校数学建模兴趣小组收集J'一组恒温动物体重W(单位:克卜与脉搏率大单位:心跳次数/分钟)的对应

数据(W,/)(立1,2,…,8),根据生物学常识和散点图得出了与W近似满足户cW*(c,k为参数).令x,=h]

81A

Wifj,=ln计算得H=8,y=5,£y”214.由最小二乘法得经验回归方程为y=bx+7.4,贝ij£的值

i=1

为;为判断拟合效果,通过经验回归方程求得预测值)々=1,2,…,8),若残差平方和

8/工(y<-^)2\

2CVi-%)2ko.28,则决定系数R*____________.(参考公式:决定系数产=1一早------I

i=11z5-7)2,

答案-0.30.98

解析因为户cW*,两边取对数可得hi/=lnc+klnVV,又M=lnW,>\=lnfh

依题意经验回归方程,=hr+7.4必过点叵,y),

所以5=8b+7.4,

解得4=0.3,所以七-0.3,

88

£(yi-yj2£(%-%)2

又松1-亨-----=1-亨-------

'(yt-y)2xyf-sy2

i=li=l

E亳3&

四、解答题(共27分)

11.(13分)(2025・湖南名校联考)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学的100名

学生,整理得到如下列联表.

男学生女学生合计

喜欢跳绳353570

不喜欢跳绳102030

合计4555100

(I)依据小概率值。=0.1的独立性检验,能否认为学生•的性别和是否喜欢跳绳有关联?(5分)

(2)已知该校学生每分钟的跳绳个数X〜M170,100),该校学生经过训练后,跳绳个数都有明显进步.假设经

过训练后每人每分钟的跳绳个数都增加10,该校有1000名学生,预估经过训练后该校每分钟的跳绳个数

在[170,200]内的学生人数.(结果精确到整数)(8分)

附::=_____吸〃-3>2______式中

八(a+b)(c+d)(a+c)(b+d)'n=a+b+c+d.

a.().10.050.01

2.7063.8416.635

若X〜N(4,/),JiMP("-crWXW〃+o;u0.6827,P(〃-2cWXW〃+2o户0.9545,尸("-3oWXW"+3。户0.9973.

解⑴零假设为〃o:学生的性别和是否喜欢运动无关.

2_100X(35X20-35X10)2

~2.357<2.706,

45x55x70x30

所以根据小概率值Q=0.1的独立性检验,没有充分证据推断为不成立,因此可以认为,。成立,即不能认

为学生的性别与是否喜欢跳绳有关.

(2)训练前该校学生每人每分钟的跳绳个数X~N(170,100),则厘70,片二100,(7=10,

又训练前学生每分钟的跳绳个数在[160,190]内,160=〃w,190=〃+2d

所以P(160WXW190)=PQZXS+2O)=P3FL〃+%「(〃-2彳*+2叽。.6;271。9:45

=0.34135+0.47725=0.8186,

由1000X0.8186=8183819(人),

估计训练前该校每分钟的跳绳个数在[160,190|内的学生人数为819,

即预估经过训练后该校每分钟的跳绳个数在[170,200]内的学生人数为819.

12.(14分)(2025・曲靖模拟)自“机器人扭秧歌”这一节目在2025年春晚舞台大放异彩后,专注于四足机器

人研发的某中国科技公司在全球范围内倍受瞩目,旗下一款机器人在巡检与监控、安防与救援、科研与影

视等方面应用广泛.现统计出该款机器人在某地区2024年1月至5月的销售量如表所示.

月份X12345

销售量.V/台26375()6493

(1)经计算样本相关系数内0.98,故变量达),线性相关性很强,求),关于x的经验回归方程;(5分)

(2)用⑴中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于5时,称该对数据为

一对“次数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“次数据”对数X的分布列和

均值.(9分)

n

2

AAA«(Xi-x)(y£-y)人A

阳:经验回归直线y二以十a中斜率和截距的最小二乘估计公式分别为小二运'---------,u=y-bx.

工(勺一科

i=l

解⑴由表格可得歹3X(1+2+3+4+5)=3,

y=^X(26+37+50+64+93)=54,

55

X(%,-X)2=4+1+0+1+4=10,v(x,-x)(>'ry)=56+l7+0+10+78=161,

i=1i=1

5

h£(勺一幻CVLT)AA

所以2?二日中--------=—=16.1,a=y-bx=54-16.1X3=5.7,

y°/io

i=l

故y关于x的经验回归方程是,=16.1i+5.7.

(2)当产1时,y=16.1X1+5.7=21.8,

残差的绝对值为|26-21.8|=4.2<5;

当户2时,y=16.IX2+5.7=37.9,

残差的绝对值为|37-37.9|=0.9<5;

当x=3时,y=16.IX3+5.7=54,

残差的绝对值为|50-54|=4<5;

当x=4时,y=16.1X4+5.7=70.1,

残差的绝对值为|64-70.1|=6.1>5;

当户5时,y=16.1X5+5.7=86.2,

残差的绝对值为|93-86.2|=6.8>5,

所以“次数据”为第四组和第五组,共两组.

故“次数据”对数X的所有可能取值为0,1,2.

ax=。)/磊

P(X=I)=甯=|,

「件2)=警磊

所以X的分布列为

X012

133

P

W510

E(X)=°X才IX*步2.

IY思维创新,,

(13题5分,14题6分,共11分)

13.哈希表(HashTable)是一种利用铤值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是

“除留余数法”.例如,当除数为3时,键值为13的数据因13・3余1,应存放于位置.1中,从而可直接依

据键值快速定位数据位置,多个数据可映射到同一位置(如键值10和13均映射到同〜位置).现有•个容量

为7个位置(编号0~6)的哈希表,以除留余数法(除数为7)进行映射,需要存储22个数据.设这7个位置存

放的数据个数分别为由,。1,。2,。3,伤,。6,则下列说法中正确的是()

A.至少有1个位置存放了不少于5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论