2026年高考数学复习讲义专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(解析版)_第1页
2026年高考数学复习讲义专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(解析版)_第2页
2026年高考数学复习讲义专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(解析版)_第3页
2026年高考数学复习讲义专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(解析版)_第4页
2026年高考数学复习讲义专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(解析版)_第5页
已阅读5页,还剩41页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题20概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)

目录

01析·考情精解

02破·题型攻坚

考点概率与统计解答题全归纳

真题动向

知识点1根据频率分布直方图求平均数、中位数和众数

知识点2样本相关系数

知识点3回归分析

知识点4独立性检验

必备知识知识点5离散型随机变量分布列均值,方差

知识点6二项分布

知识点7超几何分布

知识点8正态分布

题型01统计估计与概率

题型02统计图表与概率

题型03残差与决定系数

命题预测题型04回归分析

题型05独立性检验

题型06二项分布与超几何分布

题型07正态分布

题型08概率中的决策问题

题型09概率中的赛制问题

题型10马尔科夫链

题型以中档解答题为主,分值为14分左右。整体难度中档,是得分的关键板块之一。

1.高频基础考点:样本空间、随机事件的关系与运算,频率与概率的区别,互斥事件、对立事

件的辨析及简单概率计算。

命题轨

2.核心基础考点:概率模型,古典概型,条件概率、全概率公式考查频率较高,还会涉及相互

迹透视独立事件的概率计算。

试题多以校园活动、生活安全、保险、竞赛等实际场景为背景,考查学生将实际问题转化为概率

模型的能力。。

考点2025年2024年2023年

考点频

上海卷T19,14分

次总结概率统计上海卷T17,14分上海卷T19,14分

预计在2026年高考中,解答题中利用排列、组合考查离散型随机变量的分布列、期望、方差、

2026命

二项分布和正态分布等问题,有时亦考查回归方程、统计案例的相关内容,加强阅读理解与信息

题预测处理能力.

考点概率与统计解答题全归纳

1.2024年巴黎奥运会,中国获得了男子4100米混合泳接力金牌.以下是历届奥运会男子4100米混合泳

接力项目冠军成绩记录(单位:秒),数据按照升序排列.

206.78207.46207.95209.34209.35

210.68213.73214.84216.93216.93

(1)求这组数据的极差与中位数;

(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;

(3)若比赛成绩y关于年份x的回归方程为y0.311xbˆ,年份x的平均数为2006,预测2028年冠军队的

成绩(精确到0.01秒).

【解】(1)由题意,数据的最大值为216.93,最小值为206.78,

则极差为216.93206.7810.15;

数据中间两数为209.35与210.78,

209.35210.68

则中位数为210.015.

2

故极差为10.15,中位数为210.015;

(2)由题意,数据共10个,211以上数据共有4个,

故设事件A“恰有2个数据在211以上”,

21

C4C63

则P(A)3,

C1010

3

故恰有2个数据在211以上的概率为;

10

(3)由题意,成绩的平均数

206.78207.46207.95209.34209.35210.68213.73214.84216.93216.93

10

211.399,

由直线y0.311xb过(2006,211.399),

则b211.3990.3112006835.265,

故回归直线方程为y0.311x835.265.

当x2028时,y0.3112028835.265204.557204.56.

故预测2028年冠军队的成绩为204.56秒.

2.为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均

体育锻炼时长与学业成绩的数据如下表所示:

时间范围学业成绩0,0.50.5,11,1.51.5,22,2.5

优秀5444231

不优秀1341471374027

(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?

(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)

(3)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?

n(adbc)2

(附:2,其中nabcd,P23.8410.05.)

abcdacbd

179432825

【解】(1)由表可知锻炼时长不少于1小时的人数为占比,

58058

25

则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为2900012500.

58

(2)估计该地区初中生的日均体育锻炼时长约为

10.50.5111.51.5222.5

13919117943280.9.

58022222

则估计该地区初中学生日均体育锻炼的时长为0.9小时.

(3)由题列联表如下:

1,2其他合计

优秀455095

不优秀177308485

合计222358580

提出零假设H0:该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关.

其中0.05.

580(4530817750)2

23.9763.841.

95485222358

则零假设不成立,

即有95%的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关.

3.21世纪汽车博览会在上海2023年6月7日在上海举行,下表为某汽车模型公司共有25个汽车模型,其

外观和内饰的颜色分布如下表所示:

红色外观蓝色外观

米色内饰812

棕色内饰23

(1)若小明从这些模型中随机拿一个模型,记事件A为小明取到的模型为红色外观,事件B取到模型有棕色

内饰,求PB,PB|A,并据此判断事件A和事件B是否独立;

(2)为回馈客户,该公司举行了一个抽奖活动,并规定,在一次抽奖中,每人可以一次性抽取两个汽车模型。

为了得到奖品类型,现作出如下假设:

假设1:每人抽取的两个模型会出现三种结果:①两个模型的外观和内饰均为同色;②两个模型的外观和内

饰均为不同色;③两个模型的外观同色但内饰不同色,或内饰同色但外观不同色。

假设2:该抽奖设置三类奖,奖金金额分别为:一等奖600元,二等奖300元,三等奖150元。

假设3:每种抽取的结果都对应一类奖。出现某种结果的概率越小,奖金金额越高。

请判断以上三种结果分别对应几等奖。设中奖的奖金数是X,写出X的分布,并求X的数学期望。

23182221

【解】(1)由给定的数表知,P(B),P(A),P(B|A),

255255105

221

而P(AB)P(A)P(B),因此事件A,B相互独立,

2555

11

所以P(B),P(B|A),事件A,B相互独立.

55

(2)设事件C:外观和内饰均为同色,事件D:外观内饰都异色,事件E:仅外观或仅内饰同色,

C2C2C2C249C1C1C1C1244

8122383122

依题意,P(C)2;P(D)2;

C25150C2515025

C1C1C1C1C1C1C1C177

8212381223

P(E)2,则P(E)P(C)P(D),

C25150

因此抽取的两个模型的外观和内饰均为不同色是一等奖;外观和内饰均为同色是二等奖;

外观同色但内饰不同色,或内饰同色但外观不同色是三等奖,

奖金额X的可能值为:600,300,150,

奖金额X的分布列:

X600300150

44977

P

25150150

44977

奖金额X的期望E(X)600300150271(元).

25150150

众数、中位数、平均数与频率分布直方图的关系

(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘

积之和近似代替.

(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.

(3)众数:众数是最高小矩形底边的中点所对应的数据.

(1)样本相关系数:设由变量x和y获得的两组数据分别为xi和yi(i=1,2,…,n),其对应关系如下表

所示:

变量xx1x2x3x4x5x6…xn

变量yy1y2y3y4y5y6…yn

两组数据xi和yi的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,

n

xixyiy

其计算公式为ri1,

n2n2

xixyiy

i1i1

1n1n

其中,xxi,yyi,它们分别是这两组数据的算术平均数.

ni1ni1

(2)相关系数r与相关程度

(1)当r0时,称成对样本数据正相关;

当r0时,成对样本数据负相关;当r0时,成对样本数据间没有线性相关关系;

(2)样本相关系数r的取值范围为[-1,1];

当r越接近1时,成对样本数据的线性相关程度越强;

当r越接近0时,成对样本数据的线性相关程度越弱.

^

(1)残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,

观测值减去预测称为残差;

(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号或身高数据,或

体重的估计值等,这样作出的图形称为残差图;

(3)残差图法:残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的

宽带越窄,说明模型拟合精度越高;

一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析,借助残差分析还可以对模型进

行改进,使我们能根据改进模型作出更符合实际的预测与决策;

n

2

(4)残差平方和:yiyˆi称为残差平方和,残差平方和越小,模型的拟合效果越好;

i1

n

2

(yiyˆi)

22i122

(5)决定系数R比较,R1n,R越大,表示残差平方和越小,模型的拟合效果越好,R越

2

(yiy)

i1

小,残差平方和越大,即模型的拟合效果越差.

n(adbc)2

(1)2计算公式:2,其中nabcd.

(ab)(cd)(ac)(bd)

2

(2)临界值的定义:对于任何小概率值,可以找到相应的正实数x,使得Px成立,我们称x

为的临界值,概率值越小,临界值x越大.

(3)独立性检验:H0:PY1X0PY1X1,通常称H0为零假设或原假设.

基于小概率值的检验规则是:

2

当x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;

2

当x时,我们没有充分证据推断H0不成立,可以认为X和Y独立.

这种利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称

独立性检验.

(4)2独立性检验中几个常用的小概率值和相应的临界值

0.10.050.010.0050.001

x2.7063.8416.6357.87910.828

(5)独立性检验的一般方法

①根据题目信息,完善列联表;

②提出零假设:假设两个变量相互独立,并给出在问题中的解释。

2

n(adbc)2

③根据列联表中的数据及计算公式2求出的值;

(ab)(cd)(ac)(bd)

④当2时,我们就推断不成立,即两个变量不独立,该推断犯错误的概率不超过;

xH0

当2时,我们没有充分证据推断不成立,可以认为两个变量相互独立。

xH0

n

()

1E(X)x1p1x2p2xnpnxnpn

i1

()222

2D(X)(x1E(X))p1(xiE(X))pi(xnE(X))pn

1、定义

一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,不

发生的概率,那么事件恰好发生次的概率是kknk(,,,,)

q1pAkPXkCnpqk012…n

于是得到X的分布列

X01…k…n

p00n11n1kknknn0

CnpqCnpq…Cnpq…Cnpq

由于表中第二行恰好是二项式展开式

n00n11n1kknknn0各对应项的值,称这样的离散型随机变量服从

qpCnpqCnpqCnpqCnpqX

参数为n,p的二项分布,记作X~B(n,p),并称p为成功概率.

注意:①由二项分布的定义可以发现,两点分布是一种特殊的二项分布,即n1时的二项分布,所以二项

分布可以看成是两点分布的一般形式.

②本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.

3、二项分布的期望、方差

若X~B(n,p),则E(X)np,D(X)np(1p).

1、定义

在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件Xk发生的概率为

CkCnk

MNM,,其中,,且*,

P(Xk)nk0,1,2,…,mmminMnnN,MN,n,M,NN

CN

称分布列为超几何分布列.如果随机变量X的分布列为超几何分布列,则称随机变量X服从超几何分布.

X01…m

0n01n1mnm

CMCNMCMCNMCMCNM

Pnn…n

CNCNCN

2、超几何分布的适用范围件及本质

(1)适用范围:

①考察对象分两类;

②已知各类对象的个数;

③从中抽取若干个个体,考察某类个体个数Y的概率分布.

(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.

1、定义

b

随机变量X落在区间(a,b]的概率为P(aXb)(x)dx,即由正态曲线,过点(a,0)和点(b,0)的

a,

两条x轴的垂线,及x轴所围成的平面图形的面积,如下图中阴影部分所示,就是X落在区间(a,b]的概率

的近似值.

b

一般地,如果对于任何实数a,b(ab),随机变量X满足P(aXb)(x)dx,则称随机变量X服

a,

从正态分布.正态分布完全由参数,确定,因此正态分布常记作N(,2).如果随机变量X服从正态

分布,则记为XN(,2).

其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总

体波动大小的特征数,可以用样本的标准差去估计.

2、3原则

a

2

若XN(,),则对于任意的实数a0,P(aXa)(x)dx为下图中阴影部分的面积,

a,

对于固定的和a而言,该面积随着的减小而变大.这说明越小,X落在区间(a,a]的概率越大,

即X集中在周围的概率越大

特别地,有P(X)0.6826;P(2X2)0.9544;

P(3X3)0.9974.

由P(3X3)0.9974,知正态总体几乎总取值于区间(3,3)之内.而在此区间以外

取值的概率只有0.0026,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用

中,通常认为服从于正态分布N(,2)的随机变量X只取(3,3)之间的值,并简称之为3原则.

1.小明有自觉体锻的习惯,某运动软件记录了其每天运动的时长(单位:min),小明从最近90天的记录

中随机选取了10天的记录,具体数据如下:68、34、70、45、74、126、108、66、36、72.

(1)求这组数据的第60百分位数:

(2)运动时长不超过60min为不达标,估算从90天记录中随机抽取1天,该天运动时长不达标的概率:

(3)从这10个数中随机删除2个数得到一组新的数据,求前后两组数据的极差相同的概率.

【解】(1)把10天的记录按照从小到大排列为:34,36,45,66,68,70,72,74,108,126,

因为1060%6是整数,所以第60百分位数为第6个数与第7个数的平均数,

7072

因为71,这组数据的第60百分位数为71;

2

3

(2)因为选取的样本中运动时长不达标的频率为0.3,

10

所以估计该天运动时长不达标的概率为0.3;

(3)因为前后两组数据的极差相同,所以随机删除的2个数为36,45,66,68,70,72,74,108中的两个,

2

C828

则概率P2

C1045

2.一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:kg),按

从小到大的排序结果如下:62,74,75,84,84,85,85,85,86,87,89,92,93,94,97,99,101,

104,107,117.

(1)求该水果店过去20天苹果日销售量的平均数;

(2)若以过去20天苹果的日销售量的第80百分位数作为下个月每日苹果的平均进货量,试确定下个月每日

苹果的平均进货量;

(3)若从过去20天中随机抽取3天,分别求“3天中每天的苹果销售量均超过90kg”与“3天中恰有2天的苹果

销售量超过90kg”的概率.

【解】(1)该水果店过去20天苹果日销售量的平均数

6274758428538687899293949799101104107117

x90kg.

20

99101

(2)因为200.816,所以第80百分位数为100kg,所以下个月每日苹果的平均进货量为100kg.

2

(3)20天中苹果销售量超过90kg的有9天.

设“3天中每天的苹果销售量均超过90kg”为事件A,“3天中恰有2天的苹果销售量超过90kg”为事件B,

C37C2C133

9911

则PA3,PB3.

C2095C2095

3.小闵同学某一天进行了10次100米短跑集训,其中上午进行了6次,下午进行了4次;如下是他上午

集训6次的成绩(单位:s):13.7、13.9、14.9、15.3、12.9、13.3.

(1)求这6次成绩的中位数;

(2)参考这一天上午集训的数据,用经验概率估计概率,求该同学训练100米短跑3次至少有一次用时小于

13s的概率;

(3)若该同学下午4次的集训原始成绩记录丢失,但记得这4次的平均成绩是14.25s,方差是0.75,求他这

一天10次训练成绩的平均值和方差.

【解】(1)将这6次成绩从小到大排列为:12.9、13.3、13.7、13.9、14.9、15.3,

13.713.9

这6次成绩的中位数为:13.8;

2

1

(2)用时小于13s的概率为:P,所以该同学训练100米短跑3次至少有一次用时小于13s的概率为:

16

3

3191;

P11P111

6216

13.713.914.915.312.913.3

(3)上午六次的成绩平均数为:x14,

16

上午六次的方差为:

122222243

s212.91413.31413.71413.91414.91415.314,

1660

2

设下午四次成绩平均数为x214.25,下午四次的方差为s20.75,

614414.25

总的平均数为:x14.1,

10

总的方差为:

22

262426432432

ss1xx1s2xx214.11414.114.250.745

10101060104

4.为培养学生的社会责任感,某校开展了为期一学期的“温暖社区,青春奉献”志愿服务活动.活动结束后,

学校从甲、乙两个班级中统计了部分学生的志愿服务时长(单位:小时),统计结果用茎叶图记录如图所

示(十位数字作为“茎”,个位数字作为“叶”).已知甲组有9名学生的数据,乙组有10名学生的数据.

(1)分别写出甲、乙两组学生服务时长的第70百分位数;

(2)从甲、乙两组学生中各随机抽取1人,求抽取的2人中恰有1人的服务时长超过30小时的概率;

2

(3)记甲组志愿服务时长的方差为s0;在甲组中增加一名学生A得到“新甲组”,若A的志愿服务时长为27,

22

则记“新甲组”志愿服务时长的方差为s1;若A的志愿服务时长为20,则记“新甲组”志愿服务时长的方差为s2;

2、2、2

通过计算比较s0s1s2的大小(结果精确到0.1),并从数学角度解释这一现象.

【解】(1)因为90.76.3,所以甲组学生服务时长的第70百分位数为32;

2932

因为100.77,所以乙组学生服务时长的第70百分位数为30.5;

2

(2)因为甲组有9名学生,乙组有10名学生,根据分步乘法计数原理,从甲、乙两组学生中各随机抽取1

人,有91090种选取方法,

又甲、乙两组学生中各有3人的服务时长超过30小时,所以抽取的2人中恰有1人的服务时长超过30小

时有376339种选取方法,

3913

记事件A“抽取的2人中恰有1人的服务时长超过30小时”,则P(A),

9030

13

故从甲、乙两组学生中各随机抽取1人,抽取的2人中恰有1人的服务时长超过30小时的概率为;

30

(3)对甲组:

182123252529323436

甲组9名学生服务时长的平均数为x27,

09

甲组志愿服务时长的方差为

22222222

182721272327252722927322734273627

s233.3,

09

2

对新甲组1:x127,所以s130.

1

对新甲组2:x2792026.3,所以s234.4.

2102

222

所以s1s0s2.

数学解释:由于甲组均值为27,方差反映了数据的离散程度,当增加数据27(原样本均值),数据相对更

集中,所以方差变小;当增加数据20,数据更加分散,方差变大.

5.某区2025年3月31日至4月13日的天气预报如图所示.

(1)从3月31日至4月13日某天开始,连续统计三天,求这三天中至少有两天是阵雨的概率;

(2)根据天气预报,该区4月14日的最低气温是9C,温差是指一段时间内最高温度与最低温度之间的差值,

例如3月31日的最高温度为17C,最低温度为9C,当天的温差为8C记4月1日至4日这4天温差的

4

方差为s2,4月11日至14日这4天温差的方差为s2,若s2s2,求4月14日天气预报的最高气温;

12231

(3)从3月31日至4月13日中随机抽取两天,用X表示一天温差不高于9C的天数,求X的分布列及期望.

【解】(1)设“从3月31日至4月13日某天开始,连续统计三天,这三天中至少有两天是阵雨”为事件A,

41

连续统计三天共有12个样本点,事件A共有4个样本点,所以P(A)

123

(2)4月1日至4日这4天温差分别为9C、8C、9C、9C,

4

123

2

因此s1xix,设4月14日的温差为xC,

4i116

则4月11日至14日这4天温差分别为8C、9°C、8C、xC,

x25

因此xC,

4

222

21x25x25x2543

s2829x

4444316

解得x9,因此,4月11日这天最高气温是18C.

(3)从3月31日至4月13日,一天温差不超过9C的共有11天,高于9C的共有3天

X可能取值为0,1,2.

C23C1C133C255

311311

P(X0)2,P(X1)2,P(X2)2

C1491C1491C1491

随机变量X的分布列为:

X012

33355

P

919191

3335511

随机变量X的期望E(X)012.

9191917

6.某校高三年级学生参加了一次时政知识竞赛,为了了解本次竞赛的成绩情况,从所有答卷中随机抽取100

份作为样本进行统计,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:40,50、50,60、

L、90,100得到如图所示的频率分布直方图.

(1)求实数m的值;若年级准备选取80分及以上的学生进入下一轮竞赛,已知该校高三年级有1000名学生,

估计该校高三年级参加下一轮竞赛的人数;

L

(2)王老师抽取了10名参加竞赛的学生,他们的分数为:x1、x2、x3、、x10.已知这10个分数的平均数x91,

标准差s5,若剔除其中的96和86这2个分数,求剩余8个分数的平均数与方差.

【解】(1)在频率分布直方图中,所有矩形的面积之和为1,

即m2m0.0150.0220.03101,解得m0.005,

80分及以上的学生所占的比例为0.020.0052100.3,

故估计该校高三年级参加下一轮竞赛的人数为10000.3300人.

8

(2)不妨设x996,x1086,根据题意可得xi10919686728,

i1

728

故剩余8个分数的平均数为x91,

8

22222

x91x91x9196918691

因为原数据的方差为s212825,

10

22222

所以x191x291x891251055200,

222

x91x91x91200

故剩余8个分数的方差为s212825.

88

7.王老师将全班40名学生的高一数学期中考试(满分100分)成绩分成5组,绘制成如图所示的频率分

布直方图,现将[50,60)记作第一组,[60,70)、[70,80)、[80,90)、[90,100]分别记作第二、三、四、五组.已

知第一组、第二组的频率之和为0.3,第一组和第五组的频率相同.

(1)估计此次考试成绩的平均值(同一组数据用该组数据的中点值代替);

(2)王老师将测试成绩在[80,90)和[90,100]内的试卷进行分析,再从中选2人的试卷进行优秀答卷展示,求

被选中进行优秀答卷展示的这2人的测试成绩至少1个在[90,100]内的概率;

(3)已知第二组考生成绩的平均数和方差分别为65和40,第四组考生成绩的平均数和方差分别为83和70,

据此计算第二组和第四组所有学生成绩的方差.

10a10b0.3a0.005,

【解】(1)由题意得,解得

10(0.0450.020a)0.7b0.025.

所以平均数等于550.05650.25750.45850.2950.0574.5

(2)由题意,[80,90)内有8人,[90,100]内有2人,

2

C817

所以被选中进行优秀答卷展示的这2人的测试成绩至少1个在[90,100]内的概率为12.

C1045

22

(3)设第二组、第四组的平均数与方差分别为x1,x2,s1,s2,

由题意,第二组、第四组分别有10人和8人,

6510838

所以成绩在第二组、第四组的平均数x73

108

108

2122

成绩在第二组、第四组的方差s[(xix)(yjx)]

18i1j1

108

122

[(xix1)(x1x)][(yjx2)(x2x)]

18i1j1

22

5242

s1x1xs2x2x

99

5242400

406573708373

993

400

故估计成绩在第二组、第四组的方差是.

3

8.(2025·云南丽江·三模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了4次试

验,得到数据如下:

零件的个数x

2345

(个)

加工的时间y

2.5344.5

(小时)

n

xiyinxy

ˆi1ˆ

参考公式:用最小二乘法求线性回归方程系数公式bn,aˆybx

22

xinx

i1

(1)求y关于x的线性回归方程yˆbˆxaˆ;

(2)求各样本的残差;

(3)试预测加工10个零件需要的时间.

23452.5344.5

【解】(1)x3.5y3.5

44

i1

xiyi22.5334454.552.5

4

i1

2,

xi49162554

4

52.543.53.5

bˆ0.7,aˆ3.50.73.51.05,

5443.52

∴所求线性回归方程为yˆ0.7x1.05.

(2)计算每个xi对应的预测值yˆ:

yˆ10.721.051.41.052.45,

yˆ20.731.052.11.053.15,

yˆ30.741.052.81.053.85,

yˆ40.751.053.51.054.55;

计算残差eiyiyˆ:

e12.52.450.05

e233.150.15

e343.850.15

e44.54.550.05

所以,各样本的残差依次为:0.05,0.15,0.15,0.05.

(3)当x10时,yˆ0.7101.058.05,

∴预测加工10个零件需要8.05小时.

9.某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100km)的变化规

律,进行了相关实验,记录不同速度下的油耗数据的散点图如下:

66

2

并计算得xiyi3025,xi45100.

i1i1

(1)根据散点图求y关于x的经验回归方程(精确到0.01);

(2)根据线性回归方程,绘制残差图,并分析线性回归方程的拟合效果(若残差的平方和小于0.775,则说明

拟合效果良好,否则拟合效果较差).

nn

xixyiyxiyinxy

ˆi1i1ˆ

附:bnn,ybxaˆ.

222

xixxinx

i1i1

607080901001101

【解】(1)由图得x85,y7.56.86.25.75.456.1,

66

6

xy6xy

ii

ˆi130256856.143

则b60.05,

224510068585875

xi6x

i1

故aˆ6.10.058510.35,

则y关于x的经验回归方程为yˆ0.05x10.35.

(2)结合(1),计算得残差如下表:

行驶速度60708090100110

油耗实际

7.56.86.25.75.45

油耗估计

7.356.856.355.855.354.85

残差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论