高考数学一轮复习题型突破:统计案例(解析版)_第1页
高考数学一轮复习题型突破:统计案例(解析版)_第2页
高考数学一轮复习题型突破:统计案例(解析版)_第3页
高考数学一轮复习题型突破:统计案例(解析版)_第4页
高考数学一轮复习题型突破:统计案例(解析版)_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题10.2统计案例

三I题型目录

犍一相关第犍关系数

题型二回归直线方程与样本中心

题型三线性回归方程

题型四非线性回归方程

题型五误差分析

题型六独立性检验

才典例集练

期型一相关关系与相关系数

例I.(2022春.河南省直辖县级单位.高一济源高中校考期末)下列两个变量具有相关关系的是()

A.正方形的边长与面积B.匀速行驶的车辆的行驶距离与时间

C.人的身而与视力D.人的身高与体重

【答案】D

【分析】根据函数关系及相关关系的定义判断即可.

【详解】对于A,由正方形的面积S与边长"的公式知S=",即正方形的边长与面积具有函数关系,故A

错误;

对于B,匀速行驶车辆的行驶距离S与时间,为S=i%其中u为匀速行驶的速度,

即匀速行驶的车辆的行驶距离与时间具有函数关系,故B错误;

对于C,人的身高与视力无任何关系,故C错误;

对于D,人的身高会影响体重,但不是唯一因素,即人的身高与体重具有相关关系,故D正确.

故选:D.

例2.(2023春・河南濮阳•高二统考期末)某公司对其产品研发的年投资额x(单位:百万元)与其年销售量

)’(单位:千件)的数据进行统计,整理后得到如下统计表;

Xi2345

y1.523.5815

⑴求变量X和)'的样本相关系数「(精确到().01),并推断变量X和)'的线性相关程度;(参考;若|同2().75,

则线性相关性程度很强;若0.30班|<0.75,则线性相关性程度一般,若|收0.25,则线性相关性程度很弱.)

(2)求年销售量丁关于年投资额”的经验回归方程.

nu

EG一5)(凹一7)vX/Z.-/uy

参考公式:样本相关系数〃=下且----f----------="n="一~n-------';经验回归方程»=八+4

悟X,-叫加J**原"〃F

za-可(片-,)-如A

A1

中6=上-----------=――5------,a=y-bx.参考数据同5s7.14

za-对£七一,晓

i=lr-1

【答案】⑴。92,变量X和y线性相关性程度很强

⑵y=3.3x-3.9

【分析】(1)根据公式求出相关系数约等于092,从而得到答案;

(2)根据公式计算出5=3.3,«=-3.9,得到答案.

【详解】(1)由题意,元=3,»=6,

因为fX;=55,Xy;=307.5,X玉匕=123,

5—

-5冷,

j=l123-5x3x633

所以“.—-——]==—x0.92

R2L7155-5x9x7307.5-5x365V51

二斤-5),

因为M20.75,所以变量x和丁线性相关性程度很强.

2%凹一55y

123-5x3x6c、

(2)旌母------------------;­=3.3

55-5x32

/=1

根据&=9-加得,«=6-3.3x3=-3.9

所以年销售廉卜关于年投资额大的经验回归方程为a=3.3x-3.9.

举一反三

练习1.(2023春・山东•高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所对应

的成对样本数据呈现出线性相关关系的是()

【答案】AB

【分析】根据数据点的分布情况直观判断是否有线性相关关系即可.

【详解】A、B中各点都有线性拟合趋势,其中A样本数据正相关,B样本数据负相关;

C中各点有非线性拟合趋势,D中各点分布比较分散,它们不具有线性相关.

故选:AB

练习2.(2023秋.高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:①卜|

越接近于1,相关程度越大;②卜越接近于0,相关程度越小;③卜|越接近于I,相关程度越小;④卜|越接

近干0,相关程度越大.其中正确的是()

A.①②B.②©C.②③D.①④

【答案】A

【分析】根据相关系数的性质可得结论.

【详解】由相关系数性质:卜|越接近于1,成对样本数据的线性相关程度越强,

卜|越接近于0,成对样本数据的线性相关程度越弱,

可知①@正确:

故选:A.

练习3.(2023春・江苏常州•高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差x(℃)与本

年份/20182019202020212022

年份代码X12345

种植面积w万亩814152028

附:①样本相关系数「=•;②¥=鼠+3为经验回归方程,

—,岳=],,V2240«47.33.

/2

i=l

根据上表,下列结论正确的是()

A.该地区这5年沃柑的种植面积的方差为212

B.种植面积),与年份代码x的样本相关系数约为().972(精确到6()01)

C.),关于x的经验回归方程为y=4.6x+3.2

D.预测该地区沃柑种植面积最早在2027年能突破40万亩

【答案】BC

【分析】根据样本方差、相关系数、回归方程等知识对选项进行分析•,从而确定正确答案.

1+2+3+4+58+14+15+20+28…

【详解】根据题意,得^==3,y=--------:-------=17*

55

5;=|x[(—9尸+(—3尸+(—2-+32+112]=44.8,A错误;

由题意得Z,/=1x8+2x14+3x15+4x20+5x28=301,

M

55

^<=12+22+32+42+52=55,^>7=82+142+152+202+282=1669,

所小2加T

v"5/忱y:-5y

Z-I

301-5x3x1746八八”

-7-------7----------«0.972,B正确;

755-45x71669-144547.33

^xr.y.-5x-y

301-5x3x17”--

所以b=R------5-5-_-45=4.6,a=y-^x=17-4.6x3=3.2.

1=1

所以),关于X的经验回归方程为y=4.6x+3.2,C正确;

令y=4.6x+3.2"0,得xN8,所以最小的整数为8,2017+8=2025,

所以该地区沃柑种植面积最早在2025年能突破4()万亩,D错误.

故选:BC

练习5.(2023春•重庆沙坪坝•高三重庆一中校考期中)根据国家统计局统计,我国2018—2022年的新生儿

数量如下:

年份编号X12345

年份20182019202020212022

新生儿数量y(单位:万人)1523146512001062956

(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量与年份编号x的关系,请用相关系数,•说明相

关关系的强弱;(。.75斗归1,则认为与x线性相关性很强)

(2)建立)'关于x的回归方程,并预测我国2025年的新生儿数晟.

参考公式及数据「=丽'5=寰聚券a="跖翦"=62°6£",=

6206,SF=iX以一5元守=-1537,J(,:=]*-5产)(富一火一5尸).1564.

【答案】⑴答案见解析;

(2)y=T53.7x+1702.3,472.7万人.

【分析】(1)求出相关系数即得解;

(2)利用最小二乘法求出1y关于x的【可归方程,再预测我国2025年的新生儿数量.

Z%/-5取

“曙…8

【详解】(1)

,川>0.75,故y与X的线性相关性很强..

从而可以用线性回归模型拟合y与X的关系.

(2)x=-(l+2+3+4+5)=3,y=-^.=-x6206=1241.2,

552]5

5

-5x2=l2+22+32+42+52-5X32=10.

“1>/一5回

故6=气---------=-^-=-153.7

Z2210

f=l

所以。=5-后=1241.2-(-153.7)x3=1702.3,

所以)'关于x的回归方程为y=T53.7x+1702.3,

将2025年对应的年份编号X=8代入回归方程得》=-153.7X8+1702.3=472.7

所以我国2025年的新生儿数量约为472.7万人.

题型二回归直线方程与样本中心

例3.(2023春・上海宝山•高二上海市行知中学校考期中)己知x,y的对应值如下表所示:

X02468

y।2/n+l3m+313

若y与x线性相关,且回归直线方程为y=L2x+0.2,贝卜〃二

【答案】I

【分析】根据线性回归方程过样本中心点直接计算即可.

【详解】根据表格可知,工=0+2+;+6+8=4,

-_1+(//?+1)+(2/?z+1)+(3/?7+3)+13_+19

,=5=,

因为),与%线性相关,且回归直线方程为y=1.2x+().2,

所以生包=1.2x4+82,得6m+19=25,解得〃?=1.

5

故答案为:1

例4.(2023春・湖北武汉•高二武钢三中校考阶段练习)已知由样本数据点集合求得的

回归直线方程为),=].5工+0.5,且5=3,现发现两个数据点(122.2)和(487.8)误差较大,去除后重新求得

的回归直线/的斜率为1.2,则去除后当<=4时,V的估计值为•

31

【答案】6.2/y

【分析】根据给定条件,求出去除前后的样本中心点,求出新的回归方程即可求解作答.

【详解】将7=3代入亍=L5x+O.5得亍=5,即样本中心点为(3,5),由数据点(122.2)和(4.8,7.8)知:

1.2+4.8,2.2+7.8

--=3,------=5c,

22

因此去除这两个数据点后,样本中心点不变,设新的回归直线方程为卞=L2x+R则〃=5-1.27=1.4,

即新的回归直线方程为RL2X+L4,当x=4时,y的估计值为6.2,

所以了的估计值为6.2.

故答案为:6.2.

举一反三

练习6.(2023•上海奉贤•校考模拟预测)已知一组成对数据。8,24),(13,34),(10,38),㈠㈤的回归方程为

y=-Zr+59.5,则该组数据的相关系数”(精确到“001).

【答案】-0.998

【分析】一组成对数据的平均值&J)一定在回归方程上,可求得〃?,再利用相关系数厂的计算公式算出即

可.

【详解】由条件可得,

-18+13+10-1,八

x=-----------------=10,

4

-24+34+38+〃?96+in

y=------;-------=—;—,

44

(x,力一定在I可归方程产-2A+59.5上,代入解得m=62,

-96+6279

y=------=一,

42

4

>戊=18x24+13x34+10x38-1x62=1192,

/=1

4

=182+132+102+(-1)2=594,

r=1

>;y:=242+342+38、622=7020,

r-1

ZE-4"1192-4xl0x—

r=/』=j2«-0.998

(£x;-4Z)((Xy;)-)J(594-4xl00)x(7020-4x(肾)

故答案为:-0.998

练习7.(2023春・山东聊城•高三山东聊城一中校联考阶段练习)为研究变量乂y的相关关系,收集得到如下

数据:

X56789

y98643

若由最小二乘法求得F关于X的经验回归方程为y=-1.6x+a,则据此计算残差为。的样本点是()

A.(5,9)B.(6,8)C.(7,6)D.(8,4)

【答案】C

【分析】先求出回归方程的样本中心点,从而可求得争=-1.61+17.2,再根据残差的定义可判断.

-1—1

【详解】由题意可得:x=-(5+6+7+8+9)=7,y=-(9+84-64-4+3)=6,

即样本中心点为(7,6),可得6=-L6x7+机解得$=17.2,

所以¥=-1.61+17.2,可得

X56789

y98643

y9.27.664.42.8

y-y-0.20.40-0.40.2

所以残差为。的样本点是(7,6).

故选:C.

练习8.(2023春•江苏连云港•高三校考阶段练习)某人工智能公司近5年的利润情况如下表所示:

第x年12345

7

利润)'/亿元2345

已知变量)'与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为y=1.2x+a,预测该人工智

能公司第6年的利润约为一亿元.

【答案】7.8/—

-21

【分析】分别求得7=3,),=W,乂回归直线方程必过样本中心点,可得”=0.6,将X=6代入即可得出结

果.

【详解】依题意还:(1+2+3+4+5)=3,y=l(2+3+4+5+7)=^,

因为回归直线方程为y_1.2x+a必过样本中心点、(工J),

91

即手=1.2x3+。,解得〃=0.6,

则回归直线方程为y=1.2x+0.6,

当工=6时),=1.2x6+0.6=7.8,即该人工智能公司第6年的利涧约为7.8亿元.

故答案为:7.8

练习9.(2023春・山东青岛•高三青岛市即墨区笫一中学统考期中)某研究性学习小组对春季昼夜温差大小

与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼夜温差x(°C)与实验室种子浸泡后的发芽数

y(颗)之间的线性回归方程:y=2Ax+a,且对应数据如下表:

【答案】B

【分析】根据给定的数表,求出样本的中心点,进而求;I"值,再代入计算作答.

-1+2+3+4+5C-3+7+8+10+12

【详解】依题意,x=------------=3,y=--------------=8.

于是8=2.1x3+&,解得&=1.7,即线性回归方程为y=2.1x+1.7,

当x=13时,y=2.1x13+1.7=29,

所以昼夜温差为13℃时,那么种子的发芽数大约是29颗.

故选:B

练习10.(2023春・江苏淮安•高三淮阴中学校联考阶段练习)用噗型y=a/拟合一组数据组

(4X)(i=l,2,…,7),其中百+々+…+/=6.设z=ln)1变换后的线性回归方程为2=x+5,则,出…片=

【答案】e4'

【分析】根据回归直线方程,必过样本点中心(工]),再利用换元公式,以及对数运算公式,叱简求值.

【详解】因为线性回归方程为2=x+5恒过(;,习,

因为%+…+石=6,所以无=、+=—,z=x+5=—+5=—,

7777

即_=Iny+l”2+...+ln%=丁(丁%“$)=4J

、,-j-7-T,

所以ln(y%…为)=41,即X为…力=e".

故答案为:e4'

题型三线性回归方程

例5.(2023春・重庆北陪•高二重庆市兼善中学校考阶段练习)近年来随着教育科研的不断进步,兼善中学

教育质量不断提高,某知名机构对近年来升入北京航天航空大学兼善学子人数作了如下统计

年份20182019202020212022

时间代号/12345

人数)'(人)567810

附:回归方程3=仪+,中,=t-------,a=y-bT,

ZD

/-I

⑴求关于t的回归方程£=bt+a

⑵用所求回归方程预测兼善中学2023年(t=6)升入北航的人数

【答案】(1)9=12+3.6

(2)11k.

【分析】(1)求线性回归方程,先求出再根据公式求出儿&即可.

(2)将,=6代入回归方程即可.

【详解】(1)这里〃=5了=,合,=昔=3,了=,力,=乎=7.2

〃片5〃H5

nn■一

又£=55-5x32=10,-/?/>,=120-5x3x7.2=12

»=|1=1

从而6=1.2,a=y-/?F=7.2-1.2x3=3.6.

故所求回归方程为亍=12+3.6.

(2)将r=6代入回归方程y=1.2x6+3.6=10.8(人).故升入北航“人.

例6.(2023春・陕西延安•高二陕西延安中学校考期中)某校在一次强基计划模拟考试后,从全体考生中随

机抽取52名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图:

■•■:

r•••••l■■"-r・>.•・-T【*.4二*

...:…炉•••'•

1

•••••

•,•4i

|-1•■___.....

■■1

■■1.....

•■

•■B\

30405060708090100110120130140150数学成绩

根据散点图可以看出丫与x之间有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于重

感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据

505050

后,对剩下的数据作处理,得到一些统计的值:W>,=5800,¥^=3900,2>/=462770,

1=11=1/=|

5050

ZU-H)2=28540,E(X--y)2=18930,其中七,R分别表示这50名考生的数学成绩、物理成绩,i=1,

r=!i=l

2,…,50,y与x的相关系数ru0.45.

⑴若不剔除A,B两名考生的数据,用52组数据作回归分析,设此时y与x的相关系数为ro.试判断ro与

r的大小关系(不必说明理由);

⑵求y关于x的线性回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的

数学成绩为125分),物理成绩是多少?(精确到0.1)

附:线性回归方程中亍=2+3工中:b=1=1;-------------,a=y-bx.

之a-a

【答案】(1)%<小理由见解析

(2)y=0.36x+36.24;81.2分,

【分析】(1)根据已知条件,结合数据的散点图,即可求解;

(2)根据已知条件,结合最小二乘法求得回归直线方程,再将冗二125代入,即可求解.

【详解】(1)解:

理由如下:

由图可知,变量,'与X正相关关系,

①异常点A3会降低变量之间的线性相关程度;

②52个数据点与其回归直线的总偏差更大,回归效果更差,所以相关系数更小;

③50个数据点与其回归直线的总偏差更小,回归效果更好,所以相关系数更大;

④50个数据点更贴近其回归直线八

⑤52个数据点与其|口|归直线更离散.

-150-]&

(2)解:由题设中的数据,可得工=云>>1=116,),=/»产78,

f=i,Ui=i

50--——

所以£(X,7)(E-)')=Ex.y.-50xy=10370,

21r-1

50__

AZ(x,-x)(M-)')]0370__

所以右=-^5----------=—^―«0.36,则4=亍一菽=78-0.36x116=36.24,

28540

1=1

所以回归直线方程为R0.36X+36.24,

将工=125代入回归直线方程,可得$,=0.36x25+36.24=81.24、81.2,

所以估计B考试的物理成绩为81.2分.

举一反三

练习11.(2023・安徽亳州・蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面枳x(单位:公顷)和

野生动物数量y的关系,某研究小组将该地区等面积花分为400个区块,从中随机抽取40个区块,得到样

本数据(与乂)(i=L2,,40),皆分数据如下:

X・•・2.73.63.23.9•••

y・・・50.663.752.154.3・・・

40404040

经计算得:X^=160,W>=2400,2(七一可;160,XU-^)(Z-y)=1280.

J=!/=1i=1r=1

⑴利用最小二乘估计建立y关于K的线性回归方程;

(2)该小组又利用这组数据建立了关于y的线性回归方程,并把这两条拟合直线画在同一坐标系xOy下,

横坐标X,纵坐标y的意义与植被覆盖面积X和野牛.动物数量y一致.设前者与后者的斜率分加为公,J

比较勺,比的大小关系,并证明.

附:y关于X的回归方程y=〃+法中,斜率和截距的最小二乘估计公式分别为:,;=上;^-----—,名=]-质,

储:一"

1=1

^x^-nxy

恪〜回恪资才

【答案】(l)y=8x+28

(2底<内,证明见解析

【分析】(1)根据最小二乘法计算公式求解;

(2)根据相关系数|耳<1证明.

■、……-160,-2400,八,1280。

【详解】(1)x=—=4.y=——=60,/?=——=8,«=60-32=28

4040160

故回归方程为),=8x+28;

Z(-)()~)

(2)x关于y的线性回归方程为/=百=口------------

£()广寸

r-1

则&』辛'""]=/,/为),与主的相关系数,

1=1

又卜归1,K,他>0,故即勺二2,

下证:&产包,

若尢=&,则卜1=1,即y=8%+28(i=l,2,・・,40)恒成立,

代人表格中的一组数据得:50.6=8x2.7+28,矛盾,

故人<内.

综上,,,关于x的回归方程为y=8x+28.

练习12.(2023春陕西宝鸡商三眉县中学校考阶段练习)根据统计,某蔬菜基地西红柿亩产量的增加量V(百

千克)与某种液体肥料每亩使用量X(千克)之间的对应数据的散点图,如图所示.

八M百千克)

7-----------------T

O24568x(千克)

(1)依据数据的散点图可以看出,可用线性回归模型拟合)'与文的关系,请计算相关系数「并加乂说明(若

r>0.75,则线性相关程度很高,可用线性回归模型拟合);

⑵求)'关于4的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:

相关系数公式厂=,=2---------,回归方程y=//+日中斜率和截距的

最小二乘估计公式分别为:〃=」.2“,a=y-bx.

>2一〃/

1=11=1

【答案】(1)答案见解析:

(2)y=0.7x+1.5,9.9百千克.

【分析】(1)利用给定的图象,求出相关系数公式中的相关量,再代入公式计算并判断作答.

(2)利用(1)中信息,结合最小二乘法公式求出回归直线方程,再估计作答.

2+4+5+6+8=3+4+5+6+7

【详解】(1)因为f=~T~=5=5,

^ix/.-x)(x-y)=(-3)x(-2)4-(-l)x(-l)+0x0+lxl+3x2=l4,

r-1

222

X(^-x)=(—3)2+(—1)2+()2+/+32=20,(—2)2+(—1)2+()2+1+2=1O,

1=11=1

£(-)(》-方

147c

>().75

因此相关系数「=卜日j]x/20xx/10~10

悟―TAC

所以可用线性回归模型拟介)'与x的关系.

.£(菁-可回-到14

(2)由(1)知,人=上一-----------=—

za.行20

因此9=o.7x+1.5,当X=12时,y=o.7x12+1.5=9.9,

所以预测液体肥料每亩使用最为12千克时,西红柿亩产展的增加量约为9.9百千克.

练习13.(2023春•贵州黔东南•高三校考阶段练习)随着农村电子商务体系和快递物流配送体系加快贯通,

以及内容电商、直播电商等模式不断创新落地,农村电商呈现高速发展的态势,下表为2017-2022年中国农

村网络零售额规模(单位:千亿元),其中2017-2022年对应的代码分别为1〜6.

年份代码K123456

农村网络零售额)’12.513.717.118.()20.523.02

(1)根据2017-2021年的数据求农村网络零售额规模关于年度代码x的线性回归方程亍=/"+力(4,A的值精

确到0.01);

(2)若由回归方程得到的估计数据与剩下的检验数据的误差不超过1T亿,则认为得到的回归方程是“理想的”,

试判断(1)中所得回归方程是否是“理想的

参考公式:/;=上---------,a=y-bx.

一沅2

/=!

参考数据:£?”55,£>戊=265.7.

/=1/=!

【答案】⑴3=2-03x+10.27

(2)|可归方程是“理想的”.

【分析】(1)根据题设中的公式可求线性回归方程.

(2)根据(1)的结果可计算估计数据与剩卜•的检验数据的误差,从而可判断回归方程是否是“理想”.

1+2+3+4+5r-12.513.717.11820.5

【详解】(I);--------------------=3=++++=1636

5

»/7召

265.7-5x3x16.36

故法与--------=2.03

55-5x9

<=1

故A=16.36-2.03x3=10.27,

故J=2.03x+10.27.

(2)当x=6,由$=2.03x+l0.27可得对应的估计数据为22.45,

此时|22.45-23.02|=0.57<1,

故回归方程是“理想的

练习14.(2023春・广东广州•高三广州市真光中学校考阶段练习)某乡政府为提高当地农民收入,指导农民

种植药材,并在种植药材的土地附近种草放牧发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展

生态循环农业.卜・图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图.并计

算得到i>=480,£X/=2052,岳―尸=25,为(%-初其一用=132,勿吗=>0,

1-1/•11J=Ii=]/"1

々叱一沔(凹-刃=1048,

其中叫=%;.

i=l

w平均收入(千元)

01234567x/年份代码

注:年份代码1-7分别对应年份2016-2022

⑴根据折线图判断,y=〃+瓜与p=c+di=哪一个话它作为平均收入y关千年份代码x的回归方程类型?并

说明理由;

(2)根据(1)的判断结果及数据,建立y关于x的回归方程,并预测2023年该农户种植药材的平均收入.

Xu,-x)(z.-y)

附:相关系数〃=丁泻------:--------回归直线的斜率和截距的最小二乘法估计公式分别为:

V1=1r=l

力心-元)(%一力

人=『;-----------,a=y-bx,2.65.

七(七-守

r=l

【答案】(l)y=a+/比;理由见解析

(2)y=4.71x4-49.71;87.39千元

【分析】(1)由相关系数的计算即可由大小作出判断,

(2)根据最小二乘法即可求解方程,代入即可求值.

【详解】(1)因为天=;(1+2+3+4+5+6+7)=4,

y(X.-x)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4):+(7-4)2=28.

r=l

一菊(凹一乃

132

相关系数IJ7x0.998,

对于模型y=“+法,2"x25

JZa-君2£(y,一切2

V/-Ii-i

7

Z(叱一记)(另一刃

对于模型丁二。+公,相关系数「'=j=l。0.968

喝一沔22(%一田243.3x25

r=1

因为0.998>0.968,>

所以),=〃+加适宜作为平均收入)关于年份代码x的回归方程.

(2)由(1)可知回归方程类型为),=〃+辰,

7

由已知数据及公式可得方=『-----------^=?.4,71,h北去=鸳一至X4=49.7L

287777

元)2

1=1

所以),关于x的回归方程为y=4.7Lt+49.71,

又年份代码1-7分别对应年份2016-2022,所以2023年对应年份代码为8,

代人可得9=4.71x8+49.71=87.39千元,

所以预测2023年该农户种植药材的平均收入为87.39千元.

练习15.(2023春・安徽阜阳•高三安徽省临泉第一中学校考阶段练习)某城市的公交公司为了方便市民出行,

科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间x与乘客等候

人数y之间的关系,经过调查得到如下数据:

间隔时间(X分钟)68101214

等候人数(y人)1518202423

⑴易知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;

(2)建立y关于x的回归直线方程,并预测车辆发车间隔时间为20分钟时乘客的等候人数.

^x^-nxy

附:回归直线,=舐+》的斜率和截距的最小二乘估计分别为6=母——

f=l

否=3一枝;相关系数r=7;3后之11.62.

y-y\

【答案】(1)答案见解析

(2)y=l.lx+9,31人.

【分析】(1)根据相关系数的公式,分别计算数据求解即可;

(2)根据回归直线方程的参数计算公式可得y关丁”的回归直线方程为9=十9,再代入人-20求解即

可.

【详解】(1)由题意,知7=10,y=2O,

5

^l^-x)(y.-y)=(6-10)(15-20)+(8-10)(18-20)+(10-10)(20-2())+(12-10)

r=1

(24-20)+(14—10)(23—20)=20+4+0+8+12=44

丈I:%—天y=16+4+0+4+16=40,^(y.-y)2=25+4+0+16+9=54,

f=lZ=l

44i]

所以砺.又3而*U62,则…⑹

因为y与%的相关系数近似为0.95,说明y与4的线性相关非常高,

所以可以用线性回归模型拟合y与X的关系.

A£(玉-可(一)44

(2)由(1)可得,b=上-.......................=—=11,

£限才40

1=1

则2-锻=20-1.1x10=9,

所以y关于X的I可归直线方程为y=l.lx+9,

当x=20时,3=1.1x20+9=31,

所以预测车辆发车间隔时间为20分钟时乘客的等候人数为31人.

题型四非线性回归方程

例7.(2023•陕西・西北工业大学附属中学校联考模拟预测)为了反映城市的人口数量x与就'业压力指数y之

间的变量关系,研究人员选择使用非线性回归模型),=/V・e看对所测数据进行拟合,并设z=lny,得到的

9779

【分析】由非线性回归模型尸e'e滔和z=l”,得回归直线方程2代入样本点中心即可求

值.

—4+6+8+10~-2+C+5+613+c

【详解】x=------=7,z=-----=---

444

/a79

依题意,z=lny=lne10e,0=—x-—,

7o(+14+/•77Q

而回归直线方程2=木磊过点[7,一]J,故q£=MX琉,解得c=3.

故答案为:3

例H.(2023•江苏镇江.江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数V与温度工有关,现将收

集到的温度占和产卵数y(i=1,2,,10)的10组观测数据作了初步处理,得到如图的散点图及一些统计量表.

10101010£10(—).

Mlr=1r=1r-11=1

36054.5136044384

10C101010

Z1—)2£(—)(,-田zaT(z一)Z(—)(—

r-1/=ii=I/=1

3588326430

_।io

表中4=«,2,二仙凹,5=至工4

IU/=1

350-.•

300-

250-

200,

150-*

100-•

50-*

•1•1•1•」」!」」,

0202224262830323436x

(1)根据散点图判断,y=a+bx,y=〃+〃?/与y=c©/哪一个适宜作为)'与'之间的回归方程模型并求出了

关于x回归方程;(给出判断即可:不必说明理由)

⑵某兴趣小组抽取两批鱼卵,已知第一批中共有6个鱼卵,其中“死卵”有2个;第二批中共有8个鱼卵,

其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数

学期望.

附:对于一组数据(%,匕),(〃2,玲),(/,匕),其回归直线y=0+如的斜率和截距的最小二乘估计分别为

2(4-初匕-D)

P=启r-----------、a=v-pil.

r=1

【答案】(1)),=qe'/适宜,y=小"

17

(2)分布列见解析,—.

【分析】(i)根据散点图判断,看出样本点分布在一条指数函数的周围,所以丁=罕2适宜作为y与x之间

的回归方程模型;令z=lny,转化线性回归方程求解,进而得了关于“回归方程;

(2)由题意,J的取值为0J2,由全概率公式求得对应的概率,从而可求分布列及数学期望.

【详解】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,

所以,,=适宜作为y与X之间的回归方程模型;

10

X(苦-工)(zD32]

令z=ln),,则2=&工+1119,。2=^4^-----------=—=—»

Z(—)238412

f=l

Inq=z-c2x=1.4,z=-^x+\A,

•••y关于X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论