第3节 成对数据的统计分析_第1页
第3节 成对数据的统计分析_第2页
第3节 成对数据的统计分析_第3页
第3节 成对数据的统计分析_第4页
第3节 成对数据的统计分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3节成对数据的统计分析

考试要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2X2列

联表,会运用这些方法解决简单的实际问题.

知识诊断•基础夯实

【知识梳理】

1.变量的相关关系

(1)相关关系的分类:正相关和负相关.

(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在

一条直线附近,我们就称这两个变量线性相关.

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量

非线性相关或曲线相关.

2.样本相关系数

(1)相关系数r的计算

变量x和变量y的样本相关系数r的计算公式如下:

n--

£Cxi-x)(yy—y)

_______[___________

rl~n-l~n-'

A/LCxi-x)ECyi—y)2

(2)相关系数厂的性质

①当厂>()时,称成对样本数据正相关;当/(()时,成对样本数据负相关;当r=0

时.,成对样本数据间没有线性相关关系.

②样本相关系数r的取值范围为「一1,11.

当H越接近1时,成对样本数据的线性相关程度越强;

当H越接近0时,成对样本数据的线性相关程度越弱.

3.一元线性回归模型

⑴我们将、晨+)称为丫关于工的经验回归方程,其中

n-n

£(X/—x)(»—y)X.Xiyj—nxy

=1z=l-

I£(刘一K)2£Xr-nx-

i=1i=l

A-A一

^a=y-bx.

(2)决定系数

nA.

LCyi—yi)2

岸=1一口----------,我越大,即拟合效果越好,改越小,模型拟合效果越差.

£n(y/—y)-——

/=1

4.列联表与独立性检验

(1)关于分类变量X和y的抽样数据的2X2列联表

Y

X合计

r=or=i

x=oaba~\~b

x=\cdc+d

合计a+cb+d〃=〃+/?+c+d

记〃=a+b+c+d,则随机变量/=(〃+6)-;+"+冷.

⑵独立性检验

基于小概率值a的检验规则是:

当Z22心时,我们就推断“0不成立,即认为x和y不独立,该推断犯错误的概

率不超过a;

当/Vx〃时,我们没有充分证据推断“0不成立,可以认为X和丫独立.

卜表给出了Z2独立性检验中几个常用的小概率值和相应的临界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

[常用结论]

1.求解经验回归方程的关键是确定回归系数;k应充分利用经验回归直线过样

本点的中心a,y).

2.根据z2的值可以判断两个分类变量有关的可信程度,若/越大,则两个分类变

量有关的把握越大.

【诊断自测】

1.思考辨析(在括号内打“J”或“X”)

⑴散点图是判断两个变量是否相关的一种重要方法和手段.()

(2)通过经验回归方程;=晨卜:可以估计预报变量的取值和变化趋势.()

⑶只有两个变量有相关关系,所得到的回归模型才有预测价值.()

(4)事件X,y关系越密切,则由观测数据计算得到的/的值越大.()

答案⑴J(2)V(3)V(4)V

2.(选修三P103T1改编)两个变量的相关关系有:①正相关;②负相关;③不相关,

则下列散点图从左到右分别反映的变量间的相关关系是()

)yy

oxoxox

A.①②③B.②③①

C.②①③D.①③②

答案D

解析第一个图大体趋势从左向右上升,故正相关,第二个图不相关,第三个图

大体趋势从左向右下降,故负相关,故选D.

3.(多选)在统计中,由一组样本数据(xi,yi)>。2,y2),…,(x〃,知)利用最小二乘

法得到两个变量的经验回归方程为;,=£+;那么下列说法正确的是()

AAA——

A.直线必经过点(x,y)

B.直线;,=£+;表示最接近),与犬之间真实关系的一条直线

C.相关系数为心且仍越接近于1,相关程度越大;团越接近于0,相关程度越小

D.用决定系数收来刻画回归效果,R?越小说明拟合效果越好

答案ABC

解析直线丁=法+〃必过样本点中心即点(工,y)f故A正确;直线),=法+。是采

用最小二乘法求解出的直线方程,接近真实关系,故B正确;相关系数〃的绝对

值越接近于1,表示相关程度越强,越接近于0,相关程度越弱,故C正确;用

决定系数N来刻画回归效果,N越大,说明模型的拟合效果越好,故D错;吴.

4.(多选)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的

数据,绘制了如下所示的2X2列联表(个别数据暂用字母表示):

幸福感强幸福感弱合计

阅读量多m1872

阅读量少36n78

9060150

计算得:12.981,参照下表:

a0.100.050.0250.0100.0050.001

Xa2.7063.8415.0246.6357.87910.828

对于下面的选项,正确的是()

A.根据小概率值。=0.01()的独立性检验,可以认为“阅读量多少与幸福感强弱无

关”

B."z=54

C.根据小概率值a=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前

提下认为“阅读量多少与幸福感强弱有关”

D.〃=52

答案BC

解析•・•/-12.981>7.879>6.635,

・•・根据小概率值a=0.010的独立性检验,可以在犯错误的概率不超过1%的前提

下认为“阅读量多少与幸福感强弱有关”,

根据小概率值。=0.005的独立性检脸,可以在犯错误的概率不超过0.5%的前提

下认为“阅读量多少与幸福感强弱有关”,

・・・A错,C正确,

,.・根+36=90,18+〃=6(),

=54,〃=42,

AB正确,D错.

考点突破•题型剖析

考点一成对数据的相关性

例1(1)(多选)下列各图中,两个变量X,y具有相关关系的是()

y

o

A

o

c

答案CD

解析相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;

若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关,故选CD.

(2)(多选)下列有关经验回归分析的说法中正确的有()

A.经验回归直线必过点(x,y)

B.经验回归直线就是散点图中经过样本数据点最多的那条直线

C.当样本相关系数—>0时,两个变量正相关

D.如果两个变量的相关性越弱,则仍就越接近于0

答案ACD

解析对于A,经验回归直线必过点(x,),),故A正确;

对于B,经验回归直线在散点图中可能不经过任一样本数据点,故B不正确;

对于C,当样本相关系数一>0时,则两个变量正相关,故C正确;

对丁D,如果两个变量的相关性越弱,则m就越接近丁(),故D正确.

感悟提升判定两个变量相关性的方法

(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角

到右下角,两个变量负相关.

⑵样本相关系数:当,>0时,正相关;当一<0时,负相关;M越接近于1,相关

性越强.

(3)决定系数法:利用决定系数判定,R2越接近1,模型的拟合效果越好,相关性

越强.

训练1(1)在一组样本数据(XI,yi),(X2,”),…,(X,”y“)(〃22,XI,X2,…,Xn

不全相等)的散点图中,若所有样本点(刘,,)(,=1,2,…,〃)都在直线y=—%

+1上,则这组样本数据的样本相关系数为()

A.—1B.0

C.-:D.1

答案A

解析因为样本点在直线丁=一%+1上,呈现完全负相关,样本相关系数为-1.

(2)变量X与y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,

5):变量U与,相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),

(13,1)0表示变量y与x之间的线性相关系数,n表示变量u与V之间的线性

相关系数,则()

A.r2<n<0B.0</,2<n

C.r2<0<nD.r2=n

答案C

解析由已知中的数据可知,第一组数据中变量y与x之间成正相关,相关系数

n>0,第二组数据中变量U与V之间成负相关,相关系数n<0,

即nVOVn

考点二回归分析

角度1线性回归分析

例2(2023•德州模拟)2021年12月17日,工信部发布的《“十四五”促进中小企

业发展规划》明确提出建立“百I•万T”的中小企业梯度培育体系,引导中小企

业走向“专精特新”“小巨人”“隐形冠军”的发展方向.“专精特新”是指具

备专业化、精细化、特色化、新颖化优势的中小企业.如表是某地各年新增企业数

量的有关数据:

年份(年)20172018201920202021

年份代码。)12345

新增企业数量(),)817292442

请根据上表所给的数据,求出),关于x的线性回归方程,并预测2024年此地新增

企业的数量.

参考公式:回归方程;=:+晟中,斜率和截距的最小二乘法估计公式分别为

AN(Xi~x)(jL))A-A-

b-,a=y—bx.

昌(X/-x)2

1+2+3+4+5

解x=c=3,

8+17+29+24+42

尸--------7--------=24

M(H—x)G,i—y)=(—2)X(—16)+(—l)X(—7)+0X5+lX0+2X18=75,

51

玄(x,—X)2=4+1+0+1+4=10,

5~~

AZ(x/—x)(yi—y)

所以/?=-5-=7.5,

高(xi-x)2

a=y—bx=\.5,所以y=1.5+7.5x.

当x=8时,由线性回归方程可得;,=61.5,

所以估计2024年此时新增企业的数量约为62家.

角度2非线性回归分析

例3(2023・淄博诊断)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱.其幼苗从观

察之日起,第x天的高度为),cm,测得数据如下:

/p>

y0479111213

数据的散点图如图所示:

1()2()3()4050«

为近似描述),与x的关系,除了一次函数;=£+;,还有(=,也+:和;=Q+:

两个函数可选.

(1)从三个函数中选出“最好”的曲线拟合),与犬的关系,并求出其回归方程(,保

留到小数点后1位);

(2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并

给出理由.

n-一〃

A(XLx)(y,-y)^.Xiyi-nxy人-人一

参考公式:b='■=~,a=y-bx.

£(X/—x)2YyXT-nx1

参考数据(其中iii=yjxhti=x1):x=20,

w=4,1=668,y=8,ax?=4676,N〃?=140,

7777

£3=7907396,二孙=1567,283,£伊=56575.

解(1)从散点图可以看出,曲线的形状与函数),二5相似,

故选择函数y=Z?也+a拟合y与x的关系.

;283-7X4X859.

b=140-7X42=28^2,1,

A

4=8—2.1X4=—0.4,

其经验回归方程为:,=2.1五一0.4.

⑵将y=1()0(),1()()1分别代入经验回归方程,得

2.16一0.4=1000和2.1而一0.4=1001,

(\001.4V000.4V/一

故厂J-{TT)~454,

显然454>365,

说法“高度从1000cm长到1001cm所需时间超过一年”成立.

感悟提升回归分析问题的类型及解题方法

(1)求经验回归方程

①当两个系数均未知时,可利用公式法求解;

②当两个系数已知一个求另一个时,可利用经验回归直线过样本点的中心求解.

(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值.

(3)经验回归方程的拟合效果可以利用相关系数判断,当|八越趋近于1时,两变量

的线性相关性越强.

训练2为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家

进行技术指导,根据统计,该田园综合体西红柿亩产量的增加量),(千克)与某种液

体肥料每亩使用量以千克)之间的对应数据如下:

x(千克)24568

y(千克)300400400400500

(1)由上表数据可知,可用经验回归模型拟合),与x的关系,请计算样本相关系数

r并加以说明(若仍>0.75,则线性相关程度很高,可用经验回归模型拟合);

(2)求),关于x的经验回归方程,并预测当液体肥料每亩使用量为15千克时,西

红柿亩产量的增加量约为多少千克?

n~~

E,(xi-x)()Ly)

附:相关系数4=;,

2

(rr)上(yi-y)

回归方程;,=:+的斜率和截距的最小二乘估计公式分别为,=

n

N(XLX)(yi-y)

n-f

宫(Xi-X)2

a=y-bx,

解(1)由已知数据可得X=2+4+;+6+8=5,

J

300+400+400+400+500

y=---------------------------------=400,

5-

所以玄(H-x)(y—y)=(—3)X(—100)+(—l)X0+0X0+lX0+3X100=600,

(X/-X)2=yl(-3)2+(-1)2+02+l2+32=2^5,

22222

A/;£,Cyi-y)(-100)+0+0+0+100=10072,

g(刘―Qy)600__3_

所以样本相关系数,•=

也Ge「嗝|…一2回卡次

^0.95>0.75.

所以可用经验回归模型拟合),与x的关系.

5

AZCxi-x)(yi-y)

600=30

(2)b=~5一20—30,

春(X/—X)2

々=400—5X30=250,

所以经验回归方程为;=30x+250.

当x=15时,y=30X15+250=700(千克),

即当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为700千克.

考点三独立性检验

例4(2021•全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品

和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,

产品的质量情况统计如下表:

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

⑴甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)依据小概率值a=0.01的独立性检验分析甲机床的产品质量与乙机床的产品质

量有差异.

nlad-be)2

=

附:)C(〃+b)(c+d)(〃+c)(〃+d)'

a0.10.050.010.005

Xa2.7063.8416.6357.879

解(1)根据题表中数据知,甲机床生产的产品中一级品的频率是黑=0.75,乙机

4UU

床生产的产品中一级品的频率是丽=0.6.

(2)零假设为H。:甲机床的产品质量与乙机床的产品质量无差异.

ggg七上迎以9./口0400X(150X80-120X50)2400

根据通表中的数据可向z2=nnnvonnvo-7nYi10.256>6.635

ZUU入ZUU入Z/U入1JUoJ

=X0.0l.

根据小概率值。=0.01为/独立性检验,没有充分证据推断“0成立,

因此可以认为从不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.

此推断犯错误的概率不大于0.01.

感悟提升独立性检验的一般步骤

(1)根据样本数据制成2X2列联表.

Q)根据公式炉=("(­八I卜算.

入ka-rb)(c+d)(a+c)(Z?+d)

⑶比较Z2与临界值的大小关系,作统计推断.

训练3某学生兴趣小组随机调查了某市10()天中每天的空气质量等级和当天到某

公园锻炼的人次,整理数据得到下表(单位:天):

人次

空气质量羲、[0,2001(200,400](400,600]

1(优)21625

2(良)51012

3(轻度污染)678

4(中度污染)720

⑴分别估计该市一天的空气质量等级为1,2,3,4的概率;

⑵求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中

点值为代表);

(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质

量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2X2

列联表,并根据列联表,能否在犯错误的概率不超过().05的前提下,认为一天中

到该公园锻炼的人次与该市当天的空气质量有关?

人次W400人次>400

空气质量好

空气质量不好

n{ad—be)2

附:/=

(〃+力)(c+d)(a+c)(/?+")'

a0.0500.0100.001

Xa3.8416.63510,828

解(1)由所给数据,得该市一天的空气质量等级为1,2,3,4的概率的估计值

如下表:

空气质量等级1234

概率的估计值0.430.270.210.09

⑵一天中到该公园锻炼的平均人次的估计值为福(100X20+300X35+500X45)

=350.

(3)根据所给数据,可得2X2列联表:

人次W400人次>400

空气质量好3337

空气质量不好228

零假设为Ho:一天中到该公园锻炼的人次与该市当天的空气质量无关.

IOOX(33X8—22X37)2

根据列联表得好=一~5.820>3.841=xo.o5.

55X45X70X30

根据小概率值。=0.050的/独立性检验,可推断”。不成立,所以在犯错误的概

率不超过0.05的前提下,可认为一天中到该公园锻炼的人次与该市当天的空气质

量有关.

分层精练•巩固提升

【A级基础巩固】

1.(2023・湘豫名校模拟)根据如表样本数据:

X23456

y42.5—0.5-2-3

得到的经验回归方程为丁=陵+。,则()

A.40,/?>()B.a>0,b<0

C.〃V(),/?>()D.aVO,b<0

答案B

八-2+3+4+5+6

解析由表中的数据可得,变量)随着x的增大而减小,则bV(),x=—二—

=4,

4+2.5-0.5-2-3

尸5=°2

又经验回归方程;=£+:经过点(4,0.2),可得:>0.

2.甲、乙、丙、丁四位同学各自对4,8两个变量的线性相关性做试验,并用回归

分析方法分别求得样本相关系数r与残差平方和〃?,如下表:

甲乙丙T

r0.820.780.69().85

tn106115124103

则哪位同学的试验结果体现4,3两个变量有更强的线性相关性?()

A.甲BZ

C.丙D.T

答案D

解析〃的绝对值越大,山越小,线性相关性越强.

3.某种产品的广告费支出x与销售额y(单位:万元)之间的关系如下表:

X24568

y3040605070

y与x的经验回归方程为;,=6.5x+17.5,当广告支出6万元时,随机误差的残差

为()

A.-5B.-5.5

C.-6D.—6.5

答案D

解析由题意结合经验回归方程的预测作用可得,当x=6时,>-6.5X6+17.5

=56.5,则随机误差的残差为50—56.5=-6.5.

4.(2023・南昌模拟)某公司在2019〜2023年的收入与支出情况如下表所示:

收入M亿元)2.22.64.05.35.9

支出M亿元)0.21.52.02.53.8

根据表中数据可得经验回归方程为;,=0.8x+;依此估计该公司收入为8亿元时

的支出为()

A.4.2亿元B.4.4亿元

C.5.2亿元D.5.4亿元

答案C

解析根据题表中的数据,

得x=]x(2.2+2.6+4.0+5.3+5.9)=4,

y=!x(0.2+1.5+2.0+2.5+3.8)=2,

J

A

・・・。=2—0.8乂4=-1.2,

A

・•・经验回归方程为y=0.网一1.2,

A

当x=8时,),=().8乂8—1.2=5.2(亿元),

即该公司收入为8亿元时的支出为5.2亿元.

5.(多选)(2023•深圳模拟)某人工智能公司近5年的利涧情况如下表所示:

第X年12345

利润w亿元23457

已知变量y与x之间具有线性相关关系,设用最小二乘法建立的经验回归方程为;

=1.2%+;则下列说法正确的是()

A.。=0.6

B.变量y与x之间的线性相关系数r<()

C.预测该人工智能公司第6年的利润约为7.8亿元

D.该人工智能公司这5年的利润的方差小于2

答案AC

14-2+3+4+5-2+34-4+5+721

解析由题表可知,x=5=3,y=5=5=4.2,

由经验回归直线恒过点(尤,y),得4.2=1.2X3+m即々=0.6,故A正确;

由A可得经验回归方程为;=1.2r+().6,显然为正相关,其相关系数r>0,故B

错误;

A

令x=6,则),=1.2X6+0.6=78故C正确;

该人工智能公司这5年的利润的方差?=1x[(2-/1.2)2+(3-d.2)2+0-/|.2)2+(5

-4.2>+(7—4.2)2]=2.96>2,故D错误.

6.(多选)(2023・大连模拟)变量x与变量),的20对数据记为(r,M,其中拒N*,运20,

冲点即,尸点鲁产,根据最小二乘法求得经验回归方程是产区+〃,变量间的

相关系数为八则下列说法中正确的是()

A.利用经验回归方程计算所得的;•与实际值y,•必有误差

B.经验回归直线),=Z?x+〃必过点(x,y)

C.若所有的点8,刈都在经验回归直线;,=£+联上,则仍=1

D.若变量x与),正相关,则Q>()

答案BCD

解析对于A,若所有样本点都在经验回归直线二,则;,•与v相等,故A错误;

对于B,经验回归直线;=£+;必过样本数据的中心点(x,y),故B正确;

对于C,若所有样本点都在经验回归直线上,则变量间的相关系数为±1,即仍=1,

故C正确;

对于D,变量x与y正相关,则->0,故D正确.

7.(多选)下列说法正确的是()

A.设有一个经验回归方程;,=3—5达变量/增加一个单位时,),平均增加5个单位

B.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近

于1

C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高

D.在一元线性回归模型中,决定系数代越接近于1,说明回归的效果越好

答案CD

解析A中,因为y=3—5%,所以变量x增加一个单位时,y平均减少5个单位,

故A错误;

B中,线性相关性具有正负,相关性越强,则样本相关系数,•的绝对值越接近于

1,故B错误;

C中,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的

拟合精度越高,故C正确;

D中,在一元线性回归模型中,决定系数产越接近于1,说明模型拟合的精度越

高,即回归的效果越好,故D正确.

8.已知x和y的散点图如图所示,在相关关系中,若用)=oeC2x拟合时的决定系

数为而用;=鼠+:拟合时的决定系数为冠则就此中较大的是________.

3M

2(M

2M5X

1X

1(M

X5M1

/

(78)(

M5

答案Ri

解析由散点图知,用),=oe它拟合的效果比

拟合的效果要好,

所以居〉虺,故较大者为心.

9.(2023•青岛模拟)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密

度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:

接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培

训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是

否集中培训有关”犯错误的概率不超过________.

附:州=(»)(;+:【::,)(〃+</)'其中〃=〃+^+c+a

a0.050.0250.0100.001

Xa3.8415.0246.63510.828

答案0.025

解析由题意可得列联表如下,

培训方式

合计

集中分散

一次考过453075

一次未考过102030

合计5550105

105X(45X20—10X30)2

一七6.109>5.024fo.025.

55X50X75X30

10.某市物价部门对本市的5家商场的某商品一天的销售量及其价格进行调查,5

家商场的售价x(元/件)和销售量),(件)的数据如下表所示:

售价X99.5m10.511

销售量),11n865

由散点图可知,销售量y与售价x之间有较强的线性相关关系,其经验回归方程

是y=-3.2x+40,且阳+n=20,则其中的〃=

答案10

9+9.5+〃z+10.5+11m

解析犬=---------5---------=8+百,

11+〃+8+6+5,n

尸5=叫,

回归直线一定经过点(x,旦

即6+5=—3.2(8+9+40,

即32〃+〃=42.

又〃z+〃=20,所以“7=10,71=10.

11.(2022.全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计

一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截

面积(单位:m?)和材积量(单位:m)得到如下数据:

样本

12345678910总和

号i

根部0.040.060.040.080.080.050.050.070.070.060.6

横截

面积

Xi

材积

0.250.400.220.540.510.340.360.460.420.403.9

量》

101010

并计算得百斤=0.038,岳»=1.6158,区汨v=0.2474.

⑴估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横

截面积总和为186nf.m知树木的材积量与其根部横截面积近似成正比.利用以上

数据给出该林区这种树木的总材积量的估计值.

E(X/—x)(y-y)____

附:相关系数4=J”〃,3.896y1.377.

寸£(xi-x)2方(y—y)2

解(1)样本中10棵这种树木的根部横截面积的平均值x=^=0.06(m2),

样本中1()棵这种树木的材积量的平均值y=/3=90.39(m3),

据此可估计该林区这种树木平均一棵的根部横截面积为0.06n?,平均一棵的材积

量为().39nR

10

»(不一T)(y—J)

(2)r=-1

10,10,

710

2cM-1()三歹

_;=1

/(XJ-.-1072—ioy2)

V1-11-1

___________0.2474—10X0.06X0.39__________

(0.038-10X0.062)(1.6158-10X0.392)

0.01340.0134…

=~,y-----------〜n07

1().()()()18960.01377,,

(3)设该林区这种树木的总材积量的估计值为

又已知树木的材积量与其根部横截面积近似成正比,

0.06_186

可得039~-解得y=l209.

则该林区这种树木的总材积量估计为1209m3.

12.(2023•青岛模拟)为进一步保护环境,加强治理空气污染,某市环保监测部门对

市区空气质量进行调研,随机抽查了市区100天的空气质量等级与当天空气中SCh

的浓度(单位:4g/m〉整理数据得到下表:

勺浓度

[0,50](5(),150](15(),475]

空气质量

1(优)2862

2(良)578

3(轻度污染)389

4(中度污染)11211

若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量

等级为3或4,则称这天“空气质量不好”,根据上述数据,回答以下问题.

⑴估计事件”该市一天的空气质量好,且SO2的浓度不超过150”的概率;

⑵完成下面的2X2列联表.

SO2的浓度

合计

ro,1501(150,475]

空气质量好

空气质量不好

合计

(3)根据(2)中的列联表,依据小概率值。=0.01的独立性检验,能否据此推断该市

一天的空气质量与当天SO2的浓度有关?

解(1)由表格可知,该市一天的空气质量好,且SO2的浓度不超过150天的天数

为28+6+5+7=46,

则“该市一天的空气质量好,且SO?的浓度不超过150”的概率2=盖=0.46.

⑵由表格数据可得到列联表如下:

SO2的浓度合计

[0,150](150,475]

空气质量好461056

空气质量不好242044

合计7030100

⑶零假设为Ho:该市一天的空气质量与当天SO2的浓度无关.

100X(46X20-24X10)2

由(2)知/=一七8.936>6.635=xo.oi,

70X30X56X44

根据小概率值a=0.01妁z2独立性检验,没有充分证据推断”0成立,因此可以认

为H)不成立,即认为该市一天的空气质量与当天SCh的浓度有关.

【B级能力提升】

13.己知变量),与x的一组数据如表所示,根据数据得到),关于x的经验回归方程

X1234

ybc'e5c6

若;,=/,则x等于()

A.6B.7

C.8D.9

答案B

解析由〉=9"一|,得Iny=bx~\,

令z=lny,贝1Jz=Z?x—1,

Lttc上〃一1+2+3+4

由冠思知,x==2.5,

2+34-5+6

z=4=%

因为(x,z)满足z=bx—1,

所以4=〃X2.5—1,解得力=2,

所以z=2x—1,所以y=e1r,

令eWe",解得工=7.

14.(多选)(2023・武汉调圻)某班级学生开展课外数学探究活动,将一杯冷水从冰箱

中取出后静置,在25C的室温下测量水温y(单位:℃)随时间N单位:min)的变

化关系,在测量了15个数据后,根据这些实验数据(myi)(i=1,2,…,15)得到

如下的散点图:

温度/七

15------------------------------

10-*--------------------------------

---------------------------------

°102()3。时间/min

现需要选择合适的回归方程进行回归分析,则根据散点图,合适的回归方程类型

有()

A.y=25—cie3B.y=25-\-yjc\x-\~C2

C.y=25--3—D.y=ci(JV—25)+C2

C1X十C2

答案AC

解析题中散点图的特点是单调递增,增长速度越来越慢,且y<25.

对于A,当a,C2>0时,),=一。上一呼为增函数,且其增长速度逐渐减小且小于

0,故可能符合,故A正确;

对于B,该函数值大于25,故B错误;

对于C,当°,c>0时,y=一为增函数,其增长速度逐渐减小且小于0,

'CIX+C'2

故可能符合,故C正确;

对于D,当ci>0时,y=cix为直线,与散点图不符合,故D错误.

15.(多选)已知由样本数据(即,》),i=l,2,3,4,5,6,求得的经验回归方程为

;=2丫

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论