第03讲 成对数据的统计分析 精讲(解析版)-高考数学备考复习重点资料归纳_第1页
第03讲 成对数据的统计分析 精讲(解析版)-高考数学备考复习重点资料归纳_第2页
第03讲 成对数据的统计分析 精讲(解析版)-高考数学备考复习重点资料归纳_第3页
第03讲 成对数据的统计分析 精讲(解析版)-高考数学备考复习重点资料归纳_第4页
第03讲 成对数据的统计分析 精讲(解析版)-高考数学备考复习重点资料归纳_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第03讲成对数据的统计分析(精

讲)

目录

第一部分:知识点精准记忆

第二部分:课前自我评估测试

第三部分:典型例题剖析

题型一:成对数据的相关性

题型二:回归分析

角度1:经验回归方程及应用

角度2:非线性经验回归方程及应用

角度3:相关系数一

角度4:残差分析

题型三:列联表与独立性检验

第四部分:高考真题感悟

第一部分:知识点精准记忆

知识点一:变量的相关关系

⑴两个变量有关系,但又没有确切到可由其中一个去精掰地决定另一个的程度,这种关系称

为相关关系.

(2)正相关、负相关

从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两

个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两

个变量负相关.

(3)线性相关、非线性相关

一般地,如果两个变量的取值呈现正相关或负相关,而且放点落在一条直线附近,我们就称这

两个变量线性相关.

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或

曲线相关.

知识点二:样本相关系数

(1)相关系数,•的计算

变量%与变量y的样本相关系数,•的“算公式如下:

r=-________

Vi=lV1=1

(2)相关系数r的性质

①当,•>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.

当/•=()时,成对样小数据间没有线性相关关系.

②样本相关系数r的取值范围为[-1』],当1川越接近1时,成对样本数据的线性相关程度越

强;当Iri越接近0时,成对样本数据的线性相关程度越弱.

知识点三:一元线性回归模型

Y=bx+a+e

(1)数学表述式:如果两个变量之间的关系可以表示为

E(e)=0,D(e)=a2

我们称该式为y关于人的一元线性回归模型.

其中)称为因变量或响应变量,1称为a变量或解释变量;。和〃为模型的未知参数,a称为

截距参数,〃称为斜率参数;e是y与bx+ci之间的随机误差.

(2)经验回归方程

我们将),=法+〃称为y关于x的经验回归方程,也称经验I可归函数或经验回归公式,其图

2(M-x)(y-y)

b二千--------——

形称为经验回归直线,其中汽(七-工)2

/=1

a=y-bx

(3)利用R2刻画回归效果

)2〃

R2的计算公式为R-=T------,其意义是R2越大,残差平方和-X)2越小,

i・l

即模型的拟合效果越好;R?越小,残差平方和越大,即模型的拟合效果越差.

知识点四:列联表与独立性检验

(1)2x2列联表

如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2x2列联表.

XY合计

r=oY=\

x=oaba+b

x=\cdc+d

合计a+cb+dn=a+b+c+d

(2)独立性检验

2

依据上述2x2列联表构造统计量二n(ad-bc)

(。+b)(c+d)(a+c)(b+d)

利用z2的取值推断分类变量x和y是否独立的方法称为/独立性检验,读作“卡方独立性

检验”,简称独立性检验.

常用的小概率值和临界值表

a0.10.050.010.0050.001

42.7063.8416.6357.87910.828

第二部分:课前自我评估测试

I.(2022.重庆.高二阶段练习)甲、乙、丙、丁四位同学各自对KN两变量的线性相关性做试

验,分别求得样本相关系数〃,如下表:

甲乙丙T

r0.20-0.95-0.120.85

则试验结果中M.V两变量有更强线性相关性的是()

A.甲B.乙C.丙D.T

【答案】B

【详解】由己知,乙的相关系数的绝对值为"=0.95,是四人中最大的,因此乙同学有更强

的相关性.

故选:B.

2.(2022・全国•长垣市第一中学高三开学考试(文))在研究线性回归模型时:样本数据

(xp>;.)(/=1,2,3,,〃)所对应的点均在直线),=-;x+3上,用配表示解释变量对于预报变

量变化的贡献率,则店=()

A.-IB.--C.1D.2

2

【答案】C

【详解】因为样本数据所对应的点都在直线y=-gx+3上,所以*=].

故选:C

3.(2022•河南南阳•高二期末(文))对两个变量x与进行回归分析,有4个不同模型可

供选择,其中拟合效果最好的是()

A.模型1的相关系数「为-0.95B.模型2的相关系数,•为0.89

C.模型3的相关系数「为0.36D.模型4的相关系数〃为Q.33

【答案】A

【详解】对于模型而言,当卜|越接近于1,则模型的拟合效果越好,故拟合效果最好的模型

1.

故选:A.

4.(多选)(2022•全国•高二课时练习)下列散点图中,变量X,丫可用直线拟合的是()

y.

A.

D.

【答案】AB

【详解】由题可知A,B中的点落在一条直线附近,故其变量X,丫有近似的线性关系:

c,D中的点没有落在一条直线附近,故其变量X,丫不具有近似的线性关系.

故选:AB.

5.(2022•山东济宁•高二期末)下列命题中正确的是()

A.在回归分析中,成对样本数据的样本相关系数;•的绝对值越大,成对样本数据的线性相

关程度越强

B.在回归分析中,可用决定系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果

越好

C.比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效

果越差

D.对分类变量x与匕统计量/的值越大,则判断“X与y有关系”的把握程度越大

【答案】ABD

【详解】相关系数的绝对值越大,相关程度越强,A正确;

决定系数越大,拟合效果越好,故B正确;

残差平方和越小,模拟效果越好,故C错误;

统计量/的值越大,分类变量X与y相互独立的概率越小,即判断“X与y有关系”的把握

程度越大,故D正确.

故选:ABD

6.(2022.全国.高二课时练习)中国射击队在东京奥运会上共获得4金1银6铜,共II枚

奖牌的成绩,创下了中国射击队奥运参赛史上奖牌数最多的新纪录.现从某射击训练基地随

立2x2列联表,并判断是否有90%的把握认为成绩优异与性别有关.

参考公式和数据:n=a+b+c+d

(a+b)(c+d)(a+c)(b+d)*

P(K2>k)0.100.050.010

k2.7063.8416.635

【答案】列联表见解析;没有90%的把握认为成绩优异与性别有关.

【详解】由己知数据可得2x2列联表如下:

男生女生总计

成绩优异437

成绩不优异6713

总计1()1()20

六_20X(4X7-3X6『

«0.2198<2.706•

7x13x10x10

・•・没有90%的把握认为“成绩优异”与性别有关.

第三部分:典型例题剖析

题型一:成对数据的相关性

典型例题

例题1.(2022•北京通州•高二期末)对三组数据进行统计,获得以下散点图,关于其相关

系数依次是小4,G,则它们的大小关系是()

VVJV

•-

353535

3O3O3O

252525

2O2O2O

151515

101010

555

C>5101520253035%(95101520253035x(95101520253035x

A.弓B.f\>r2>ryC.D.G>4>4

【答案】A

【详解】解:由散点图可知,图一两个变量成正相关,且线性相关性较强,故.乃,

图二两个变量成负相关,且线性相关性较强,故5<-0.75,

图三两个变量线性相关性较弱,故同<。75,

所以4>4>G;

故选:A

例题2.(2022•江苏淮安•高二期末)对四组数据进行统计后,获得了如下图所示的散点图,

对于其相关系数的比较,下列说法正确的是()

yw「小

相关系数为:相关系数为小相关系数为:相关系数为:

A.4v4vOv4v?B.Gv彳<0<r2<4

C.&<,3<()<q<4D.,j<〃<0<G<与

【答案】C

【详解】由题意可知,第一、四组数据正相关,第二、三组负相关,

当相关系数的绝对值越大,数据的线性相关性越强,

且第一组数据的线性相关性较第四组强,则4>〃>(),

第二组数据的线性相关性较第三组强,则同〉同且4<0,则为“<0.

因此,弓

故选:C.

例题3.(2022•河南信阳•高二期末(文))若一组观测值(为,%),(巧,幻,…,(土,”)(〃21。)

对应的点位于同一直线上,则X,y的相关系数为.

【答案】±1

【详解】由已知条件和相关系数的定义得,-y的相关系数为±1.

故答案为:±1

同类题型归类练

1.(2022•河南驻马店•高二期末(理))相关变量x,),的散点图如图所示,现对这两个变

量进行线性相关分析.方案一:根据图中所有数据,得到回归直线方程)=切丫+%,相关系

数为、方案二:剔除点(10,32),根据剩下的数据得到回归直线方程),=打工+%,相关系

数为5.则()

C.-1</;</;<0D.-1</;</;<0

【答案】D

【详解】由散点图可知这两个变量为负相关,所以4<0百<0.

因为剔除点(10,32)后,剩下点的数据更具有线性相关性,|目更接近1,

所以一1<々<彳<0.

故选:D.

2.(2022•陕西西安・高二期末(理))小华为了研究数学名次和物理名次的相关关系,记录

了本班五名同学的数学和物理的名次,如图.后来发现第四名同学数据记录有误,那么去掉

数据。(3,10)后,下列说法错误的是()

2)

0,1

•£(1

理y

)

,10

次•Q(3

,5)

•c(4

,4)

•8(2

____x

_____

_____

_____

_____

_____

名次

数学

°

变大

方和

差平

B.残

〃变

系数

相关

线性

样本

A.

近于1

,•越趋

系数

相关

线性

D.

变强

程度

相关

y的

量X、

C.变

】B

【答案

相关

为正

,且

度变强

相关程

的线性

y与x

后,

(310)

掉。

,去

点图知

】由散

【详解

于1,

越趋近

系数「

性相关

,且线

「变大

所以

小.

和变

平方

残差

均匀,

分布更

,散点

0)后

7)(3,1

去掉

误.

,B错

D正确

故AC

B.

故选:

图,

的散点

图所示

获得如

统计,

据进行

四组数

末)对

二期

州•高

广东潮

022•

)(2

(多选

3.

的有

,正确

的关系

关系数

于其相

20

20

20

15

15

15

10

10

1()

5

5

5

9

6

3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论