




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高二数学《考点•题型•技巧》精讲与精练高分突破系列(人教A版选择性必修第三册)
第八章成对数据的统计分析
8.1成对数据的统计相关性
【知识梳理】
知识点一相关关系
1.相关关系的定义:两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相
关关系.
2.相关关系的分类
(1)按变量间的增减性分为正相关和负相关.
①正相关:当一个变量的值增加时.,另一个变量的相应值也呈现增加的趋势:
②负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.
(2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.
知识点二相关关系的刻画
1.散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中的点表示出来,
由这些点组成的统计图,叫做散点图.
2.样本相关系数
f(可一川—y)
(1)我们常用样本相关系数,来确切地反映成对样本数据(为,W的相关程度,其中,=
(2)样本相关系数r的取值范围为[-1,1].
①若r>0时,成对样本数据正相关;
②若r<0时,成对样本数据负相关;
③当仍越接近1时,成对样本数据的线性相关程度越强;
④当仍越接近0时,成对样本数据的线性相关程度越弱.
【题型归纳】
一、变量间相关关系的判断
1.下列两个变量之间的关系,哪个是相关关系()
A.正方体的棱长和体积B.圆半径和圆的面积
C.正”边形的边数和内角度数之和D.人的身高和体重
2.两对变量A和8,C和。的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有
相关关系,说出它们相关关系的区别.
表1
A261813104-1
B202434385064
表2
C05101520253035
D541.67602.66672.09704.99806.71908.59975.421034.75
二、样本相关系数的性质
3.在一组成对样本数据为(xi,yi),3,"),…,Un,xi,X2,…,X"不全相等)的散点图中,若这组成对
样本数据的样本相关系数为-1,则所有的样本点(为,y,)(/=1,2,〃)满足的方程可以是()
A.y=一5+1B.y—x—1
C.y=x+lD.y=—x2
4.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是(
A.<r4<0<r3<r2B.4</<0<4<4
<r
C.D.r2<弓<。<八3
三、样本相关系数的计算及应用
5.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,实验数据经整理得到如下的折线图:
由图可以看出,这种酶的活性指标值y与温度x具有较强的线性相关关系,请用相关系数加以说明.
6rr~——£卜,―*)(y7)
附:Wk:-x)(»-y)=85,=5.5,77«2.65,样本相关系数「=/“:"=Z
6.某杂志社近9年来的纸质广告收入y(单位:千万元)如表所示:
年份201220132014201520162017201820192020
时间代号f123456789
纸质广告收入y22.22.52.632.42.221.8
(1)根据2012年至2020年的数据,求与r之间的线性相关系数(精确到0.001).
(2)根据2016年至2020年的数据,求V与r之间的线性相关系数(精确至U0.001).
(3)如果要用回归直线方程预测该杂志社2021年的纸质广告收入,现在有两个方案,方案一:选取这9年的数据
进行预测,方案二:选取后5年的数据进行预测.请你从实际生活背景以及线性相关性的角度分析哪个方案更合适.
(当N>。75时认为两个变量有很强的线性相关关系.)
【双基达标】
1.下列语句所表示的事件中的因素不具有相关关系的是()
A.瑞雪兆丰年B.读书破万卷,下笔如有神
C.吸烟有害健康D.喜鹊叫喜,乌鸦叫丧
2.已知〃表示变量X与丫之间的线性相关系数,/'2表示变量U与丫之间的线性相关系数,且〃=0.837,以=-0.957,
则()
A,变量x与y之间呈正相关关系,且x与y之间的相关性强于u与卜之间的相关性
B.变量XVY之间呈负相关关系,且X与y之间的相关性强于u与V之间的相关性
c.变量u与v之间呈负相关关系,且x与丫之间的相关性弱于。与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
3.已知变量X与y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量[7与V相对应的一组
数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).彳表示变量X与丫之间的线性相关系数,4表示变量U与V
之间的线性相关系数,则下列结论中正确的是()
A.5<彳<0B.。<e<4C.弓<0<qD.弓=4
4.某公司2006~2011年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:
年份200620072008200920102011
利润X12.214.6161820.422.3
支出y0.620.740.810.8911.11
根据统计资料,则利润中位数()
A.是16,x与>有正线性相关关系
B.是17,x与y有正线性相关关系
C.是17,x与y有负线性相关关系
D.是18,x与>有负线性相关关系
5.如图,有5组(x,),)数据,去掉点对应的数据后,剩下的4组数据的线性相关程度最大.
y
2
1*E(10,12)
0
9•0(3,10)
8
7
6
5
4•C(4,5)
3
2.・8(2,4)
.3(1,3)
0123456789101112«
6.对两个变量的相关系数,有下列说法:(1)卜|越大,相关程度越大;(2)H越小,相关程度越大;(3)卜|趋
近于0时,没有非线性相关系数;(4)卜|越接近于1时,线性相关程度越强,其中正确的是.
7.有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天
气温的对比表:
温度/℃-50471215
热饮杯数156150132128130116
温度/℃1923273136
热饮杯数10489937654
(1)画出散点图;
(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?
8.互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针
对该市市场占有率较高的甲,乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如
下表:
1日2日3日4日5日
外卖甲日接单X(百单)529811
外卖乙日接单y(百单)2310515
(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;
(2)据统计表明,y与X之间具有线性相关关系,请用相关系数r对y与X之间的相关性强弱进行判断;(若1川>0.75,
则可认为y与x有较强的线性相关关系,r值精确到0.001)
参考数据:£(%-初》-刃=66氐(玉_可度(》-方匕77.
i=lVj=lf=l
【高分突破】
1.如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出错误的选项()
A.2020年下半年,同城和异地快递量最高均出现在11月
B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)
C.2020年下半年,异地快递量与月份呈正相关关系
D.2020年下半年,每个月的异地快递量都是同城快递量的6倍以上
2.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第1年与年销量y(单位:
万件)之间的关系如表:
X1234
y12284256
在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.
M万件)
60
50
40
30
20
10
12~~3~~4x
附注:参考数据:gd”32.6,后=2.24,=418.
力(%-矶%-习
参考公式:相关系数r=I“
V/=11=1
3.在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄
然发生转变.某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营
店统计了近五年来创收利润数%(单位:万元)与时间4(单位:年)的数据,列表如下:
%12345
2.42.74.16.47.9
(1)依据表中给出的数据,是否可用线性回归模型拟合y与,的关系,请计算相关系数『并加以说明(计算结果精
确到0.01).(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
附:相关系数公式:
参考数据:,56.95x7.547,%戊=85.2愎―苗=而,£(%-y)2=J22.78
/=iV,=1Vf=i
(2)谈专营店为吸引顾客,特推出两种促销方案.
方案一:每满500元可减50元;
2
方案二:每满500元可抽奖一次,每次中奖的概率都为《,中奖就可以获得100元现金奖励,假设顾客每次抽奖的
结果相互独立.
某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择返回现金,还是选择参加四次抽奖?说
明理由.
4.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数
据的散点图,如图所示.
”(百千克)
O24568x(千克)
依据数据的散点图可以看出,可用线性回归模型拟合y与X的关系,请计算相关系数厂并加以说明(若旧>。75,则
线性相关程度很高,可用线性回归模型拟合);
附:相关系数公式
参考数据:限B0.55,7(19«0.95.
5.随着电子阅读的普及,传统纸质媒体遭受到了强烈的冲击.某杂志社近9年来的纸质广告收入如下表所示:
年份201220132014201520162017201820192020
时间代号r123456789
广告收入
22.22.52.832.52.321.8
(千万元)
根据这9年的数据,对/和作线性相关性检验,求得样本相关系数的绝对值为0.243;根据后5年的数据,对f和y
作线性相关性检验,求得样本相关系数的绝对值为0.984.
(1)如果要用线性回归方程预测该杂志社2021年的纸质广告收入,现在有两个方案,方案一:选取这9年数据进
行预测,方案二:选取后5年数据进行预测.从实际生活背景以及线性相关性检验的角度分析,你觉得哪个方案更
合适?
(2)某购物网站同时销售某本畅销书籍的纸质版本和电子书,据统计,在该网站购买该书籍的大量读者中,只购
买电子书的读者比例为50%,纸质版本和电子书同时购买的读者比例为10%,现用此统计结果作为概率.
①若从该网站购买该书籍的大量读者中任取一位,求只购买纸质版本的概率;
②若从上述读者中随机调查3位,求购买电子书人数多于只购买纸质版本人数的概率.
【答案详解】
【题型归纳】
1.【答案】D
【详解】
A:由正方体的棱长与其体积有因果关系,不是相关关系;
B:圆的半径与其面积有因果关系,不是相关关系;
C:正〃边形的边数和内角度数之和有因果关系,不是相关关系;
D:人的身高和体重,存在非确定性的依存关系,属于相关关系.
故选:D
2.【详解】
散点图分别如图(1)和图(2).
"
100
000
900
800
700
600
500
-10010203001020304050C
(1)⑵
从图中可以看出两图中的点各自分布在一条曲线附近,因此两对变量都具有相关关系.
图(1)中,当A的值由小变大时,8的值却是由大变小,故A和8成负相关;
图(2)中,当C的值由小变大时,。的值也是由小变大,故C和。成正相关.
3.【答案】A
【详解】•••这组成对样本数据的样本相关系数为-1,
这一组成对样本数据(xi,yi),。2,竺),…,(x„,%)线性相关,且是负相关.
二可排除B,C,D,故选A.
4.【答案】A
【详解】由图可知,图2和图3是正相关,图1和图4是负相关,
国1和图2的点相对更加集中,所以相关性更强,所以4接近于-1,2接近1,
所以4<与<0<4<4,故选:A
_1
5.【详解】由题意得:x=-x(8+l1+14+20+23+26)=17,
6
6
X(x,.一元)2=(8-17)2+(11-17)2+(14-17)2+(20-17)2+(23-17)2+(26-17)2=252,
/=1
£6(%一可(%—了)
»=185.“85〜(J/
>/252x5.56>/7x5.5
由此可得酶的活性指标值y与温度工具有较强的线性相关关系.
6.【详解】(1)由2012年至2020年的数据得,
-_1+2+3+4+5+6+7+8+9_<
f=-=5,
-2+2.2+2.5+2.6+3+2.4+2.2+2+1.8汽
y=------------------------------------------=2.3o,
9
9
Zf/=1x2+2x22+3x2.5+4x2.6+5x3+6x24+7x2.2+8x2+9x1.8=101.3,
7=1
9_2
Z(")=16+9+4+1+1+4+9+16=60,
f=l
泣-a=0.09+0.01+0.04+0.09+0.49+0.01+0.01+0.09+0.25=1.08,
i=1
101.3-9x5x2.3-2.2
所以所求线性相关系数々=
760x1.08>760x1.08
(2)由2016年至2020年的数据得
-5+6+7+8+9「
5
_3+2.4+2.2+2+1.8
y=----------------------=2.28,
9
Z4%=5x3+6x2.4+7x2.2+8x2+9x1.8=77,
i=5
0.722+0.122+0.082+0.28?+(-0.48)2=0.848,
9_
77—5x7x2.28-2.8
i=l2-0.962
所以所求线性相关系数为4=x/lOx0.8485/^48
(3)选取方案二更合适,理由如下:.
①从表格中的数据可以看出从2016年开始,纸质广告收入呈现逐年下降的趋势,可以预见2021年的纸质广告收入
会接着下跌,前四年的增长趋势已经不能作为预测后续数据的依据;
②卜|越接近1,两个变量之间的线性相关性越强,因为根据这9年的数据得到的相关系数的绝对值0.273<0.75,我
们没有理由认为丫与t具有线性相关关系,而后5年的数据得到的相关系数的绝对值0.962>0.75,所以认为V与f具
有很强的线性相关关系.
【双基达标】
1.【答案】D
【详解】“瑞雪兆丰年”和“读书破万卷,下笔如有神”是根据多年经验总结归纳出来的,吸烟有害健康具有科学根据,
所以它们都是相关关系,所以A、B、C三项具有相关关系;
结合生活经验知喜鹊和乌鸦发出叫声是它们自身的生理反应,与人无任何关系,故D项不具有相关关系
故选:D.
2.【答案】C
【详解】因为线性相关系数,7=0.837,-0.957,
所以变量X与y之间呈正相关关系,变量。与V之间呈负相关关系,
*与y之间的相关性弱于u与丫之间的相关性.
故选:C
3.【答案】C
【详解】由变量X与y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量X与V之间正
相关,.,.{>();
由变量u与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可知变量U与V之间负相关,
弓<0;
综上所述:弓与弓的大小关系是弓<o<4.
故选:C.
4.【答案】B
【详解】由题意,利润中位数是笥”=17,而且随着利润的增加,支出也在增加,故x与y有正线性相关关系.
故选:B.
5.【答案】D
【详解】A、B、C、E四点分布在一条直线附近且贴近某一直线,。点离得远.
去掉D点剩下的4组数据的线性相关性最大
故答案为:D
6.【答案】⑴、(4)
【详解】用相关系数,-衡量两个变量之间的相关关系强弱时,
,•的绝对值越接近于1,表示两个变量的线性相关性越强,
厂的绝对值越接近于0,表示两个变量的线性相关性越弱,
对于(1),卜|越大,相关程度越大,命题(1)正确;
对于(2),卜|越小,相关程度越小,命题(2)错误;
对于(3),H趋近于0时,线性相关关系越弱,命题(3)错误;
对于(4),卜|越接近于1时,线性相关程度越强,命题(4)正确.
综上正确的命题是(1)、(4).
故答案为:(1)、(4).
7.【详解】(1)以x轴表示温度,以y轴表示热饮杯数,可作散点图如图.
热饮杯数
160
40
120
100
80
60
40
20
-50510152025303540温度/弋
(2)从图中可以看出,各点散布在从左上角到右下角的区域里,
因此,气温与热饮销售杯数之间是具有相关关系,
即气温越高,卖出去的热饮杯数越少.
8.【详解】
_2+3+10+5+15
(1)由表格中的数据,可得亍=-------------=7,y=-------;-------=7,
外卖甲的日接单量的方差,=(5-加+(2-7)、(9;7)/8-7)2+(11-7)2=0
外卖乙的日接单量的方差4=(2-7)2+(3-7)2+(与7)2+(5-7)2+(15-7)2=236.
因为于=叉*<.点,即外卖甲平均日接单量与外卖乙平均日接单量相同,但外卖甲日接单量波动更小,所以外卖甲
比外卖乙经营状况更好.
⑵因为|J,,,
V»=i/=i
5n5
又Z(xT)(y—)=66ZG一可£(%一寸”77,
i=lVi=li=l
所以代入计算可得,相关系数rn%々0.857>0.75,
77
所以可认为>与x之间有较强的线性相关关系.
【高分突破】
1.【答案】D
【详解】对于A,由图可看出,同城和异地快递量最高都在II月份,故A正确;
—e679556.6—599604.6708642.6—679556.6八l口1」3…日.0___,
对于B,因为....———.....>--——>9月异地快递增长率明显局于10月异地快递增长率,故
599604.6679556.6
B正确;
对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显增加,因此可以判断异地快递量
与月份呈正相关关系,故C正确;
对于D,2020年7月的异地快递量为572812.9万件,同城快递量为1051911万件,异地快递量不到同城快递量的
6倍,故D不正确.
故选:D.
2.【详解】作出散点图如图:
乂
60
50
40
30
20
10
1234x
由散点图可知,各点大致分布在一条直线附近,由此推断X与)'线性相关.
由题中所给表格及参考数据得:
x=ly=M2占y=418,Jz(y-y)-"32.6,24=30,
乙7
2/=iV/=)'»=i
£(七一x)(%-y)=-4xy=418-4x曰=73,
;=iz=i22
73
«0.9997
2.24x32.6
・.・y与龙的相关系数近似为0.9997,可以推断该公司的年销量V与第九年呈正线性相关,且线性相关程度很强.
3.【详解】(1)由题知,r=1(l+2+3+4+5)=3,y=1(2.4+2.7+4.1+6.4+7.9)=4.7,
555
方3=8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025二手住宅购销合同
- 特色康养小镇项目社区养老与医疗保健服务整合建议
- 2025中外技术研发类合同示范文本
- 装配式建筑部品部件标准化设计在装配式建筑装配式防腐蚀中的应用报告
- 工业互联网平台软件定义网络在5G网络中的优化应用报告
- 工业互联网平台网络流量整形技术在工业互联网平台用户体验中的应用报告
- 文化与科技融合趋势下的数字艺术产业市场分析报告
- 新能源与环保:2025年环保型城市轨道交通系统规划与建设
- 环保设备制造业市场竞争态势与创新产品应用领域拓展报告
- 历史文化街区在城市更新中的历史文化传承与创新发展研究
- 绳索救援技术培训内容
- 吊篮安装安全技术交底范本
- GB/T 13460-2025再生橡胶通用规范
- 2025年农村商业银行招聘考试笔试试题(含答案)
- 全国医师定期考核公共卫生考核试题500题-1
- 电信运营商客户流失管理手册
- 上饶城投笔试试题及答案
- 2025-2030鳞状非小细胞肺癌治疗学行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 陪诊师考试2024年全真模拟试题及答案
- 2024年恒丰银行招聘笔试真题
- 课程顾问电话销售流程
评论
0/150
提交评论