81成对数据的统计相关性_第1页
81成对数据的统计相关性_第2页
81成对数据的统计相关性_第3页
81成对数据的统计相关性_第4页
81成对数据的统计相关性_第5页
已阅读5页,还剩11页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章成对数据的统计分析§8.1 成对数据的统计相关性【学习目标1.结合实例,了解样本相关系数的统计含义 .2. 了解样本相关系数与标准化数据向 量夹角的关系.3.结合实例,会通过样本相关系数比较多组成对样本数据的相关性.知识梳理械圮教材弃宴*础1知识点一相关关系1 .相关关系的定义:两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程 度,这种关系称为相关关系.思考相关关系是函数关系吗?答案 不是.函数关系是唯一确定的关系.2 .相关关系的分类(1)按变量间的增减性分为正相夫和负相去.正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;负相关:当一个变量的值

2、增加时,另一个变量的相应值呈现减少的趋势.(2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.知识点二相关关系的刻画1 .散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.2 .样本相关系数(1)我们常用样本相关系数r来确切地反映成对样本数据(xi, yi)的相关程度,其中 r =n_xi x yi y(2)

3、样本相关系数r的取值范围为 1,1.若r>0时,成对样本数据正也关;若r<0时,成对样本数据负作关;当|r|越接近时,成对样本数据的线性相关程度越强;当|r|越接近0_时,成对样本数据的线性相关程度越弱.思考辨析判断正误1 .函数关系是一种确定关系,而相关关系是一种不确定关系.(V )2 .样本相关系数r越大,两变量的相关性越强.(X )3 .散点图可以直观地分析出两个变量是否具有相关性.(V )4 .若变量x, y满足函数关系,则这两个变量线性相关.(X )题型探究探以重点提升一一一、变量间相关关系的判断例1 (1)(多选)下列关系中,属于相关关系的是 ()A.正方形的边长与面积

4、之间的关系B.农作物的产量与施肥量之间的关系C.出租车费与行驶的里程D.降雪量与交通事故的发生率之间的关系答案 BD解析 A中,正方形的边长与面积之间的关系是函数关系;B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;C为确定的函数关系;D中,降雪量与交通事故的发生率之间具有相关关系.(2)某种产品的广告支出费 x与销售额y之间有如下对应数据(单位:百万元):x24568y3040605070画出散点图;从散点图中判断销售金额与广告支出费成什么样的关系?解 以x对应的数据为横坐标,y对应的数据为纵坐标,所作的散点图如图所示.70洲 口: IH - 2 ' 4 5 H从

5、图中可以发现广告支出费与销售金额之间具有相关关系,并且当广告支出费由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系. 反思感悟两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果 发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要 受个别点的位置的影响.跟踪训练1 (多选)在下列所示的四个图中,每个图的两个变量具有相关关系的图是 ()答案 BC解析 图A的两个变量具有函数关系;图BC的两个变量具有相关关系;图D的

6、两个变量之间既不是函数关系,也不是相关关系.二、样本相关系数的性质例2 (1)甲、乙、丙、丁四位同学各自对A, B两变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数 r如下表:甲乙丙丁r0.820.780.690.85则哪位同学的试验结果体现A, B两变量有更强的线性相关性()A.甲 B.乙 C.丙 D. 丁答案 D解析|r|越接近1,相关性越强,故选 D.(2)在一组成对样本数据为(X1,y1),(X2,y2),,(xn,yn)(n> 2,X1,X2,,Xn不全相等)的散点图中,若这组成对样本数据的样本相关系数为1,则所有的样本点(Xi, yi)(i=1,2,,n)满足的方

7、程可以是().1 .A . y=2X+1B. y=X- 12C. y= x+ 1D. y= x答案 A解析二这组成对样本数据的样本相关系数为-1,,这一组成对样本数据 (X1, y1),(X2 , y2),,(Xn, yn)线性相关,且是负相关.可排除B , C, D,故选A.反思感悟样本相关系数的性质(1)r的绝对值越接近 0,相关性越弱.(2)r的绝对值越接近1,相关性越强.跟踪训练2对变量x, y有成对样本数据(x, yi)(i= 1,2,,10),得散点图图1;对变量u, v有成对样本数据(ui, v)(i=1,2,,10),得散点图图2.由这两个散点图可以判断()u与v正相关 u与v

8、负相关 u与v正相关 u与v负相关A .变量x与y正相关, B .变量x与y正相关, C.变量x与y负相关, D.变量x与y负相关, 答案 C解析 由这两个散点图可以判断,变量 x与y负相关,u与v正相关.(2)(多选)对两个变量的样本相关系数r,下列说法正确的是()A. |r|越大,相关程度越大B. |r的小,相关程度越大C. |r趋近于0时,没有线性相关关系D. |r|越接近1时,线性相关程度越强答案 AD解析 对于A, |r|越大,相关程度越大,A正确;对于B, |r|越小,相关程度越小,B错误;对于C, |r|趋近于0时,线性相关关系越弱,C错误;对于D, |r|越接近1时,线性相关程

9、度越强,D正确.综上,正确的是 AD.三、样本相关系数的计算及应用 例3某厂的生产原料耗费 x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:x2468y30405070(1)画出(x, y)的散点图;(2)计算x与y之间的样本相关系数,并刻画它们的相关程度.解(1)画出(x, y)的散点图如图所示.(2) x =5,y =47.5,4x2= 120,i = 144y2 = 9 900,xiyi= 1 080,4xiyi 4 x yi = 1I 1 080 一y2-5 y 2= 140.8 125= 15.8,i = 1*47.50.982 7.V 120-4 X 52 9 9

10、00-4X47.52由样本相关系数r= 0.982 7,可以推断生产原料耗费与销售额这两个变量正线性相关,且相关程度很高.反思感悟线性相关强弱的判断方法(1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强.其绝对值越大,相关性越强.(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,跟踪训练3假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)5xiyi = 112.3, .79i = 1有如下统计资料:x23456y2.23.85.56.57.055计算y与x之间的样本相关系数(精确到0.001,已知x2=90,y2= 140.8,= 8.9,成=

11、1.4). 2+3+4+5+6x =4,2.2+3.8+5.5 + 6.5+7.0=5.5xiyi- 5 x y = 112.3-5X 4X5=12.3, i = 15x2-5x 2=90-5X42=10,i = 15xiyi 5 x y12.312.312.312.3-j = -,= -:=y-10X 15.8 V158 72X779 1.4 X 8.90.987.随堂演炼1.(多选)下列命题正确的是()A.任意两个变量都具有相关关系B.圆的周长与该圆的直径具有相关关系C.某商品的需求量与该商品的价格是一种非确定性关系D.当两个变量相关且样本相关系数r>0时,表明两个变量正相关答案 C

12、D解析 A显然不对,B是函数关系,CD正确.2.若变量y与x之间的样本相关系数 r=- 0.983 2,则变量y与x之间()A.不具有线性相关关系B.具有线性相关关系C.它们的线性相关关系还需要进一步确定D.不确定答案 B解析 变量y与x之间的样本相关系数 r=- 0.983 2, |r|= 0.983 2接近1,样本相关系数的绝对值越大,相关性越强,变量y与x之间有较强的线性相关关系,故选 B.3 .两个变量x, y的样本相关系数 门= 0.785 9,两个变量u,v的样本相关系数r2= 0.956 8,则下列判断正确的是( A .变量x与y正相关, B .变量x与y负相关, C.变量x与y

13、正相关, D.变量x与y负相关,变量u与v负相关,变量 变量u与v正相关,变量 变量u与v负相关,变量 变量u与v正相关,变量x与y的线性相关性较强 x与y的线性相关性较强 u与v的线性相关性较强 u与v的线性相关性较强答案 C解析 由样本相关系数 1 = 0.785 9>0知x与y正相关,由样本相关系数2= 0.956 8<0知u, v负相关,又|门|<2|, .,变量u与v的线性相关性比x与y的线性相关性强.故选 C.4 .据两个变量x, y之间的成对样本数据画出散点图如图,这两个变量是否具有线性相关关 系.(填“是”或“否”)答案否解析 图中的点分布杂乱,两个变量不具有

14、线性相关关系.5.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):固定资产价值33566789910工业增加值15172528303637424045根据上表资料计算的样本相关系数约为 答案 0.991 8解析 x3 +3+5+6+6+ 7+8+9+9+1010=6.6,15+ 17+25+ 28+30+36+37 + 42+40+4510=31.5.10Xi- x yi y1 .知识清单:(1)相关关系.(2)散点图.(3)正相关、负相关、线性相关、非线性相关.(4)样本相关系数.2 .方法归纳:数形结合.3 .常见误区:相关关系与函数关系不分,样本相关系数

15、绝对值的大小与相关程度的关系.课时对点练注立就基强化落实/基础巩固1 .若“名师出高徒”成立,则名师与高徒之间存在什么关系A.相关关系B.函数关系D,不能确定C.无任何关系答案 A2 .(多选)给出下列关系,其中有相关关系的是()A.人的年龄与他(她)拥有的财富之间的关系B.曲线上的点与该点的坐标之间的关系C.苹果的产量与气候之间的关系D.森林中的同一种树木,其截面直径与高度之间的关系答案 ACD3 .两个变量的相关关系有正相关,负相关,不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A. B. C. D.答案 D解析 对于(1),图中的点成带状分布,且从左到右上升,是正相关关系;

16、对于(2),图中的点没有明显的带状分布, 是不相关;对于(3),图中的点成带状分布, 且从左到右是下降的, 是负相关关系.故选 D.4 .(多选)某校地理学兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图 如图所示,则下列说法正确的是 ()M'E要如眄屋T米m附 uOni in 物於帆A.沸点与海拔高度呈正相关B.沸点与气压呈正相关C.沸点与海拔高度呈负相关D.沸点与海拔高度、沸点与气压的相关性都很强答案 BCD解析由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸 点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以

17、沸点与海拔高度、沸点与气压的相关性都很强,故 B, C, D正确,A错误.5.变量X与丫相对应的一组成对样本数据为 (10,1), (11.3,2), (11.8,3), (12.5,4), (13,5),变 量U与V相对应的一组成对样本数据为 (10,5), (11.3,4), (11.8,3) , (12.5,2) , (13,1). n表示变 量丫与X之间的样本相关系数,2表示变量V与U之间的样本相关系数,则()A .210B. 021C. 201D.门=2答案 C解析 由已知中的数据可知:第一组成对样本数据正相关,则样本相关系数大于零,第二组成对样本数据负相关,则样本相关系数小于零,故

18、选 C.6 .如图所示的两个变量不具有相关关系的有 .(填序号)r 1 7 - TX鼠;虑OX。耳。工。T3 答案解析 是确定的函数关系;中的点大都分布在一条曲线周围;中的点大都分布在一条直线周围;中点的分布没有任何规律可言,x, y不具有相关关系.7 .给出下列x, y值的数据如下:x1248y35917则根据数据可以判断 x和y的关系是.(填“确定关系” “相关关系”或“没有关 系”)答案确定关系解析 由表中数据可以得到 x, y之间是一种函数关系:y=2x+ 1,所以x, y是一种确定的 关系,即函数关系.8 .对某高三学生在连续 9次数学测试中的成绩(单位:分)进行统计得到如图所示的散

19、点图.下面关于这位同学的数学成绩的分析中,正确的序号有 .Im维1J4-'KMT . .,011 7 .r 2 .4 4 5 6 7 «芍涮流序号该同学的数学成绩总的趋势是在逐步提高;该同学在这连续九次测试中的最高分与最低分的差超过40分;该同学的数学成绩与测试序号具有线性相关性,且为正相关.答案解析 散点图从左向右看呈上升趋势,所以该同学的数学成绩总的趋势是在逐步提高,正确;该同学在这连续九次测试中的最高分大于130分,最低分小于 90分,极差超过40分,正确;该同学的数学成绩与测试序号具有比较明显的线性相关性,且为正相关,正确.9.某个男孩的年龄与身高的统计数据如下表所示

20、:年龄x(岁)123456身高y(cm)788798108115120画出散点图;(2)判断y与x是否具有线性相关关系,如果相关,是正相关还是负相关.解(1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系,且是正相关关系.10.关于两个变量 x和y的7组数据如下表所示:x21232527293235y711212466115325求变量y与x的样本相关系数,并判断变量y与x之间是正相关还是负相关.解 x =7(21 +23 + 25 + 27+29+32 + 35)27.4,一 1,y =7(7+ 11 + 21 + 24+66+ 115+325)

21、= 81.3,7x2= 212 + 232+ 252+ 272+ 292+ 322+ 352= 5 414,i = 17xiyi = 21 X 7 + 23X 11 + 25 X 21 + 27 X 24+29 X 66+32 X 115+35 X 325= 18 542,i = 17y2= 72+112+212+242+662+ 1152+ 3252= 124 393,i = 17xiyi 7 x y18 542-7X 27.4X81.3 5 414-7X 27.42 124 393-7X 81.320.837 5.2 948.66 3 520.92.-r>0, .变量y与x之间是正相

22、关关系.(综合运用11 .两个变量y与x的模型中,分别选择了 4个不同模型,它们的样本相关系数r如下,其中拟合效果最好的模型是()模型模型1模型2模型3模型4样本相关系数r0.980.800.500.25A.模型1 B,模型2 C.模型3 D,模型4答案 A12 .某统计部门对四组成对样本数据进行统计分析后,获得如图所示的散点图,关于样本相关系数的比较,其中正确的是 ()行本相算吊故为,.12)S in IS jo 23杵本相美系独为力切S |U Q 20 2S 期卜.(5 际本蹴第需为以 佛A. r4r20r1r3C .2403门答案 CB . 240门3D . 42031解析 根据散点图的

23、特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中在一条直线附近,说明相关性越强,由题中数据可知:(1)(3)为正相关,(2)(4)为负相关,故r1>0, r3>0, r2<0, r4<0,又(1)与(2)中散点图更接近于一条直线,故 门>r3,2<% 因此2<r4<0<3<11.故选C.13 .如图所示,有5组(x, y)数据,去掉哪一组数据之后,剩下的4组数据成线性相关关系(A. E B . D C. B D. A答案 B解析 去掉D组数据之后,剩下的 4组数据成线性相关关系.14 .高三年级267位学生参加期末考试, 某班37位学生的语文成绩、 数学成绩与总成绩在全 年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看:(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .答案(1)乙(2)数学解析(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙;(2)由高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级的排名情 况的散点图可知,两个图中,同一个人的总成绩是不会变的.第二个图看,丙是从右往左数第5个点,即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论