成对数据的统计相关性(2课时)课件-高二下学期数学人教A版选择性_第1页
成对数据的统计相关性(2课时)课件-高二下学期数学人教A版选择性_第2页
成对数据的统计相关性(2课时)课件-高二下学期数学人教A版选择性_第3页
成对数据的统计相关性(2课时)课件-高二下学期数学人教A版选择性_第4页
成对数据的统计相关性(2课时)课件-高二下学期数学人教A版选择性_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回顾旧知在必修课程中,我们学习了单个变量观察数据的统计特征的处理方法,例如:用直方图描述样本数据的分布规律;用均值刻画样本数据的集中趋势;用方差刻画样本数据的离散程度……这些方法主要适用于通过样本认识单个变量的统计规律.在现实中,我们还经常需要了解两个或两个以上变量之间的关系,例如:成年子女身高和父母身高之间的关系;青少年使用手机时长和近视的关系;高中生数学成绩和物理成绩的关系;某城市空气污染指数和燃油汽车数量的关系……为此,我们需要进一步学习通过样本推断变量之间关系的知识和方法.【思考1】必修课程中我们学习了哪些统计知识?我们还需要了解哪些方面的统计知识呢?成对数据的统计相关性一元线性回归模型成对数据的统计分析2×2列联表两个随机变量的相关性可以通过成对样本数据进行分析研究变量之间的随机关系,并且进行预测检验两个随机变量的独立性

本章的学习对于提高我们解决实际问题的能力,提升数据分析、数学建模等核心素养.章前导入8.1成对数据的统计相关性第一课时8.1.1变量的相关关系人教A版选择性必修第三册第八章第一单元课时目标1.会通过收集现实问题中两个有关联变量的数据作出散点图,能利用散点图直观认识变量间的相关关系.2.会求样本相关系数r,并能利用样本相关系数r判断两个随机变量线性相关程度的大小.【问题1】下列两个变量之间有关系吗?关系是否确定?(1)正方体的体积V与棱长a;

(2)汽车匀速行驶时的路程S与时间t;(3)学习成绩与学习时间t;(4)一个人的体重与视力;(5)一个人的体重与他的身高有关系.有确定关系:V=a3有确定关系:s=vt有关系但不是唯一因素没有关系有关系但不是唯一因素1.两个变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.1.两个变量的相关关系【追问1】你还可以举一些关于两个变量具有相关关系的例子吗?【子女身高y与父亲身高x之间的关系】一般来说,父亲的个子高(矮),其子女的个子也会比较高(矮);但影响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高.【商品销售收入y与广告支出x之间的关系】一般来说,广告支出越多,商品销售收入越高,但广告支出并不是决定商品销售收入的唯一因素,商品销售收入还与产品质量、居民收入等因素有关.1.两个变量的相关关系【追问1】你还可以举一些关于两个变量具有相关关系的例子吗?【空气污染指数y与汽车保有量x之间的关系】一般来说,汽车保有量增加,空气污染指数会上升;但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素.【粮食亩产量y与施肥量x之间的关系】在一定范围内,施肥量越大,粮食亩产量就越高;但施肥量并不是决定粮食亩产量的唯一因素,粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响.(2)两个变量的关系①函数关系:变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了;

②相关关系:变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性;

③不相关:体重与视力.1.两个变量的相关关系【追问2】一般地,两个变量有哪些关系?【例1】

(多选)下列两个变量存在相关关系的为()A.扇形的半径与面积之间的关系B.降雪量与交通事故的发生率之间的关系C.人的身高与体重之间的关系D.家庭的支出与收入之间的关系BCD解析:扇形的半径与面积之间的关系是函数关系,其余均为相关关系.1.两个变量的相关关系函数关系是一种确定关系,而相关关系是一种非确定关系,

两个变量之间产生相关关系的原因受许多不确定因素的影响.

反思感悟【思考2】我们应该如何研究两个变量之间的相关关系?通过样本数据分析从数据中提取信息构建适当的模型利用模型进行估计或推断2.线性相关与非线性相关【探究1】在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的筒单随机样本数据,如下表所示,表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.【问题2】根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?2.线性相关与非线性相关如果用横轴表示年龄,纵轴表示脂肪含量,上述数据用直角坐标系中的点表示出来,图有什么特征?(1)散点图

把成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.由散点图得,散点大致落在一条从左下角到右上角的直线附近,这表明随年龄值的增加,脂肪含量值呈现增高的趋势.由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.2.线性相关与非线性相关【追问1】你能根据散点图的特征来解析数据得到的结论吗?(2)正(负)相关正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;负相关:当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.2.线性相关与非线性相关散点图中的点散布在从左下角到右上角的区域散点图中的点散布在从左上角到右下角的区域(3)线性相关线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.2.线性相关与非线性相关●●●●●●●●●●●●●●●●●●正相关负相关线性相关【追问2】观察下面三个图,判断两个变量之间是否具有相关性?如果是,那么是否属于线性相关?2.线性相关与非线性相关非线性相关(曲线相关)不相关(4)非线性相关一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.【例2】某个男孩的年龄与身高的统计数据如表所示:(1)画出散点图;(2)判断y与x是否具有线性相关关系,如果相关,是正相关还是负相关?年龄x(岁)123456身高y(cm)788798108115120解析:(1)散点图如图所示.(2)由散点图知,所有散点分布在一条直线附近,因此,认为y与x具有线性相关关系,且是正相关关系.2.线性相关与非线性相关判断两个变量x和y是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.

反思感悟【练习】下面是水稻产量与施化肥量的一组观测数据:(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量存在什么关系吗?水稻产量会一直随施化肥量的增加而增加吗?施化肥量15202530354045水稻产量320330360410460470480解析:(1)散点图如图.(2)从图中可以发现,当施化肥量由小到大变化时,水稻产量也由小变大,图中的散点大致分布在一条直线的附近,因此施化肥量和水稻产量线性相关,但水稻产量只是在一定范围内随着施化肥量的增加而增加,不会一直随施化肥量的增加而增加.2.线性相关与非线性相关课堂小结相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;注意区分相关关系和函数关系.散点图成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.正相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称之两个变量正相关.负相关当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关;正相关不一定是线性相关,也可能是非线性相关.课堂小结有相关性散点杂乱无章,无规律可言,看不出两个变量有什么相关性课堂小结课堂小结课堂练习【练习1】(多选)在下列所示的四个图中,每个图的两个变量具有相关关系的图是()解:图A的两个变量具有函数关系;图BC的两个变量具有相关关系;图D的两个变量之间既不是函数关系,也不是相关关系.BC课堂小结课堂练习【练习2】两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A.①②③ B.②③①

C.②①③ D.①③②解:对于(1),图中的点成带状分布,且从左到右上升,是①正相关关系;对于(2),图中的点没有明显的带状分布,是③不相关;对于(3),图中的点成带状分布,且从左到右是下降的,是②负相关关系.故选D.D课堂小结课堂练习【练习3】某个男孩的年龄与身高的统计数据如下表所示:(1)画出散点图;(2)判断y与x是否具有线性相关关系,如果相关,是正相关还是负相关解:(1)散点图如图所示;(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系,且是正相关关系.年龄x(岁)123456身高y(cm)7887981081151208.1成对数据的统计相关性第二课时8.1.1变量的相关关系人教A版选择性必修第三册第八章第一单元1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与“标准化”处理后的成对数据两分量向量夹角的关系.2.结合实例,会通过相关系数比较多组成对数据的相关性.学习目标形数旧知回顾1.样本相关系数【探究】从图形上,我们可判断出图①是负相关,图②是正相关,那么能否判断出图②的相关性比图①强?散点图可以直观的说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度.【问题1】能否像引人均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关的正负及相关程度进行定量分析呢?1.样本相关系数

【追问1】经过中心化的散点图,如何判断两个变量的相关性呢?线性负相关线性正相关无相关关系非线性相关线性负相关线性正相关无相关关系非线性相关(x,y)基本异号(x,y)基本同号中心化1.样本相关系数1.样本相关系数

【追问2】散点图不能精确描述相关关系,能否用具体数据判断正相关和负相关呢?

1.样本相关系数新知探究

为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.

1.样本相关系数

1.样本相关系数①r的正负:反映成对样本数据的变化趋势r=0时,只表明成对样本数据间无线性相关关系,但不排除它们有其他相关关系.【追问4】相关系数r的取值范围是多少呢?

1.样本相关系数

1.样本相关系数②r的范围:−1≤r≤1.①r的正负:反映成对样本数据的变化趋势.r=0时,只表明成对样本数据间无线性相关关系,但不排除它们有其他相关关系.④样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.③|r|的大小:反映成对样本数据线性相关的程度(即散点集中于某条直线的程度):|r|越接近1:线性相关程度越强;|r|越接近0:线性相关程度越弱.1.样本相关系数

r=0.97r=−0.85r=0.24r=−0.05正线性相关程度很强负线性相关程度较强正线性相关程度很弱负线性相关程度极弱1.样本相关系数样本相关系数证明过程

样本相关系数证明过程

样本相关系数证明过程

实际理解与运用【例3.1】P104-3.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:两个变量的样本相关系数是否为1?若不是,请你解释其中的原因.析:计算可得r≈0.9997,由此可得,弹簧伸长长度x和相应所受外力F几乎完全正线性相关,样本数据没有完全正线性相关,跟测量存在误差、弹簧制造工艺等因素有关.1.样本相关系数【例3.2】对四组成对样本数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是()A.r2<r4<0<r3<r1

B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1

D.r2<r4<0<r1<r3A1.样本相关系数解析:由给出的四组成对样本数据的散点图可以看出,题图1和题图3是正相关,样本相关系数大于0,题图2和题图4是负相关,样本相关系数小于0,题图1和题图2的样本点集中在一条直线附近,所以相关程度更强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.1.样本相关系数(1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关程度越强.(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关程度越强.

反思感悟线性相关程度强弱的判断方法【例4】

(课本例1)

根据表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.编号1234567年龄/岁23273941454950脂肪含量/%9.517.821.225.927.526.328.2编号891011121314年龄/岁53545657586061脂肪含量/%29.630.231.430.833.535.234.62.样本相关系数的性质

2.样本相关系数的性质【例5】有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.第n年12345678910居民年收入/亿元32.231.132.935.837.138.039.043.044.646.0A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断A商品销售额与居民年收入的相关程度和变化趋势的异同.2.样本相关系数的性质2.样本相关系数的性质

解析:画出成对样本数据的散点图,如图所示.从散点图看,A商品销售额与居民年收入的样本数据呈现出线性相关关系.

【例6】(课本例3)

在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表所示.体重与身高、臂展与身高分别具有怎样的相关性?编号身高/cm体重/kg臂展/cm1173551692179711703175521724179621775182821746173631667180551748170811699169541661017754176111775917012178671741317456170编号身高/cm体重/kg臂展/cm1416666161151766116616176491651717560173181694816219184861892016958164211825417022171581642317761173241735816525173511692.样本相关系数的性质

2.样本相关系数的性质(1)当|r|越接近1时,两个变量的相关程度越强,当|r|越接近0时,两个变量的相关程度越弱.(2)样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论