相关系数-课件完整版_第1页
相关系数-课件完整版_第2页
相关系数-课件完整版_第3页
相关系数-课件完整版_第4页
相关系数-课件完整版_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 1、两个变量的关系、两个变量的关系 不相关不相关 相关相关 关系关系 函数关系函数关系 线性相关线性相关 非线性相关非线性相关 相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定 时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量 之间的关系。之间的关系。 复习回复习回顾顾 相关关系相关关系 给出两个变量,当一个变量一定时,另给出两个变量,当一个变量一定时,另 一个变量的取值具有一定的随机性一个变量的取值具有一定的随机性 1、注意与函数关系的区别、注意与函数关系的区别 2、回归分析、回归分析 散点图散点图 将样本中的所有数据点(将样

2、本中的所有数据点(xi , yi ),描在,描在 平面直角坐标系中,以表示具有相关关系平面直角坐标系中,以表示具有相关关系 的两个变量的一组数据的图形的两个变量的一组数据的图形 2、最小二乘估计、最小二乘估计下的线性回归方程:下的线性回归方程: 2 2 n n 1 1 2 2 n n 1 1 _ _ _ 2 2 n n 1 1 _ _ _ ) )n(n() )xx xx xx yxx b i i i ii i i n i ii yny ( )y)( 1 2)a,b 的意义是:以的意义是:以 a 为基数,为基数,x 每增加每增加1个单位,个单位,y相相 应地平均增加应地平均增加 b 个单位个单位

3、。 1) 称为样本点的中心称为样本点的中心。( (x x, ,y y) ) xbya axby (1)(1)计算平均数计算平均数 (2)(2)计算计算 与与 的积的积, ,求求 (3)(3)计算计算 (4)(4)将上述有关结果代入公式,求将上述有关结果代入公式,求b b、a a, 写出回归直线方程写出回归直线方程 ,xy i x i y 1 n ii i x y 22 11 , nn ii ii xy 3、求线性回归方程的步骤:、求线性回归方程的步骤: 4、回归分析的基本步骤回归分析的基本步骤: A.画散点画散点图图 B.求回归方求回归方程程 C.用回归直线方程解决应用问题用回归直线方程解决应

4、用问题 求线性回归方程的步骤:求线性回归方程的步骤: (1)(1)计算平均数计算平均数 (2)(2)计算计算 与与 的积的积, ,求求 (3)(3)计算计算 (4)(4)将上述有关结果代入公式,求将上述有关结果代入公式,求b b、a a,写,写 出回归直线方程出回归直线方程 ,xy i x i y 1 n ii i x y n i i x 1 2 相关性相关性 1、在散点图中,点有一个集中的大致趋势、在散点图中,点有一个集中的大致趋势 2、在散点图中,所有的点都在一条直线附近、在散点图中,所有的点都在一条直线附近 波动线性相关。波动线性相关。 xxx yy y O OO 问题:有时散点图的各点

5、并不集中在一条 直线的附近,仍然可以按照求回归直线方 程的步骤求回归直线,显然这样的回归直 线没有实际意义。在怎样的情况下求得的 回归直线方程才有实际意义? 即建立的线性回归 模型是否合理? 如何对一组数据之 间的线性相关程 度作出定量分析? 需要对需要对x,y 的线性相关的线性相关 性进行检验性进行检验 从散点图上可以看出,如果变量之间存在着某种关系,这些点会有从散点图上可以看出,如果变量之间存在着某种关系,这些点会有 一个一个集中的大致趋势集中的大致趋势,这种趋势通常可以用,这种趋势通常可以用一条光滑的曲线一条光滑的曲线来近似描述,来近似描述, 这种近似的过程称为这种近似的过程称为曲线拟合

6、曲线拟合。在两个变量。在两个变量x x和和y y的散点图中,所有点看的散点图中,所有点看 上去都在一条直线附近波动,则称变量间是上去都在一条直线附近波动,则称变量间是线性相关线性相关的。此时,我们可的。此时,我们可 以用一条直线来拟合,这条直线叫以用一条直线来拟合,这条直线叫回归直线回归直线。 x y O 思考:思考:观察散点图的大致趋势,人的年龄的与人体脂观察散点图的大致趋势,人的年龄的与人体脂 肪含量具有什么相关关系?肪含量具有什么相关关系? 年龄与脂肪的散点图,从整体上看,它们是线性相关的年龄与脂肪的散点图,从整体上看,它们是线性相关的 思考思考2 2:在上面的散点图中,这些点散布在从左

7、下角在上面的散点图中,这些点散布在从左下角 到右上角的区域,对于两个变量的这种相关关系,我到右上角的区域,对于两个变量的这种相关关系,我 们将它称为们将它称为正相关正相关. .一般地,如果两个变量成正相关,一般地,如果两个变量成正相关, 那么这两个变量的变化趋势如何?那么这两个变量的变化趋势如何? 思考思考3 3:如果两个变量成负相关,从整体上看这两个变如果两个变量成负相关,从整体上看这两个变 量的变化趋势如何?其散点图有什么特点?量的变化趋势如何?其散点图有什么特点? 一个变量随另一个变量的变大而变小,散点图中的点一个变量随另一个变量的变大而变小,散点图中的点 散布在从左上角到右下角的区域散

8、布在从左上角到右下角的区域. .这就像函数中的增这就像函数中的增 函数和减函数。即一个变量从小到大,另一个变量也函数和减函数。即一个变量从小到大,另一个变量也 从小到大,或从大到小。从小到大,或从大到小。 思考思考4 4:你能列举一些生活中的变量成正相关或负相你能列举一些生活中的变量成正相关或负相 关的实例吗关的实例吗? ? 年龄与身高是正相关,网速与下载文件所需时间是负年龄与身高是正相关,网速与下载文件所需时间是负 相关。相关。 例例2. 52. 5个学生的数学和物理成绩如下表:个学生的数学和物理成绩如下表: 学生学生 学科学科 ABCDE 数学数学8075706560 物理物理706668

9、6462 画出散点图,并判断它们是否有相关关系画出散点图,并判断它们是否有相关关系. . 数学数学 物理物理 具有相关关系具有相关关系. . 例例3. 3. 下表给出了某校下表给出了某校1212名高一学生的身高名高一学生的身高( (单位:单位:cm)cm) 和体重和体重( (单位:单位:kg)kg): 身身 高高 15 1 15 2 15 3 15 4 15 6 15 7 15 8 16 0 16 0 16 2 16 3 16 4 体体 重重 404141 41. 5 42 42. 5 4344454546 45. 5 画出散点图,并观察它们是否有相关关系画出散点图,并观察它们是否有相关关系.

10、 身身 高高 体体 重重 具有相关关系具有相关关系. 思考:如何分析变量之间是否具有相关的关系?思考:如何分析变量之间是否具有相关的关系? 分析变量之间是否具有相关的关系,我们可以借助分析变量之间是否具有相关的关系,我们可以借助 日常生活和工作日常生活和工作经验经验对一些常规问题来进行对一些常规问题来进行定性分析定性分析, 如儿童的身高随着年龄的增长而增长,但它们之间又如儿童的身高随着年龄的增长而增长,但它们之间又 不存在一种确定的函数关系,因此它们之间是一种非不存在一种确定的函数关系,因此它们之间是一种非 确定性的随机关系,即相关关系。确定性的随机关系,即相关关系。 散点图也只是形象地描述点

11、的分布情况,它的散点图也只是形象地描述点的分布情况,它的“线性线性”是是 否明显只能通过观察,否明显只能通过观察,但仅凭这种定性分析不够;但仅凭这种定性分析不够;要想把握其要想把握其 特征,必须进行特征,必须进行定量定量的研究的研究 相关系数相关系数 n n i ii i i i= =1 1 n nn n 2 22 2 i ii i i i= =1 1i i= =1 1 ( (x x - - x x) )( (y y - - y y) ) r r = = ( (x x - - x x) )( (y y - - y y) ) 2 2 _ _ n n 1 1i i 2 2 i i 2 2 n n

12、1 1i i 2 2 i i n n 1 1i i _ _ _ i ii i ) )y yn n( (y y) )x xn n( (x x y yx xn ny yx x 建构数学建构数学 . 75. 0, . ,0 ; , 1 .,0 ;,0 强的线性相关关系 时认为两个变量有很大于当通常 关系 不存在线性相关表明两个变量之间几乎时越接近于 的线性相关性越强 表明两个变量的绝对值越接近 表明两个变量负相关时当 表明两个变量正相关时当 r r r r r 相关系数相关系数r的性质:的性质: (2) ; 1r (3) 越接近于越接近于1,x,y的线性相关的线性相关 程度越强;程度越强; r (4

13、) 越接近于越接近于0,x,y的线性相关的线性相关 程度越弱;程度越弱; r .,0 ;,0 表明两个变量负相关时当 表明两个变量正相关时当 r r (1) P7思考交流思考交流 1如图所示,图中有5组数据,去掉组 数据后(填字母代号),剩下的4组数据的线 性相关性最大() ECD A 2 2、对于散点图下列说法中正确一个是(、对于散点图下列说法中正确一个是( ) A.A.通过散点图一定可以看出变量之间的变化规律通过散点图一定可以看出变量之间的变化规律 B.B.通过散点图通过散点图一定不可以看出变量之间的变化规律一定不可以看出变量之间的变化规律 C.C.通过散点图可以看出正相关与负相关有明显区

14、别通过散点图可以看出正相关与负相关有明显区别 D.D.通过散点图看不出正相关与负相关有什么区别通过散点图看不出正相关与负相关有什么区别 C 3 2 2 _ _ n n 1 1i i 2 2 i i 2 2 n n 1 1i i 2 2 i i n n 1 1i i _ _ _ i ii i ) )y yn(n(y y) )x xn(n(x x y yx xn ny yx x r 2 2 n n 1 1 2 2 n n 1 1 _ _ _ 2 2 n n 1 1 _ _ _ ) )n(n() )xx xx xx yxx b i i i ii i i n i ii yny ( )y)( 1 例例.

15、 . 下表是随机抽取的下表是随机抽取的8 8对母女的身高数据,试对母女的身高数据,试 根据这些数据探讨根据这些数据探讨y y与与x x之间的关系之间的关系. . 母亲身高母亲身高x/cmx/cm 154154 157157 158158 159159 160160 161161 162162 163163 女儿身高女儿身高y/cmy/cm 155155 156156 159159 162162 161161 164164 165165 166166 解:画出散点图 列表: ixiyixi2yi2xiyi 1154155237162402523870 2157156246492433624492

16、 3158159249642528125122 4159162252812624425758 5160161256002592125760 6161164259212689626404 7162165262442722526730 8163166265692755627058 12741288202944 207484205194 16125.159 n y y n x x ii 其中: 963. 0 1165 .59 80 161820748425.1598202944 16125.1598205194 22 2 2 _ _ n n 1 1i i 2 2 i i 2 2 _ _ n n 1

17、1i i 2 2 i i n n 1 1i i _ _ _ i ii i y yn ny yx xn nx x y yx xn ny yx x r 计算相关系数: 因为r=0.963接近1,所以x与y具有较强的 线性相关关系. 建立线性回归模型:y=a+bx 191.53 345. 1 xbya b 2 2 _ _ n n 1 1i i 2 2 i i n n 1 1i i _ _ _ i ii i 2 2 _ _ n n 1 1i i 2 2 i i n n 1 1i i _ _ _ i ii i x x8 8x x y yx x8 8y yx x x xn nx x y yx xn ny yx x xy xy 345. 1191.53 的线性回归方程为对故 小结 1、相关关系的判断、相关关系的判断 2、画散点图、画散点图 3、线性关系系数、线性关系系数 例例1.下表给出我国从下表给出我国从1949至至1999年人口数据资料,年人口数据资料, 试根据表中数据估计我国试根据表中数据估计我国2004年的人口数年的人口数. 检验:检验: (1)作统计假设)作统计假设H0:x与与y不具有线性相关关系不具有线性相关关系; (2)由)由0.05与与n-2=9,在附录在附录1中查的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论