版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 现实世界中许多事物与事物之间存在着现实世界中许多事物与事物之间存在着联系,统计方法的一个重要目的是探讨事物联系,统计方法的一个重要目的是探讨事物的数量规律,通过对不同性质的事物进行大的数量规律,通过对不同性质的事物进行大量观察,发现某些表面关系不大的事物之间量观察,发现某些表面关系不大的事物之间存在的依存关系,并度量这种关系的紧密程存在的依存关系,并度量这种关系的紧密程度。度。 然而,多数情况是两事物间虽存在着联然而,多数情况是两事物间虽存在着联系,但其方式不是系,但其方式不是“决定决定”, 人们发现这种不太明确的规律以后,为人们发现这种不太明确的规律以后,为了验证、利用这些规律,人们会进一
2、步试验,了验证、利用这些规律,人们会进一步试验,筛选出最主要的变量,再进行理论论证,直筛选出最主要的变量,再进行理论论证,直至形成一种比较稳定的、可控的操作模式。至形成一种比较稳定的、可控的操作模式。 统计学上,如果发现了某两个变量之间统计学上,如果发现了某两个变量之间的相关关系,会对这两个变量的一系列观测的相关关系,会对这两个变量的一系列观测值进行有效的统计技术处理值进行有效的统计技术处理,形成具有一定概率的统计规律。形成具有一定概率的统计规律。 相关关系的种类:相关关系的种类: 按相关的按相关的不同可以分为正相关和负相关不同可以分为正相关和负相关 按相关的按相关的不同可以分为线性相关和非线
3、不同可以分为线性相关和非线 性相关性相关 按影响因素的按影响因素的不同分为单相关、复相关不同分为单相关、复相关 和偏相关和偏相关 按照变量关联的按照变量关联的可分为完全相关、可分为完全相关、 不完全相关和完全不相关(无关)不完全相关和完全不相关(无关) 简单线性相关简单线性相关 当一个变量当一个变量X X由小到大,另一个变量由小到大,另一个变量Y Y亦亦相应地由小到大(或由大到小),两变量的相应地由小到大(或由大到小),两变量的散点图呈直线趋势,那么这两个变量之间有散点图呈直线趋势,那么这两个变量之间有线性关系。分析这种线性关系的理论和方法,线性关系。分析这种线性关系的理论和方法,统称为直线相
4、关或线性相关。统称为直线相关或线性相关。 两变量直线相关的性质和密切程度,用两变量直线相关的性质和密切程度,用直线相关系数直线相关系数r r来描述。来描述。 相关系数:相关系数:又称为积差相关系数或积又称为积差相关系数或积矩相关系数,它表示两个变量之间直线关矩相关系数,它表示两个变量之间直线关系的系的密切程度密切程度和和相关方向相关方向的统计指标。的统计指标。 总体相关系数用符号总体相关系数用符号表示,随机样表示,随机样本相关系数用符号本相关系数用符号r r表示。表示。 r r取值范围:取值范围:-1r1-1r1,没有单位。,没有单位。相关系数的计算及意义:相关系数的计算及意义:r r计算公式
5、:计算公式: 22yyxxyyxxlllriiiiyyxxxynxxxxlxx/222nyxxyyyxxlnyyyylxyyy/222 (y的离均差平方和)的离均差平方和) (x的离均差平方和的离均差平方和)(x与与y的离均差积和)的离均差积和) 相关系数假设检验:相关系数假设检验:212nrrt ,=n-2 从样本计算的r值,是总体相关系数的估计值,从=0(无直线相关)的总体抽出的样本,其r不一定为0,因此得到r后必须检验r是否来自=0的总体,以判断两变量间是否存在直线相关关系。可用t检验或直接查r界值表实现。 实例讲解实例讲解实例110名20岁男青年身高与前臂长的数据见表1。 计算相关系数
6、并对计算相关系数并对=0=0进行假设检验;进行假设检验;表1 10名20岁男青年身高与前臂长 身 高(cm) 170 173 160 155 173 188 178 183 180 165 前臂长(cm) 45 42 44 41 47 50 47 46 49 43 实例讲解实例讲解1 1由原始数据及散点图进行初步分析(图由原始数据及散点图进行初步分析(图1 1)图1 10名20岁男青年身高与前臂长散点图图1 10名20岁男青年身高与前臂长散点图353537373939414143434545474749495151150150160160170170180180190190身高(cm)前臂长(
7、cm)前臂长(cm)实例讲解实例讲解2 2、计算相关系数、计算相关系数8227. 04 .785 .962226226104541725785414 .7810454206905 .962101725298525785414 .45206904545 .172298525172522222222YYXXXYXYYYXXlllrnYXXYlnYYlnXXlXYYYYXXX,实例讲解实例讲解 H H0 0:=0=0,即身高与前臂长间无直线相关关系,即身高与前臂长间无直线相关关系 H H1 1:00,即身高与前臂长间有直线相关关系,即身高与前臂长间有直线相关关系09. 48227. 01210822
8、7. 021022nrrsrtr82102 n=0.05 ,查查t t界值表,得界值表,得0.0020.002P P0.005 r2,就判断r1比r2相关更密切。因为查表,若按同一检验水准0.05,则前者认为无相关而后者有相关,可见正确推断有无相关必须经过假设检验。4. 4. 积差相关分析只适用于双变量正态分布资料。积差相关分析只适用于双变量正态分布资料。 不服从双变量正态分布而不宜作积差相关分析。不服从双变量正态分布而不宜作积差相关分析。 总体分布类型未知。总体分布类型未知。 用等级表示的原始数据。用等级表示的原始数据。秩相关:秩相关:又叫等级相关(rank correlation),即斯皮
9、尔曼(Spearman)等级相关。是用双变量数量等级顺序作直线相关分析。实例讲解实例讲解 某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如下:表3 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度 城市编号 1 2 3 4 5 6 7 8 肺癌标化死亡率(1/10万) 5.60 18.50 16.23 11.40 13.80 8.13 18.00 12.10 苯并 (a) 芘 (g/100m3) 0.05 1.17 1.05 0.10 0.75 0.50 0.65 1.20 实例2试检验两者有无相关?试检验两者有无相关?实例讲解实例讲解 本题资料不服从双变量
10、正态分布,宜计算等级相关系数。计算过程见下表。 肺肺 癌癌 标标 化化 死死 亡亡 率率 ( 1/10万万 ) 苯苯 并并 ( a) 芘芘 城城市市编编 号号 X 等等 级级 Y 等等 级级 d = d2 1 5.60 1 0.05 1 0 0 2 18.50 8 1.17 7 1 1 3 16.23 6 1.05 6 0 0 4 11.40 3 0.10 2 1 1 5 13.80 5 0.75 5 0 0 6 8.13 2 0.50 3 1 1 7 18.00 7 0.65 4 3 9 8 12.10 4 1.20 8 4 16 d2=28 rs = 1- n n:总例数:总例数 d d:
11、每一对值的等级差:每一对值的等级差rs= 16288(821)=0.6667 ) 1(622nndH0:s0,即肺癌标化死亡率和大气中苯并(a)芘无相关关系H1:s0,即肺癌标化死亡率和大气中苯并(a)芘有相关关系0.05查查rs界值表,得界值表,得0.10P0.05,按,按0.05水准,不拒绝水准,不拒绝H0,尚不能认为肺癌标化死亡率和大气中的苯并(尚不能认为肺癌标化死亡率和大气中的苯并(a)芘有相关)芘有相关关系。关系。 实例讲解实例讲解SPSSSPSS软件分析结果:软件分析结果:Correlations1.000.667.07188.6671.000.071.88CorrelationC
12、oefficientSig.(2-tailed)NCorrelationCoefficientSig.(2-tailed)NMORTALBENSpearmans rhoMORTALBEN“回归回归”一词的来历。一词的来历。 两变量之间存在直线关系时,通过计算两变量之间存在直线关系时,通过计算回归方程来描述这两个变量相互依存的回归方程来描述这两个变量相互依存的数量关系。数量关系。根据直线回归方程由已知(或易测)变根据直线回归方程由已知(或易测)变量值,估计未知(或难测)变量值。量值,估计未知(或难测)变量值。对总体回归直线作出估计,评价样本回对总体回归直线作出估计,评价样本回归直线的可信程度。归
13、直线的可信程度。估计正常值范围。估计正常值范围。 用途:用途:简单线性回归方程:简单线性回归方程: = a + bx y表表 1 直线回归方程直线回归方程 a、b 两系数对比两系数对比 a b 含义含义 回归直线在回归直线在 Y 轴上的截距轴上的截距(intercept) 。 表示表示 X 为零时为零时,Y 的平均水平的估计值。的平均水平的估计值。 回归系数回归系数(regression coefficient) ,) ,即直线的斜率。表示即直线的斜率。表示 X 每变化一个每变化一个单位时单位时,Y 的平均变化量的估计值。的平均变化量的估计值。 系数系数0 a0 表示直线与纵轴的交点在原点的上
14、表示直线与纵轴的交点在原点的上方。方。 b0,表示直线从左下方走向右上,表示直线从左下方走向右上方,即方,即 Y 随随 X 增大而增大。增大而增大。 系数系数0 a0 表示直线与纵轴的交点在原点的下表示直线与纵轴的交点在原点的下方。方。 b0,表示直线从左上方走向右下,表示直线从左上方走向右下方,即方,即 Y 随随 X 增大而减小。增大而减小。 系数系数=0 a=0 表表示回归直线通过原点示回归直线通过原点 b=0,表示直线与,表示直线与 X 轴平行,即轴平行,即 Y不随不随 X 的变化而变化。的变化而变化。 计算公式计算公式 XbYa XXXYllXXYYXXb2)()( 最小二乘法原理,此
15、时估计误差平方和最小二乘法原理,此时估计误差平方和 最小。最小。2YY2XXYYXXllbxxxyxbya直线回归方程的假设检验直线回归方程的假设检验 样本回归系数样本回归系数b b的假设检验的假设检验(1 1)方差分析;)方差分析;(2 2)t t检验。检验。总回归SS/222SSllllllryyxxxyyyxxxy决定系数决定系数: 习惯上写成习惯上写成 ,称为,称为确定系数确定系数(或(或决定系决定系数数),数值上等于自变量对因变量的贡献率,即用自),数值上等于自变量对因变量的贡献率,即用自变量能解释因变量变化的百分之多少。变量能解释因变量变化的百分之多少。 越接近于越接近于1 1,回
16、归拟合分析的效果越好,即,回归拟合分析的效果越好,即价值越大。价值越大。 2r2R2R 注意:注意:如果如果X X与与Y Y有回归关系,则一定存在相关关有回归关系,则一定存在相关关系,但是若存在相关关系,则不一定存在回归关系。系,但是若存在相关关系,则不一定存在回归关系。 作直线回归分析时的注意事项:作直线回归分析时的注意事项: 1 1)两变量间的关系)两变量间的关系必须有实际意义。必须有实际意义。2 2)计算直线回归的两变量,若)计算直线回归的两变量,若X X为选定的,则对应为选定的,则对应于每个于每个X X值的值的Y Y值必须服从正态分布,其即值必须服从正态分布,其即Y Y的均数;的均数;
17、若若X X、Y Y都是随机变量,则要求都是随机变量,则要求X X、Y Y服从双变量正态服从双变量正态分布。分布。否则先经变量变换,使资料符合要求后再进否则先经变量变换,使资料符合要求后再进行回归分析。行回归分析。3 3)用同一资料计算)用同一资料计算X X推算推算Y Y,和由,和由Y Y推算推算X X的两个的两个回归方程,结果不同。因此,回归方程,结果不同。因此,要正确选定自变量。要正确选定自变量。若两变量之间有因果关系,应若两变量之间有因果关系,应以以“因因”为为X X;无;无法确定时,则以较易测定者或变异较小者为法确定时,则以较易测定者或变异较小者为X X。4 4)观察值必须是同质的。观察
18、值必须是同质的。如果有两个不同的子如果有两个不同的子群,可能产生实际上不存在的回归,也可能忽视群,可能产生实际上不存在的回归,也可能忽视了确实存在的回归关系。了确实存在的回归关系。5 5)回归方程一般)回归方程一般只适用于自变量只适用于自变量X X的原观察数据的原观察数据范围范围,而且实验条件也应与取得原观察数据的实,而且实验条件也应与取得原观察数据的实验条件一致,验条件一致,不能任意外推不能任意外推。实例讲解实例讲解实例3某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量和增加体重的数据见表2。 表2 8只大白鼠的进食量和体重增加量鼠号 1 2 3 4 5 6 7 8 进食量(g)
19、 800 780 720 867 690 787 934 750 增量(g) 185 158 130 180 134 167 186 133 求直线回归方程并对回归系数作假设检验。求直线回归方程并对回归系数作假设检验。 实例讲解实例讲解1 1、由原始数据绘制散点图并初步分析(图、由原始数据绘制散点图并初步分析(图2 2)图图2 2 大白鼠的进食量与增加体重散点图大白鼠的进食量与增加体重散点图 1001201401601802006007008009001000进食量(g)增重(g)实例讲解实例讲解X=6328,X2=5048814,Y=1273,Y2=206619, ,XY=1018263 2
20、 2、计算回归系数、计算回归系数b b和截距和截距a a,求回归方程,求回归方程326.47791261. 0125.159261. 04336611320113208127363281018263)( )(875.405281273206619)(43366863285048814)(222222XbYallbnYXXYlnYYlnXXlXXXYXYYYXX回归方程:回归方程: = -47.326 + 0.261xy3 3、回归系数假设检验:、回归系数假设检验: H H0 0:0 0,即进食量与增重之间无直线关系,即进食量与增重之间无直线关系H H1 1:00,即进食量与增重之间有直线关系,
21、即进食量与增重之间有直线关系0.050.0597.1097905.2954875.4052905.29544336611320875.405222回总剩回总SSSSSSllSSlSSXXXYYY变变异异来来源源 SS MS F 总总变变异异 4052.875 7 回回归归 2954.905 1 2954.905 16.147 剩剩余余 1097.970 6 182.995 方差分析表实例讲解实例讲解查查F界值表,得界值表,得P0.01,按,按0.05水准,拒绝水准,拒绝H0,接受,接受H1,可认为大白鼠的进食量与增加体重间有直线关系。可认为大白鼠的进食量与增加体重间有直线关系。 实例讲解实例讲
22、解t检验:检验: 018. 4433665276.13261. 005276.132897.10972.XXXYbXYlsbsbtnSSs)()(剩按按=6=6,查,查t t界值表,得界值表,得0.010.01P P0.050.05,按按0.050.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,结论同上。,结论同上。 本题本题tF018. 4147.16 故可用直线回归方程故可用直线回归方程 来描述大白鼠的进食量与增加体重的关系。来描述大白鼠的进食量与增加体重的关系。XbXaY261. 0326.47实例讲解实例讲解4 4、计算总体回归系数、计算总体回归系数的的95%95%可信
23、区间可信区间 上限上限= = 0.2612.44713.5107 =0.1022=0.1022下限下限= = 0.2612.44713.5107 = =0.41980.41984336643366总体回归系数总体回归系数的的95%95%可信区间:可信区间:(b bt t0.05(n0.05(n2) 2) S Sb b,b bt t0.05(n0.05(n2) 2) S Sb b)SPSS软件操作过程:软件操作过程:1、建立数据库、建立数据库2、分析操作:、分析操作:2.1 2.1 绘散点图绘散点图F GraphsF ScatterF SimpleF Define: Y Axis: 增重增重 X
24、 Axis: 食量食量 F OK食量1000900800700600增重1901801701601501401301202.2 2.2 分析界面操作:分析界面操作:F AnalyzeF RegressionF Linear Dependent: 增重增重 Independent: 食量食量 F OK回归系数回归系数模拟的拟合参数模拟的拟合参数残差统计量残差统计量因变量因变量标准化预测值标准化预测值预测值预测值预测区间预测区间影响统计量影响统计量实例讲解实例讲解1001201401601802006007008009001000进食量(g)增重(g)5 5、绘制回归直线、绘制回归直线图图3 3 大白鼠的进食量与增加体重回归直线大白鼠的进食量与增加体重回归直线 1 1、区别、区别分析目的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025 高中信息技术数据与计算在历史研究课件
- 公安考评落实奖惩制度
- 小学奖惩制度细则
- 生物公司销售奖惩制度
- 医院医保违规扣款奖惩制度
- 能源供应服务操作规范
- 合同管理与审批流程(标准版)
- 2026年山西省忻州市单招职业倾向性测试题库含答案详解(能力提升)
- 2026年广州科技贸易职业学院单招综合素质考试题库及答案详解(夺冠系列)
- 2026年山西省阳泉市单招职业倾向性测试题库附答案详解(能力提升)
- 《基于FCFF模型的三一重工企业价值评估的案例分析报告》16000字【论文】
- 客运公司安全生产培训和教育学习制度
- 攻读博士学位期间材料科学研究计划参考范文
- 2023陆上石油天然气停产井安全风险防控指南
- DB32∕T2621-2014 特大型桥梁机电工程质量检验评定规范
- 三氧化硫泄露现场预案(6篇)
- 西方社会学理论教案
- 考点24 人与环境-五年(2020-2024年)高考生物学真题专项分类汇编
- 概率论与数理统计章节练习题及答案
- 医疗设备的保养与维护
- 2024届中职对口(职教)高考语文冲刺复习题(应用文写作)(含解析)
评论
0/150
提交评论