




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学原理李杰明相关分析第1页,课件共52页,创作于2023年2月第一节相关分析的意义和任务
一、相关关系的概念(注意相关关系与函数关系的区别)
(一)函数关系
它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。
例如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。第2页,课件共52页,创作于2023年2月(二)相关关系
它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:1.相关关系是现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。第3页,课件共52页,创作于2023年2月商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。
在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。例第4页,课件共52页,创作于2023年2月二、相关关系的种类
第5页,课件共52页,创作于2023年2月(一)按相关关系涉及的因素多少来分,可分为:单相关和复相关。
在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。(了解)
二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。
三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。第6页,课件共52页,创作于2023年2月(二)按相关关系的形式来分,可分为:
直线相关和曲线相关
直线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。
曲线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。第7页,课件共52页,创作于2023年2月(三)按相关关系的性质来分,可分为:
正相关和负相关正相关是指两相关现象变化的方向是一致的。
负相关是指两相关现象变化的方向是相反的。第8页,课件共52页,创作于2023年2月(四)
按相关程度分,可分为:
完全相关、不完全相关和不相关
完全相关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。
不相关是指两现象之间在数量上的变化上各自独立,互不影响。
不完全相关就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。第9页,课件共52页,创作于2023年2月三、相关分析的主要内容
相关分析的主要内容,概括起来是五个方面:(一)确定现象之间有无关系,以及相关关系的表现形式;(二)
确定相关关系的密切程度;(三)选择合适的数学模型;(四)测定变量估计值的可靠程度;(五)对计算出的相关系数,进行显著检验。第10页,课件共52页,创作于2023年2月第二节简单线性相关分析
一、相关表和相关图相关图,也称散布图(或散点图)。第11页,课件共52页,创作于2023年2月某市1998年—2005年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。(简单相关表)
序号年份工资性
现金支出(万元)x城镇储蓄存款余额(万元)y119985001202199954014032000620150420017302005200290028062003970350720041050450820051170510例1第12页,课件共52页,创作于2023年2月第13页,课件共52页,创作于2023年2月企业按销售额分组(万元)流通费用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58例2(分组相关表)(单变量分组相关表)(双变量分组相关表:表7-4p351)第14页,课件共52页,创作于2023年2月二、相关系数的测定与应用
相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号r表示。第15页,课件共52页,创作于2023年2月r的测定方法:第16页,课件共52页,创作于2023年2月仍以上例1资料计算:序号年份x(万元)y(万元)11998500120-310-15596100240254805021999540140-270-13572900182253645032000620150-190-12536100156252375042001730200-80-75640056256000520029002809058100254506200397035016075256005625120007200410504502401755760030625420008200511705103602351296005522584600合计64802200--432400155000253300第17页,课件共52页,创作于2023年2月经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。第18页,课件共52页,创作于2023年2月(二)相关系数简捷计算方法
第19页,课件共52页,创作于2023年2月资料计算如下:序号年份x(万元)y(万元)x2y2xy119985001202500001440060000219995401402916001960075000320006201503844002250093000420017302005329004000014600052002900280810000784002520006200397035094090012250033950072004105045011025002025004725008200511705101368900260100596700合计6480220056812007600002035300第20页,课件共52页,创作于2023年2月第21页,课件共52页,创作于2023年2月对r的解释如下:(即r的特点)(1)r取正值或负值决定于分子协方差;(2)r的绝对值,在0与1之间;(3)r的绝对值大小,可说明现象之间相关关系的紧密程度。三、相关系数的密切程度
第22页,课件共52页,创作于2023年2月简单线性相关分析的特点
通过对r的计算方法的讨论,可看出二个明显特点:2.相关关系中只能计算出一个相关系数r。1.相关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;第23页,课件共52页,创作于2023年2月(一)单变量分组表计算相关系数
四、分组表计算的相关系数
(二)双变量分组表计算相关系数(了解,p355)
第24页,课件共52页,创作于2023年2月五、相关系数的显著性检验(了解,p355-358)
r的显著性检验:即检验r是否等于0。第25页,课件共52页,创作于2023年2月第三节直线回归分析
在回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性(直线)回归和非线性(曲线)回归之分。第26页,课件共52页,创作于2023年2月(一)简单直线回归分析的特点
2.在两个互为根据时,可以有两个回归方程。yc=a+bx称y倚x回归直线xc=c+dy称x倚y回归直线1.在回归分析时,必须根据研究目的,具体确定哪个是自变量,哪个是因变量。一、简单直线回归分析3.回归分析方程的主要作用在于给出自变量的数值来估计因变量的可能值。第27页,课件共52页,创作于2023年2月(二)简单直线回归方程的确定1.基本方法简单直线回归方程的一般形式为:
yc=a+bxyc——因变量的估计值;
x——自变量;
a——回归直线在y轴上的截距;
b——回归直线的斜率,称回归系数,表明x每增加一个单位,因变量yc的平均变化值
b>0,x与y为正相关
b<0,x与y为负相关第28页,课件共52页,创作于2023年2月
a、b的确定:在简单直线回归方程中,a、b为待定系数,常用最小平方法来确定,即∑(y-yc)2=最小值。第29页,课件共52页,创作于2023年2月简单直线回归方程建立的步骤为:
①确定自变量x和因变量y;②计算x2、xy、Σx、Σy、Σx2、Σxy;③代入公式,先求b,再求a。2.简单直线回归方程的计算第30页,课件共52页,创作于2023年2月仍用上例1资料得到:
yc=-199.5+0.5858x表明该市工资性现金支出每增加1万元,储蓄存款余额就增加0.5858万元。第31页,课件共52页,创作于2023年2月举例说明b(回归系数)在经济管理中的作用:
某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:
yc=77.36-1.818x,其中,
x表示月产量(千件)y表示单位成本(元);a=77.36(元),表示生产这种产品在单位成本方面的条件;
b=-1.818,表示月产品每增加1000件,单位成本平均降低1.818元。第32页,课件共52页,创作于2023年2月(三)判定系数(p361-364)判定系数是测定回归方程拟合优度的一个重要指标。第33页,课件共52页,创作于2023年2月(四)估计标准误差
估计标准误差的概念和作用
估计标准误差就是用来说明回归方程推算结果的准确程度的统计分析指标。以绝对值表示,其数值越小,说明推算结果的准确程度越高,回归直线的代表性也越大。用Syx表示,也可用Sy表示。第34页,课件共52页,创作于2023年2月估计标准误差的两种计算方法
1.根据因变量实际值和估计值的离差计算:第35页,课件共52页,创作于2023年2月仍用前例资料计算Sy:第36页,课件共52页,创作于2023年2月(五)线性回归方程的显著性检验(了解,p365-367)第37页,课件共52页,创作于2023年2月二、多元线性回归分析
多元线性回归分析可以看作是一元线性回归分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:(一)多元线性回归方程第38页,课件共52页,创作于2023年2月第39页,课件共52页,创作于2023年2月
以我国1973-1983年11年手表价格和手表销售量的实际资料为例,拟合一元线性回归方程为:
yc=9643-65x此时,回归系数b表明,手表平均价格每降低1元/只,销售量约平均增长65万只。一元线性回归模型只列入了手表平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。例第40页,课件共52页,创作于2023年2月列成计算表如下:年份(n=11)手表销售量y(万只)人均货币收入x1(元)手表平均价格x2(元/只)x1yx2yx1x21973650.4102.113466405.8487153.613681.41974758.4105.313479859.52101625.614110.21975819.9110.112990270.99105767.114202.919761051.7113.9131119788.63137772.714920.919771149.7120.4127148423.88146011.915290.819781388.1131.0125181841.10173512.516375.019791944.4157.0123305270.80239161.219311.019802534.0193.5123490329.00311682.023800.519812890.0210.2114607478.00329460.023962.819823576.0228.789817831.20318264.020354.319833898.0258.7861008412.60335228.022248.2合计20660.61730.913153905911.562285638.6198258.0第41页,课件共52页,创作于2023年2月年份(n=11)197310424.4117956197411088.0917956197512122.0116641197612973.2117161197714496.1616129197817161.0015625197924649.0015129198037442.2515129198144184.0412996198252303.697921198366925.697396合计303769.55160039续表第42页,课件共52页,创作于2023年2月第43页,课件共52页,创作于2023年2月
b1表明在手表平均价格固定时,人均货币收入每增加1元,手表销售量平均增长18.6368万只;
b2表明在人均货币收入固定时,手表平均价格每上升1元/只,手表销售量平均减少8.0328万只。这里的b2比原一元线性回归模型中的同一回归系数b=-65要大得多,是因为一元线性回归模型只列入了手表平均价格对销售量的影响而忽略了居民收入这一很重要的因素,在手表平均价格的影响中渗入了居民收入的影响。第44页,课件共52页,创作于2023年2月上面的方法推广到多个自变量,其回归方程为:第45页,课件共52页,创作于2023年2月(二)多元线性回归模型的判定系数和估计标准误差(了解,p370-371)第46页,课件共52页,创作于2023年2月
拟合方法:统计上通常采用变量代换法把非线性形式转换为线性形式处理,使线性回归分析的方法也能适用于非线性回归问题的研究。第四节曲线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年上海大专招生试卷及答案
- 2025年集安市事业单位“硕博专项”招聘及急需紧缺人才招聘(1号)(37人)模拟试卷完整答案详解
- 2025贵阳学院人才引进15人模拟试卷及1套参考答案详解
- 硬笔楷书禾字旁课件
- 2025晋能控股集团有限公司招聘高校毕业生模拟试卷及答案详解(全优)
- 长沙宁乡中考真题及答案
- 2025年医技科室考试试题及答案
- 2025年金东美术招聘真题及答案
- 田忌赛马教学课件
- 田径场地专业知识培训课件
- GB 16663-2025醇基液体燃料
- 广东上进联考2025-2026学年领航高中联盟2026届高三10月一轮复习阶段检测化学(含答案)
- 2024年全国统计师之初级统计基础理论及相关知识考试快速提分卷(附答案)
- 【获奖教学课件】小学综合实践活动创建自己的阅读银行-“阅读存折”设计方案2
- GB/T 42579-2023北斗卫星导航系统时间
- 【超星学习通】追寻幸福:中国伦理史视角(清华大学)章节答案
- 完整版青少年普法宣传教育课件
- GB/T 39126-2020室内绿色装饰装修选材评价体系
- GB/T 28726-2012气体分析氦离子化气相色谱法
- 企业降本增效培训课件
- 分则第二章危害国家安全罪课件
评论
0/150
提交评论