统计学,回归分析_第1页
统计学,回归分析_第2页
统计学,回归分析_第3页
统计学,回归分析_第4页
统计学,回归分析_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

RegressionAnalsys

回归分析

童新元

中国人民解放军总医院名人格言纵使世界给我珍宝和荣誉,我也不愿意离开我的祖国,因为纵使我的祖国在耻辱之中,我还是喜欢,热爱,祝福我的祖国。

---裴多菲(匈牙利诗人,1823—1849)问题能否由脂肪的含量推出热量的多少?知道父代身高,可否推测子代身高?回归方程解决由一个量变化推断另一量变化的问题。1)“回归”概念的来源“香港回归”,“澳门回归”….“回归”这一名词起源于19世纪生物学家和统计学家F·Galton的遗传学研究。问题:现实直观经验:“通常都认为子女比父母的身高要高”。这是人身的客观规律还是一种假象?如果这个趋势是客观规律话,人身高应该是越来越高,早就超过了现在的水平。观察研究英国生物遗传学家Galton观察了1078对夫妇与子女,分析他们的身高关系。以每对夫妇的平均身高作为x,取他们的一个成年儿子的身高作为y,将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线。计算出的回归直线方程为:Y^=33.73+0.516x这种趋势及回归方程表明父母平均身高x每增加一个单位时,其成年儿子的身高y也平均增加0.516个单位。结果表明,虽然高个子父辈确实有生高个子儿子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。平均说来,一群高个子父辈的儿子们的平均高度要低于他们父辈的平均高度,他们儿子的身高没有比他们更高,高个子父辈偏离其父辈平均身高的一部分被其子代拉回来了,即子代的平均身高向中心回归。低个子父辈的儿子们虽然仍为低个子,平均身高却比他们的父辈增加了,即父辈偏离中心的部分在子代被拉回来一些。说明子代的平均身高没有比他们的父辈更低。正因为子代的身高有回到父辈平均身高的趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个子高其子女更高,父辈个子矮其子女更矮的两极分化现象。这个例子说明了生物学中“种”的概念的稳定性。正是为了描述这种有趣的现象,Galton引进了“回归”这个名词来描述父辈身高与子代身高的关系。大自然界很多物种都有

“回归”现象:大象、蚂蚁后代体重回归到其平均水平人类社会的“回归”.少小离家,老大归。。。社会学…叶落归根和谐社会稳定--发展贫富分化严重社会不稳定中国改革开放中国经济体制改革“中国经济进入中等发达国家水平”中国政治体制改革“我深知改革的难度,主要是任何一项改革必须有人民的觉醒、人民的支持、人民的积极性和创造精神。”

--温家宝中国半数人还处于文革状态,要么是缺乏理性的文革战士,要么是逆来顺从的奴隶状态,基本不懂现代社会的处事原则。—茅于轼“权利回归于人民,人民真正当家作主””没有独裁专制,才有新中国“由父高推测子女身高的设想影响子女身高y的因素:基本生长规律、父母的身高x

个体差异(随机误差)问题的模型化:回归分析模型子高=基本生长+父母高作用+个体差异2)回归方程回归分析研究目的是由自变量的信息去推断因变量,并用直线方程来表示它们的线性关系。直线回归方程的一般表达式为

回归分析的数据基本格式变量x变量yx1y1x2y2

......xnyn相关问题回归分析的任务:

在平面上怎么找最佳的直线?实现的类似问题:

某地区有若干个房子,现要修建一条直的公路,怎样让大家都满意?3)参数的估计回归方程:采用最小二乘法原理:所有实测点到回归直线的纵向距离平方之和最小.求解线性方程组,而得到最小二乘估计系数b和a

参数的计算公式β的估计:

α

的估计:

计算结果a=33.73,b=0.516回归方程:y^=33.73+0.516x例12-1

测定16种食物中的热量(卡路里)和脂肪含量(克).试建立食物热量与脂肪含量之间的回归方程.计算结果a=36.0727,b=15.2584回归方程:y^=36.0727+15.2584x回归方程的基本含义回归方程在坐标轴上的含义

a:截距b:斜率称为回归系数。回归系数b的意义:回归系数b反映的是x每增加1个单位时y的增加幅度;b越大,x对y的影响幅度越大。回归直线与散点图的关系b>0b<0b=0b=0b=0b=04)回归方程的检验回归方程的抽样误差:回归方程来自样本,存在抽样误差回归方程的假设检验步骤:1建立假设:

H0:回归方程无统计学意义

H1:回归方程有统计学意义α=0.05

2变异的分解:方差分析思想

yi-y=(yi-y^)+(y^-y)

∑(yi-y)2=∑(yi-y^)2+∑(y^-y)2

变异分解示意图F值的构造SS总=SS残差

+SS回归df总=df残差

+df回归MS回归=SS回归/df回归MS残差

=SS残差

/df残差F=

MS回归/MS残差

F值越大,越不利H0假设的成立。

方差分析表

----------------------------------------------------------

y的变异来源

SSDFMS

F值P

----------------------------------------------------------

回归方程SS回归

1MS回归

F=MS回归/Mse

残差

SSe

n-2Mse

总变异SSTn-1

---------------------------------------------------------3统计推断与决策

p<α,拒绝H0;回归方程有统计学意义

p>α,不拒绝H0。回归方程无统计学意义5)回归系数的假设检验:建立假设

H0:β=0

H1:β≠0α=0.05

回归系数的标准误与t统计量

得到P,做出推断

p<α,拒绝H0;p>α,不拒绝H0。6)回归方程价值的评价回归方程评价:方程的假设检验回归价值的评价:确定系数确定系数反映回归方程对因变量y的影响程度。决定系数的意义决定系数越大,回归方程价值越高.实际中,决定系数大于0.5时才有好的应用价值.本实例回归方程的评价回归模型的方差分析:

F=67.923P=0.000回归系数的t检验:

tb=8.2416,P=0.000R2=0.82917)直线回归图若两变量间存在直线关系,在散点图上绘上回归直线,形成直线回归图.直线回归图的CHISS实现1、进入数据模块

点击

数据→文件→打开数据库表

打开文件名为:b12-1.DBF→确认2、进入图形模块

进行绘图

点击

图形→统计图→曲线拟合

→确认横轴:X脂肪纵轴:Y热量8)回归分析的应用---预测

若回归方程有意义时,可以通过自变量X的值来预测因变量Y的值.

通过知道父代身高推测子代平均身高例12-1中,脂肪含量与热量值建立的回归方程有意义P<0.05,且决定系数0.8291较大,我们可以通过食物中的脂肪含量来预测热量值.

问:已知脂肪为10g,试求其对应热量值.

解:已求得回归方程为:

y^=36.0727+15.2584x

当x=10g时,代入回归方程求得:y^=188.6567cal9)回归分析的条件线性独立正态等方差10)相关与回归的注意事项1.相关与回归的关系二者反映的是一个问题的两个角度相关:关联程度回归:数量关系二者的基本结论一致相关系数的假设检验与回归系数的假设检验等价2.相关与回归应有实际意义经典统计案例1冰淇淋与犯罪率的关系美国一小镇警察局长发现该镇的冰淇淋销量越多,犯罪率越高,呈正相关。1)能否限制冰淇淋销量来降低犯罪率。2)试讨论该问题。经典统计案例2小孩的身高同小树的高关系呈正相关。试讨论该问题。3.异常点的诊断y。。。。。。

x4.线性与非线性关系脉搏与测量时间人体的身高与年龄

注意:局部线性与整体非线性.4.伴随关系与因果关系(1)两相关变量间的关系伴随关系因果关系(2)相关与因果关系相关分析泛指两个变量间的关联程度的分析。相关并不一定表示一个变量的改变是引起另一变化的原因,而可能受另一因素的影响。因此,相关关系并不一定是因果关系。回归反映的仅仅是两变的数量关系,不能证明‘因果’,只可以作为‘因果’的证据之一。(3)因果关系的判断判断因果关系至少需要以下证据:数量方面的关系;时间上的先后关系;条件消失,结果消失;条件重现,结果重现。。。生物学中因果关系还需要动物模型方面的证据,生物学理论依据等。(4)关于‘相关’的若干提法及其关系*A与B是否有关A与B是否独立不同A下B是否相等A对B是否有影响A与B的结果是否一致(配对)有关=不独立=不相等=有影响=一致无关=独立=相等=无影响=不一致(5)相关性与差异性*空腹血糖与餐后血糖

---有相关性,有差异性空腹身高与餐后身高

---有相关性,无差异性空腹答题得分与视力得分

---无相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论