回归分析预测法_第1页
回归分析预测法_第2页
回归分析预测法_第3页
回归分析预测法_第4页
回归分析预测法_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析预测法第一页,共三十五页,2022年,8月28日第一节回归分析的基本概念一.基本概念

1.回归分析的来由:

20世纪初,英统计学家F.Golden研究父子身高的遗传统计,高个子父母下一代比父亲更高的概率小于比他矮的概率,而矮个子父亲下一代比父亲高的概率大于比他矮的概率;且这两种高度父辈的后代,高度有向两种父辈平均身高靠拢的趋势,这种现象称为“回归”——是一种自然界现象规律的提取。

东森平台 第二页,共三十五页,2022年,8月28日

2.回归分析研究变量之间的互相关系,把其中一些因素作为控制的变量,而把另一些随机变量作为因变量,利用适当的数学模型尽可能趋向于趋势变化的均值描述它们的关系的分析,称为回归分析。即假定y与x相关,应有y=f(x)

若x1,x2,‥‥‥xn个变量影响y,应有

y=f(x1,x2,‥‥‥xn)

显然,有一些问题必须解决第三页,共三十五页,2022年,8月28日①因素分析现代社会中,任何一件事物与多个因素相关,如何选取主要因素,忽略次要因素,使建立的数学模型不因变量太多而复杂,又能较好的抓住主要矛盾。解决方法是求相关系数R②运动轨迹的模型主要利用已知统计数据在图上打点进行观察分析,寻求一条最佳线路。采用最小二乘法,即在满足该条线路的模拟值与真值总平方误差∑ei2为最小的条件下,来求出模拟数学模型各参数。(为Gauss--Markov最佳线性与无偏估计量)第四页,共三十五页,2022年,8月28日③相关性检验目的是鉴别所求出的模型是否可靠,方法:利用相关性检验准则进行检验④精确度:即讨论在一定置信度条件下的置信区间⑤预测:前面的问题已解决,数学模型已经建立且可靠,精度问题也已解决,利用延续性原则代入需预测的数据,并求出结果。第五页,共三十五页,2022年,8月28日二.方法分类线性线性一元多元非线性非线性第六页,共三十五页,2022年,8月28日第二节一元线性回归预测一.回归方程的建立假定需预测的目标为y,与之对应的因素x,随机抽样,子样数为n,通过图上打点作粗略估计已知的一组对应数据,初步定为线性关系,同时再考虑到随机因素,应有:

yi=a+bxi+eii=1,2,……n(1)

不考虑随机因素,应有:

yi=a+bxii=1,2,n(2)

代(2)入(1),求得随机项

ei=yi

yi=yi

–(a+bxi)(3)ei称为残差∧∧第七页,共三十五页,2022年,8月28日这表示,真值与模拟直线y=a+bx之间存在实际误差ei,累积平方误差为Q=∑ei2,称残差平方和,又称剩余平方和。反之,我们已知的是实际数据(xi,yi),从可能的无穷条模拟直线中选取某一条直线,使之模拟得最好,标准为Q=∑e2i最小。由(3)Q(a,b)=∑ei2=∑(yi

–a--bxi)2求极值点,应有:[Q(a,b)]’a=0

及[Q(a,b)]’b=0第八页,共三十五页,2022年,8月28日得出∑(yi—a—bxi)=0∑(yi—a—bxi)xi=0

求出a,ba=(1/n)∑yi-b=(∑xiyi—nxy)/(∑xi2—nx2)

记∑(xi—x)2=lxx……x的离差平方和∑(xi—x)(yi--y)=lxy……x,y离差乘积和第九页,共三十五页,2022年,8月28日则b可简记为

b=lxy/lxx,a=y–(lxy/lxx)xa,b称回归系数

y=a+bx称线性回归方程。这种方法称为最小二乘法,又叫最小平方法OLS(OrdinaryLeastSquare)第十页,共三十五页,2022年,8月28日二.一元线性回归方程的代表特性

1、∑ei=0,即残差和为02、回归直线过点(x,y)∵y=a+bx即过数据重心。

3、回归平均值等于离散平均值,即=y

i=1.n第十一页,共三十五页,2022年,8月28日三.相关检验

相关检验解决两大问题:

x与y是否线性相关及相关强弱如何?它们之间相关显著性如何?

1、y的离差平方和

lyy=∑(yi—y)2

对于任意给定的xi,都有yi的波动,波动的大小可用yi—y来评价,n次结果的总波动大小为lyy,……数据分散程度。第十二页,共三十五页,2022年,8月28日

2、回归平方和

U=∑(—y)2

对于任意给定的xi,yi与xi是人为给定的线性变化而得到,它与实际的均值必产生偏差,这种偏差是由回归而产生的,是回归偏差平方和U……回归分散程度制定。

3.残差平方和

Q=∑(yi—y)2

实际值与模拟值产生的误差,由于yi随xi变化的随机特性引起,模拟的好则残差平方和应尽可能小

lyy=Q+U∧∧第十三页,共三十五页,2022年,8月28日这个公式中:离差平方和lyy是不可变更的客观存在,且残差平方和Q尽可能小,故有U→lyy效果好,即yi与xi之间存在强的线性关系。于是有定义:R2=U/lyy(0≦︱R︱≦1)

即U=R2·lyy

由lyy=U+Q推出Q=(1—R2)lyy

其中R称为相关系数。当R=0为不相关,R→+1为强正相关,R→-1为强负相关第十四页,共三十五页,2022年,8月28日这样,通过研究相关系数R,可作出两个因素之间是否具有线性相关关系,且能判其相关程度。相关程度的显著与不显著(即使相关性强,但某因素对另一因素的影响不大,即不显著,那么这种因素也是不重要的)有一个具体界限,这是R检验。由于抽样误差的影响,R达到的显著值与样本个数n有关,且取决于不同的显著性水平(或置信度),配成相关系数检验表,它们给出了在不同的n,a时,相关系数达到的最小值。第十五页,共三十五页,2022年,8月28日第十六页,共三十五页,2022年,8月28日第十七页,共三十五页,2022年,8月28日四、精度:即是在确定的置信度条件下,求出相应的置信区间:(n>>0)

当a=4.6%时(yi

–2s,yi+2s)

a=0.27%时(yi

–3s,yi+3s)其中S=Q/(n—2),称为剩余标准差。

2004/10/11第十八页,共三十五页,2022年,8月28日五.预测利用公式=a+bx

对于任意确定的时间(此时取y=a+bt)或数值(自变量x),可以决定所给定时间或自变量条件的预测值y及预测范围.第十九页,共三十五页,2022年,8月28日第三节多元线性回归预测

这是指所预测的变量与多个自变量线性相关的情形,这里谈一种较简单的分析方法。非线性回归均可转化为线性回归,所以我们研究多元线性回归就有突出重要性。设y与xj

线性相关,j=1,2,3,……m,即m元。那么有y与xj

构成的线性关系:

y=bo+b1x1+‥‥‥+bmxm+e

其中bo,b1,‥‥bm为常数,e为随机项,则对应之回归方程应为(不考虑随机因素)

y=bo+b1x1+‥‥‥+bmxm

第二十页,共三十五页,2022年,8月28日针对y与xj

的第k次观察数据,就有:

yk=bo+b1xk1+‥‥‥+bmxkm+ekyk=bo+b1xk1+‥‥‥+bmxkmk=1,2,……,n,即有n组数据取用。由上两式,得,

ek=

yk-yk=yk-bo-b1xk1-‥‥‥-bmxkm第二十一页,共三十五页,2022年,8月28日

按照一元线性回归方法,利用最小二乘法,求各系数:Q(bo,b1‥‥bm)=∑(yk-bo-b1xk1-‥-bmxkm)2

为最小,求各系数的偏导数.

则Q’b0=-2∑(yk-bo-b1xk1-‥-bmxkm)=0:Q’bj=-2∑(yk-bo-b1xk1-‥-bmxkm)xj=0j=1,2,‥‥,m.k=1,2,…n;由此,共得m+1个方程,第二十二页,共三十五页,2022年,8月28日求bo:∑yk-nbo-b1∑xk1-‥‥-

bm∑xkm=0∴bo=(1/n)∑yk-(b1

1/n∑xk1+‥‥+bm1/n∑xkm)

令:y=(1/n)∑yk,xj=

(1/n)∑ykj

有bo=y-(b1+b2

+……+bm)

其余m个方程,可表示为矩阵解:

l11l12

……l1jl1mb1l1yl21l22

……l2jl2mb2l2yli1li2

……lijlimbiliy

lm1lm2

……lmjlmmbmlmy

=第二十三页,共三十五页,2022年,8月28日其中:lij=∑(xki

)(xkj

)

liy=∑(xki

)(yk

)i,j=1,2,‥‥,m;k=1,2…n;第二十四页,共三十五页,2022年,8月28日判断y与某一自变量xj的相关显著程度采用t检验.

构造统计量tj=bj/[SCjj]

其中S=Q/(n-m-1)

l11l12…l1m

C11’C12’

…C1m’

C’=:::=:::

lm1lm2…lmm

Cm1’Cm2’

…Cmm’Cii’就是C’中对角线元素.

如果tj>ta/2,(n-m-1)

则对应的xj对y的影响程度大,否则影响小,应予排除.-1第二十五页,共三十五页,2022年,8月28日

m维线性相关显著性检验,采用F检验.

构造统计量

F=(U/m)/[Q/(n-m-1)]

当F>Fa(m,n-m-1)为显著,

其中:U=∑(yi-y)2Q=∑(yi-yi)2第二十六页,共三十五页,2022年,8月28日

回归思维在期,股市中的运用-----------乖离率指标由于任何性质的变动趋势,都有回归的性质,即向均值回归,在股市市场,股票的股价均有向均值靠近的性质。一般地,描述这样性质的技术指标称乖离率BIAS,定义为:{[C’-M(n)]/M(n)}·100%C’为当日股价或当日指数,M(n)为n日股价或n日指数的移动平均值,

1.若当日股价剧烈上升或下跌,将使BIAS的绝对值加大,回归愿望强烈。----------------应出货或补仓。(1)(1)(1)第二十七页,共三十五页,2022年,8月28日

2.若当日股价沿移动平均值前进,则BIAS在0值附近,股价运行轨道不变,---------考虑继续持仓或减仓操作,

3.BIAS的数值表明了股价与市场平均成本的盈利或亏损的百分比,即大多数投资者所据有的盈利或亏损空间。投资策略:-3~-5为买入时机

+3~+5为卖出时机

-15~-20为最好时机

-10~-15为较好时机

-5~-10可买入

+15~+40选点卖出短线BIAS(5)BIAS(10)第二十八页,共三十五页,2022年,8月28日支撑线压力线买入卖出卖出

买入买入第二十九页,共三十五页,2022年,8月28日

96.12,因政策和升幅过大下调至97.1月开始上升,至5.12日深成指从2792至6103,升幅过3311点,因技术要求及97发行额度影响,暴发性下跌,至5.14日收盘5505,跌598点,BIAS(5)=-4.66,BIAS(10)=-2.54,5.15日以5416开盘,探底5279引发反弹,收至5622点,5.16(周五)以2163点开盘,收至5125点,比前日降497点,BIAS(5)=-8.98,BIAS(10)=-9.92,5.19,5.20略有反弹,5.21日因利空谣传再次下跌,5.22日国务院证券委,中行等出台禁止国企和上市公司买卖股票的几点规定出台,导致股市暴跌,沪:BIAS(5)=-6.87↓,BIAS(10)=-10.88↓

深:BIAS(5)=-7.02↓,BIAS(10)=-12.37↓第三十页,共三十五页,2022年,8月28日第四节非线性回归预测两个变量之间的关系并非全是线性关系,非线性关系也比较多。我们在作图上估计趋势时,可利用标准曲线与之比较,哪种曲线最合实际情况,若不是线性关系,通常有几种典型的常用模型。第三十一页,共三十五页,2022年,8月28日

一.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论