(运筹学与控制论专业论文)股票的涨跌及其影响因素的典型相关分析.pdf_第1页
(运筹学与控制论专业论文)股票的涨跌及其影响因素的典型相关分析.pdf_第2页
(运筹学与控制论专业论文)股票的涨跌及其影响因素的典型相关分析.pdf_第3页
(运筹学与控制论专业论文)股票的涨跌及其影响因素的典型相关分析.pdf_第4页
(运筹学与控制论专业论文)股票的涨跌及其影响因素的典型相关分析.pdf_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东大学硕士学位论文 c o s t o f 蜘咄m e l e n g t l l o f 恤u p p 盯s i i a d o w o f m c d a y k l i n e ,m e l e n g t h o f m e l o w 盱 s h a d o w o f t h e d a y k l i n e ,t h e l l i g h 删n g m t ca n d t l i e l o w o p e l l i n g m t e o f s t o c k e t c 1 1 l i st l l e s i sg i v c sc o n i a t i o n 锄a l y s i sa b o u tt l 圮d a t ao f2 7 0d a y s 协| d e 舫mj u l y5 , 2 0 0 6t oj l l l y1 3 ,2 0 0 7 ,锄dh 鹪t e n t a l i v ed i s c 璐s i o na b l o l l tt l l e s u n 1 1 ”r e s i l l ti s : c m 砌c a lc o n c l a t i o na r l a l y s i sm e t i l o dc 锄坞v e a lt h e 化l a n v e 陀1 a t i o nb t 蚋v nt h e r i 锄dd r o p o f 咖k 锄d i 协r e l a t i n g f k t o 格t h a t t h i s m e l o dc 锄l l e l pd i r e c tg t o c k i l l v e s t t h e r ea r ef o l l rp a n si nl h i st l l e s i s :t h e6 r 髓c h a p t c ri n _ 昀d u c 鹤t h eb k g r o u n d , p p o s e ,r e s e a r c h i i i gm e m o d s 趾dm a i nc o n c l l l s i o n ;t h es c c o n dc h a p t 盯i sa t o m 也e b 鹅i ct h i n h n g ,s t 印s 锄dc a l c m a t i o no fm ec 锄o i l i c a lc 呲l a t i o na n a l y s i s ;n 圮廿l i r d c h a p t e i 。i sa _ b o u tt t l ec h 0 0 s i n go f i i l d 印e n d e n tv 撕a b l eu i l i t 肌dd 印d 饥tv a r i a b l eu i l i t ; 柚dm el a s tc k l p t e rg i v 鹤o u ts 咖ea u t h c n t i cp r o l o f sa t o l i tc a n 砌c a lc o n e l a t i o n a l 】a l y s i s a tl a s t t l l et l l i so 仃e r s m ea d v i t 0s t o c ki n v 豁t 嗍 k e y - o r d s :c a n o i l i c a lc o r l a t i o na n a l y s i s ;蛐d c k ;t h ea v 锨g e 、,a l u eo f t h ed a i l yr i a n d d l d po f s t o c k ;r a t i o n ;m a s se l 硎o n 山东大学硕上学位论文 第1 章引言 1 1 选题的背景和目的 中国的股票市场从无到有己经走过了十七年的发展历程。作为一个新兴的股 票市场,在短短的十七年中得到了迅速的发展,市场容量高速扩张,投资者队 伍不断壮大,到目前为止,股票a 股帐户已经接近1 亿户。 我国股民在股市中冲浪,辛苦几年没有赚到什么钱,究其原因: 由于我国股市目前还不规范,一些上市公司信息渠道不够畅通,缺乏良好 的企业经营理念,漠视股东利益,在财务上造假帐,欺骗了广大投资者,致使 股价大大超过其自身价值。 由于主力机构和庄家兴风作浪,误导股民,使绩优个股受冷落,s t 、p t 股成为股市追逐的热点。 最直接的原因是广大股民的投资理念有问题,投机风盛行,急于暴富,热 衷于短线,冷淡了长线,盲目跟庄。 这些问题汇集在一起,导致绝大多数股民赔钱,少数人暴利,极大地挫伤 了广大股民的积极性,严重影响了股票市场健康有序地发展。 尽管目前中国股市还不够成熟,西方一些价值型投资方法还难以广泛应用, 但是未来中国股市必然要走上了理性发展的道路。如何改变目前的困境,不仅 是政府部门需要规范管理,而且广大股民也需要向理性投资方向努力,共同促 进市场的健康发展。 每支股票的涨跌,从长期来看,是某些因素共同作用的结果。本文选题的 背景和目的是构建股票的涨跌及其影响因素的典型相关分析模型,定量判断各 影响因素的变动对股票涨跌的作用程度,并对计算结果进行实证分析,找出影 响股票涨跌的主要因素,以指导股票投资。 1 2 研究方法和主要结论 本文的研究方法和思路是构建股票的涨跌及其影响因素的典型相关分析模 型,定量判断各影响因素的变动对股票涨跌的作用程度,并对计算结果进行实 证分析,从而找出影响股票涨跌的主要因素。 研究中借助股票分析软件获取股票的开盘价、收盘价、最高价、最低价等 山东大学硕士学位论文 常用交易数据;利用v f 语言编程,对这些数据进行初步处理,得到了大量的股 票衍生数据,如:日k 线上影线长度、日k 线下影线长度等;借助s p s s 软件, 将这些股票交易数据与股票的涨跌进行相关分析;对相关性大的数据,再采用 典型相关分析的方法,对股票的涨跌及其影响因素进行分析。 本文以中国银行( 6 0 1 9 8 8 ) 为例,对影响股票涨跌的部分因素进行了分析, 选取了股票的日涨跌幅、日最大升幅、日最大降幅、日涨跌幅的1 0 0 日均值作 为因变量组变量,选取上证指数日涨跌幅、股票的昨收盘价、股票的日成交量、 股票的收盘价减去股票的平均成本价、股票日k 线上影线长度、股票日k 线下 影线长度、股票的日高开低开率等作为自变量组变量,以2 0 0 6 年7 月5 日到2 0 0 7 年8 月1 0 日共2 7 0 个交易日的数据为样本,进行了典型相关分析,构建了股票 的涨跌及其影响因素的典型相关分析模型,找出了影响股票涨跌的主要因素, 并将该模型应用于股票工商银行( 6 0 1 3 9 8 ) 采用典型相关分析方法可以揭示股票的涨跌及其影响因素的相互关系,分 析结果与实际情况基本吻合,这为正确投资股票提供了科学的依据。 2 山东大学硕士学位论文 第2 章典型相关分析概述 2 1 典型相关分析的基本思想 典型相关分析是主成分分析和因子分析的进一步发展,是研究两组变量间 的相互依赖关系,把两组变量之间的相互关系变为研究两个新的变量之间的相 关,而且又不抛弃原来变量的信息,这两个新的变量分别由第一组变量和第二 组变量的线性组合构成。由于两组变量的个数可以是不同的,两组变量所代表 的内容也可以是不同的。因此,典型相关分析在实际问题中应用是十分广泛的。 典型性相关分析与简单相关分析相比,典型性相关分析有其独特的作用。 现在要研究两组变量之间的相关性,1 9 3 6 年,h o t e l l i n g 提出了典型相关 分析。基于复相关系数的定义方法,这里自然考虑到两组变量的线性组合: 批2 q + 口2 + + 口, 【v = 也咒+ 红儿+ + 6 并研究它们之间的相关系数p ( u ,v ) 。在所有的线性组合中,找一对相关系 数最大的线性组合,用这个组合的单相关系数来表不两组变量的相关性,叫做 两组变量的典型相关系数,而这两个线性组合叫做一对典型变量。 在两组多变量的情形下,需要用若干对典型变量才能完全反映出它们之间 的相关性。设己求到的第一对典型变量为: 2 q - + q 毛+ + 郎却 【v l = 6 l ,咒+ 6 2 ,只+ + 。) 下一步,再在两组变量的与u b ,v 不相关的线性组合中,找一对相关系数最 大的线性组合,设为: “2 2 4 1 2 工1 + k x 2 + + 唧2 却 【v 2 = 6 1 2 y l + 6 2 2 y 2 + 6 叮2 它就是第二对典型变量,满足条件:p ( ,心) = o ,p ( h ,v 2 ) = o 而且p ( u 。v :) 就是第二个典型相关系数。这样下去,可以得到若干对典型变量, 从而提取出两组变量间的全部信息。 典型相关分析的实质就是在两组随机变量中选取若干个有代表性的综合指 标,用这些指标的相关关系来表示原来的两组变量的相关关系。这在两组变量 3 山东大学硕士学位论文 的相关性分析中,可以起到合理的简化变量的作用:当典型相关系数足够大时, 可以像回归分析那样,由一组变量的数值预测另一组变量的线性组合的数值。 2 2 典型相关分析的步骤 典型相关分析的步骤有:( 1 ) 确定典型相关分析的目标;( 2 ) 设计典型相关分析; ( 3 ) 检验典型相关分析的基本假设;“) 估计典型模型,评价模型拟合程度;( 5 ) 解 释典型变量;( 6 ) 验证模型。 围2 - 1 典型相关分析的逻辑框图 4 研究的问题 选取目标。确定两组变量的相关关系,达到最大相关, 解释两组变量之间的关系,定义自变量组和因变量组 i 设计典型相关分析 每个变量的观测值 全部的样本量 j 基本假设 线性相关 多元正态性 j 典型函数的估计和识别 推导典型函数,选取用语解释的函数 统计显著性、相关程度、共同方差的冗余度测量 j 解释典型函数和变量 典型权重、典型载荷 典型交义载荷 验证因变量 分割样本 构成典型变量的灵敏度分析 山东大学硕士学位论文 2 2 1 确定典型相关分析的目标 典型相关分析所适用的数据是两组变量。假定每组变量都能赋予一定的理论 意义,通常一组可以定义为自变量,另一组可以定义为因变量典型相关分析可 以达到以下目标: ( 1 ) 确定两组变量相互独立,或者相反,确定两组变量间存在关系的大小。 ( 2 ) 为每组变量推导出一组权重,使得每组变量的线性组合达到最大程度相 关。最大化余下的相关关系的其他的线性函数是与前面的线性函数独立的。 ( 3 ) 解释自变量与因变量组中存在的相关关系,通常是通过测量每个变量对 典型函数的相对贡献来衡量。 2 2 2 设计典型相关分析 典型相关分析作为一种多元分析方法,与其他的多元分析技术有共同的基本 要求。其他方法( 尤其是多元回归、判别分析和方差分析) 所讨论的测量误差的 影响、变量类型及变换也与典型相关分析有很大关系。 样本大小的影响和每个变量需要足够的观测都是典型相关分析经常遇到的。 研究者容易使自变量组和因变量组包含很多的变量,而没有认识到样本量的含 义。小的样本不能很好地代表相关关系,这样掩盖了有意义的相关关系。建议 研究者至少保持每个变量1 0 个观测,以避免数据的“过度拟合”。 2 2 3 典型相关分析的基本假定 线性假定影响典型相关分析的两个方面。首先,任意两个变量间的相关系数 是基于线性关系的。如果这个关系不是线性的,一个或者两个变量需要变换。 其次,典型相关是变量间的相关。如果关系不是线性的,典型相关分析将不能 测量到这种关系。 2 2 4 推导典型函数、评价整体拟合程度 每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量。 可从变量组中提取的典型变量( 函数) 的最大数目等于最小数据组中的变量数 目。比如,一个研究问题包含5 个自变量和3 个因变量、可提取的典型函数的 最大数目是3 。 推导典型函数 典型相关函数的推导类似于没有旋转的因子分析的过程。典型相关分析集中 山东大学硕士学位论文 说明两组变量问的最大相互关系。第一对典型变量在两组变量中有最大的相互 关系。第二对典型变量得到第一对典型变量没有解释的两组变量间的最大相互 关系。简言之,随着典型变量的提取,接下来的典型变量是基于剩余残差,并 且典型相关系数会越来越少。每对典型变量是正交的,并且与其它变量是独立 的。 典型相关程度是通过相关系数的大小来衡量的。典型相关系数的平方表示一 个典型变量通过另外一个典型变量所解释的方差比例,也可称作两个典型变量 间共同方差的比例。典型相关系数的平方值称作典型根或者特征值。典型函数的解释 一般来讲,实际提取的典型函数都是典型相关系数在某个水平(比如o05)上显著的函数。对显著的典型变量的解释是基于这样的假设,即认为相关的函 数中,每组中的变量都对共同方差有较大贡献。海尔( h a i r1984)等人推荐三 个准则结合使用来解释典型函数。这三个准则是:( 1 ) 函数的统计显著性水平;( 2 ) 典型相关的大小:( 3 ) 两个数据集中方差解释的冗余测量。 通常认为一个有统计显著性的相关系数可接受显著性水平是o05也有o01 的水平)。统计软件所提供的最常见的检验是基于rao近似的f统计量。除了对每个典型函数分别进行检验以外,全部典型根的多元检验也可以用来评价典型 根的显著性。许多评价判别函数显著性的测量,包括w i l k s l 猢d a ,h o t e l l i n g 迹、p i l l a i 迹和r o y sg c r o 。 计算冗余指数分三步:(1)共享方差的比例。在典型相关分析中,我们关心因 每个输入变量与它的典型变量问的相关系数。通过平方每个因变量的载荷,可 以得到每个因变量通过因变量组的典型变量解释的方差比例为了计算典型变 量所解释的共同方差的比例,将典型载荷的平方值进行简单平均。(2)解释的方 差比例。第二步是要计算通过自变量典型变量能够解释的因变量典型变量的方 差比例。这也就是自变量典型变量与因变量典型变量间相关系数的平方,也就是典型相关系数的平方。( 3 ) 冗余指数。一个典型变量的冗余指数就是这个变量的共同方差比例乘以平方典型相关系数,可以得到每个典型函数可以解释的共 同方差部分。要得到较高的冗余指数,必须有较高的典型相关系数和由因变量 6 山东大学硕上学位论文 解决这个问题,引入拉格朗日乘数6 2 、五2 构呼一垡羹鹳2 l j | 酲; 鋈l l 攀;一萋嚣耄曼一| i 一蓁 篓,;鹱 驰i ! 圭塑;影。的蒴韩:丽冗象搏熬。型晕引型i 罪弱酗涮空召繁z 型罩萄? i 壹;,恪粤涪坚型霄编豢; 冀。翼i ;霉一豢萎重,薹 螽 霎笺! 鳇萎二二鬣 囊| 蛊孝;一孝g 参 坦嗡;嚣赫斡| i 辇i ;堡一謇蚕l | _ 一蓁 i羹;毫仍需对结果做大量 的解释。这些解释包括研究典型函数中原始变量 的相对重要性。主要使用以下三种方法:( 1 ) 典型权重( 标准相关系数) :( 2 ) 典型 载荷( 结构系数) :( 3 ) 典型交叉载荷( 交叉结构系数) 。 典型权重 传统的解释典型函数的方法包括观察每个原始变量在它的典型变量中的典 型权重,即标准化相关系数( s t a n d a r d i z e dc a n o n i c a lc o e f f i c i e n t s ) 的符号和 大小。有较大的典型权重,则说明原始变量对它的典型变量贡献较大,反之则 相反。原始变量的典型权重有相反的符号说明变量之间存在一种反面关系,反 之则有正面关系。但是这种解释遭到了很多批评。这些问题说明在解释典型相 关的时候应慎用典型权重。 典型载荷 由于典型权重的缺陷,典型载荷逐步成为解释典型相关分析结果的基础。典 型载荷分析,即典型结构分析( ( c a n o n i c a ls t r u c t u r ea n a l y s i s ) ,是原始变量 ( 自变量或者因变量) 与它的典型变量间的简单线性相关系数。典型载荷反映原 始变量与典型变量的共同方差,它的解释类似于因子载荷,就是每个原始变量 对典型函数的相对贡献。 山东大学硕士学位论文 第3 章自变量组和因变量组的选取 我们将影响股票涨跌的变量称做自变量,反映股票涨跌的变量称做因变 量。 由于股票的日涨跌幅、日最大升幅、日最大降幅、股票日涨跌幅的均值能 从不同的方面反映股票的涨跌情况,故本文选取股票的日涨跌幅、日最大升幅、 日最大降幅、日涨跌幅的均值作为典型相关分析的因变量组。 影响股票涨跌的因素按大类来分,主要有:股票日k 线的基本数据、股票 所属板块指数的日涨跌幅及其名次、股票日k 线基本数据的衍生数据以及其它 影响股票涨跌的因素数据等。这样一来,可选的自变量有很多。 由于可选的自变量有很多,因此,需要在众多变量中挑选出自变量,选取 自变量的标准有两条:一是选取出来的自变量,应与因变量组的相关性大;二 是选取出来的自变量之间的相关性不大。本章将给出自变量的含义,自变量值 的获得方法,和自变量的选取方法。文中所用的股票基本数据全部从“齐鲁证 券集成版股票分析交易软件”中获得。 中国银行( 6 0 1 9 8 8 ) 股票部分日k 线图,见图3 1 。 图3 1 中国银行股票部分日k 线图 山东大学硕士学位论文 3 1 自变量和因变量数据的获得 获取变量的数据,是进行数据统计和分析的基础。这里以“齐鲁证券集成 版股票分析交易软件”为工具,介绍使用股票日k 线获取变量数据的方法,其 它获取变量数据的方法见附录。 股票日k 线的基本数据包括: 股票的昨收盘价、开盘价、最高价、最低价、收盘价 股票的日成交量 股票的平均成本价等。 运行“齐鲁证券集成版股票分析交易软件”,调出中国银行( 6 0 1 9 8 8 ) 的 日k 线图,见前面的图3 1 。 在该界面,执行菜单: 系统 数据导出 ;在弹出的“数据导出”窗口, 选“e x c e l 文件”;点“导出”按钮,即在默认路径:c :d o c u 鹏n t sa n d s e t t i n g s u s e r 桌面,生成了6 0 1 9 8 8 x l s 文件。其中,路径和文件名也可以另 行指定。 这样获取的数据包括:日期、开盘、最高、最低、收盘、成交量等十余个 数据项。这些数据项随日k 线技术指标的不同而不同,见表3 一l 。 衰3 - 1 中国银行股票日k 线基本数据 山东大学硕士学位论文 下面对使用股票“日k 线图”获取数据再做几点说明: 1 选取不同的技术指标,可以获得不同的基本数据,如:l ( d j 指标、姒c d 指标等。 2 在获取数据前,应先对日k 线做复权处理。 3 使用“齐鲁证券集成版股票分析交易软件”,既可以获取e x c e l 文件, 也可以获取文本文件,甚至还可以获取图形文件。 4 除了使用“齐鲁证券集成版股票分析交易软件”获取股票基本数据外, 也可以使用其它股票分析软件,如:国泰君安大智慧分析软件等,或通过有关 网站,如:中国上市企业资讯网等。 5 可以将6 0 1 9 8 8 x l s 文件中的某些空白行进行删除,如:第1 、2 、3 、5 行;可以将6 0 1 9 8 8 x l s 文件中的某些无关列( 数据项) 进行删除,如:第7 1 4 列;为了今后使用这些数据的方便,可以将6 0 1 9 8 8 。x l s 文件中的列进行单元格 格式设置,如:将时间设为文本格式,将开盘价、最高价、最低价、收盘价、 成交量设为数值格式( 保留两位小数) 等。 6 本文选取2 0 0 6 年7 月5 日至2 0 0 7 年8 月1 0 日之间的数据作为统计样本。 要选择其它样本,可以删除某些行,选取一段时间的数据,作为统计样本。 7 可以将6 0 1 9 8 8 x l s 文件转换成其它格式文件,如:vf 数据库表文件, 以利用vf 编程进行数据处理。 经过以上处理后的中国银行股票部分基本数据见表3 2 。 裹3 - 2 中国银行股票部分基本数据列表 3 2 因变量组的选取 本文选取了四个因变量:y 。代表股票的日涨跌幅,y :代表股票的日最大 升幅,y 3 代表股票的日最大降幅,n 代表股票日涨跌幅的1 0 0 日均值。股票日涨 1 3 山东大学硕士学位论文 跌幅的均值选取了股票的l o o 日涨跌幅均值。 3 2 1 因变量组变量值的计算 1 、股票的日涨跌幅、日最大升幅、日最大降幅的计算公式如下: 日涨跌幅= ( 收盘价一昨收盘价) 昨收盘价 日最大升幅= ( 最高价一昨收盘价) 昨收盘价 曰最大降幅= ( 昨收盘价一最低价) 昨收盘价 这三个变量的计算,比较简单,可以在e x c e l 表中进行,也可以利用vf 编程计算,这里不在累述。 2 、股票日涨跌幅的均值计算 本文利用vf 程序t j p r g ,计算股票日涨跌幅的均值。它可以一次计算 股票的多种日涨跌幅均值,即可以一次计算m 日的均值、m + 1 日的均值n 日均 值,这里设m n 。 股票日涨跌幅均值的计算程序清单及使用说明如下: c l e a r c l e a ra l l s e tt a l ko f f m = 1 0 0 n = 1 0 0 国1 0 ,2 0s a y ”i n p u tm :“g e tm 国1 2 ,2 0s a y ”i n p u tn :“g e tn r e a d u s et j c o u n tt 0s d i m ea ( s ) ,b ( s ,n ) g o1 f o ri 暑1t os a ( i ) = 日涨跌 s k i p e n d f o r g o1 f o ri 窖血t on f o rj 1 1t oi 一1 b ( j ,i ) 掌o e n d f o r f o fj i it os 1 4 山东大学硕士学位论文 b ( j ,i ) 暑o f o rk 暑j i + 1t oj b ( j ,i ) - b ( j ,i ) + a ( k ) e n d f o r e n d f o f e n d f o f f o fi 置1t os f o rj ;mt on s t 一”m a “+ a l l t r i m ( s t r ( j m + 1 ) ) i fi r e d l & s tw i t h 1 0 0 0 e ls e r e p l s tw i t hb ( i ,j ) j e n d i f e n d f o r s k i p e n d f o r r e t u r n 本程序中用到的数据库名称为:t j d b f ,数据库字段有:日期、股票的日 涨跌、m 1 、m 2 、陋2 0 等字段。m l 、腿2 、眦2 0 中分别存放股票日涨 跌幅的m 日均值、m + 1 日均值n 日均值。其中,日均值的缺省值为1 0 0 0 。 使用s p s s 统计分析软件的相关分析,得知:股票的日涨跌幅1 0 0 日均值既 与因变量日涨跌幅的相关性较小,又与自变量组的相关性大,故选取股票的日 涨跌幅1 0 0 日均值作为因变量组变量。相关分析的过程,这里不再累述。因变量 组变量值的部分数据列表见表3 3 。 表3 - 3 因变量组的部分数据列表 日期y ly 2y 3y 4 - o 2 80 8 31 3 9- o 1 0 5 60 5 62 2 3- 0 0 4 0 8 31 1 lo 5 5- o o l _ o 5 50 2 71 6 5o 0 l 2 2 l3 3 l1 1 0o 0 1 1 3 3_ o 2 71 3 31 0 0 0 吲1 1 2 8 吲1 1 ,2 9 o “1 1 3 0 0 6 ,1 2 0 1 0 6 ,1 2 ,0 | 4 0 6 0 7 1 2 3 3 自变量组的选取 自变量可从下列四类数据选取:股票日k 线的基本数据、股票所属板块指 山东大学硕士学位论文 数的日涨跌幅及其名次、股票日k 线基本数据的衍生数据以及其它影响股票涨 跌的因素数据等。 3 3 1 股票日k 线基本数据中自变量的选取 股票日k 线基本数据 这些数据包括:( 1 ) 股票价格:昨收盘价、开盘价、最高价、最低价、收盘价 等;( 2 ) 股票的日成交量;( 3 ) 股票的平均成本价等。 平均成本价可从股票日k 线上获得,其它数据的获得方法前面已经给出。 股票日k 线基本数据的自变量选取 使用s p s s 软件,对中国银行2 0 0 6 年7 月5 日至2 0 0 7 年8 月1 0 日共2 7 0 个 交易日的数据进行相关分析,得到如下结论: ( 1 ) 昨收盘价与因变量( 日涨跌幅、日最大升幅、日最大降幅、日涨跌幅的l o o 日均值) 的相关系数在0 9 9 5 以上,且在0 0 1 的水平上显著相关。因此,在这5 个变量中,我们将昨收盘价作为自变量组变量。 ( 2 ) 股票的日成交量与因变量( 日涨跌幅、日最大升幅、日最大降幅、日涨跌 幅的1 0 0 日均值) 的在0 0 1 的水平上显著相关,我们将成交量也作为自变量组 变量。 3 3 2 股票所属板块指数日涨跌幅中自变量的选取 中国银行( 6 0 1 9 8 8 ) 是上海证券交易所的股票,隶属于上证指数板块,且隶 属于北京板块、金融行业、沪深3 0 0 、3 0 0 金融、上证1 0 0 、上证5 0 、中证1 0 0 、 道琼斯8 8 、含h 股、奥运概念、基金重仓等行业和概念板块。股票所属板块指 数的日涨跌幅是指这些板块指数的日涨跌幅;股票所属板块指数日涨跌幅的名 次是指这些板块指数在所有板块指数日涨跌幅中的名次。 使用s p s s ,对中国银行2 0 0 6 年7 月5 日至2 0 0 7 年8 月1 0 日共2 7 0 个交易 日的数据进行相关分析,得到如下结论: 在这些行业和概念板块指数中,上证指数的日涨跌幅与因变量( 日涨跌幅、 日最大升幅、日最大降幅、日涨跌幅的l o o 日均值) 的相关性最大。因此,我们 只选取上证指数日涨跌幅作为自变量组变量。 这里用到的道琼斯8 8 、含h 股、奥运概念、基金重仓等4 个行业和概念板 块指数的日涨跌幅用v f 语言程序计算获得,程序清单及使用说明如下,其它行 1 6 山东大学硕士学位论文 业和概念板块指数的日涨跌幅由它们的日k 线图获得基本数据,再经过简单计 算得到。 股票所属板块指数日涨跌幅的计算程序包括一个主程序b k t j p r g 和一个子 程序s u b p r g 。它可以计算股票所属板块指数的日涨跌幅,及其在所有板块中的 涨跌名次。 其中,日期板块库要求按板块的日涨跌幅由大到小次序排列。 b k m c p r g 程序清单如下: c l e a r c l e a ra 1 1 s e tt a l ko f f s t = d a t e ( ) e t = d a t e ( ) l o ,2 0s a y i n p u ts t a rd a t e :”g e ts t 1 2 ,2 0s a y i n p u te n dd a t e :g e te t r e a d n = e t s t + 1 d i m e n s i o na ( n ) ,t i ( n ) u s e 上证指数 t = s t k = 0 f o ri = 1t on 1 s = d t o c ( t ) l s = ”2 0 ”+ s u b s t r ( 1 s ,7 ,2 ) + s u b s t r ( 1 s ,1 ,2 ) + s u b s t r ( 1 s ,4 ,2 ) 1 0 c aa l lf o r 日期= l s i ff o u n d ( ) k = k + 1 a ( k ) = ”b k + 1 s t i ( k ) = a 1 1 t r i m ( 日期) e n d i f t = t + 1 e n d f o r c l e a r d oc a s e c a s ek = 0 1 0 ,2 0s a y 该段时间无交易 w a i t c a s ek = l 1 0 ,2 0s a y ”该段时问只有一个交易日,板块统计数据存在b k t j d b f 中” w a i t d os u b o t h e r w js e 1 7 山东大学硕上学位论文 第4 章实例分析本章将使用s p s s 1 0 o 统计分析软件,建立中国银行( 6 0 1 9 8 8 ) 的典型相关 分析模型,并将该模型应用于工商银行(601398)。 4 1 典型相关实例分析 这里选取中国银行2 0 0 6 年7 月5 日至2 0 0 7 年8 月l o 日共2 7 0 个交易日的数据进行典型相关分析,其它时间段的统计分析见附录。s p s s 10o典型相关分析宏命令如下: 工n c l u d e 。d :p r o g r 硼f i l e s s p s s c a n o n i c a lc o r r e l a t i o n s p s c a n c o r rs e t l 皇x 1 ,x 2 ,x 3 ,x 4 ,x 5 ,x 6 ,x 7 s e t 2 = y 1 ,y 2 ,y 3 ,y 4 执行典型相关分析宏命令,得到各种统计数据,下面给出这些数据和对这 些数据的分析。 统计中所有变量的缺省值均为1 0 0 0 。 4 1 1自变量组与因变量组的相关性分析 见表4 一l 襄4 - 1 自变量组与因变量组的相关系数 由表4 1 可知,自变量组与因变量组各指标之间都有很强的相关性,只是 由于各指标具体内容不同,造成相关程度上存在一定程度的差异性,总体上能 够用自变量组的指标来解释因变量组。 4 1 2 典型相关系数及其显著性检验 2 l 山东大学硕士学位论文 从表4 2 可以看出,这四个典型相关系数均较高,表明相应的典型变量之 间密切相关,高度相关,自变量组变量对因变量组变量的影响明显。通过比较 他们各自的z 2 统计量计算值、临界值及p 值,4 对典型变量通过了z 2 统计量的 检验,且p 值都小于o 0 5 。这表明,这4 对典型变量之间相关系数显著,能够 用自变量组的典型变量来解释因变量组的典型变量。 4 1 3 典型相关变量 鉴于原始变量的计量单位不同,不宜直接比较,这里采用标准化的典型变 量系数,构建典型变量,见表4 3 。 裹4 _ 3 典型相关变量 宝曼墨型塑茎錾量 1 ;却1 1 “五+ o 1 9 。毛一o 3 7 。恐一o 9 2 。 k = 一l 0 1 兑一o 9 l 乃 2 屹:o 7 8 。而+ o 1 3 。毛+ o 1 8 。_ + o 3 3 “而 ,2 = o 7 3 乃一0 3 9 。乃+ o 2 。乃 3 吩:加5 。而+ 0 3 4 。而+ o 4 4 。恐一o 5 旄+ o 6 5 。而 v j = 乏5 m + 1 8 乃一1 2 乃 4 :o 2 。葺+ o 7 4 屯+ 0 4 8 。而+ o 3 8 - 一o 4 3 一o 2 4 。毛 v 4 = 加2 6 0 乃+ o 9 9 0 儿 4 1 4 冗余度分析 冗余度分析是对构建的典型相关变量解释能力的判断,见表4 4 。 山东大学硕士学位论文 表4 - 4 典型冗余度分析 从表4 4 可知,前4 对典型变量的解释能力均较强。典型相关系数的平方 数据显示,因变量组变量中分别有9 9 、7 6 、7 4 、5 0 的信息可由相应的自变 量组变量予以解释。但方差比率只反映出因变量组和自变量组对第1 、第2 对典 型变量具有较高的解释能力。 4 1 5 影响分析 根据典型变量的重要程度及系数大小,从建立的典型相关变量可以看出,股 票的涨跌及其影响因素的关系可以用4 对典型相关变量予以综合描述。 第1 对典型变量中,对自变量典型变量中起主要作用的是日k 线下影线 长度、x 5 日k 线上影线长度,它们与自变量典型变量皆为负相关;对因变量典型 变量中起主要作用的是y 2 日最大升幅、y 3 日最大降幅,它们与因变量典型变量 皆为负相关。第1 对典型变量反映的是股票日k 线的上、日k 线下影线长度和 股票升、日最大降幅之间的关系,它们之间成正相关。 第2 对典型变量中,对自变量典型变量中起主要作用的是x 。上证指数涨跌 幅,它与白变量典型变量皆为正相关;对因变量典型变量中起主要作用的是y 。 股票的日涨跌幅,它与因变量典型变量正相关。第2 对典型变量反映的是上证 指数的日涨跌幅、股票的日涨跌幅之间的关系,它们之间成正相关。因此,进 行股票投资,必须对大势要有正确的预测,要善于在行业和概念中把握个股。 第3 对典型变量中,对自变量典型变量中起主要作用的是x ,股票的高开低 开,它与自变量典型变量正相关;对因变量典型变量中起主要作用的是股票的 日涨跌幅,它与因变量典型变量负相关。第3 对典型变量反映的是股票的高开 低开和股票日涨跌之间的关系,它们之间成负相关。 山东大学硕士学位论文 由表4 5 可知,对工商银行而言,自变量组与因变量组各指标之间也有 很强的相关性,只是由于各指标具体内容不同,造成相关程度上存在一定程度 的差异性,总体上能够用自变量组的指标来解释因变量组。 4 2 2 典型相关系数及其显著性检验 裹4 - 6 典型相关系数及其显著性检验 从表4 6 可以看出,这四个典型相关系数均较高,表明相应的典型变量之 间密切相关,高度相关,自变量组变量对因变量组变量的影响明显。通过比较 他们各自的z 2 统计量计算值、临界值及p 值,4 对典型变量通过了z 2 统计量的 检验,且p 值都小于0 0 5 。这表明,这4 对典型变量之间相关系数显著,能够 用自变量组的典型变量来解释因变量组的典型变量。 4 2 3 典型相关变量构建 鉴于原始变量的计量单位不同,不宜直接比较,这里采用标准化的典型变 山东大学硕士学位论文 量系数,构建典型相关变量。 见表4 7 寰4 - 7 典型相关变量 序号典型相关变量 l m :o 6 ) 而+ o 5 2 。一o 6 。而 h = l 7 5 m l 4 5 儿+ l 1 4 乃 2 屹:- o 7 4 。五+ o 6 3 而一o 6 4 。而一o 7 7 。 屹= 一1 1 3 乃一0 5 4 乃 3 嵋= 一o 6 5 而一0 4 5 吒+ o 6 5 而+ o 5 6 _ 一o 3 5 民 码= - o 5 7 m + 1 0 7 儿+ o 7 5 “乃+ o 4 4 儿 4 ;1 2 。_ = - o 8 7 m o 6 4 弘+ o 7 3 儿 4 2 4 冗余度分析 冗余度分析是对构建的典型相关变量解释能力的判断,见表4 8 。 裹4 - 8 典型冗余度分析 从表4 8 可知,前4 对典型变量的解释能力均较强。典型相关系数的平方 数据显示,因变量组变量中分别有9 6 、8 6 、7 4 、3 7 的信息可由相应的自变 2 6 山东大学硕士学位论文 量组变量予以解释。但方差比率只反映出因变量组和自变量组对第l 、第2 对典 型变量具有较高的解释能力。 4 2 5 影响分析 根据典型变量的重要程度及系数大小,从建立的典型相关变量可以看出,股 票的涨跌及其影响因素的关系可以用4 对典型相关变量予以综合描述 第1 对典型变量中,对自变量典型变量中起主要作用的是x 5 日k 线上影线 长度、】【e 日k 线下影线长度、x ,股票的日高开低开率;对因变量典型变量中起主 要作用的是y 。日涨跌幅、y :日最大升幅、y 3 日最大降幅。第1 对典型变量反映的 是股票日k 线的日高开低开率、上下影线长度和股票涨跌之间的关系。 第2 对典型变量中,对自变量典型变量中起主要作用的是x 。上证指数涨跌 幅、x 。股票的昨收盘价、x 3 股票的日成交量,抽股票的收盘价减去股票的平均成 本价;对因变量典型变量中起主要作用的是y l 股票的日涨跌幅、y 4 股票日涨跌 幅均值。第2 对典型变量反映的是上证指数涨跌幅、股票的昨收盘价、股票的 日成交量,股票的收盘价减去股票的平均成本价与股票的日涨跌幅、股票日涨跌 幅的均值之间的关系。 第3 对典型变量中,对自变量典型变量中起主要作用的是x 。上证指数的日 涨跌幅、x 。股票的昨收盘价、x 。股票的日成交量、轴股票的收盘价减去股票的平 均成本价、粕股票日k 线下影线长度;对因变量典型变量中起主要作用的是股票 的y 2 股票的日最大升幅、y 3 股票的日最大降幅。第3 对典型变量反映的是上证 指数的日涨跌幅、股票的昨收盘价、股票的日成交量、股票的收盘价减去股票 的平均成本价、股票日k 线下影线长度与股票的日最大升幅、股票的日最大降 幅之间的关系。 第4 对典型变量中,对自变量典型变量中起主要作用的是x ;股票的收盘价 减去股票的平均成本价,它们与自变量典型变量皆为正相关;对因变量典型变 量中起主要作用的是y 。股票的日涨跌幅、y 3 股票的日最大降幅、乳股票日涨跌幅 的均值。第4 对典型变量反映的是股票的收盘价减去股票的平均成本价和股票 的均涨跌幅、股票的日最大降幅、股票日涨跌幅的均值之间的关系。 山东大学硕士学位论文 附录 一、中国银行其它时间段样本的统计分析 这里以中国银行( 6 0 1 9 8 8 ) 具有代表性的股票价格上升期、下降期和盘整期 三个时间段进行统计分析。 l 、上升期的统计分析 这里以中国银行2 0 0 6 年1 1 月1 5 日至2 0 0 7 年1 月4 日,上升期共3 4 个交 易日的统计结果为例,进行数据统计分析。统计结果见附表1 、附表2 、附表3 。 附裹1 自变量组与因变量组的相关系数 上证股票的股票的股票的收股票k 线 股票的日股票的 指数昨收盘日成交 盘价平上影线长k 线下影日高开 涨跌价 量均成本价度线长度低开率 x 1 o 6 3 x 2 o 5 8 0 7 8 x o 7 5 x 5 0 0 8 x 6 0 9 1 0 3 5 股票的日涨跌 幅y l 股票的日最大 升幅y 2 股票的日最大 降幅y 3 o 5 o 7 4 o ,5 4 o 2 5 o 9 4 o 5 4 0 8 5 o 4 0 4 8 o 0 0 o 9 1o 5 8 o 4 2 以2 9 股票的1 0 0 日涨 o 4 10 9 60 8 6 0 9 8 o 5o 8 20 6 5 跌幅均值y 4 附表2 典型相关系数及其显著性检验 典型变量典型相关系数w i l k sc h i s - s q d f s i g 数 山东大学硕士学位论文 具有较高的解释能力。 ( 5 ) 影响分析 第l 对典型变量中,对自变量典型变量中起主要作用的是x :昨收盘价、】【b 日k 线下影线长度,它们与自变量典型变量分别为负、正相关;对因变量典型 变量中起主要作用的是y 2 日最大升幅,它们与因变量典型变量为正相关。第l 对典型变量反映的是股票的昨收盘价、日k 线下影线长度和股票日最大升幅之 间的关系。 第2 对典型变量中,对自变量典型变量中起主要作用的是x 2 昨收盘价、x 股票的收盘价减去平均成本价的差,它们与自变量典型变量分别为正、负相关; 对因变量典型变量中起主要作用的是y 。涨跌幅、y | 日均涨跌幅,它们与因变量 典型变量分别为负、正相关。第2 对典型变量反映的是昨收盘价、股票的收盘价 减去平均成本价的差和股票的日涨跌幅之间的关系。 第3 对典型变量中,对自变量典型变量中起主要作用的是】【4 股票的收盘价 减去平均成本价的差,它与自变量典型变量正相关;对因变量典型变量中起主 要作用的是y :股票日最大升幅,它与因变量典型变量负相关。第3 对典型变量 反映的是股票的收盘价减去平均成本价的差和股票日最大升幅之间的关系,它 们之间成负相关。 第4 对典型变量中,对自变量典型变量中起主要作用的是x 。股票的收盘价 减去平均成本价的差,它与自变量典型变量正相关;对因变量典型变量中起主 要作用的是y 。股票的日涨跌幅,它与因变量典型变量负相关。第4 对典型变量 反映的是股票的收盘价减去平均成本价的差和股票日涨跌幅之间的关系,它们 之间成负相关。 2 、下降期的统计分析 这里以中国银行2 0 0 7 年5 月1 0 日至2 0 0 7 年7 月1 5 日,下降期共4 0 个交 易日的统计结果为例,进行数据统计分析。 统计结果见附表5 、附表6 、附表7 、附表8 。 3 l 山东大学硕士学位论文 附表6 典型相关系数及其显著性检验 附表7 典型相关变量 序号典型相关变量 = _ o 3 9 弓一o 8 9 m = o 1 m o 7 4 一0 9 1 乃 2 = _ o 2 3 耳+ 1 o 而一o 2 2 而+ o 1 5 矗 v 2 = - 0 4 乃+ o 9 2 乃 3 蚝:- 0 6 3 五+ o 5 7 恐一0 8 7 _ 一o 3 7 一o 3 6 一o 1 6 而 屹= - o 7 1 咒一o 3 5 儿一o 3 7 儿 4 心:o 6 3 而+ 0 1 5 而+ o 1 4 而一o 2 8 黾+ 0 5 4 毛一0 4 9 矗+ o 7 9 而 v 4 = 一1 9 9 m + 1 2 8 m 1 3 6 乃一o 1 几

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论