



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、微机应用第27卷第3期,2011年微机应用研究与设计第27卷第3期,2011年,第29期。1007-757X(2011)03-0029-02数据的灰色关联分析。于萍李可摘要:灰色关联分析是利用微软的Excel函数和数据分析工具软件进行的,用于分析世界主要指数与原油期货走势的关联度。用电子表格计算灰色关联度。结果表明,各指数与原油期货走势的相关程度为道琼斯指数、富时上海综合指数、纳斯达克、美国指数和深交所指数。表明用电子表格进行灰色关联分析是可行的,易于推广和推广。道琼斯指数与原油期货走势有较强的相关性。关键词:灰色关联分析;Excel函数;原油期货分类编号:TP391文件符号代码:B 0简介为
2、了定量研究事物之间的相关程度,人们提出了各种形式的相关系数,如典型相关系数和相似系数。这些系数都是基于数理统计理论,使用时需要大量的数据,因为数据量小,很难找出统计规律。灰色关联分析方法在一定程度上弥补了这一不足,也适用于基于灰色系统理论的数据少、信息差的情况。灰色系统理论起源于20世纪80年代,主要研究不完全信息系统。灰色关联分析的目的是确定参考序列和比较序列之间的相关系数和关联度,找出系统中各因素之间的主要关系。原油期货走势受多种因素影响。3.这些因素的影响程度并不明确,是一个灰色系统,因此应该用灰色关联分析法对其进行分析,以得到更加客观、科学的评价结果。介绍了利用电子表格软件进行灰色关联
3、分析的具体过程。1材料与方法原油期货的原始数据及其影响因素来自网上每日收盘价。由于数据都是时间序列,不适合多元回归和逐步回归,所以采用灰色关联分析。在多元统计中,如果一个变量随另一个变量变化,那么X是自变量,Y是因变量。在灰色关联方法中,x称为比较系列(xi),y是参考系列(x0)。在本例中,为了分析上证综指、深成指、富时、道琼斯、纳斯达克、标准普尔和美元对原油期货走势的影响,我们将原油期货的日收盘价作为参考序列,其他指数的日收盘价作为比较序列,如图1所示。相关分析的基本思想是通过分析比较系列指数变化对参考系列指数的影响来判断相关程度。本文中的所有操作都是通过Excel函数及其“分析数据库”工
4、具完成的。如果未安装此功能,请依次选择“工具”-“添加宏”,并在安装光盘上加载“分析数据库”。成功加载后,您可以在工具下拉菜单中看到数据分析选项。2分析过程和结果2.1图1是原始数据表。对于制作本例的原始数据没有特殊要求,只要它在每一列中满足相同的属性值。图中的红色数据是端午节休市期间中国股市的插值数据。最后一行是平均值。Excel通过在单元格中输入函数公式(参见fx列)并将其向右平行拖动来计算平均值,以获得每列的平均值。原油期货的日收盘价为参考序列,其他指数的日收盘价为比较序列。图1原始数据内容2.2原始数据转换-无量纲原始数据由于系列的单位或维度不同,在进行相关性分析之前,系列应无量纲化,
5、以实现维度一致性。本文采用平均变换,即分别得到每个序列数据的平均值,然后用平均值去除相应序列中的原始数据,得到的商就是一个新的数据序列,即平均序列作者简介:于萍(1962-),女,山东青岛人,汕头大学医学院,助理实验员,大专,计算机应用,广东汕头人,515041李可(1954-),男,江西临川人,汕头大学医学院教授,博士,统计学,广东汕头人,515041微机应用卷。2011年微机应用研究与设计第27卷第3期,2011年,30图2对原始数据进行平均。2.3找出每次比较序列和参考序列之间的绝对差异。计算公式是指fx列中的函数公式,图3中的数据是拉取后得到的。图3平均后参考序列和比较序列之间的绝对差
6、值2.4求两个极点的最大值和最小值。在Excel中选择“格式”-“条件格式”后,出现属性设置框,依次选择“单元格值”-“相等”,使用公式:=max ($ c $49: $ j $70)和=min ($ c $49)计算xi与x0的相关系数I,i=(MAX MIN)/(xi MIN),其中分辨率系数为0,1,一般取=0.54。根据这一I计算公式,编制出图4 FX列的函数公式,并拉取后得到参考序列与各比较序列之间的相关系数(图4)。图4通过参考序列和每个比较序列之间的相关系数2.5来计算相关度,并且基于灰色相关系数来进一步计算灰色相关度。所谓相关度,实质上是曲线之间几何形状的差异程度。因此,曲线之
7、间的差异可以用作相关程度的度量。因为相关系数是比较序列和参考序列在每个时间(即曲线中的每个点)的相关度值,所以它具有一个以上的数字,所以有必要将每个时间(即曲线中的每个点)的相关系数集中为一个值,即平均值,作为比较序列和参考序列之间的相关度的定量表达。在Excel中选择“工具”-“数据分析”-“描述统计”,出现属性设置框。选择数据区域后,您可以得到图4中每一列数据的平均值和标准偏差。结果是:上证综指=0.95260.0355;深圳成分指数=0.70910.1569;富时=0.95500.0371;道琼斯指数=0.96510.0252。奈芝=0.95150.0335;标准普尔=0.95750.0
8、299;美元指数=0.93490.0450。根据关联度排序,各因素与原油期货的关联度如下:道琼斯指数、富时上海综合指数、美国指数、深交所指数,既显示了影响原油期货走势的因素,又显示了各因素与原油期货走势的主次关系。3 .论述了利用电子表格进行统计分析具有方便、易于推广的优点,适用于完成一些简单的统计分析。由于Excel的统计分析是直接在数据表中进行的,所以便于数据的动态管理和连续分析。当因素极性不一致时,灰色关联分析通常需要极性转换。根据灰色关联法的要求,极性需要一致。因此,灰色关联系数没有符号。当事物之间存在负相关关系时,相关度也是正的,例如本例中原油期货与美元指数之间的关系。本文分析了世界
9、主要股指和美元指数对国际原油期货走势的影响。除了美元指数的负面影响,其他指数都有正面影响。结果表明:第一,道琼斯指数对原油期货走势的影响最大,美元与原油期货呈稳定的负相关关系;其次,上证综指与原油期货的相关强度与欧美主要股指相似,值得进一步研究和关注。(续第37页)微机应用第27卷第3期微机应用的发展与应用第27卷第3期2011表2:2的选择结果:SVM主要参数4.3实验结果分析:从表1和表2可以看出,分类算法四的准确率、召回率和F1值最高;准确性,回忆然而,算法二、三和四需要较长的计算时间,因为粒子群优化算法用于优化参数的选择。但是,算法一的主要参数都是固定的,所以参数的选择是盲目的,只能依
10、靠经验和运气。如果您想调试传统内核函数的参数以达到最佳的分类效果,您必须手动调试它。但是,每次调试都需要很长时间(在本文的示例中,大约需要半个小时),并且调试结果不一定是最佳的。虽然算法四的计算时间较长,但通过一次计算,可以获得比原始文本倾向性分类更高的准确率、精确度和F1值,值得花费这一时间。结论本文针对传统的文本倾向性分类方法,采用了一种新的SVM方法,该方法结合了多种不同的全局核函数和局部核函数。采用粒子群优化算法对SVM参数和组合核函数的组合参数进行优化,减少了训练和推广中参数选择的盲目性,提高了训练精度和泛化能力,改善了文本倾向性分类算法的分类效果。为了提高文本倾向性的分类性能,还需
11、要改进语义分析、分词和特征提取等方法。同时,有必要进一步改进本文提出的SVM改进方法,进一步减少训练时间,这也是我们今后工作的方向。竖起大拇指还是竖起大拇指?语义定向在评论无监督分类中的应用。计算语言学协会第40届年会论文集,李艳玲,戴冠中,朱业兴,2002年2月。基于类别空间模型的文本倾向性分类方法J.计算机应用,2007年9月,第27卷,第9.3期.基于语义理解的文本倾向性识别机制J.中国信息学报,2007年1月,第21卷,第1.4期.网络舆情信息获取与分析研究D;上海:上海交通大学,2008年1月5日,李,SVM-KNN组合改进算法在专利文本分类中的应用J.计算机工程与应用,212 2006.20.6杨昌华,凯文辛一,林新海.从博客公司建立情感词典。在美国公民自由联盟2007年的演示和海报会议记录中。(接收日期:2010年1月19日)(续第30页)。教材1:邓巨龙灰色系统基本方法M武汉:华中科技大学出版社,2002年2月刘思峰、党郭尧、方志庚。灰色系统理论及其应用科学出版社,2005。3刘江永。国际政治与原油期货的真相与规律探索,载现代国际关系20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论