



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Microcomputer Applications Vol. 27, No.3, 2011研究与设计2011 年第 27 卷第 3 期微型电脑应用文章编号:1007-757X(2011)03-0029-02使用Microsoft Excel进行数据的灰关联分析于萍 李克摘要:使用Microsoft Excel函数和数据分析工具软件进行灰关联分析,并应用于世界主要指数与原油期货走势的关联程度分 析。使用Excel计算灰关联度。结果显示各指数与原油期货走势的关联度,依次为道指标普富时上证指数纳指美指深 证成指。表明使用Excel进行灰关联分析是可行的,并且易于普及和推广;道琼斯指数对原油期货的走势具有更强的关联。 关键词:灰关联分析;Excel函数;原油期货中图分类号:TP391文献标志码:B0引言2分析过程和结果为了定量的研究事物之间的关联程度,人们提出了各种形式的相关系数,如典型的相关系数和相似系数等。这些系 数都是以数理统计理论为基础的,使用时要求有大量的数 据,因为数据量少会难以找出统计规律,灰关联分析方法从某种程度上弥补了这种缺憾,对于少数据、贫信息的情况同样适合,依据的是灰色系统理论。灰 色系统理论源于 20 世纪 80 年代,其主要是考察和研究信息 不完备的系统1。灰关联分析的目的,是确定参考序列和若 干个比较序列之间的关联系数和关联度,寻求系统中各个因 素间的主要关系2。原油期货的走势受许多因素的影响3,诸因素的影响 程度尚不清楚,为一灰色系统,宜采用灰色关联分析法进行 分析,以得出更为客观、科学的评价结果。本文介绍了使用 Excel 软件进行灰关联分析的具体过程。2.1 图 1 为原始数据表格,制作本实例的原始数据无特殊要求,只要满足各列中为同一属性数值即可。图中红色数 据为中国股市端午节休市期间的内插数据,最后一行为均 数,Excel 计算均数的方法是在单元格中输入函数式(见 fx栏),向右平行拉拽得每列均数。原油期货每日收盘价为参考数列,其余指数每日收盘价为比较数列。1材料与方法原油期货及其影响因素的原始数据来源于网上每日行情收盘价,因数据均为时间序列,不适合用多元回归、逐步 回归等方法处理,故采用灰色关联分析。在多元统计中,如 某变量(y)随另一变量(x)的变化而变化,则称 x 为自 变量,y 为应变量。而在灰关联方法中则称 x 为比较数列(xi),y 为参考数列(x0)。本例中,旨在分析上证指数、 深证成指、英国富时、道琼斯、纳斯达克、标准普尔、美元 等指数对原油期货走势的影响,故设定原油期货每日收盘价为参考数列,其余指数每日收盘价为比较数列,如图 1 所示。关联分析的基本思想是通过分析比较数列指标变化对参考 数列指标的影响来判断其关联度。本文所有操作使用 Excel 函数及其“分析数据库”工具完成,如果没有安装这项功能,请依次选择“工具”-“加 载宏”,在安装光盘中加载“分析数据库”。加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项。图 1 原始数据内容2.2 原始资料变换-无量纲化 原始数据由于数列单位不同或量纲不同,在进行关联分析之前,首先对各数列进行无量纲化处理,达到量纲一致。 本文采用均值化变换,即分別求出各个序列数据的平均值,再用平均值去除对应序列中的各个原始数据,所得到的商为新的数据列,即均值化数列。在 Excel 中,这一过程可通过 在单元格中输入函数式(见 fx 栏)并向右向下拉拽得图 2 数据。作者简介:于萍,(1962-),女,山东青岛,汕头大学医学院,助理实验师,大专,计算机应用,广东汕头,515041李克,(1954-),男,江西临川,汕头大学医学院,教授,博士,统计学,广东汕头,515041Microcomputer Applications Vol. 27, No.3, 2011研究与设计2011 年第 27 卷第 3 期微型电脑应用图2 对原始数据进行均值化处理图4 参考序列与各比较序列间的关联系数2.5 计算关联度 在灰关联系数基础上进一步求出灰关联度。所谓关联程度,实质上是曲线间几何形状的差别程度。因此曲线间差值大小,可作为关联程度的衡量尺度。因为关联系数是比较数 列与参考数列在各个时刻(即曲线中的各点)的关联程度值, 所以它的数不止一个,因此有必要将各个时刻(即曲线中的 各点)的关联系数集中为一个值,即平均值,作为比较数列 与参考数列间关联程度的数量表示。在 Excel 中选择“工具”-“数据分析”-“描述统计” 后,出现属性设置框,选择数据区域后,可以获得图 4 各列 数据的平均数及其标准差,结果为:上证指数=0.95260.0355;深证成指=0.70910.1569;富时=0.95500.0371;道指=0.96510.0252;纳指=0.95150.0335;标普=0.95750.0299;美指=0.93490.0450。 根据关联度排序,各因素对原油期货的关联程度依次为:道指标普富时上证指数纳指美指深证成指,该 结果不仅表明了影响原油期货走势较大的因素,同时也表明了各因素对原油期货走势的主次关系。2.3 求差序列求各个时刻比较数列与参考数列的绝对差,计算公式参考 fx 栏中函数式,拉拽后得图 3 数据。图3 均值化后参考序列与比较序列的绝对差2.4 求两极最大值和最小值在 Excel 中选择“格式”-“条件格式”后,出现属性设置框,依次选择:“单元格数值”-“等于”,使用公式:=MAX($C$49:$J$70)和=MIN($C$49:$J$70)并选择数据区 域,在“格式”中选择颜色,可以找出两极最大值和最小值, 并标记上颜色,本例标记为红色,见图 3。计算 xi 对 x0 的关联系数i ,i =(MAX+ MIN)/(xi+MIN),式中为分辨系数, 0 ,1 ,一般 取= 0.54。根据此i 计算公式编制图 4fx 栏中的函数式, 拉拽后得到参考序列与各比较序列间的关联系数(图 4)。3讨论使用 Excel 进行统计分析具有方便易于普及的优点,适合完成一些简单的统计分析,由于 Excel 的统计分析直接在 数据表中进行,所以便于数据的动态管理以及连续分析。灰关联分析对于因素极性不一致时,通常要作极性转换。按照 灰关联方法的要求,极性需要一致。所以灰关联系数并没有正负号之分,当事物之间为负的联系时,其关联度亦为正数,如本例中的原油期货与美元指数之间关系。本文分析了世界 主要股票指数以及美元指数对国际原油期货走势的影响,除 美元指数为负的影响外,其它指数均为正向影响,结果表明: 一是道琼斯指数对原油期货走势的影响是最强的,美元与原 油期货呈现稳定的负关联,二是上证指数与原油期货的关联 度强度与欧美主要股票指数相近也值得进一步研究和注意。(下转第 37 页)30Microcomputer Applications Vol. 27, No.3, 2011开发应用微型电脑应用2011 年第 27 卷第 3 期表 2:SVM 主要参数的选取结果4.3 实验结果的分析:法的分类效果有了提高。文本倾向性分类性能的提高,也需要结合语义 分析、分词、特征提取等方法的改进。同时,还需 要对本文提出的 SVM 改进办法进一步改进,进一 步减少训练时间,这也是我们以后工作努力的方向。从表 1、表 2 可以看出,分类算法 IV 的准确率、召回率和 F1 值是最高的;分类算法 II 和分类算法 III 的准确率、召回率、F1 值都比分类算法 I 的高; 分类算法 II 和分类算法 III 之间的准确率、召回率、 F1 值相比互有优劣。但是算法 II、III、IV 需要的 计算时间较长,原因是采用了粒子群算法对参数的 选择进行了寻优。但是,算法 I 的主要参数选择, 都是固定的,对参数的选择就很盲目,只能依靠经 验和运气。如果要调试传统核函数的各项参数,使 得分类的效果达到最优,就必须人工进行调试。但 是,每调试一次就要花费相当长的时间(在论文中 的例子约半小时),而且调试结果不一定最优。虽 然算法 IV 的计算时间较长,但是只是一次性的计 算就可以达到比原来的文本倾向性分类较高的准 确度、精度和 F1 值,因此还是值得花这个时间的。参考文献1 Turney.P. Thumbs Up or Thumbs Down? SemanticOrientationAppliedtoUnsupervisedClassfication of Reviews.In proceedings of the40th Annual Meeting of the Association forComputational Linguistics, 2002.2 李艳玲,戴冠中,朱烨行.基于基于类别空间模型 的文本倾向性分类方法J.计算机应用.2007 年9 月第 27 卷第 9 期.3 徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾 向性识别机制J.中文信息学报.2007 年 1 月, 第 21 卷,第 1 期.4 金晓鸥;互联网舆情信息获取与分析研究D; 上海:上海交通大学,2008 年 1 月5 李程雄,丁月华,文贵华.SVM-KNN 组合改进算 法在专利文本分类中的应用J.计算机工程与 应用.212 2006.20.6 Changhua Yang, Kevin Hsin-Yih, Lin Hsin-His Chen. Building Emotion Lexicon from Weblog Corpora. In proceedings of the ACL 2007 Demo and Poster Sessions.5结束语本文针对文本倾向性分类的传统办法,采取了新的组合多个不同的全局核函数和局部核函数的 SVM,并且通过粒子群算法来优化 SVM 的各项参 数,以及对组合核函数的组合参数进行优化,减少 了训练推广时的参数选择盲目性,提高了训练的精 度、提高了泛化推广能力,使得文本倾向性分类算(收稿日期:2010-01-19)(上接第 30 页)应用M. 科学出版社, 2005.3 刘江永. 国际政治与原油期货真相与规律的 探究J. 现代国际关系, 2009,6:9-17.4 东亚斌,段志善. 灰色关联度分辨系数的一种新 的确定方法J. 西安建筑科技大学学报, 2008,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人与家教合同范本
- 加工定做印刷合同范本
- 项目机器购买合同范本
- 代办管道维修合同范本
- 劳动合同范本 景区
- 种植基地订单合同范本
- 电台广告合同范本
- 混合痔外剥内扎术后护理查房
- 回归热脾区叩击禁忌护理查房
- 内部调岗合同
- 医学影像学与辅助检查
- 电力工程竣工验收报告
- 黑龙江小学生诗词大赛备考试题库400题(一二年级适用)
- 《HSK标准教程1》第4课课件
- 双J管健康宣教
- 如何提高美术课堂教学的有效性
- 水电站新ppt课件 第一章 水轮机的类型构造及工作原理
- 护理查对制度课件
- 市政工程占道施工方案
- GB/T 39965-2021节能量前评估计算方法
- GB/T 20671.1-2006非金属垫片材料分类体系及试验方法第1部分:非金属垫片材料分类体系
评论
0/150
提交评论