事务间关联规则挖掘在股价_期货价格预测中的应用.pdf_第1页
事务间关联规则挖掘在股价_期货价格预测中的应用.pdf_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

程淤 轰攀 事务间关联规则挖掘在股价 期货价格预侧中的应用 邢文靖 北京航空航天大学经济管理学院 北京 摘要 关联规则作为数据挖掘的一种重要分析方法 在近 年来发展日趋成熟 在金融领域 一些研究已开始关注利用关联规则挖掘不同金融产品价格间的关 联性 不 同市场变动趋势之间的关联性等 然而 前人的研究主要集中在事务内相关性挖掘 发面 引入事务间关联规则的概念 并利用 算法研究中国股票市 场 债券市场 期货市场变动的关联性 以及不 同国家 间股票市场的关联性 关镇词 数据挖掘 工 算法事务间关联规则板块联动 中图分类号 文献标识码 文 编 号 一 一 一 引 决联规则的概念由 和 耐 提出 是数据 中一 种简单但很实用 的规则 给定一个项的集合 分别表示两个项集 则 关联规则表示为 传统的关联规则挖掘算法只能挖掘出现在同一事务或同一序列中项间 的关联规则 如 若 与长虹的股价同时上涨 则当日海信的股价上 涨的可能性为 族 然而股票投资者可能更关心类似 的规则 若 与长虹的股价在第一个交易日同时上涨 则两日后海信 的股价以 既的 概率上涨 规则 显示 了同一事务内不同项 间的关系 而 显示了不同事务中在 特定维属性上的关联 根据文献 称经典的关联规则 如 为事务 内关联规则 称后者为事务间关联规则 文献 提出跨事务或事务间关 联规则的概念 并将其应用在证券市场分析中 文献 提出了 算 法 利用频繁事务内项集产生频繁事务间项集 本文利用事务间关联规则挖掘方法研究中国金融市场股票 债券 期 货 汇率等指标的相关性 并尝试预测的可能性 二 向 描迷 定义 定义 氏 表示项目的集合 是一组非负整数的集合 称为域属性 事务数据库是事务的集合 不 爪 二 是 的子集 事务记为 肠 表示维属性 表示项集 定义 事务数据库中的滑动窗口由属性域 上的 个连续区段组成 从区段 开始以使包含位于区段 处的事务 称 中的每个区段 为 的子 窗 记为叭 其中 一 记 为 中的的子窗数 本文引入滑动窗口意在描述事务间关联规则所涵盖到的区段个数 为 了关联规则挖掘的效率 我们引入二 这一参数来表示滑动窗口 的大小 定义 设 表示工中的事务个数 表示滑动窗口的大小 定义巨事 务 为 汇 一 定义 定义一个巨事务中的所有项 为扩展项 记所有扩展项的集合 为 二 二 二 定义 定义项集 为事务内项集 项集 忿为事务间 或跨 事务 项集 定义 事务间关联规则是形如 斗功蕴涵式 并且满足条件 定义 设 是满足定义 的扩展集 则事务间关联规则 二 的 支持度 与置信度 定义为 和 分别位于地址 每个滑动窗口包含 个子窗 如 包含子窗 含项 含项 界 含项 每个滑动窗口形成一个巨事务 该巨事务为滑动窗口中所有项的集 合 在表 中 中的巨事务为 而丫 二 为了能从该事务数据库中挖掘事务间关联规则 我们设定两个必要的 参数 最 小支持度 与 最小置信度 令 二 二 我们可以从表 中挖掘出的一条规则为 功 表 事务数据库 D D D D DE E E 1 1 1 1 1 a b b b W l l l 2 2 2 2 2 b d d d d d W2 2 2 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 a b e d d d d d d d d d d d 5 5 5 5 5 b e e e e e e e 6 6 6 6 6 a a a 7 7 7 7 7 7 7 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 行I T oM 叨d x 川 J即p 陀 X 一 I M 以下为举例解释上述定义 事务分别位于区段1 2 4 5 亡 动流砚 X Y 二 T T 助 x UY T l l r I T 侧 T 1 表1为含有5项事务的事务数据库 这5个 3 令w 4 则有5个滑动窗口矶 W2 三 务向关联规口抢扭 与传统关联规则挖掘方法类似 事务间关联规则挖掘包括两步 一 找到支持度高于最小支持度的频繁跨事务项集 二 对每个频繁跨事务项集L 生成满足如下条件的关联规则S城 一及 1 殆 o s 1 i u 2 殆 j L 一 s l i u j 护o 3 规则s二 乙一S 的置信度高于最小置信度 根据文献 3 F工T I算法包含以下三个步骤 l 挖掘并存储跨频繁的事务内项集 2 讲数据库转换为一组频繁项集编码表 F工 T表 3 挖掘频繁事务间项集 四 茸法在中 任 市场的应用 在本节中 我们将F工 T 工算法应用于不同的金融数据 中 结果验证了事 务间关联规则挖掘方法在股价预测上的效果 一 数据集1 5 1 应用 科 学 L E Y 二 摹 选取中国上证国债指数 G B 上证综合指数 Cl 人民币欧元牌 价 E R 人 民币 美元牌价 U R 数据记录从2 00 7年1月2 3日开始 至 2007年6月2 2日的日数据 除去由于假期等原因产生的非交易日 得到9 9条 记录 我们将数据集分为两个部分 上升 集与 下降 集 前者包含在 实验日期上涨的股指 债指和汇率变动方向 而后者包含在实验日当天股 指 债指和汇率下行变动的数据 令 s Pa n 5 以便我们发现五个交易日 内的关联规则 实验结果非常有趣 在 上升 组中 我们发现的一条规 则为 ER l 阳 2 Cl 4 s u pp ort二0 1 9 eon fid enee二0 8 6 即 若人 民币欧元牌价在第一交易日上涨 且上证国债指数在第二天上涨 则 上证综指在第四天上涨的概率为8 6 在 下降 组中 一条有趣的规则为 Cl l 欧 3 G B 5 s upport 0 1 0 eon fid enee 0 81 即若上证综指在第一个交易日下跌且欧元兑人 民币汇率在第三天下 跌 则上证国债指数在第五个交易日下跌的概率为8 1 在挖掘出此类规则后 当出现类似前件事件后 投资者可以依照规则 购买某种股票或债券 从这一实证研究中 我们可以看到关联规则挖掘方 法能够在未知领域发现未知的有益规则 而这种规则将对投资者把握正确 投资方向大有裨益 二 致据集2 选取上证综指 SCI 香港恒生指数 H sl 台湾加权指数 盯I 从20 7年l月旧至20 7年6月29日 共129个交易日的日交易数据 与 4 1中方法相同 将数据分成 上升 组与 下降 组 在 上升 组中 发现的一条有趣规则为 H s l l 钾I 2 se l s support二 0 2 6 con f i d ence 0 8 1 此规则意味着如果香港恒生指数与台湾加权 指数分别在第一个交易日和第二个上涨则 则上证综指 以8 5 的可能性在 第五个交易日上涨 在这三个指数之间发现的这一规则揭示了香港 台湾以及中国大陆地 区间可能存在的股票市场得的相关性 三 致据集3 选取期货连续SH F E铜 L扼铜和NY视X原油 人民币兑美元汇率这四个 指标 从2006年7月3日至2007年6月旧334个交易日的日数据 根据Ka r olyi 1991 4 蒋序标 200 4 5 上海期货交易所 期铜与伦教金融交易所期铜间存在价格引导关系 在此 我们加入纽约商 交所原油期货及人民币兑美元汇率这两个指标 以期挖掘这四者之间的有 益规则 当设定 span 4时 我们能挖掘出如下规则 S H F E铜 1 L阴 铜 3 NY挑X原油 3 su 即ort 0 11 e o n fi d e n e e二0 7 9 即若沪 锅在第一天上涨且伦铜在第三天上涨 则纽商交所原油在第三天以7 9 的 概率上涨 五 绪论及月 传统的关联规则挖掘可用于股价预测 但经典的关联规则挖捆方法只 局限于事务 内挖掘 本文引入了事务间关联规则挖掘概念 运用Flr i算 法 我们能够沿不同的属性纬度挖掘事务间关联规则 我们将这种方法应 用于中国股票市场的研究之中 发现并证实了其预侧效果 最后 我们讨 论了这一方法在期货市场的预测应用 通过本文的数据集分析 展示了事 务间关联规则挖掘在不同经济指标方面的预侧效果 参考文做 l R Agra al etal l 3 妞 ining as so c iatio n r ulesbet能en sets of ite田5inla r ge d a taba s e s P roe o f t h e A以51以幻DConf on 日助age鹉nt of D a t几 2 0 7一2 1 6 2 A n th o ny K H T u ngeta l 199 9 B r ea ki ng t h e B a r r i ero f t r a n s a c ti ons Mi n i n g I nter一Tr a n s a c tio n As s o eiat i o n R u le s P roe A以 SIGK I D Intl Co nf K n o ledgeDiseo v e ry and D a taMini明 3 A K H Tung etal E f fi e i en t m i n i n g o fi n t er t r a n sae t i on assoe i a t i on r u l es IEE ET r a n saet i onson K n o份le d g e a n dData E ng in e e ring1 5 1 20 03 4 3 5 6 4 G A K a rolyietal 1 991 I n t ra d avo l a t ili ty i n t h es t oe k i n d ex a n d s t oe ki n d ex f ut u r e口a r kets R ev i e o fF i n a n e i a lSt u d i e s 657 一6 8 4 5 L眨与Sl l FE期铜价格引导关系实证研究 蒋序标 周志明 系统工程 2004 129 作者简介 邢文蜻 女 北京人 北京航空航天大学经济管理学院硕士研究生 主要 研究方向为事务间关联规则挖掘在中国证券市场价格预侧中的应用 上接第4页 安装运行费用3 0万日圆 6年即可回收投资 与水电接近 逐渐开发利用有 利可求 二 生态环境效益 开发利用可再生能源 可以大量减少化石能源的消耗量 减少C0 2 5 0 2 N浇等有毒有害气体的排量 美化净化环境 改善生态 为国民经济 的可持续发展增加后劲 长期生态环境效益显著 三 杜会效益发展绿色能派 能够充分利用现有物质 改善生态环境 增收节支 为社会安定和谐 奠定基础 为改善居民生活质量提供物质保证 社会效益明显 总之 充 分利用现有政策形势 发展绿色能源 综合效益显著 七 结 营县同全国一样 在全面建设和谐小康社会的进程 中 大力发展绿色 能源 加快改善能源结构 节约资源 减少环境压力 应对气候变化 是 发展循环经济 缓解能源矛盾 改善生态环境 促进经济全面健康协调可 持续发展的首选措施 中国作为一个发展中国家 正面临着发展经济和保 护环境的双重压力 所以加快发展绿色能源迫在眉睫 国家电力监管委员 会副主席史玉波说 水电是最大的清洁的可再生能源 是电力工业发展 的重点领域 国家发改委副主任张国宝说 目前在可再生能源中 技 术成熟并装机容量大的 只有风 电 中科院广州能源所所长陈勇也首先 推荐风电 中国可再生能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论