版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于粒化的互联网金融大数据分析摘要:随着大数据时代的到来,数据挖掘技术正日益渗透到各行各业。基于数据挖掘技术挖掘出掌柜钱包的基本面数据,其目的是为了获取投资的标量信息。随后建立支持向量机的指数回归预测模型,通过模型回测判断预测效果良好。为了更好的判断未来价量信息的走向,因此采用基于模糊信息化的支持向量机指数预测模型,以每周信息为一个信息点,所得到结果准确。 关键词:大数据;信息粒化;支持向量机;指数预测 引言 “掌柜钱包”是兴业全球基金与兴业银行联合推出的互联网的理财存取业务,该业务于年月日上线运行,自上线以来在同类只货币基金多次排前两名,截至年月,资金规模达亿元,在货币基金市场排名第五。在掌
2、柜钱包广受欢迎的同时,我们也要对其进行预警研究,而本文使用的技术分析就是一种比较有效的方式。技术分析注重对金融市场历史数据的研究,通过图表展现预测价格走势和投资策略分析。在理论上,技术分析只考虑市场或金融工具的实际价格行为,并认为价格会通过其他渠道反映所有投资者的相关因素。技术分析是一种证券交易的基本分析方法,也是实际操作是最大的分析方法。关于技术分析的运用和市场交易的有效性,学术界和实务界一直存在争议。但从实践角度,为了更好地理解和运用技术分析,实现投资收益,减少被动风险其研究也是非常有意义的。一个衡量风险的指标是,而本文运用的能够有效性的检验误差。 文献综述 随着金融市场的扩张、金融风险预
3、警的发展,技术分析较传统投资优势逐渐显现。在年发表的投资组合选择理论中提出了均值方差模型,开创了现代投资组合理论。紧接着年对资产组合模型进行了简化,提出了资本资产定价模型,阐释了单一投资回报率与标准投资组合的投资回报率之间的相关性。随后在年提出了套利定价模型,认为如果市场未达到均衡状态并且不考虑交易成本等中间因素,就会存在无风险套利机会。从而将资本资产定价理论推向了一个新的研究阶段。近些年,机器学习技术在技术投资领域得到了快速发展,作为一个常用的技术有了大量的研究。提出在解决财务问题的银行信用卡客户的流失预测和保险中的欺诈检测,能够敏感性的判断,实证结果表明,所提出的改进的基于主动学习的方法产
4、生了最佳灵敏度,并且减少了规则的长度和数量,从而提高了可理解性。提出在供应链金融管理供应商和客户管理之间的需求,建立一个认证管理系统,从而提高了中小企业融资过程的信用评级状况。胡海清等提出了供应链金融模式下的信用风险管理,利用建立风险评估体系,证实了风险评估的有效性。,等提出将机器学习方法应用到金融时间序列预测上,金融市场的可预测性和基于模型的盈利交易的可行性受到市场成熟度、所采用的预测方法、预测产生的时间范围以及评估模型和模拟模型交易的方法的显著影响,且预测所得到的效果显著。等提出模型避免了用户指定的控制参数,通过预测商品期货指数的每日收盘价来评估该混合模型的可行性和效率。实验结果表明,该模
5、型是有效的,并且比粒子群优化()混合和标准模型表现更好。例如,与标准回归相比,该模型将平均绝对误差提高了(提前天预测),(提前天预测)和(提前天预测)。更多的,等人分析了篇关于和金融时间序列的分析进展,结论表明比传统的时间序列方法更准确。 粒化支持向量机理论介绍 相关理论,世纪年代初等人根据统计学习理论提出了一种新的机器学习方法,即方法。该方法以结构风险最小化原则为理论基础,通过适当地选择函数子集及该子集中的判别函数,使学习机器的实际风险达到最小,保证了通过有限训练样本得到的小误差分类器,对独立测试集的测试误差仍然较小。在支持向量和输入空间抽取的向量之间的内积核是构造支持向量机学习算法的关键。
6、其中支持向量机是由算法从训练数据中抽取的小子集构成。其种类主要有:线性核函数:(,);多项式核函数:(,)(),;径向基核函数:(,)(),;两层感知器核函数:(,)()通过对比发现,虽然对掌柜钱包进行了回归预测,但是大多数时候无法对指数进行精确预测,如果能够对开盘指数和变化空间进行预测就显得很重要。利用对进行模糊信息粒化后的每日开盘指数进行变化趋势和变化空间的预测。信息粒化由美国数学家教授提出,是粒化计算和词语计算的主要方面,研究信息粒化的形成、表示、粗细、语义解释等。从本质上讲,信息粒化是通过不可区分性、相似性、功能相近性、函数性等来划分对象的集合。是将一个整体分解为一个个相似的元素部分进
7、行研究,每个部分为一个信息粒。这种信息粒命题表达方式为:()或者其中是论域中取值的变量,是的模糊子集,由隶属函数来刻画。表示可能性概率。一般假设为实数集合(),是的凸模糊子集,是单位区间的模糊子集。“掌柜钱包”,技术分析模型构建,选取数据:每一行表示每一个交易日的掌柜钱包指数各种指标,列分别表示当天指数的开盘指数,指数最高,指数最低值,收盘指数,当日交易量,当日交易额。模型目的:利用建立的回归模型对指数每日的开盘数进行回归拟合模型假设:指数每日的开盘数与前一日的开盘指数,指数最高值,指数最低价,收盘指数,交易量和交易额相关,即把前一日的开盘指数,指数最高值,指数最低价,收盘指数,交易量和交易额
8、作为当日开盘指数的自变量,当日的开盘指数为因变量。在给定的训练样本,(),(),采用不敏感损失函数算法,寻找回归函数(,)中的参数,将问题转化为:()!()!,烅烄烆引入拉格朗日函数可以得到对偶规划,()()()()()()!,!,烅烄烆对于非线性回归类似,可以通过核函数来实现。目前比较常用的核函数类型有:线性核函数:(,);多项式核函数:(,)();高斯核函数:(,)();核函数:(,)()支持向量机的核函数以及参数的选取对其目标的预测性能有很大的影响,从现有的研究成果来看,大多数情况下最常用的核函数高斯核函数都获得了较好的预测效果,因此本文借鉴已有的研究成果采用高斯核函数进行研究。此时的支
9、持向量机存在两个需要调节的参数:惩罚参数和高斯核函数参数。算法流程图对于掌柜钱包的有效预测可以从整体上观测股市的变化提供强有力的信息,所有对掌柜钱包的预测很有意义,通过对掌柜钱包的开盘至今的每日开盘数据进行回归分析。 结果分析 通过使用核函数高斯核函数的研究网络搜索法来对高斯核函数和惩罚参数进行优化选择实现。选择回归预测分析最佳的参数。利用上面得到的最佳参数和对进行训练,然后再对原始数据进行回归预测,得出图、图。利用回归预测分析最佳的参数进行网络训练。利用网格搜索法最终得到的拟合结果为:均方误差,相关系数,在的置信区间下,预测的准确率为,预测效果良好。利用高斯核函数的强大回归,得到的效果良好。
10、对上一个模型进行改良的上面是对一个指标进行回归预测,而这里进行的是对个指标(最低价,平均价,最高价)进行回归预测,得到的是一个区间进行说明,其准确性更高。利用对模糊粒子进行回归预测。基于上面寻得的参数,利用支持向量机回归预测。对于的拟合结果分析,利用上面得到的最佳参数训练和预测,最终模型得到的拟合效果为:均方误差相关系数接下来个交易日的平均模糊粒子参数:再次利用对、进行回归预测。最终结果如下,求得的模糊粒子参数最低值,平均值,最高值的预测值分别是:,通过与接下来的几天进行实证分析其结果确实是在里面,证明回测成功。通过截取年月日的线图,可以证明拟合效果良好。表年月结论及未来工作在粒化建模回测过程
11、中没有考虑手续费和冲击成本等因素,仅仅是一个大概的测试结果,其目的是为了说明使用交易策略建模的思想和过程。本节提出的模型也可以扩展到小时级别,分钟级别等其他频率交易数据模型的构建。虽然技术投资分析在我国尚处于发展起步阶段,但年以来发展态势快速,未来发展前景广阔。近些年来机器学习的大力发展也为金融技术投资分析提供了理论基础,也让技术投资不失为一种非常高效的金融分析方法。 值得注意的是,虽然技术投资是一种客观、高效、无偏的投资方式,但投资者也不能过度依赖,毕竟市场的多变性和有效性都会给技术投资带来诸多挑战,因而需要充分发挥金融工程师的创造力,不断挖掘创新投资模型。相信随着大数据技术、人工智能的快速
12、发展,技术投资在国内会有更好的发展势头。 6 1、最灵梦想是一个天真的词,实现梦想是个残酷的词。21.2.42.4.202108:1508:15:212月-2108:152、只有收获,才能检验耕耘的好处;只有贡献,方可衡量人生的价值。二二一二二一年二月四日2021年2月4日星期四3、不要放弃,你要配的上自己的野心,也不要辜负了所受的苦难。08:152.4.202108:152.4.202108:1508:15:212.4.202108:152.4.20214、找一个理由,否认忧伤,笑容就会灿烂到无所不在。2.4.20212.4.202108:1508:1508:15:2108:15:215、成
13、功与不成功之间有时距离很短只要后者再向前几步。二月 21星期四, 二月 4, 20212/4/20216、只要努力抬起你的双脚,胜利将属于你。8时15分8时15分4-2月-212.4.20217、青春如此华美,却在烟火在散场。21.2.421.2.421.2.4。2021年2月4日星期四二二一二二一年二月四日8、真正没有资格谈明天的人,是那个不懂得珍惜今日的人。08:1508:15:212.4.2021星期四, 二月 4, 20211、你始终不属于我,属于我的只是我自己。21.2.42.4.202108:1508:15:212月-2108:152、一份信心,一份努力,一份成功;十分信心,十分努
14、力,十分成功。二二一二二一年二月四日2021年2月4日星期四3、你是唯一的,你是十分独特的,你就是你生命中的第一名。08:152.4.202108:152.4.202108:1508:15:212.4.202108:152.4.20214、要跟成功者有同样的结果,就必须采取同样的行动。2.4.20212.4.202108:1508:1508:15:2108:15:215、我们的生命,就是以不断出发的姿势得到重生。二月 21星期四, 二月 4, 20212/4/20216、只要站起来的次数比倒下去的次数多,那就是成功。8时15分8时15分4-2月-212.4.20217、自知之明是最难得的知识。21.2.421.2.421.2.4。2021年2月4日星期四二二一二二一年二月四日8、勇气通往天堂,怯懦通往地狱。08:1508:15:212.4.2021星期四, 二月 4, 20211、最灵繁的人也看不见自己的背脊。21.2.42.4.202108:1508:15:212月-2108:152、最困难的事情就是认识自己。二二一二二一年二月四日2021年2月4日星期四3、有勇气承担命运这才是英雄好汉。08:152.4.202108:152.4.202108:1508:15:212.4.202108:152.4.20214、与肝胆人共事,无字句处读书。2.4.20212.4.202
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重庆2025年重庆巫溪县教育事业单位遴选101人笔试历年参考题库附带答案详解(5卷)
- 绍兴2025年第二期绍兴市部分机关事业单位编外和企业招聘笔试历年参考题库附带答案详解(5卷)
- 2025年智慧城市安全防范:视频行为分析技术创新研究
- HJ14202025一氯二氟甲烷生产设施副产三氟甲烷排放核算方法与报告技术规范
- 2026广东汕尾市陆河县城镇公益性岗位招聘4人备考题库及答案详解(名校卷)
- 2026广西百色市西林县古障镇中心小学招聘后勤人员1人备考题库含答案详解(能力提升)
- 2026河南洛阳市西苑初级中学招聘备考题库含答案详解(达标题)
- 2026中铁华铁工程设计集团有限公司区域指挥部招聘备考题库及完整答案详解一套
- 2026年青岛市房地产职业中等专业学校教师公开招聘备考题库(7人)及答案详解(名校卷)
- 2026江苏苏州浒墅关实验幼儿园教育集团招聘1人备考题库附答案详解
- 牙周病概述(口腔内科学课件)
- 安全员《C证》考试题库
- 北京市文物局局属事业单位招聘考试真题及答案2022
- 医院财务制度专家讲座
- 2023年上海市杨浦区中考一模(暨上学期期末)语文试题(含答案解析)
- 甲状腺病变的CT诊断
- GB/T 8834-2006绳索有关物理和机械性能的测定
- 1.《郑人买履》课件PPT
- GB∕T 36110-2018 文物展柜密封性能及检测
- 甘肃省生态功能区划
- 模拟电子技术基础 第四章 放大电路的频率响应
评论
0/150
提交评论