付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
由于股价预测具有建模复杂、多尺度、多来源且异质的特点,本文采用数值数据和文本数据相融合,使用半监督学习方法对股价预测模型进行训练,建立具有自注意力机制的LSTM模型。本章对深度学习、半监督学习、行为金融学、文本情感分析等基础理论进行阐述,同时介绍本文建模将会使用到的基础核心深度模型Self-Attention、LSTM和多源数据融合。一般来说,机器学习是从输入数据中学习并总结规律从而进行预测错误!未找到引用源。在机器学习领域中,深度学习是其中的一种方法。相比于传统的机器学习算法在训练之前需要预处理和特征提取,其使用多层映射出输入和输出之间的非线复合而成的高级函数。通过设计建立适量的神经元计算节点和多层运算结构,选择合适的输入层和输出层,组合低层特征形成有价值的高层特征,使模型具有更好的学习能力。目前,深度学习广泛应用于图像识别领域和自然语言处理领域,在人脸识别、机器翻译等领域创造了巨大的价值错误!未找到引用源。同时,金融也是深度学习研究最多的应用领域之一,深度学习方法如CNN、RNN、LSTM等都取得了巨大的成绩,主要应用领域由金融文本情感分析、金融风险评估、投资组合管理等问题。其中,金融文本挖掘和情感分析应用尤为广通常利用其对财经新闻、社交媒体等文本信息进行分析,从而实现对股票价格、趋势等的预测。传统机器学习仅包含监督学习和无监督学习,其区别在于数据是否具有标签。监督学习的方法分为回归和分类,其具体是指已知数据间关系即标签,同时具有数据特征,通过训练,得出最优映射关系。得出的模型在输入无标签数据时,判断出其所属标签。而无监督学习是指数据仅有特征而没有标签,不断学习后寻找数据间的规律。相比于监督学习,无监督学习更像是自学。错误!未找到引用源。o而在现实问题中,常常会出现少量样本有标记和较多样本无标记的情形。有标签数据获取成本高或无法获取足够多的具有标签的数据促使有标签数据和无标签数据相结合的半监督学习技术不断发展并被广泛应用错误!未找到引用源。在金融领域内,可收集的数据总量少、数据收集的时间成本高、数据的人工标注成本高等导致可使用的数据量太少。标签太少,模型就不够准确,而增加标签,又会显著增加风控成本错误!未找到引用源。。在这种情况下,金融专家常会利用少量有标签数据和大量无标签数据进行半监督学习,以达到目标。1.3行为金融学行为金融学是行为经济学的一个研究分支,提出金融市场中投资人的非理性行为。行为金融学指出,投资者的决策行为容易受到知识、所获信息以及心理等悔理论、期望理论、行为组合理论和羊群效应理论。行为金融学将人的心理因素加入金融问题的研究中,二者结合产生很多投资策略如差异化策略、投资组合策略、反向投资策略等。1.4文本情感分析文本情感分析是将爬取挖掘的文本对其进行分词获得情感词汇,然后对其进行归纳和推理。随着互联网的日益发展,论坛等交流平台上产生了大量的有价值意义的评论信息。这些评论信息可以表达用户的情感倾向,如积极、消极、中立等。基于此,其他使用者可以通过已经发布的信息综合考虑后了解人们对某一事件的情感。而越来越多持股者也开始通过互联网论坛来发表自己对该支股票买或卖或者财经新闻等的看法,并与其他股民进行互动交流,从而得到想要知道的信息。股吧论坛有着大量股民投资情感倾向文本和股票市场等新闻数据,因此论坛媒体等相关信息对股民是否持有该股有着重大的影响。基于此,借助文本情感分析得到量化后的投资者情绪加入股票预测模型中进一步提高预测准确率具有重大意义错误!未找到引用源。。长短期记忆神经网络(LSTM)是在循环神经网络(RNN)上的一种改进提升。为了解决传统RNN模型长期依赖所导致的梯度消失或爆炸的问题,1997年ft、输入门it和输出门0t,以及单元状态Ct和候选态Ct。具体训练过程是指首先将输入数据xt与之前的输出数据ht-1经过遗忘门,决定所要遗忘的特征;然后通过输入门和候选态对数据进行更新,同时根据xt与ht-1以及之前单元状态Ct-1对目前单元状态Ct进行更新;最后经过输出门输出当前信息ht。长短期记忆网络训练结构如图(2-1)所示:图2-1LSTM循环体结构计算过程如式(2-1)至(2-6):和tanh激活函数。随着对LSTM模型的深入研究,为了解决该模型对长时间序列信息记忆能力衰退问题,注意力机制被学者们研究并提出。2017年,google机器翻译团队使用自注意力机制来学习文本表示,自此注意力机制成为各学者们研究的热门话题,同时也在各个领域上也取得了不错的效果。Softmax()value,∑αn×VnA₁A₂A₃学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 覆盖工程施工方案(3篇)
- 踏春春游活动方案策划(3篇)
- 酒店老人活动方案策划(3篇)
- 铺砌方砖施工方案(3篇)
- 雨蓖井施工方案(3篇)
- 高中展览活动策划方案(3篇)
- 膀胱肿瘤患者的临床试验与参与指南
- 数字出版专业就业前景
- 农村中职就业方向
- 制冰工保密知识考核试卷含答案
- 2024-2025学年北京市朝阳区统编版五年级下册期末考试语文试卷【含答案】
- 虹口区2024-2025学年下学期期末考试六年级数学试卷及答案(上海新教材沪教版)
- GB/T 25383-2025风能发电系统风力发电机组风轮叶片
- 展览合同变更协议范本
- 等离子切割机使用方法
- 2025年湖南株洲二中自主招生考试数学试卷试题(含答案详解)
- 广东2024年广东石油化工学院招聘专职辅导员20人笔试历年典型考题及考点附答案解析
- SYT 5874-2021 油井堵水效果评价方法-PDF解密
- Spark大数据技术与应用智慧树知到期末考试答案2024年
- 开封滨润新材料有限公司 20 万吨年聚合氯化铝项目环境影响报告
- 技术创新成熟度评价标准及评价细则
评论
0/150
提交评论