【《多源异构数据融合理论综述》1500字】_第1页
【《多源异构数据融合理论综述》1500字】_第2页
【《多源异构数据融合理论综述》1500字】_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章前言多源异构数据融合理论综述数据融合(DataFusion)又称信息融合(InformationFusion),这一概念起源于人类和动物的进化能力,通过整合来自多种感官的信息提高它们的生存能力。例如,利用视觉、触觉、嗅觉和味觉的多种信息组合可以更加准确地分析一种物质是否可食用。20世纪70年代美国国防部在开发声呐信号处理系统过程中首次明确提出了数据融合技术,并对多个传感器的数据融合与信息处理技术进行了大量研究。随着数据融合技术在多个军事和民事领域中的应用与发展,数据融合逐渐成为了一门专业的工程学科。在本研究中,数据融合特指通过深度学习模型实现融合多个数据源,以产生比任何单个数据源提供的信息更一致、更准确和更互补的信息的过程。相关概念为了方便对数据融合过程的理解,接下来将对本章涉及到的相关概念进行介绍,以下概念均特指适用于本研究的应用场景,非一般化概念定义。特征:指的是股票可被观察到的可测量的特性或属性,包括输入特征和抽象特征。例如,代表个股市场表现的价格数据(开盘价、收盘价、最高价、最低价)、交易量、成交额、技术指标数据(MA、MACD、RSI等)等均可作为当前时间节点下的个股输入特征。特征选择:也称为变量选择、属性选择或变量子集选择,指的是选择相关特征作为模型输入的过程。特征选择是一个重要的数据预处理(DataPreprocessing)过程,因为给定的数据集往往包含有一些与目标任务无关的特征,或是可以通过其他特征推演出来的特征,这些特征被称为是“冗余特征”。特征选择的目的就是为了剔除冗余特征,避免输入维度灾难,使其更易于研究人员解释。并且输入维度的降低一定程度上可以简化模型从而缩短训练时间。尤其是在样本数据量较少的情况下还可以使得模型减少过拟合的可能性从而增强模型的泛化能力。因此在获取数据之后通常会先进行特征选择然后再进行模型学习和训练。特征抽取:特征抽取的概念在有些文献中与特征选择的概念相同,但在本研究中特指利用一定手段从原始数据中构建旨在提供非冗余的抽象特征的过程。这一过程有助于进一步完成模型的目标任务,且在某些情况下可以带来更好的可解释性。例如在处理时间序列数据时,常提到一点是利用模型抽取数据中的“时序特征”。时序特征这一概念目前并没有明确的定义,更多的是表示序列输入数据在时间维度上的抽象依赖关系。总之,在本研究中,特征抽取的目的是为了创造出对目标任务更有价值、更具鉴别性的抽象特征信息。融合层次每一种来源的数据都可为目标任务提供一定的信息,多源信息融合的目的是最大限度地对多种来源的数据进行综合分析、判断以便更好地完成目标任务。多源信息融合不是简单的信息累加,对不同来源的数据特征进行简单的拼接整合或采用同种模式的特征抽取不能保证信息挖掘的有效性。因此,多源信息融合需要根据不同数据来源的特性,通过针对性地进行特征抽取,创造出更有价值的新信息,以便模型学习输入数据与目标任务之间的映射关系。如图3-1所示,从数据抽象的层次角度出发,多源信息融合可以分为三个层次:数据层融合(低等水平融合)、特征层融合(中等水平融合)和决策层融合(高等水平融合)。图3-1多源信息融合的不同层次数据层融合指的是将多源异构数据预处理为数值型的标准输入格式(可供模型直接计算)之后,在数据级别上进行融合的过程。加权平均是最简单直观的一种融合方式,可通过先验知识为不同来源的数据直接分配权重,也可在模型中设置相应模块自动学习各数据源之间的权重。数据层融合需要建立在数据表示与特征选择的基础上;特征层融合主要是在对原始数据进行特征抽取,也可在此基础之上进行更高层次的特征融合。这一层的特征抽取与融合过程一般被认为是信息融合过程中最关键的一步,基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论