下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据的分类挖掘优化技术 : As big data optimization mining is needed to improve classification recognition and retrieval performance of big data , a big data classification mining method based on distributional extraction of weak correlation index features is proposed. The sparse fusion method is adopted to per
2、form clustering space division for big data flow. The high?dimensional fractal features of big data are reorganized by using the self?correlation feature matching method. The vector quantification method is adopted for convergence control of base elementclassification of big data. The weak correlati
3、on index features of big data information flow are extracted to realize optimization classification and mining of big data. The simulation results show that the method for data classification and mining improves the precision and recall performance of big data mining and retrieval, and has high mini
4、ng accuracy and good anti?interference capability. Keywords: big data ; information fusion ; classification mining ; clustering space division ; feature extraction 0 引 言 随着网络空间的不断扩容以及网络信息技术的发展, 在网络 云存储数据库中, 大数据存在较大的差异性特征, 需要对大数据 进行分类挖掘, 提高对大数据信息库的检索和分类识别能力, 研 究大数据分类挖掘技术,在提高大数据检索、访问、调度和特征 提取能力方面具有重要意
5、义, 相关的数据分类挖掘方法研究受到 人们的极大重视 1 。当前主要采用主成分挖掘方法、粒子群分 布式挖掘方法以及统计特征提取的大数据挖掘方法 2 。通过自 适应分布式学习算法实现大数据挖掘, 把网络分布式云存储大数 据时间序列解析模型分解为含有多个非线性成分的统计量, 进行 数据的分布式特征重构, 提高数据挖掘的抗干扰能力。 但是随着 数据规模的扩大, 挖掘的准确性不好, 提出基于弱关联性指数特 征分布提取的大?稻莘掷嗤诰蚍椒d ?首先进行大数据分布的统计 特征分析, 然后进行特征提取和数据分类算法设计, 最后进行数 据挖掘仿真实验,得出有效性结论。 1 大数据的统计性特征分析 1.1 大数
6、据的稀疏性融合 为了实现对大数据的分类挖掘优化, 首先采用统计特征分析 方法进行大数据特征提取和信息重构, 对大数据信息流采用稀疏 性融合方法进行聚类空间划分。 本文研究的大数据对象为网络分 布式云存储大数据。 用图表示网络分布式云存储大数据的输入模 型,统计特征分布的向量量化边集为, 单个存储分布节点的信息 覆盖域为 r ,设,且,得到网络分布式云存储大数据的信息融合 支持向量集为: 式中:和分别表示网络分布式云存储大数据的时域和频域分 布结构特征;和分别表示大数据的采样时间间隔和波束分布间 隔。采用观测或实验手段获得网络分布式云存储采样的先验知识 3 ,通过对数据的多元信息融合处理得到网络
7、分布式云存储并 行调度和重构的特征分布向量定义为: 式中:为网络分布式云存储特征分布矩阵的对角元素值; 为 测量误差。 通过大数据的稀疏性融合, 得到网络分布式云存储重 构的约束指标分布向量集, 以此为特征基础进行向量量化分析和 数据重构。 1.2 大数据分类挖掘的聚类空间划分 基于奈奎斯特采样定理 4 ,结合大数据稀疏性融合结果, 进行大数据分类挖掘聚类空间划分, 对大数据信息流特征重组模 型进行归一化处理,得数据分类挖掘指向性维数满足: 式中,为对取模。对大数据聚类空间划分,进行大数据信息 流时频分解,得分解式为: 式中,表示数据弱关联指向性分布函数, 将提取指向性特征 输入到大数据分类挖
8、掘传输信道中, 进行向量量化分解。 假设为 时间窗函数, 通过构建大数据分类挖掘知识库模型, 得到数据的 副本信息融合嵌入维数 m满足:通过自相关特征匹配方 法进行大数据高维分形特征重组,假设分类特征重组的传递函 数,采用一个二维的连续函数进行大数据聚类的收敛性控制, 得 到大数据分类挖掘的极大熵的判决特征函数式为: 当网络分布式云存储数据是局部平稳的, 通过构造数据集的 规则向量集,得到大数据分类挖掘的聚类空间为: 结合训练数据集的规则向量子集解向量分布融合结果 5 , 得到大数据分类挖掘聚类空间分布的指向性函数为: 2 大数据分类挖掘实现 在对大数据信息流采用稀疏性融合方法进行聚类空间划分
9、 的基础上, 进行数据分类特征提取和挖掘过程优化, 本文提出一 种基于弱关联性指数特征分布提取的大数据分类挖掘方法, 采用 向量量化方法进行大数据的基元分类的收敛性控制 6 ,向量量 化的特征函数为: 式中:表示大数据特征序列的相关性指数系数; 表示先验点 簇;表示信息融合的深度;为数据的关联维。 利用数据集的相似性分布式重建方法, 得到数据的时频分解 的变换定义为: 经自相关特征匹配,则数据聚类目标函数为: 式中,为数据特征分布子带信息。 采用向量量化方法进行大 数据的基元分类的收敛性控制 7 ,提取数据的能量密度谱 (Spectrogram , SPEC 为: 基于模糊聚类方法进行数据分类
10、挖掘, 数据分类挖掘的特征 空间的维数满足:( 14) 网络分布式云存储重构的误差项满足高斯 ?马尔科夫假设 将网络分布式云存储重构的约束指标矩阵改写为边缘分布矩阵 为: 式中:为的关联维向量; 为的云数据的聚类指向性分布矩阵; 为的参数向量; 为的网络分布式云存储聚类的误差向量。 提取大 数据信息流的弱关联性指数特征,得到关联数据的线性组合为: 利用 IFFT 变换进行大数据的弱关联性特征估计,得到: 分析上述提取的特征估计结果得知, 由于大数据分类挖掘的 过程受到大数据的基元分类的收敛性控制, 所以大数据分类挖掘 的收敛性较好,准确性得以提高。 3 实验分析 对大数据分类挖掘的仿真实验建立
11、在 Matlab 仿真环境基础 上,大数据为网络分布式云存储大数据, 实验仿真环境为: Intel Core3?530 1 GB内存,操作系统为 Windows 7大数据分布的阵 元数目为 64,初始采样的信噪比定为 8 dB ,数据特征分布的随 机点个数为3,数据分布的频带为425 kHz。根据上述仿真设 定,得大数据的原始分布时域波形如图 1 所示。 以图 1 给出的大数据为研究对象, 进行分类挖掘, 提取大数 据信息流的弱关联性指数特征, 实现大数据分类挖掘。 图 2给出 了采用本文方法和传统的统计特征分析方法进行数据分类挖掘 的准确性对比。 分析得知, 采用本文方法进行大数据挖掘检索的 查准性和查全性较高,提高了大数据挖掘的准确性。 4 结语 本文提出一种基于弱关联性指数特征分布提取的大数据分 类挖掘方法, 对大数据信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 对新手心理辅导师的服务策略研究及其实施效果分析报告
- 咖啡店选址与产品开发经营计划
- 产品设计到市场推广全面解析智能硬件的运作
- 高档小区的个性化幕墙装修设计与工作计划
- 宠物美容师AI基础题
- 财政监管岗位面试准备手册
- 充电桩与便利店协同发展
- 环境设计中绿植与水体的景观造型研究
- 人力资源管理师三级岗位胜任力提升计划与实施方案
- 广汉禁毒迎检通知书
- 2025年船舶租赁合同协议书模板
- 2025年注册兽医《兽医临床诊疗学》备考题库及答案解析
- 2025年小学五年级数学上学期单元测试专项训练(含答案)
- 2025宁夏交通建设投资集团有限公司校园招聘和社会招聘230人(1号)考试笔试备考试题及答案解析
- 2025汉中市级机关遴选公务员及选聘事业单位人员(54人)笔试考试备考试题及答案解析
- 2025广东广州市海珠区教育系统高校“优才计划”招聘68人笔试考试参考试题及答案解析
- 甘肃省陇南市西和县2025-2026学年八年级上学期周期学业能力评鉴数学试卷(含解析)
- 2025品牌情绪与增长白皮书
- 2025年中小学课外读物进校园落实情况自查报告
- 平面构成-特异构成
- 眼镜技术试题
评论
0/150
提交评论