CN114064811B 一种数据处理方法、装置、设备和存储介质 (中移(苏州)软件技术有限公司)_第1页
CN114064811B 一种数据处理方法、装置、设备和存储介质 (中移(苏州)软件技术有限公司)_第2页
CN114064811B 一种数据处理方法、装置、设备和存储介质 (中移(苏州)软件技术有限公司)_第3页
CN114064811B 一种数据处理方法、装置、设备和存储介质 (中移(苏州)软件技术有限公司)_第4页
CN114064811B 一种数据处理方法、装置、设备和存储介质 (中移(苏州)软件技术有限公司)_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

据数据集的相似度数据所确定的数据集中每个数据点的相似度密度和相似度关系数据进行聚2根据所述相似度数据,确定所述数据集中每个数据点的相似度密度和相似度关系数关系数据表示每个数据点与至少两个其它数据点的相似度之间的大小所述数据集中的各个数据点包括第一数据点和第二数据点,所述在相似度密度大于所述第一数据点的数据点中,选取出第一计在所述数据集中除所述第二数据点外的其它数据点中,选取出根据所述数据集中每个数据点的聚类参数和相似度密度,确定所根据所述数据集中聚类中心外的每一其它数据点的相似度密度根据预设的相似度阈值确定所述每个数据点的相根据所述每个数据点的相似度邻域和所述数据集中所述每个数据根据所述聚类中心外的每一其它数据点的相似度密度,在所述中的数据点的相似度密度大于对应的每一其它数据确定所述聚类中心外的每一其它数据点的类别与对应的所述第三数5.一种数据处理装置,其特征在于,所述装置所述获取模块,用于获取数据集的相似度数据,所述相似度数据3所述确定模块,用于根据所述相似度数据,确定所述数据集中每个所述聚类模块,用于所述数据集中的各个数据点包括第一数据点6.一种电子设备,其特征在于,包括处理器和所述处理器用于运行所述计算机程序时,执行权利要求1至4任一项所4[0002]相关技术中,对于高维数据的聚类方法主要是根据数据[0005]获取数据集的相似度数据,所述相似度数据表示所述数据集中数据点间的相似度关系数据表示每个数据点与至少两个其它数据点的相似度之间的大小[0012]根据所述数据集中每个数据点的相似度密度和聚类参数,对所述数据集进行聚5[0016]在一种实施方式中,所述根据所述数据集中每个数据点的相似度密度和聚类参集合中的数据点的相似度密度大于对应的每一其它数据点的相[0021]确定所述聚类中心外的每一其它数据点的类别与对应的所述第三数据点的类别6集合中的数据点的相似度密度大于对应的每一其它数据点的相[0043]确定所述聚类中心外的每一其它数据点的类别与对应的所述第三数据点的类别7[0048]所述处理器用于运行所述计算机程序时,执行上述任意一种所述的数据处理方度之间的大小关系;最后根据所述数据集中每个数据点的相似度密度和相似度关系数据,脸数据集前10类数据所构造的相似度矩阵[0055]图3为本申请的ORL人脸数据集类别1中数据点xi与类别1和类别2的数据点之间的[0056]图4为本申请的相似度差异控制参数γ值从2变到9时对应的聚类结果的精确度的8以及复杂的结构给数据处理带来了许多挑战,如何有效地从数据中挖掘出有价值的信息,[0067]对数据集进行聚类的主要目的是将数据集中的样本划分9[0068]k_means算法是最早提出的一种划分聚类算法,已经被用于许多应用领域,k_means算法通过不断地迭代与更新聚类中心直至收敛以实现对数据集的聚类,方法本身即的元素C23表示的是数据点x2与x3之[0083]对于获取数据集的相似度数据的实现方式,可以是先获取所述数据集的相关数[0087]通过公式(1)来确定数据集X的相关矩阵Z的实现方式,可以是通过增广拉格朗日Z=J[0110]相关矩阵Z*的块对角结构揭示了数据的子空间属性,块的个数对应子空间个数,照数据样本的类型进行排列的数据集X,则通过上述求解所得到的相关矩阵Z*则不是块对子空间的数据点可以认为是同一个类别。低秩表示将原始数据空间分割为不同的子空间,[0112]对于所述根据所述数据集的相关数据,构造所述数据集的相似度数据的实现方[0118]图3为本申请的ORL人脸数据集类别1中数据点xi与类别1和类别2的数据点之间的似度关系数据;所述相似度密度表示每个数据点在对应的相似度邻域中的数据点的个数,所述相似度关系数据表示每个数据点与至少两个其它数据点的相似度之间的大小意一数据点A,确定数据点A与数据集中除A以外的其它数据点间的相似度大于相似度阈值号处理器(DigitalSignalProcessor,DSP)、数字信号处理装置(DigitalSignal似度密度大于第一数据点的数据点与第一数据点之第三计算值可以是指分别计算第二数据点与相似度密度大于第二数据点的数据点间的相三计算值也可以是与所计算的第二数据点与相似度密度大于第二数据点的数据点间的相数据点A的聚类参数是数据点B的第一计算值;对于数据集中除第二数据点E以外的其它数[0137]在一种实施方式中,所述根据所述数据集中每个数据点的相似度密度和聚类参集合中的数据点的相似度密度大于对应的每一其它数据点的相[0143]确定所述聚类中心外的每一其它数据点的类别与对应的所述第三数据点的类别[0145]在一种实施方式中,可以是针对ORL人脸图像数据集X=[x1,x2,...,xn]=[X1,参数λ设置为2。为了确定相似度阈值ε以及构造相似度矩阵时用来控制相似度差异的γ值[0147]图4为本申请的相似度差异控制参数γ值从2变到9时对应的聚类结果的精确度的[0153]聚类模块603,用于根据所述数据集中每个数据点的相似度密度和相似度关系数[0156]在一种实施方式中,所述聚类模块603用于根据所述数据集中每个数据点的相似[0159]在一种实施方式中,所述聚类模块603用于根据数据集的相似度数据和数据集中[0162]在一种实施方式中,所述聚类模块603用于根据所述数据集中每个数据点的相似聚类中心外的每一其它数据点的相似度密度,对所述聚类中心外的其它数据点进行聚类,集合中的数据点的相似度密度大于对应的每一其它数据点的相[0167]确定所述聚类中心外的每一其它数据点的类别与对应的所述第三数据点的类别[0172]所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产[0177]在实际应用中,上述存储器701可以是易失性存储器(volatilememory),例如[0181]本申请所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论