CN118797542B 基于时空大数据的客户画像关键数据挖掘方法和系统 (南京埃飞勒信息科技有限公司)_第1页
CN118797542B 基于时空大数据的客户画像关键数据挖掘方法和系统 (南京埃飞勒信息科技有限公司)_第2页
CN118797542B 基于时空大数据的客户画像关键数据挖掘方法和系统 (南京埃飞勒信息科技有限公司)_第3页
CN118797542B 基于时空大数据的客户画像关键数据挖掘方法和系统 (南京埃飞勒信息科技有限公司)_第4页
CN118797542B 基于时空大数据的客户画像关键数据挖掘方法和系统 (南京埃飞勒信息科技有限公司)_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于时空大数据的客户画像关键数据挖掘本发明公开了一种基于时空大数据的客户2其中输出数据集包括时空特征矩阵F、客户行为模式P、时变社区步骤S4、基于动态客户画像和群体分析结果,采用构建3的异常检测算法、估计数据的经验分布;对于每个数据点,计算其与经验分布的步骤S43、构建时序因果图并应用双机器学习方法,使用反事实推理技术优化推荐决4步骤S121、接收增强特征数据集,利用欧氏距离计算构建步骤S123、接收步骤S121的时变特征矩阵和步骤S122的步骤S124、获取步骤S123的聚类结果,接收新的数据点5步骤S125、接收步骤S123或S124的聚类结果和原始数据集;计算D步骤S133、获取步骤S131的标准化时间特征和步骤S132步骤S135、获取原始时空数据和步骤S134的自适应6所述存储器存储有可被所述处理器执行的指令,所述指令用于被所现权利要求1至6任一项所述的基于时空大数据的客户画像关78策略,提升了大规模时变图结构的处理效率,满足了实时分析需求。创新性地将Wasserstein距离与局部异常因子(LOF)算法相结合,在保证高维空间异常检测精度的同高了模型在处理大规模动态图结构时的可扩展性和9据源,采用预训练的Transformer模型进行特征提取,包括:将时空数据序列化为适合[0033]步骤S13、获取分类后数据集,进行时间标准化、检测时间戳格式并统一转换为距离的异常检测算法、估计数据的经验分布;对于每个数据点,计算其与经验分布的算用户位置偏好得分,并估计时间和上下文偏好分布;整合这些信息构建多模态偏好向演化流形并分析流形轨迹,该方法能够有效识别客户群体演化过程中的关键事件和转折数,执行k_means算法得到聚类结果;基于聚类结果,分别计算轮廓系数和Calinski_[0075]构建相似度图G:a.计算V中每对数据点间的余弦相似度。b.使用k_nearest动确定过程创新性地结合了轮廓系数和Calinski_Harabasz指数,通过拐点法分析实现了解决了传统K_means难以处理非凸数据集的问题,通过构建相似度图和计算图拉普拉斯矩法能够有效保留空间数据的拓扑结构和几何特征。Riemann流形学习的应用创新性地将非[0092]步骤S152、获取步骤S151的经验分布,对每个数据点计算其与经验分布的测的自适应性和鲁棒性。局部异常因子(LOF)算法的引入为潜在异常值提供了二次验证机线异常检测策略的采用使得模型能够实时处理数据流,及时发现和响应新出现的异常模维度偏好张量,其中包含用户、位置、时间和活动类型等维度;应用张量分解方法,如基于变分自编码器(VAE)的异常评分模块的设计克服了传统方法难以建模高维概率分布的子函数中,表达特征间的条件依赖关系;应用消息传递算法,如置信传播(Belief的节点表示序列。户行为的多角度解析。时序图演化模块的构建解决了传统静态图难以反映动态变化的问示。应用Tucker分解进行多模态特征融合,得到一个高阶张量G。使用张量网络(Tensor[0146]客户行为模式有效性:使用轮廓系数SC(SilhouetteCoefficient)评估聚类效[0149]步骤S1首先获取来自多个异构数据源的原始时空大数据,使用基于Transformer准化数据进行质量评分,得到质量评分后的数据集和待修复数据集。然后,使用基于Wasserstein距离的异常检测方法对质量评分后的数据进行清洗,得到清洗后的数据集和得到最终的高质量的时空数据集。[0152]首先,将时空数据序列化为适合Transformer处理的格式,得到输入序列Xi= [0162]获取步骤S13输出的标准化时空数据集D'',对每个数据集D''i进行数据质量评[0164]获取步骤S14输出的质量评分后的数据集D''',对其中的每个数据点进行异常值[0170]获取步骤S1输出的高质量的时空数据集D*,对每个客户的时空序列执行以下操使用信息熵准则自适应选择最佳分解尺度τ*。提取时间特征向量T=[周期性,趋势性,[0193]获取步骤S22输出的客户行为模式P、时变社区结构C(t)和步骤S24输出的个性化[0203]然后,应用元路径引导的图注意力机制(MPAttention(h_1,h_2,,h_t_1)。L_task+λ_2L_distill+λ_3L_s设计基于信息熵和表示不确定性的采样策略。动态更新用户表征:f_unew=α*f_uold+数据进行质量评分,得到质量评分后的数据集和待修复数据集;然后,使用基于Wasserstein距离的异常检测方法对质量评分后的数据进行清洗,得到清洗后的数据集和得到最终的高质量的时空数据集;注意力机制捕捉不同类型的时空依赖关系,使用扩散卷积层对时空信息进行多尺度聚合,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论