已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
时序空间挖掘 内容 什么是时序数据时序数据挖掘的现状利用反馈的时序数据相似性挖掘什么是时序数据相似性挖掘利用反馈的时序数据相似性挖掘 时序数据 一类数据集的数据之间存在着时间上的关系 这类数据被称为时序数据 从时间序列的角度来看 每个数据单元可以被抽象为一个二元组 t o 其中 t为时间变量 O为数据变量 反映数据单元的实际意义 时序挖掘的现状 时间序列近似表示是将原始时间序列用某个维数更低的时间序列在一定的误差范围内代替 这样可以实现数据压缩 减少计算代价时间序列数据变换将原始时间序列映射到某个特征空间中 并用它在这个特征空间中的映像来描述原始的时间序列 傅立叶变换等时间序列聚类分类分析对时间序列进行聚类的算法有基于相似性 或距离 基于特征 基于模型和基于分割的聚类分析 相似性搜索 在数据库中找出与给定查询序列最接近的数据序列 该问题可描述为 给定某个时间序列 要求从一个大型时间序列数据库中找出与之最相似的序列衡量时间序列的相似性 通常先给定相似度量 相似度量是指两个时间序列之间的相似标准 通常以欧氏距离作为两个时间序列之间的相似度量 欧式距离 数据变换法 时间序列数据变换就是将原始时间序列映射到某个特征空间中 并用它在这个特征空间中的映像来描述原始的时间序列 这样可以实现数据压缩 减少计算代价基于离散傅里叶变换的方法离散傅里叶变换在时间序列分析方面具有独特的优点 对于给定的时间序列 先用离散傅里叶变换把其从时域空间变换到频域空间 再根据Parseval理论 时域能量函数与频域能量函数相同 且频域空间的大部分能量集中在前几个系数上 因此可以不考虑离散傅里叶变换得到的其他系数 把这些被保留的系数看作从时间序列上提取的特征 这样从每个序列获得k个特征 并进一步把它们映射到k维空间上 利用反馈的时序数据相似性挖掘 时序数据相似性挖掘就是在数据库中发现与给定时序序列的模式很相似的序列 在进行序列相似性挖掘之前给定一个相似性评价函数和一个阈值e 如果函数值小于等于e 则表明序列相似 通常用X与Y之间的距离函数D X Y 作为序列X与Y的相似性判别函数 距离函数D X Y 常用X与Y之间的欧几里德空间距离等来代替 如果计算结果小于等于给定的阈值e 则表明X与Y相似 时序数据的相似性挖掘的步骤 依据应用要求将时序数据划分为一系列子序列 用离散傅立叶变换将子序列时序数据从时域空间变换到频域空间时域能量函数与频域能量函数相同 且频域空间的大部分能量集中在前几个系数上 因此可以考虑只选用傅立叶变换得到的前k个系数 将这些系数看作从时间序列上提取的特征 于是从每个序列获得k个特征 进一步将它们作为k维空间上的一个映射 即将时序数据的子序列映射为k维空间上的点 这样便保留了时序数据的主要特征 而且降低了时序数据的维数 减小了计算的复杂性 时序数据的相似性挖掘的步骤 针对k维空间上的时序数据点 该算法采用多维索引方法R树来存储这些多维空间的点通过范围查询检索与给定序列相似的时序序列 将检索的相似时序序列展现给用户 由用户赋予其感兴趣的序列相应的权值 并通过反馈与给定序列叠加产生新的查询序列 再次进行范围查询 获得相似序列 傅立叶变换 傅立叶变换 相似性函数 算法 计算反馈时序数据点计算经过反馈得到的相似时序点computSimSeq Root P r 集合e 输入 待查询的时序点集合P 给定时序序列点r e 输出 相似时序点集合SimSet Step1 设置集合SimSet和SimSettmp初始值为空 Step2 将P中的每个点p和MBR插入R Tree 建立一链表nodelist Step3 当链表非空时 若结点为叶子结点 对于结点中的每个点p Step4 计算点p与点r的距离Dist p r 若Dist p r e 则将点p插入相似时序点集合SimSettmp Step5 对相似时序点集合SimSettmp 调用算computFeedbackSeq SimSettmp W r 计算由相似时序点集合中的点经用户赋予相应权重后与r叠加获得的时序点C Step6 对于P中的每个点p 计算点p与点C的距离Dist p r 若Dist p r e 则将点p插入相似时序点集合SimSet Step7 返回SimSet 算法 计算反馈时序点C computFeedbackSeq SimSettmp W r 输入 由初始范围查询获得的相似时序点集合SimSettmp 用户设定的权值W 给定时序序列点r 输出 由反馈获得的时序点C Step1 对由初始范围查询获得的相似时序点集合的点进行傅立叶反变换 得到时序数据曲线 由用户根据对各时序数据曲线的感兴趣程度赋予各相似
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 嘉峪关市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(综合题)
- 2026年金华市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(达标题)
- 2026年郑州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(典优)
- 阜新市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(夺冠系列)
- 鸡西市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(培优b卷)
- 2026年南宁市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)(含答案详解)
- 威海市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)带答案详解
- 鄂尔多斯市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)带答案详解(完整版)
- 齐齐哈尔市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(a卷)
- 2026年省属虚拟市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(新)
- 中学生寝室内务及管理
- 2023全国卷甲卷应用文写作课件高三英语二轮复习
- 恶性肿瘤支持治疗
- 《初中女生的青春期教育》专题课件
- 影视画面分析-镜头课件
- 箱变技术要求
- 闪亮的星星-悦纳自我(说课稿)-一年级心理健康通用版
- YY/T 0450.3-2016一次性使用无菌血管内导管辅件第3部分:球囊扩张导管用球囊充压装置
- GB/T 9740-2008化学试剂蒸发残渣测定通用方法
- GB/T 25098-2010绝缘体带电清洗剂使用导则
- 消化系统生理a课件
评论
0/150
提交评论