《商业分析概论》复杂数据的挖掘_第1页
《商业分析概论》复杂数据的挖掘_第2页
《商业分析概论》复杂数据的挖掘_第3页
《商业分析概论》复杂数据的挖掘_第4页
《商业分析概论》复杂数据的挖掘_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商业分析概论复杂数据的挖掘目录CONTENTS复杂数据挖掘概述多媒体数据的存储多媒体数据标引与检索多媒体数据的挖掘分析空间数据库挖掘12345目录目录CONTENTS1234511.1复杂数据挖掘概述复杂数据挖掘概述多媒体数据的存储空间数据库挖掘多媒体数据标引与检索多媒体数据的挖掘分析11.1复杂数据挖掘概述计算机的发展、虚拟现实技术、信息可视化促进了包括视频、图像等在内的多媒体技术的飞速发展,对大量多媒体信息进行有效的处理、组织和存储、分析和挖掘也成为信息工作者面临的挑战,这其中包括对多媒体信息的检索、知识挖掘、空间数据仓库等等研究方向。背景多媒体(Multimedia),顾名思义,就是指多种单一或复杂媒体集成起来新的媒体,更确切点说,它一般是指文字、图像、声音、动画、视频等多种媒体和计算机程序融合在一起形成的信息传播媒体,它是计算机软件和硬件的结合。11.1复杂数据挖掘概述复杂数据挖掘图像挖掘音频挖掘视频挖掘空间数据挖掘11.1复杂数据挖掘概述(1)

图像数据挖掘图像挖掘(ImageMining)指对图形图像数据信息的自动处理和知识发现,包含模式识别、图像检索以及特征分析等。一般的图像包含丰富的视觉和空间特性,如典型的视觉特性有颜色(color)、纹理(grain)、形状(shape)、轮廓(outline)等。图像的空间特性是非常重要的特性,包括图像中各种对象的模式、布局、空间层次等。图像数据挖掘的应用基于视觉和空间特性的图像挖掘技术可以广泛用于卫星遥测图片库、气象卫星云图、医疗CT扫描片、分子显微图片以及其他图像资料数据库等方面的隐含知识发现,而基于人脸识别技术、笔迹分析技术、指纹鉴别技术的图像挖掘系统在公安、交通、机场安检等地方的应用已经十分广泛。11.1复杂数据挖掘概述(2)音频数据挖掘音频挖掘(AudioMining)指对音频信息的自动处理和分析过程。音频是听觉媒体,如语音、音乐、自然声音等,使用最多的音频媒体是语音(Voice)。例如广播节目中的语音和伴随视频的语音。如今,语音处理和识别技术已经取得了很大进展,软件系统经过训练后,可以把数字语音识别为文本,然后可以利用传统的文本挖掘方法对其进行挖掘。音频数据挖掘的应用国外监听卫星电话的分析对数字音频中音乐(Music)的数据挖掘针对听觉特性中的基音、音调、旋律、音频事件和对象结构,挖掘出隐含在音频流中的节奏模式和规律,然后可以将其分类,如自动将音频数据库进行“流行音乐”、“民族音乐”等类别标引。11.1复杂数据挖掘概述(3)视频数据挖掘视频挖掘(VideoMining)指对动画视频信息的自动处理,如电视信息的主题提取、视频文件的自动摘要等等。视频媒体是一系列图像媒体的组合视觉特性空间特性时间特性视频对象特性运动特性等视频数据挖掘的应用新闻视频系统监控视频系统记录影片系统数字视频图书馆(4)空间数据挖掘空间数据挖掘(SpatialDataMining,简称SDM)是针对空间数据库的知识发现(KnowledgeDiscoveryfromSpatialDatabase)研究,是指从空间数据库中提取用户感兴趣的空间模式、特征、空间与非空间数据的普遍关系及其他一些隐含在数据库中的普遍数据特征的过程,它是数据挖掘技术在空间数据库方面应用的延伸。空间数据挖掘的应用它可用于对空间数据的理解,空间关系和空间与非空间数据间关系的发现,空间知识库的构造,空间数据库的重组和空间数据查询的优化。911.1复杂数据挖掘概述目录CONTENTS134511.2多媒体数据的存储复杂数据挖掘概述多媒体数据的存储空间数据库挖掘多媒体数据标引与检索多媒体数据的挖掘分析211.2多媒体数据的存储11.2多媒体数据的存储(图像存储)

位图位图是把一幅彩色图像分成许许多多的像素,用若干数字来指定每个像素的颜色、亮度和属性。因此一幅图就由许许多多描述每个像素的数据组成。描述每个像素点的RGB的强度可以用不同位的二进制数据,这也决定了图像文件的大小,表示强度的二进制位数越大,色彩越丰富,图像文件也就越大矢量图矢量图是用一系列计算机指令来表示一幅图,比如画点、画线、画圆等等。这种方法实际上是用数学表达式来描述一幅图,然后再编程,用计算机的语言或程序来表达。在显示图像时,计算机一边计算一边显示,由于复杂的计算往往需要花费比较长的时间,所以通常能够看到绘图的过程。目录CONTENTS1245复杂数据挖掘概述多媒体数据的存储空间数据库挖掘多媒体数据标引与检索多媒体数据的挖掘分析311.3多媒体数据标引与检索11.3多媒体数据标引与检索多媒体数据标引文本标引图像标引音频标引视频标引总的看来,多媒体数据的标引主要有两种方式:根据外在特征进行标引的元数据方式和基于内容的元数据方式。11.3多媒体数据标引与检索基于内容的标引方法自由文本法编码系统法自动处理的特征描述法11.3多媒体数据标引与检索基于内容的多媒体数据检索基于相似性的检索

这种检索方法是用户输入一种多媒体信息,如一幅图像,一段声音等,然后匹配多媒体数据库中相似的数据。基于模板的检索

这种检索方法主要针对多媒体信息的某些特征参数建立通用模板,然后通过这些模板对数据库进行匹配检索。基于语义的检索

这是多媒体检索的最高级的应用,它依赖于多媒体数据库的语义标引情况和自然语言理解。目录CONTENTS1235复杂数据挖掘概述多媒体数据的存储空间数据库挖掘多媒体数据标引与检索多媒体数据的挖掘分析411.4多媒体数据的挖掘分析1999年,O.R.Zaiane在其博士论文中介绍了多媒体数据挖掘的一个系统原型MMMiner。数据仓库的多维性是通过数据立方体表现出来的,多媒体数据仓库可能包括这样一些立方体,如色彩立方体,其中包括颜色、纹理信息;尺寸立方体,包括媒体的大小、宽度、高度等。MMMiner系统采用的基本立方体还包括一个称之为PopCube的立方体,它记录的是影像数据的普及程度(Popularity)、在网页上的分布程度(Richness)等。11.4多媒体数据的挖掘分析MMMiner多媒体挖掘模型11.4多媒体数据的挖掘分析MMMiner多媒体挖掘模型主要包括3个模块,即特征化处理、关联规则发现和分类。目录CONTENTS1234复杂数据挖掘概述多媒体数据的存储空间数据库挖掘多媒体数据标引与检索多媒体数据的挖掘分析511.5空间数据库挖掘11.5空间数据库挖掘农业数据卫星数据……数据提炼数据转换元数据处理……空间数据库统计分类聚类规则发现……气象预测军事决策……空间数据挖掘过程11.5空间数据库挖掘空间数据挖掘的几种方式空间关联规则空间对象分类空间对象聚类11.5空间数据库挖掘空间关联规则空间关联规则样式其中P、Q是和空间信息有关的属性、空间谓词等,且其中至少有一项为空间谓词。所谓空间谓词包括拓扑关系(Intersects,Overlap,disjoint等)、方位关系(Lefe-of,West-of等)、距离信息(Close-to,far-away等)。如:

11.5空间数据库挖掘空间对象分类

空间数据分类的目标是为了发现空间分类模式,与普通对象不同的是,空间对象不仅包含描述性的非空间属性信息,同时还包含对象之间的空间关联信息,如拓扑关系,距离关系以及方位关系等。因此,在空间分类中用于标志空间对象类的类标签属性主要有以下四类:对象的非空间属性;具有非空间值的空间相关属性;空间谓词;空间函数,空间函数是空间谓词的组合

11.5空间数据库挖掘

街区编号人口平均收入犯罪率发生数A5000255050B4500500040C5500255045H6000325050I5000455030…………空间对象分类OID高利润空间谓词1Yclose_to(x,Oak_park),close_to(x,Swan_lake)2Yclose_to(x,Blue_river)3Nclose_to(x,Fir_park),close_to(x,Blue_river)4N

5Nclose_to(x,Oak_park)OID高利润空间谓词1Yclose_to(x,park)close_to(x,water)2YClose_to(x,water)3Nclose_to(x,park)close_to(x,water)4N

5NClose_to(x,park)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论