数据挖掘在各领域的应用案例_第1页
数据挖掘在各领域的应用案例_第2页
数据挖掘在各领域的应用案例_第3页
数据挖掘在各领域的应用案例_第4页
数据挖掘在各领域的应用案例_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、數據挖掘于各领域之应用,谢邦昌 教授 辅仁大学统计信息系教授 中华數據挖掘协会 秘书长 STAT1001MAILS.FJU.EDU.TW WWW.CDMS.ORG.TW 2004/12/26,你不能不知的十大创新技术,资料来源: Technology Review杂志(2002/1),未来科技大预言,Technology Review杂志公布改变未来的十项新兴趋势 机器与人脑的介面 塑料电晶体 數據挖掘(Data mining) 数字权利管理 生物测定学(Biometrics) 语言识别处理 微光学技术(Microphotonics) 解开程序码(Untangling code) 机器人设计

2、微应用流体学(Microfluidics),在生物科技上,如人脑与机器介面,可加速发展生化义肢,学者认为这方面大有潜力。 机器人将为人类处理更多复杂或重复性的工作,现有研究人员发展出可设计、制造机器人的机器人。 在信息科技上,数位权利管理愈来愈受重视,以便保护知识财产,由全录公司Palo Alto研究中心创出的Content Guard公司,利用加密技术保护知识财产。,资料发掘与生物测定学也很有潜力,數據挖掘是利用数学演算法,在庞大的资料库中寻找方式,例如目前应用在掌纹、脸孔等图像辨识,或者是语言辨识处理等方面。 塑料芯片也是一大突破,在IBM、朗讯、麻省理工、剑桥大学、Penn State大

3、学都在研发塑料或有机物质芯片。 微光学技术,专家利用可反射光线的水晶、玻璃等物质,让光纤传输资料的速度,不会因为通过路由器、交换器时而降低速度。,微应用流体学方面:科学家正试图利用物理原则做实验,只利用极微量的水,加快原本需要费时费金钱的实验。加州理工学院的应用物理学家Stephen Quake,以微应用流体学发展了一套DNA分析装置,比传统的分析装置快。 Technology Review的编辑指出,微应用流体学将为生物科技大有帮助,就像当初电晶体提高了电子产品。,医药方面,Pain Control,Problem: Detecting pain Subjective 用决策树方法获取分类规

4、则; 能识别各类间有显着差异的偏差检测;用于发现和显示随机依赖关系的依赖关系分析。,动态与展望,目前,KDD研究的重点,正从理论转向应用,可说凡是用到资料库的地方,就有KDD的课题等待人们去探讨。 KDD与科学资料库的结合对科技的发展必定会起很大的促进作用,具有广泛的应用前景。,网络方面,背景,保证信息系统安全的主要问题是建立安全机制,迄今为止已发展了许多安全机制,但安全问题仍然倍受怀疑和关注。 由于已从理论上证明不存在绝对安全的安全系统,因此一般将审计跟踪、攻击检测系统作为信息系统的最后一道安全防线。,早期中大型的电脑系统中都收集审计信息来建立跟踪档,这些审计跟踪的目的多是为了性能测试或计费

5、,因此对攻击检测提供的有用信息比较少 。 此外,最主要的困难在于由于审计信息粒度的安排,审计信息粒度较细时,资料过于庞大和细节化,反将有用的信息源没在其中 。,对于企图攻击,被动审计的检出程度是不能保证的。 为了使通用的审计跟踪能用于攻击检测等安全目的,必须配备自动工具对审计资料进行分析,以期尽早发现那些可疑事件或行为的线索,给出报警或对抗措施。,基于审计信息的攻击检测技术,为了从大量的、有时是冗余的审计跟踪资料中提取出对安全功能有用的信息,基于电脑系统审计跟踪信息设计的系统安全自动分析或检测工具是很必要的 Data Mining,攻击检测方法,检测隐藏的非法行为 攻击即时检测系统的原理是基于

6、用户历史资料的建模以及在早期的证据或模型的基础。 审计系统即时地检测用户对系统的使用情况,根据系统内部所拥有用户行为的概率统计模型进行监测,当发现有可疑的用户行为发生时,保持跟踪并监测、记录该用户的行为。,神经网络的攻击检测技术 审计统计资料的攻击检测系统,具有一些天生的弱点,因为用户的行为可以是非常复杂的,所以想要准确匹配一个用户的历史行为和当前的行为相当困难。 SRI(Stanford Research Institute)的研究小组利用和发展神经网络技术来进行攻击检测。,神经网络可能用于解决传统的统计分析技术所面临的问题:,难于建立确切的统计分布 统计方法基本上是依赖用户行为的主观假设,

7、如偏差高斯分布;错发警报常由这种假设所导致。 难于实现方法的普遍性 适用某类用户行为的检测一般无法适用于另一类用户。 演算法实现比较昂贵 基于统计的演算法对不同类型的用户行为不具普遍性,因此演算法较复杂且庞大,导致演算法实现上的昂贵。而神经网络技术不存在这个问题,实现的代价较小。 系统臃肿难于剪裁 由于采用统计方法检测具有大量用户的电脑系统,将不得不保留大量的用户行为资料,导致系统的臃肿。而基于神经网络的技术能够回避这一缺点,根据即时检测到的信息有效地加以处理作出攻击可能性的判断。,结语,目前,神经网络技术提出了对传统统计技术的攻击检测方法的改进方向,但尚不十分成熟,所以传统的统计方法仍将继续发挥作用,也仍然能为发现用户的异常行为提供相当有参考价值的信息。,个人化网页方面,资料来源:罗晓惠、黄国峯、廖宜恩 国立中心大学应用数学所,目的,一般都是静态的的个人网页,此篇利用data mining的技术,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论