




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021-5-51 2021-5-52 2021-5-53 2021-5-54 2021-5-55 2021-5-56 2021-5-57 数据清理筛选数据清理筛选 数据数据 目标数据目标数据 预处理预处理 及变换及变换 变换后的数据变换后的数据 数据挖掘数据挖掘 解释解释/评估评估 2021-5-58 2021-5-59 2021-5-510 2021-5-511 2021-5-512 2021-5-513 2021-5-514 数据仓库数据仓库 数据清理数据清理 数据集成数据集成过滤过滤 数据库数据库 数据库或数据仓库 服务器 数据挖掘引擎 模式评估 图形用户界面 知识库 2021-5-5
2、15 2021-5-516 2021-5-517 2021-5-518 2021-5-519 2021-5-520 定义:论域x=x上的模糊集合a由隶属函数 a(x)来表征。其中a(x)在实轴的闭区间0,1中 取值,a(x)的大小反映x对于模糊集合a的隶属程 度。 a(x)的值接近1,表示x隶属于a的程度很高。 a(x)的值接近0,表示x隶属于a的程度很低。 特例,当a的值域取0,1闭区间的两个端点, 亦即0,1两个值时,a便退化为一个普通的逻辑 子集。隶属函数也就退化为普通逻辑值。 2021-5-521 2021-5-522 2021-5-523 2021-5-524 2021-5-525
3、2021-5-526 2021-5-527 2021-5-528 2021-5-529 2021-5-530 2021-5-531 2021-5-532 2021-5-533 2021-5-534 2021-5-535 2021-5-536 2021-5-537 数据清理数据清理 数据集成数据集成 数据转换数据转换 数据归约数据归约 2021-5-538 2021-5-539 2021-5-540 2021-5-541 n简单,但是没有意义 2021-5-542 2021-5-543 2021-5-544 2021-5-545 2021-5-546 2021-5-547 2021-5-548
4、x y y = x + 1 x1 y1 y1 2021-5-549 2021-5-550 2021-5-551 2021-5-552 ba ba n bbaa r ) 1( )( )( , a b a b 2021-5-553 2021-5-554 aaminnewmaxnew_,_ aaa aa a minnewminnewmaxnew minmax minv v_)_( 2021-5-555 av v j v v 10 where j is the smallest integer such that max(| |) reduced attribute set: a1, a4, a6 y
5、 y y n n n 2021-5-563 2021-5-564 2021-5-565 count 51015202530 1 2 3 4 5 6 7 8 9 10 1-1011-2021-30 5 10 15 20 25 13 25 15 priceprice count 2021-5-566 2021-5-567 2021-5-568 2021-5-569 2021-5-570 count 51015202530 1 2 3 4 5 6 7 8 9 10 1-1011-2021-30 5 10 15 20 25 13 25 15 priceprice count 2021-5-571 20
6、21-5-572 2021-5-573 n例例1:包含数据:包含数据:101、110、203、222、305、315 n方法:最高位包含方法:最高位包含3个值(个值(1、2、3) n分成分成100,200),),200,300),),300,400)三段)三段 n例例2:包含数据:包含数据:101、110、103、422、405、415,400 n方法:最高位包含方法:最高位包含2个值(个值(1、4) n分成分成100,150),),150,200) ,400,450) ,450,500)四段)四段 n例例3:包含数据:包含数据:101、210、203、322、305、415,500 n方法:
7、最高位包含方法:最高位包含5个值(个值(1、2、3、4、5) n分成分成100,200),),200,300) ,300,400) ,400,500),),500,600) 五段五段 2021-5-574 2021-5-575 country province_or_ state city street 15 distinct values 65 distinct values 3567 distinct values 674,339 distinct values 2021-5-576 主要内容主要内容 l为什么需要数据预处理为什么需要数据预处理? ? l数据清洗数据清洗 l数据集成与转换数据集成与转换 l数据归约数据归约 l数据离散化与概念层次的构建数据离散化与概念层次的构建 l本章小结本章小结 2021-5-577 2021-5-578 信息 可视化 数据 挖掘 可视化 数据 挖掘 2021-5-579 2021-5-580 2021-5-581 202
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025《设备采购合同模板》
- 2025技术开发委托合同
- 2025计算机软件购销合同范本
- 2025财产信托合同样本
- 2025年太阳能组件生产装备项目建议书
- 2025年专用改性型氯化聚乙烯合作协议书
- 2025年稀有金属及稀土金属材料合作协议书
- 2025年聚氧乙烯醚项目建议书
- 2025年高纯高碳铬轴承钢及渗碳轴承钢合作协议书
- 楼房打桩施工方案
- CAD输入文字时提示“找不到主词典无法启动拼写检查程序”怎么办
- -活出心花怒放的生命 课件 心理健康
- 给水泵检修方案
- 设备出入库管理办法
- KEGG代谢通路中文翻译
- 消火栓月检查表
- GB∕T 17832-2021 银合金首饰 银含量的测定 溴化钾容量法(电位滴定法)
- 低成本自动化的开展与案例77页PPT课件
- 人防工程竣工资料(全套)
- 梅州市部分饮用水源保护区调整方案
- “重庆环保”标志说明
评论
0/150
提交评论