[农学]基因表达式编程教学课件.ppt_第1页
[农学]基因表达式编程教学课件.ppt_第2页
[农学]基因表达式编程教学课件.ppt_第3页
[农学]基因表达式编程教学课件.ppt_第4页
[农学]基因表达式编程教学课件.ppt_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 先进计算模型(先进计算模型(3 3) 自然计算模型系列自然计算模型系列 之基因表达式编程之基因表达式编程 ( (NaturereNaturere Computing / t: generation number initialize P(t) by encoding routine;/ P(t): population of chromosomes fitness eval(P) by decoding routine; while (not termination condition) do crossover P(t) to yield C(t); / C(t): offspring mutation P(t) to yield C(t); fitness eval(C) by decoding routine; select P(t+1) from P(t) and C(t); t t+1; end output best solution; end Date 34 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 输出现代人 亚当,夏娃 染色体 Chromosomes0 染色体 表达式树ET 评价 表达式树 计算适应度 新一代 染色体 复,插,变, 重, 移, 在形成活体前变化 被选种机会按作轮盘赌,遗传操作 作轮盘赌,遗传操作 Yes No 已经进化成为现代人? 大自然(God)的GEP算法 研究点 1 多代积累的传统不 轻抛。 2 将要成熟时帮一把 。(新浪:外星人邦 人类加基因) 解释轮 盘赌, 转糖饼 Date 35 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 输出现代人 亚当,夏娃 染色体 Chromosomes0 染色体 表达式树ET 评价 表达式树 计算适应度 新一代 染色体 复,插,变, 重, 移, 在形成活体前变化 被选种机会按适应度作轮盘赌,遗传 操作 Yes No 已经进化成为现代人? 大自然(God)算法, 下页解 释轮盘 赌,转 糖饼 结束条件: 进化代数 或精度 Date 36 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 输出现代人 亚当,夏娃 染色体 Chromosomes0 染色体 表达式树ET 评价 表达式树 计算适应度 新一代 染色体 复,插,变, 重, 移, 在形成活体前变化 被选种机会按适应度作轮盘赌,遗传 操作 Yes No 已经进化成为现代人? 创新点? 道法自然,外思物化 内得心源 创新点, 转基因技术 1 多代积累的传统不 轻抛。 2 将要成熟时帮一把 。(新浪:外星人帮 人类加基因) 新的适 应度函数 重叠基因 Date 37 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 输出现代人 亚当,夏娃 染色体 Chromosomes0 染色体 表达式树ET 评价 表达式树 计算适应度 新一代 染色体 复,插,变, 重, 移, 在形成活体前变化 被选种机会按适应度作轮盘赌,遗传 操作 Yes No 已经进化成为现代人? 创新点 道法自然,外思物化, 内得心源 创新点, 转基因 技术 并列, 多基因 , 因子 分解 重叠基因 带回溯控 制的GEP 返祖现象 Date 38 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 轮盘赌,转糖饼,按适应度大小 分配份额 n用途: 这里,按概率决 定是否作某个遗传操作 。 小 饼 龙 虎 政策向 ”优良” 品种倾斜 适应度大的,站的份额多 Date 39 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 轮盘赌算法 用上页的例子 n1 按 龙、虎、./小糖饼的份额(适应度) 设计分割数组,分辨率1度 n 如 【0180】 标记为 糖饼 占用180/360=50% n 【90-100】 标记为 龙 占100/360=1/36, n 【340-360】标记为 虎 占20/360=2/36 n 用多个if 语句或不等式比较, 可从角度得到对应的标记 n Int Get-Label(Alpha) 容易实现,略去代码 nLabelType =糖饼,龙, ., 虎 n算法 nLabelType Diece ( ) / 返回 首选标记 n Radomize( ); n Alpha = Radom(360); n Return( Get-Label(Alpha) n 调用这个 函数 这根份额可能 是动态的 Date 40 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 轮盘赌算法 的另一种表述 (不如 前一种形象) step 1: Calculate the total fitness for the population step 2: Calculate selection probability pk for each chromosome vk step 3: Calculate cumulative probability qk for each chromosome vk step 4: Generate a random number r from the range 0, 1. step 5: If r q1, then select the first chromosome v1; otherwise, select the kth chromosome vk (2 k popSize) such that qk-1= Threshold) n |-|-|- -| n 0 chance rate =0.4% 1 适应度高于门限 优胜 机遇 Date 47 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD GEP 中婴儿会不会夭折, 计划生育,可保持种群稳定。 n种群规模P 10(简单问题),100(通常),300(复杂问题) n如果用静态数组保存种群,种群数目不变。 nGEP遗传操作 n交叉 (有性繁殖,单点, 多点交叉):一对父母,一对儿女 n变异(单点,多点)插删串也可看成变异 n 可视为 无性繁殖:一个前辈,只一个后代 n 比喻 凤凰涅槃,金蝉脱壳 nGEP中婴儿会不会夭折? 不会. (在GA,GP中 会大量死亡,90%) n多种操作产生的后代中,选择适应度高的P个作下一代。 GEP基本定理. EP中 一个很宽松的约束 t=2h-1, 个体在遗传操作的折腾下 全部存活, 得到 新生 (zuo j 0; repeat i random 1, popSize; j random 1, popSize; until (ij ) p random 1, l -1;/ p: the cut position, l: the length of chromosome Ci Pi 1: p-1 / Pj p: l ; Cj Pj 1: p-1 / Pi p: l ; end end output offspring Ck; end Date 51 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 变异 Mutation 的直观 解释 v1 = 100110110100101101000000010111001 c1 = 100110110100101000000010101001000 mutating point at 16th gene Date 52 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 变异 Mutation 的 算法描述 procedure: Mutation input: pM, parent Pk, k=1, 2, ., popSize output: offspring Ck begin for k 1 to popSize do / popSize: population size for j 1 to l do / l: the length of chromosome if pM random 0, 1 then / pM: the probability of mutation p random 1, l -1; / p: the cut position Ck Pk 1: j-1 / Pk j / Pk j+1: l ; end end end output offspring Ck ; end 掷骰子。看是否作 变异, pM: 是预定阈 值 Date 53 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 1基本概念 (快或略) 2 国际研究趋势 2000-2002 草创阶段 2002-2003 开始普及 2004-2005 3 我们在2004-2005的10项工作 多基因染色体的并列函数表达式 抗噪声数据的函数挖掘 动态分界阈值的分类判 别 频繁函数集的可配置挖掘 多染色体基因表达式 时间序列预测 掘中医方证关系 转基因编程 发现知识 属性融合分类 GEP回溯策略 Date 54 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2000-2002 2000-2002 草创阶段 Ferreira, C.开创论文 网上发表 2000,12, 正式发表 2001.12 2002.1 第一本专著 正式出版。 基本概念 ( 基因,染色体,K-表达式,各种适应度函数, 大量的探索性应用,太阳黑子, 函数发现,公式发现,逻辑电 路设计,模拟神经网络,等等 这段时间的论文标题和关键字(下页)反映了 草创特色,一花独放,基于实验 已经作了什 么? Date 55 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2000-2001 主要论文 标题 及关键字 n1. Ferreira, C., 2001. Gene Expression Programming: A New Adaptive Algorithm for Solving Problems. Complex Systems, Vol. 13, issue 2: 87-129. paper n Gene Expression Programming in Problem Solving, invited tutorial of the 6th Online World Conference on Soft Computing in Industrial Applications, September 10-24, 2001. 首次介绍GEP, 基于实验 Date 56 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2000-2001 主要论文 标题 及关键字 n Ferreira, C., 2001. Gene Expression Programming: A New Adaptive Algorithm for Solving Problems. Complex Systems, Vol. 13, issue 2: 87-129. paper n Gene Expression Programming in Problem Solving, invited tutorial of the 6th Online World Conference on Soft Computing in Industrial Applications, September 10-24, 2001. 问题求解,软件原 型,基于实验 Date 57 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2000-2001 主要论文 标题及关键字 n Ferreira, C., Discovery of the Boolean Functions to the Best Density-Classification Rules Using Gene Expression Programming. In E. Lutton, J. A. Foster, J. Miller, C. Ryan, and A. G. B. Tettamanzi, eds., Proceedings of the 4th European Conference on Genetic Programming, EuroGP 2002, volume 2278 of Lecture Notes in Computer Science, pages 51-60, Springer-Verlag, Berlin, Germany, 2002. paper 发现布尔函数, 可用于逻辑门电路 设计 Date 58 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2000-2001 主要论文 标题及关键字 nFerreira, C., Function Finding and the Creation of Numerical Constants in Gene Expression Programming. Proceedings of the 7th Online World Conference on Soft Computing in Industrial Applications, September nFerreira, C., 2002. Genetic Representation and Genetic Neutrality in Gene Expression Programming. Advances in Complex Systems, 5 (4): 389-408. 函数发现 Date 59 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2000-2001 主要论文 标题及关键字 n Ferreira, C., Function Finding and the Creation of Numerical Constants in Gene Expression Programming. Proceedings of the 7th Online World Conference on Soft Computing in Industrial Applications, September nFerreira, C., 2002. Genetic Representation and Genetic Neutrality in Gene Expression Programming. Advances in Complex Systems, 5 (4): 389-408. 遗传表达 Date 60 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 1基本概念 (快或略) 2 国际研究趋势 2000-2002 草创阶段 2002-2003 开始普及 2004-2005 3 我们在2004-2005的10项工作 多基因染色体的并列函数表达式 抗噪声数据的函数挖掘 动态分界阈值的分类判 别 频繁函数集的可配置挖掘 多染色体基因表达式 时间序列预测 掘中医方证关系 转基因编程 发现知识 属性融合分类 GEP回溯策略 已经作了什 么? (续) Date 61 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2002-2003 开始普及 n Chi Zhou, Peter C. Nelson, Weimin Xiao, and Thomas M. Tirpak, Discovery of Classification Rules by Using Gene Expression Programming. In Proceedings of the International Conference on Artificial Intelligence, pages 1355-1361, Las Vegas, USA, 2002. paper nChi Zhou, Weimin Xiao, Peter C. Nelson, and Thomas M. Tirpak, 2003. Evolving Accurate and Compact Classification Rules with Gene Expression Programming. IEEE Transactions on Evolutionary Computation, Vol. 7, No. 6, pages 519-531. paper U Illinois , 关联规则 Date 62 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2002-2003 开始普及 n12. Chi Zhou, Peter C. Nelson, Weimin Xiao, and Thomas M. Tirpak, Discovery of Classification Rules by Using Gene Expression Programming. In Proceedings of the International Conference on Artificial Intelligence, pages 1355-1361, Las Vegas, USA, 2002. paper nChi Zhou, Weimin Xiao, Peter C. Nelson, and Thomas M. Tirpak, 2003. Evolving Accurate and Compact Classification Rules with Gene Expression Programming. IEEE Transactions on Evolutionary Computation, Vol. 7, No. 6, pages 519-531. paper 分类规则 Date 63 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2002-2003 开始普及 nZuo Jie, Tang Changjie and Zhang Tianqing,“Mining Predicate Association Rule by Gene Expression Programming“, WAIM02 (International Conference for Web Information Age 2002). LNCS (Lecture Notes In Computer science) Vol.2419, pp.92- 103,edited by, Springer Verlag Berling Heidelberg 2002.8,ISBN n nYorick Hardy and W.-H. Steeb, 2002. Gene Expression Programming and One-dimensional chaotic maps. International Journal of Modern Physics C, 13 (1): 25-30. paper 谓词关联规则(广义的关联)理论上证明遗传运算封闭 性,在GEP中开始 严格 深入的证明 Date 64 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2002-2003 开始普及 nZuo Jie, Tang Changjie and Zhang Tianqing,“Mining Predicate Association Rule by Gene Expression Programming“, WAIM02 (International Conference for Web Information Age 2002). LNCS (Lecture Notes In Computer science) Vol.2419, pp.92-103,edited by, Springer Verlag Berling Heidelberg 2002.8,ISBN n Yorick Hardy and W.-H. Steeb, 2002. Gene Expression Programming and One-dimensional chaotic maps. International Journal of Modern Physics C, 13 (1): 25-30. paper 一维 混沌 映射 Date 65 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 比较深入 n15. Ferreira, C., Gene Expression Programming and the Evolution of Computer Programs. In Leandro N. de Castro and Fernando J. Von Zuben, eds., Recent Developments in Biologically Inspired Computing, pages 82-103, Idea Group Publishing, 2004. paper n1 .Zuo Jie, Tang Changjie ,Li Chuan , Yuan Chang-an and Chen An-long, “Time Series Prediction based on Gene Expression Programming“, WAIM04 (International Conference for Web Information Age 2004). LNCS (Lecture Notes In Computer science) Vol.3129, pp.55-64, edited by Q Li and G. Wang, Springer Verlag Berling Heidelberg 2004.8,ISBN 3-540 -22418-1 (SCI 检索号 :UT ISI: 000222635400007 综述和总结 Date 66 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 比较深入 n Ferreira, C., Gene Expression Programming and the Evolution of Computer Programs. In Leandro N. de Castro and Fernando J. Von Zuben, eds., Recent Developments in Biologically Inspired Computing, pages 82-103, Idea Group Publishing, 2004. paper n.Zuo Jie, Tang Changjie ,Li Chuan , Yuan Chang-an and Chen An-long, “Time Series Prediction based on Gene Expression Programming“, WAIM04 (International Conference for Web Information Age 2004). LNCS (Lecture Notes In Computer science) Vol.3129, pp.55-64, edited by Q Li and G. Wang, Springer Verlag Berling Heidelberg 2004.8,ISBN 3-540-22418 -1 (SCI 检索号 :UT ISI: 000222635400007 时间序列预测,证明了NP问题,微分插 值,挖掘微分方程,预测太阳黑子 Date 67 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 比较深入 nXin Li, Chi Zhou, Peter C. Nelson, and Thomas M. Tirpak, Investigation of Constant Creation Techniques in the Context of Gene Expression Programming. In M. Keijzer, ed., Late Breaking Paper at Genetic and Evolutionary Computation Conference, GECCO-2004, Seattle, Washington, USA, June 26 -30, n nEdwin Roger Banks, James C. Hayes, and Edwin Nunez, Parametric Regression Through Genetic Programming. In M. Keijzer, ed., Late Breaking Paper at Genetic and Evolutionary Computation Conference, GECCO-2004, Seattle, Washington, USA, June 26-30, 2004. paper GEP 常数技 术 Date 68 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 工作面扩大 比较深入 nXin Li, Chi Zhou, Peter C. Nelson, and Thomas M. Tirpak, Investigation of Constant Creation Techniques in the Context of Gene Expression Programming. In M. Keijzer, ed., Late Breaking Paper at Genetic and Evolutionary Computation Conference, GECCO-2004, Seattle, Washington, USA, June 26 -30, nEdwin Roger Banks, James C. Hayes, and Edwin Nunez, Parametric Regression Through Genetic Programming. In M. Keijzer, ed., Late Breaking Paper at Genetic and Evolutionary Computation Conference, GECCO-2004, Seattle, Washington, USA, June 26-30, 2004. paper 参数回归 Date 69 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 工作面扩大 比较深入 nFerreira, C., Designing Neural Networks Using Gene Expression Programming. 9th Online World Conference on Soft Computing in Industrial Applications, September 20 - October 8, 2004. paper n Shu-Heng Chen and Bin-Tzong Chie, Toward a Functional Modularity Approach to Agent-Based Modeling of the Evolution of Technology. In Proceedings of the 9th Workshop on Economics and Heterogeneous Interacting Agents, Kyoto, Japan, 2004. paper 神经网络 Date 70 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 工作面扩大 比较深入 nFerreira, C., Designing Neural Networks Using Gene Expression Programming. 9th Online World Conference on Soft Computing in Industrial Applications, September 20 - October 8, 2004. paper n nShu-Heng Chen and Bin-Tzong Chie, Toward a Functional Modularity Approach to Agent-Based Modeling of the Evolution of Technology. In Proceedings of the 9th Workshop on Economics and Heterogeneous Interacting Agents, Kyoto, Japan, 2004. paper 函数建模, 代理 进化 Date 71 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 工作面扩大 比较深入 n23. Zhuli Xie, Xin Li, Barbara Di Eugenio, Weimin Xiao, Thomas M. Tirpak, and Peter C. Nelson, Using Gene Expression Programming to Construct Sentence Ranking Functions for Text Summarization. In Proceedings of the 20th International Conference on Computational Linguistics, Geneva, Switzerland, August 23-27, 2004. paper n24. Heitor S. Lopes and Wagner R. Weinert, 2004. EGIPSYS: An Enhanced Gene Expression Programming Approach for Symbolic Regression Problems. International Journal of Applied Mathematics and Computer Science, 14 (3): 375-384. 文本总结,句子评分 函数 Date 72 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 工作面扩大 比较深入 n23. Zhuli Xie, Xin Li, Barbara Di Eugenio, Weimin Xiao, Thomas M. Tirpak, and Peter C. Nelson, Using Gene Expression Programming to Construct Sentence Ranking Functions for Text Summarization. In Proceedings of the 20th International Conference on Computational Linguistics, Geneva, Switzerland, August 23-27, 2004. paper n24. Heitor S. Lopes and Wagner R. Weinert, 2004. EGIPSYS: An Enhanced Gene Expression Programming Approach for Symbolic Regression Problems. International Journal of Applied Mathematics and Computer Science, 14 (3): 375-384. 符号回归 Date 73 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 2004-2005 研究者增多 工作面扩大 比较深入 n25. K.J. Brazier, G. Richards and W. Wang, Implicit fitness sharing speciation and emergent diversity in tree classifier ensembles. In Proceedings of the Fifth International Conference on Intelligent Data Engineering and Automated Learning (IDEAL ?4), Exeter, UK, August 25-27, 2004. paper 适应度共享 树分类 Date 74 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 我们的工作 说明: 后面列出的是较早的一部分工作,用来说明思路, H更多的新的结果工作参见 H7/tangchangjie/paper_doc/e_publication.htm H/chjtang/paper_doc/e_publication.htm H论文都可以下载 Date 75 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 提纲 1基本概念 (快或略) 2 国际研究趋势 2000-2002 草创阶段 2002-2003 开始普及 2004-2005 3 我们在2004-2005的10项工作 多基因染色体的并列函数表达式 抗噪声数据的函数挖掘 动态分界阈值的分类判 别 频繁函数集的可配置挖掘 多染色体基因表达式 时间序列预测 掘中医方证关系 转基因编程 发现知识 属性融合分类 GEP回溯策略 已经作了什 么? (续) Date 76 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 输出现代人 亚当,夏娃 染色体 Chromosomes0 染色体 表达式树ET 评价 表达式树 计算适应度 新一代 染色体 被选种机会按适应度作轮盘赌,遗传 操作 复,插,变, 重, 移, 在形成活体前变化 Yes No 已经进化成为现代人? 多基因染色体的并列函数 创新点 ,乘法连接,多 个基因 实现因子分解 Date 77 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 我们的工作 1 n基于多基因染色体的并列函数表达式挖掘 , n 汪锐 唐常杰 贾晓斌 曾令明 n 因式分解 只是其中的特例,准确分解与近似分解 Date 78 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 我们的工作 1 H寻求多个函数因子的乘积f1(x) f2(x) f3(x) fn (x) 来匹配原有的单一的多项式函数y = f ( x )。 与传统多 项式因式分解不同,在多项式于实数范围内不可分的 时候,GPF按照给定的精度阈值和要求的结果多项式 次数进行近似分解。 H当仅有观察数据集时,本方法可直接在原始数据集上 挖掘出表示数据内在规律的多个并列因子函数的乘积 表达。本文中称为多函数关系挖掘MFM(Multiple Function Mining)。 Date 79 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 我们的工作 2,3 基于基因表达式编程的抗噪声数据的函数挖掘方法 段磊 唐常杰 左劼 陈宇 钟义啸 计算机研究与发展 2004, 基于基因表达式编程的动态产生分界阈值的 分类判别函数挖掘方法 段磊 唐常杰 左劼 陈宇 钟义啸 Date 80 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 我们的工作 4 频繁函数集的可配置挖掘算法 贾晓斌,唐常杰,钟义啸,赵波 , 计算机学报 录用 可配置的频繁函数集挖掘算法CFFSDA, 灵活,配置多种搜索算法。 基于约束的频繁函数集(Constrained FFS)概念, 满足用户的不同兴趣需求。 基于约束的频繁函数集挖掘框架。 Date 81 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 我们的工作 4 频繁函数集的可配置挖掘算法 传统公式挖掘: 为 一批数据 找一个公式, 一把钥匙开一把锁 频繁函数集的可配置挖掘算法 为 一批复杂数据 找一批公式, 一批钥匙开一批锁, 带有 置信度,精度,准确度 Date 82 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 说明动机的例子 如图 2.1所示,假设数据集DB中的 记录是图中y=x2和直线y=10x+100 上的一些点对应的x,y值。用单个 函数不可能完全准确描述出该数据 集中x与y的联系。但可以用函数集 合很好地解决这个问题: y=x2, y =10x+100, 集合中的每个函数只能部分描述x 与y的联系。 Date 83 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 用研究成果 作 挖掘 实验 n数据集中的某记录形式如下: W表示鱼的重量, 单位克(g) ,w为 鱼的厚度,它们的 数值是测量值对L3 的百分比 Date 84 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD MinSupport =50% , Precision- Threshold =0.05 Date 85 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD 5.2 利用FFS进行分类 n本节示例FFS分类功能。实验数据源于5.1节中的数据,抽 取了Bream,Perch鱼的统计数据。其中的属性意义见5.1节 说明。实验的目的希望找出FFS作为分类规则,可以通过测 量这几种属性来判断鱼的种类。 Date 86 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD Bream鱼和Perch鱼的统计数据 Date 87 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD Bream鱼上的FFS n把表5.1 (Bream鱼)转换为合适的挖掘对象,进行挖掘。当 PrecisionThreshold =0.05,MinSupport=80%时得出下列结果: Date 88 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD n而这些函数在表5.2( Perch鱼)上的支持度分别为: H0 H89% H21% H62% H0 n如果要用FFS进行分类,则要选取在表5.1上的支持度与表5.2上的支持 度有显著差异的频繁函数。因此可以选取 Date 89 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD n分类规则:某条鱼是Bream或Perch,如果它的测量数据满足以上2个频 繁函数之一,则它是Bream,否则是Perch。 Date 90 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD n当数据来源仅限于Bream或Perch时,上述规则成立。然而,如果数据来源 于5.1节中数据集中7种种类的鱼时,上述规则不能正确分类。 测量数据满 足FFS1和 FFS5,如 果按上述分 类规则,就 会把它误分 类为Bream 鱼。 Date 91 CS_Dept.Sichaun Univ. 自然计算模型自然计算模型 SCUPHDSCUPHD n当测量数据可能来自上述七种种类的鱼时,往往需要利用频繁函数集 合进行综合判断。经过分析,可得到如下几条分类规则: Date 92 CS_Dept.Sichaun Univ. 自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论