




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、周志华周志华http:/ 南京大学计算机软件新技术国家重点实验室机器学习是人工智能的核心研究领域之一任何一个没有学习能力的系统都很难被认为是一个真正的智能系统经典定义:利用经验改善系统自身的性能随着该领域的发展,主要做智能数据分析并已成为智能数据分析技术的源泉之一典型任务:预测(例如:天气预报)数据挖掘数据库机器学习数据分析技术数据管理技术美国航空航天局JPL实验室的科学家在Science(2001年9月)上撰文指出:机器学习对科学研究的整个过程正起到越来越大的支持作用,该领域在今后的若干年内将取得稳定而快速的发展生物信息学计算金融学分子生物学行星地质学工业过程控制机器人遥感信息处理信息安全机
2、机 器器 学学 习习美国航空航天局JPL实验室的科学家在Science(2001年9月)上撰文指出:机器学习对科学研究的整个过程正起到越来越大的支持作用,该领域在今后的若干年内将取得稳定而快速的发展入侵检测:是否是入侵?是何种入侵?如何检测?历史数据:以往的正常访问模式及其表现、以往的入侵模式及其表现对当前访问模式分类这是一个典型的机器学习问题常用技术:神经网络 决策树支持向量机 贝叶斯分类器k近邻 序列分析 聚类 常用技术:神经网络 支持向量机隐马尔可夫模型贝叶斯分类器 k近邻决策树 序列分析 聚类 Google的成功,使得Internet搜索引擎成为一个新兴的产业不仅有众多专营搜索引擎的公
3、司出现(例如专门针对中文搜索的就有慧聪、百度等),而且Microsoft等巨头也开始投入巨资进行研发Google掘到的第一桶金,来源于其创始人Larry Page和Sergey Brin提出的PageRank算法机器学习技术正在支撑着各类搜索引擎(尤其是贝叶斯学习技术)DARPA 2003年开始启动PAL(Perceptive Assistant that Learns)计划5年期,首期(1-1.5年)投资2千9百万美元以机器学习为核心的计划(涉及到AI的其他分支,如知识表示和推理、自然语言处理等);包含2个子计划目标:“is expected to yield new technology
4、of significant value to the military, business, and academic sectors” “develop software that will help decision-makers manage their complex worlds of multiple simultaneous tasks and unexpected events”RADAR (Reflective Agents with Distributed Adaptive Reasoning),承担单位为CMU,首期7百万美元目标:“the system will he
5、lp busy managers to cope with time-consuming tasks” “RADAR must learn by interacting with its human master and by accepting explicit advice and instruction”CALO (Cognitive Agent that Learns and Observes),承担单位为SRI,首期2千2百万美元除SRI外,这个子计划的参加单位有20家:Boeing, CMU, Dejima Inc., Fetch Tech Inc., GATech, MIT, O
6、regon HSU, Stanford, SUNY-Stony Brook, UC Berkeley, UMass, UMich, UPenn, Rochester, USC, UT Austin, UW, Yale, CALO无疑是PAL中更核心的部分目标: “the name CALO was inspired by the Latin word calonis, which means soldiers assistant” “the CALO software, which will learn by working with and being advised by its user
7、s, will handle a broad range of interrelated decision-making tasks It will have the capability to engage in and carry out routine tasks, and to assist when the unexpected happens”从CALO的目标来看,DARPA已经开始把机器学习技术的重要性放到了国家安全的角度来考虑下述事件(大致)标志着机器学习正式成为一个学科u1983年,R.S. Michalski等人撰写机器学习:通往人工智能的途径一书u1986年,Machin
8、e Learning杂志创刊与人工智能乃至计算机科学中很多其他分支学科相比,机器学习还非常年轻、很不成熟以Tom Mitchell的经典教科书(McGraw Hill出版社,1997)为例,很难看到基础学科(例如数学、物理学)教科书中那种贯穿始终的体系,也许会让人感到这不过是不同方法和技术的堆砌主要范式的发展:u80年代中叶以前:符号主义,代表:ILP受到传统人工智能研究的深刻影响,以逻辑推理为基础u80年代中叶至90年代初:连接主义,代表:NN对传统人工智能的批评:“看上去漂亮,但解决不了实际问题”对上述批评,AI的不同分支学科实际上都做出了自己的回应,ML的回应是连接主义受到重视NN并不漂
9、亮(至少在理论体系上远远没有ILP那么漂亮),但解决了很多实际问题u90年代中叶至今:统计学习,代表:SVMNN虽然解决了不少问题,但解决问题时的“试错性”引来了“trick”的批评作为回应,统计学习开始占据支配地位。虽然SVM仍然有“试错性”,但毕竟在理论基础上比NN漂亮得多(实际上,统计学习与连接主义一脉相承)u现在:?统计学习并不是万能的,有很多问题不能解决(或不能很好地解决),例如结构化数据的学习作为回应,以逻辑为基础的符号主义与统计学习的结合开始受到重视从主要范式的发展可以看出,ML实际上是一个应用驱动的学科,其根本的驱动力是“更多、更好地解决实际问题”由于近20年的飞速发展,机器学
10、习已经具备了一定的解决实际问题的能力,似乎逐渐开始成为一种基础性、透明化的“支持技术、服务技术”基础性:在众多的学科领域都得以应用(“无所不在”)透明化:用户看不见机器学习,看见的是防火墙、生物信息、搜索引擎;(“无所不在”) “机器更好用了”(正如CALO的一些描述:“you wont leave home without it”;”embodied as a software environment that transcends workstations, PDAs, cell phones, ”)作为支持和服务技术的“普适机器学习”带来了挑战和机遇: 出现了很多被传统ML研究忽视、但非
11、常重要且尚无好的解决方案的问题(下面将以医疗和金融为代表来举几个例子) ML支持和服务的学科领域越多,新问题越多 ML与众多学科领域产生了交叉,而交叉领域正是大有可为处医疗:以乳腺癌诊断为例,“将病人误诊为健康人的代价”与“将健康人误诊为病人的代价”是不同的金融:以信用卡盗用检测为例,“将盗用误认为正常使用的代价”与“将正常使用误认为盗用的代价”是不同的传统的ML技术基本上只考虑同一代价如何处理代价敏感性?在教科书中找不到现成的答案,例如:Tom Mitchell, Machine Learning, McGraw-Hill, 1997Nils J. Nilsson, Introduction
12、 to Machine Learning, draft 1996 - 2004医疗:以乳腺癌诊断为例,“健康人”样本远远多于“病人”样本金融:以信用卡盗用检测为例,“正常使用”样本远远多于“被盗用”样本传统的ML技术基本上只考虑平衡数据如何处理数据不平衡性?在教科书中找不到现成的答案医疗:以乳腺癌诊断为例,需要向病人解释“为什么做出这样的诊断”金融:以信用卡盗用检测为例,需要向保安部门解释“为什么这是正在被盗用的卡”传统的ML技术基本上只考虑泛化不考虑理解如何处理可理解性?在教科书中找不到现成的答案 把机器学习真正当成一种支持技术、服务技术,考虑不同学科领域对机器学习的需求,找出其中具有共性的
13、、必须解决的问题,并进而着手研究一方面可以促进和丰富ML本身的发展,另一方面可以促进使用ML技术的学科领域本身的发展作为“应用基础”,与“ML应用”有根本的区别: 基础性:不是直接做应用,而是做“更广泛的应用”或“更成功的应用”所需要的方法和技术 广泛性:重点不是去解决单一应用所面临的问题,而是要解决众多应用领域所面临的共性问题应明生教授:与基础科学教科书的比较王珏教授: 多次富有启发性的讨论请各位专家 批评指正!SQNKIFDAxvspnkifca752+)&!ZWUROMJHEBzwtromjgeb9631-*%#YVSQNLIFDAxvsqnkifda752+)&$ZWU
14、RPMJHEBzwuromjheb9631-(%#YVTQNLIFDAyvsqnlifda7520)&$ZXURPMJHECzwurpmjheb9641-(%!YVTQNLIGDAyvtqnligda8520)*$ZXUSPMKHECzxurpmkhec9641+(%!YWTQOLIGDByvtqoligda8530)*$#XUSPMKHFCzxuspmkhec9741+(&!YWTQOLJGDBywtqoligdb8530-*$#XUSPNKHFCAxuspmkhfc9742+(&!YWTROLJGEBywtqoljgdb8630-*$#XVSPNKIFCAxuspn
15、khfca742+(&!ZWTROMJGEBywtroljgeb8630-*%#XVSQNKIFCAxvspnkifca742+)&!ZWUROMJGEBzwtromjgeb8631-*%#YVSQNKIFDAxvsqnkifca752+)&$ZWUROMJHEBzwuromjgeb9631-(%#YVTQNLIFDAyvsqnlifda7520)&$ZXURPMJHECzwurpmjheb9641-(%!YVTQNLIGDAyvtqnlifda8520)*$ZXURPMKHECzxurpmjhec9641+(%!YVTQOLIGDByvtqnligda8530
16、)*$ZXUSPMKHFCzxurpmkhec9741+(%!YWTQOLJGDByvtqoligdb8530)*$#XUSPNKHFCzxuspmkhfc9741+(&!YWTROLJGDBywtqoljgdb8530-*$#XVSPNKHFCAxuspnkhfc9742+(&!ZWTROLJGEBywtroljgdb8630-*%#XVSPNKIFCAxvspnkhfca742+)&!ZWTROMJGEBzwtroljgeb8631-*%#YVSQNKIFDAxvsqnkifca752+)&$ZWUROMJHEBzwuromjgeb9631-(%#YVSQN
17、LIFDAyvsqnkifda7520)&$ZWURPMJHECzwuromjheb9641-(%#YVTQNLIGDAyvsqnlifda8520)&$ZXURPMKHECzwurpmjhec9641-(%!YVTQOLIGDAyvtqnligda8520)*$ZXUSPMKHECzxurpmkhec9641+(%!YWTQOLIGDByvtqoligda8530)*$#XUSPMKHFCzxuspmkhec9741+(&!YWTQOLJGDBywtqoligdb8530-*$#XUSPNKHFCAxuspmkhfc9742+(&!YWTROLJGEBywtr
18、oljgdb8630-*%#XVSPNKIFCAxvspnkhfca742+)&!ZWTROMJGEBzwtroljgeb8631-*%#XVSQNKIFDAxvspnkifca752+)&!ZWUROMJHEBzwtromjgeb9631-*%#YVSQNLIFDAxvsqnkifda752+)&$ZWURPMJHEBzwuromjheb9631-(%#YVTQNLIFDAyvsqnhfc9742+(&!ZWTROLJGEBywtroljgdb8630-*%#XVSPNKIFCAxvspnkhfca742+)&!ZWTROMJGEBzwtromjgeb
19、8631-*%#YVSQNKIFDAxvsqnkifca752+)&$ZWUROMJHEBzwuromjgeb9631-(%#YVSQNLIFDAyvsqnkifda7520)&$ZWURPMJHECzwuromjheb9641-(%#YVTQNLIGDAyvsqnlifda8520)&$ZXURPMKHECzwurpmjhec9641-(%!YVTQOLIGDAyvtqnligda8520)*$ZXUSPMKHECzxurpmkhec9641+(%!YWTQOLIGDByvtqoligda8530)*$#XUSPMKHFCzxuspmkhec9741+(&!Y
20、WTQOLJGDBywtqoligdb8530-*$#XUSPNKHFCAxuspmkhfc9742+(&!ZWTROLJGEBywtroljgdb8630-*%#XVSPNKIFCAxvspnkhfca742+)&!ZWTROMJGEBzwtroljgeb8631-*%#XVSQNKIFDAxvspnkifca752+)&!ZWUROMJHEBzwtromjgeb9631-*%#YVSQNLIFDAxvsqnkifda752+)&$ZWURPMJHEBzwuromjheb9631-(%#YVTQNLIFDAyvsqnlifda7520)&$ZXURPM
21、JHECzwurpmjheb9641-(%!YVTQNLIGDAyvtqnlifda8520)*$ZXURPMKHECzxurpmjhec9641+(%!YVTQOLIGDByvtqnligda8530)*$ZXUSPMKHFCzxurpmkhec9741+(&!YWTQOLJGDBywtqoligdb8530-*$#XUSPNKHFCAxuspmkhfc9742+(&!YWTROLJGEBywtqoljgdb820)&$ZXURPMKHECzwurpmjhec9641-(%!YVTQOLIGDAyvtqnligda8520)*$ZXUSPMKHECzxurpmkhec
22、9641+(%!YWTQOLIGDByvtqoligda8530)*$#XUSPMKHFCzxuspmkhec9741+(&!YWTQOLJGDBywtqoligdb8530-*$#XUSPNKHFCAxuspmkhfc9742+(&!ZWTROLJGEBywtroljgdb8630-*%#XVSPNKIFCAxvspnkhfca742+)&!ZWTROMJGEBzwtroljgeb8631-*%#XVSQNKIFDAxvspnkifca752+)&!ZWUROMJHEBzwtromjgeb9631-*%#YVSQNLIFDAxvsqnkifda752+)&am
23、p;$ZWURPMJHEBzwuromjheb9631-(%#YVTQNLIFDAyvsqnlifda7520)&$ZXURPMJHECzwurpmjheb9641-(%!YVTQNLIGDAyvtqnlifda8520)*$ZXURPMKHECzxurpmjhec9641+(%!YVTQOLIGDByvtqnligda8530)*$ZXUSPMKHFCzxuspmkhec9741+(&!YWTQOLJGDBywtqoligdb8530-*$#XUSPNKHFCAxuspmkhfc9742+(&!YWTROLJGEBywtqoljgdb8630-*$#XVSPNKIFC
24、Axuspnkhfca742+(&!ZWTROMJGEBywtroljgeb8630-*%#XVSQNKIFCAxvspnkifca742+)&!ZWUROMJGEBzwtromjgeb8631-*%#YVSQNKIFDAxvsqnkifca752+)&$ZWUROMJHEBzwuromjgeb530-*$#XUSPNKHFCAxuspnkhfc9742+(&!ZWTROLJGEBywtroljgdb8630-*%#XVSPNKIFCAxvspnkhfca742+)&!ZWTROMJGEBzwtroljgeb8631-*%#XVSQNKIFDAxvspn
25、kifca752+)&!ZWUROMJHEBzwtromjgeb9631-*%#YVSQNLIFDAxvsqnkifda752+)&$ZWURPMJHEBzwuromjheb9631-(%#YVTQNLIFDAyvsqnlifda7520)&$ZXURPMJHECzwurpmjheb9641-(%!YVTQNLIGDAyvtqnlifda8520)*$ZXURPMKHECzxurpmjhec9641+(%!YVTQOLIGDByvtqnligda8530)*$#XUSPMKHFCzxuspmkhec9741+(&!YWTQOLJGDBywtqoligdb8530
26、-*$#XUSPNKHFCAxuspmkhfc9742+(&!YWTROLJGEBywtqoljgdb8630-*$#XVSPNKIFCAxuspnkhfca742+(&!ZWTROMJGEBywtroljgeb8630-*%#XVSQNKIFCAxvspnkifca742+)&!ZWUROMJGEBzwtromjgeb8631-*%#YVSQNKIFDAxvsqnkifca752+)&$ZWUROMJHEBzwuromjgeb9631-(%#YVSQNLIFDAyvsqnkifda7520)&$ZWURPMJHECzwuromjheb9641-(%#Y
27、VTQNLFCAxvspnkhfca742+)&!ZWTROMJGEBzwtroljgeb8631-*%#XVSQNKIFDAxvspnkifca752+)&!ZWUROMJHEBzwtromjgeb9631-*%#YVSQNLIFDAxvsqnkifda752+)&$ZWURPMJHEBzwuromjheb9631-(%#YVTQNLIFDAyvsqnlifda7520)&$ZXURPMJHECzwurpmjheb9641-(%!YVTQNLIGDAyvtqnlifda8520)*$ZXURPMKHECzxurpmjhec9641+(%!YVTQOLIGDByvtqnligda8530)*$#XUSPMKHFCzxuspmkhec9741+(&!YWTQOLJGDBywtqoligdb8530-*$#XUSPNKHFCAxuspmkhfc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025康复医学治疗技术副高级职称模拟试题附完整答案详解【典优】
- 2023年度医师定期考核练习题【预热题】附答案详解
- 特殊人群疫苗接种建议
- 中暑患者降温护理
- 2025年银行岗位考前冲刺测试卷及完整答案详解【网校专用】
- 房产收购合同(标准版)
- 房地产 -居住报告豪华住宅开发的全球视角 The Residence Report The global perspective on luxury residential development 2025 -2026
- 作文大赛获奖感言(31篇)
- 中科院心理咨询师理论知识考试题库及答案(1062题)
- 养生馆渠道合作计划书2
- 汽车底盘安全培训课件
- 食品添加剂培训课件
- 儿童安全用电防范培训内容课件
- 2025年轮椅转运的题库及答案
- 电商直播干货知识培训内容课件
- 老年脓毒症相关脑病诊疗急诊专家共识解读
- 2025年秋期新教材教科版二年级上册小学科学教学计划+进度表
- 2024年宁波市宁海县国有企业招聘笔试真题
- 义乌市国有资本运营有限公司2025年度员工公开招聘笔试参考题库附带答案详解
- 2025上半年教师资格证小学《综合素质》笔试真题及答案
- 功率半导体器件基础课件
评论
0/150
提交评论