机器学习导论第1章.ppt

上传人：柠*** IP属地：江西上传时间：2020-03-20 格式：PPT 页数：43 大小：409.50KB 积分：12 举报 版权申诉

免费预览已结束，剩余38页可下载查看

下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

机器学习MachineLearning 课程考核方法平时分 20分点名 10分一次不来扣3分上机作业 30分期末考核 40分主要参考书目机器学习 TomM Mitchell著曾华军张银奎等译机器学习导论 EthemAlpaydin著范明等译学时安排及上机总学时54 授课36 上机18 上机时间地点信息楼105辅导答疑周五3 4节扬帆楼503 本课程主要内容监督学习分类回归隐马尔可夫模型贝叶斯网络决策树人工神经网络贝叶斯学习增强学习如何学习本门课程本门课程注重了解和理解为将来进一步的深入学习打好基础本门课程的要求掌握基本概念了解机器学习方法的思想掌握少数经典算法并能够编程实现多动脑思考积极活跃的课堂讨论第一章绪论什么是机器学习机器学习的应用实例相关资源四个概念人工智能 ArtificialIntelligence 智能计算 IntelligentComputing 计算智能 ComputationalIntelligence 机器学习 MachineLearning 智能所以知之在人者谓之知知有所合谓之智所以能之在人者谓之能能有所合谓之能荀况荀子正名智能学智能学即研究生物智能人类智能以及人造智能的科学 21世纪的科学技术已经向我们展示了一个丰富多彩的智能世界人类智能生物智能智能机器人生物信息系统人工智能计算智能机器学习智能仪器智能机器人机器翻译人机对弈人工生命人工免疫系统人造昆虫机器人足球赛计算一切思维不过就是计算霍布斯作为一般的智能行为物质符号系统具有的计算手段既是必要的也是充分的人类认知和智能活动经编码成符号系列都可以通过计算机进行模拟西蒙梦想机器具有智能计算机科学家的梦想什么是智能能感知能学习能思维能记忆能决策能行动智能的核心是思维图灵测试怎样判断机器具有智能图灵测试1950年AlanTuring的文章 ComputingMachineryandIntelligence Mind Vol 59 No 236 提出图灵测试检验一台机器或电脑是否具有如人一样的思维能力和智能电脑和人分别封闭在不同的房间测试者不知道哪个房间是人哪个房间是电脑他向双方提出测试问题电脑和人给出各自的答案如果一系列的测试问题之后测试者分不出哪些是电脑的答案哪些是人的答案则电脑通过测试确实具有与人一样的智能测试悖论公平性问题图灵测试的出发点显然是刁难电脑要求电脑模仿人回答问题公平吗反过来要求人模仿电脑回答问题公平吗标准性问题在怎样的智能水平下对电脑进行测试天才普通人还是婴幼儿或者说怎样认定电脑的智力水平全面性问题怎样全面地测试电脑的智能喜怒哀乐和表情等有关情感的测试如何进行测试边界怎样确定欺骗性问题电脑如果有意欺骗测试者测试者能判断出来吗在一定的范围内进行测试还是可行的困惑哲学问题 1 规则与规律规则是制定的规律是客观存在的从规则能自动发现规律吗 2 生命与非生命智能是高等生命体独有的能力非生命体内能产生智能吗 3 物质与意识唯物主义和唯心主义都承认二元论只是在何者起决定作用上争论不休智能能在机器内产生将导致一元论物质生成一切 4 智能的本质理性与感性思考与行动社会性与个体性伦理问题 1 电脑与人脑能否互换 2 机器人与人机器能否融入人类社会 3 情感与役使机器是人制造并使用的工具一旦机器人具有了智能和情感人类还能当奴隶一样地役使吗 4 机器人叛乱机器人群体有可能叛乱而反过来役使人类吗现实比尔盖茨预测智能计算发展前景乃是机器最终能看会想能听会讲无论是人工智能还是智能人工只要能够殊途同归造福于人类那么所有的努力便都是有价值的未来智能机器作为真正意义上的工作助手和生活良伴将使我们的生活完全改观聪明机器的出现也决不会成为人类的灾难在智慧与创造力方面永远是人类最有发言权什么是智能计算智能计算 ComputationalIntelligence CI 目前还没有一个统一的的定义使用较多的是美国科学家贝慈德克 J C Bezdek 从智能计算系统角度所给出的定义如果一个系统仅处理低层的数值数据含有模式识别部件没有使用人工智能意义上的知识且具有计算适应性计算容错力接近人的计算速度和近似于人的误差率这4个特性则它是智能计算的从学科范畴看智能计算是在神经网络 NeuralNetworks NN 演化计算 EvolutionaryComputation EC 及模糊系统 FuzzySystem FS 这3个领域发展相对成熟的基础上形成的一个统一的学科概念智能计算的产生与发展 1992年贝慈德克在 ApproximateReasoning 学报上首次提出了智能计算的概念 1994年6月底到7月初 IEEE在美国佛罗里达州的奥兰多市召开了首届国际智能计算大会简称WCCI 94 会议第一次将神经网络演化计算和模糊系统这三个领域合并在一起形成了智能计算这个统一的学科范畴在此之后 WCCI大会就成了IEEE的一个系列性学术会议每4年举办一次 1998年5月在美国阿拉斯加州的安克雷奇市又召开了第2届智能计算国际会议WCCI 98 2002年5月在美国州夏威夷州首府火奴鲁鲁市又召开了第3届智能计算国际会议WCCI 02 此外 IEEE还出版了一些与智能计算有关的刊物目前智能计算的发展得到了国内外众多的学术组织和研究机构的高度重视并已成为智能科学技术一个重要的研究领域什么是机器学习计算机技术的发展海量数据存储和处理的能力计算机网络远程访问数据的能力例如连锁超市遍布全国各地商品上千种顾客数百万销售终端记录每笔交易的详细资料包括日期购买商品和数量销售价格和总额顾客标识码等什么是机器学习我们不能确切的知道哪些人比较倾向于购买哪些特定的商品也不知道应该向喜欢看电影的人推荐哪些电影我们已经掌握的就是历史的数据经验我们期望从数据中提取出这些问题或相似问题的答案什么是机器学习已经观测到的数据产生是随机的么其中是否隐含一些规律当你去超市买面包的时候你是不是同时也会买点牛奶夏天的时候你是不是经常买雪糕冬天则很少数据中存在一些确定的模式或规律什么是机器学习机器学习从历史数据中发现某些模式或规律描述利用发现的模式和规律进行预测机器学习的定义基于历史经验的描述和预测的理论方法和算法机器学习可行性的保证将来至少是不远的将来情况不会与收集的样本数据时有很大的不同因此未来的预测也将有望是正确的机器学习能做什么机器学习方法在大型数据库中的应用被称为数据挖掘 DataMining 大量的金属氧化物以及原料从矿山开采出来处理后产生少量的珍贵物质数据挖掘中需要处理大量的数据以构建简单有用的模型例如高精度的预测模型应用举例零售业银行金融业构建信用分析诈骗检测股票市场制造业优化控制故障检测医学领域医疗诊断电信行业通话模式的分析可用于网络优化和提高服务质量万维网上检索信息机器学习能做什么机器学习也是人工智能的组成部分授予鱼不如授予渔为了智能化处于变化环境中的系统不需具备学习能力如果系统能够学习并且适应这些变化那么系统设计者就不必预见所有情况并为它们提供解决方案了机器学习能做什么机器学习还可以解决视觉语音识别以及机器人方面的许多问题模式识别图像和音频的获得很容易机器如何做到识别让机器人识别人脸辨别声音一个图像并非是像素点的随机组合人脸是有结构对称的人脸上的器官是有组合模式的通过分析一个人的脸部图像的多个样本学习程序是可以捕获到那个人特有的模式然后进行辨认深入理解机器学习机器学习使用实例数据或过去的经验来训练计算机以优化某种性能指标例如依赖于某种参数的模型学习过程就是执行计算机程序利用训练数据或以往的经验来优化该模型的参数学习模型可以是预测的用于预测未来或者是描述的用于从数据中获取知识也可以二者兼备机器学习在构建数学模型是利用统计学理论其核心任务是从样本中推理训练过程中面对海量数据需要高效的算法表示和推理的算法也必须是高效的因此时间复杂度空间复杂度和预测精确度三者缺一不可机器学习应用举例学习关联性分类回归非监督学习增强学习学习关联性在零售业例如超市连锁店机器学习的一个应用就是购物篮分析它的任务是发现顾客所购商品之间的关联性如果顾客购买商品X时通常也购买商品Y 而一名顾客购买商品X却没有购买商品Y 则他是商品Y的潜在顾客一旦发现这类顾客可以实行打包销售策略关联规则1 条件概率P Y X 例如从以往数据中统计出P 牛奶面包 0 8关联规则2 估计P Y X D 其中D是顾客的一组属性如性别年龄婚姻状况等例如网上书店将分析的结果概率比较大的书Y 推荐给符合某属性的用户分类信贷是金融机构例如银行借出的一笔钱需要连本带息分期偿还对于银行来说重要的是能够提前预测贷款风险风险指的是客户不履行义务和不全额还款的可能性既要保证银行获利又要确保不会因提供超出客户财力的贷款而给客户带来不便和银行的损失在信用评分中银行要计算在给定信贷额度和客户信息情况下的风险客户信息包括可以获取的数据以及客户财力相关的数据即收入存款担保职业年龄以往经济记录等通过这些申请数据我们可以推断出一般规则表示客户属性及风险的相关性从而将客户分为低风险客户和高风险客户新的客户申请数据作为分类器的输入分类器将该客户输入指派到某一个类中得到的规则 ifincome xandsavings ythenlow riskelsehigh risk 分类思考1 在某些情况下我们可能不希望1 0 高风险低风险类型的判断而是希望计算一个风险概率值该如何用概率模型表达概率值P Y X X是顾客属性 Y是0或1 表示低风险和高风险例如给定客户属性x P Y 1 X x 0 8 表示客户高风险的可能性是80 分类模式识别 PatternRecogniition 光学字符识别 Opticalcharacterrecognition 图像字符文本识别It srainyoutside 人脸识别 facerecognition 语音识别 speechrecognition 医学诊断 medicaldiagnosis 回归 Regression 假如我们想要一个能够预测二手车价格的系统输入为会影响车价格的属性品牌车龄发动机性能里程以及其他信息输出为车的价格设x表示车的属性 y表示车的价格机器学习采用函数拟合来学习x的函数y 1 y w1x w0线性回归 2 y w2x2 w1x w0非线性回归回归 Regression 思考2 多属性如何回归思考3 回归和分类的共同点是什么监督学习 supervisedlearning 回归和分类均为监督学习问题即输入x和输入y都是给定的任务是学习从输出到输入的映射 y g x 其中是模型参数回归y取值是连续的数值而分类是离散的非监督学习监督学习中输出的正确值是由指导者提供的而非监督学习中却没有这样的指导者只有输入数据非监督学习的目标是发现输入数据中的规律输入空间存在着某种结构似的特定的模式比其他模式更常出现我们希望知道的是哪些经常发生那些不经常发生在统计学中这被称为密度估计 densityestimation 聚类 Clustering 聚类是密度估计的一种方法其目标是发现输入数据的簇或者分组公司的客户数据了解客户的分布分组指导公司的决策生物信息学 Bioinformatics 的应用生物方面基因 DNA是碱基ACGT的序列 RNA有DNA转录而来蛋白质由RNA转录而来 DNA是碱基序列蛋白质是氨基酸序列信息学方面比对 alignment 结构域 motif 蛋白质中反复出现的氨基酸序列其序列结构表征结构和功能如单双眼皮遗传病等氨基酸是字母蛋白质是句子那么motif就是单词增强学习 Reinforcementlearning 在某些应用中系统的输出是动作的序列在这种情况下单个动作并不重要重要的是策略即到达目标的正确动作序列机器学习程序应当能够评估策略的好坏程度从以往好的动作序列中学习以便能产生策略这种学习方法称为增强学习方法人机对弈方面例如棋牌类游戏国际象棋围棋等每一步的规则只有少量几条如何设计步骤的序列才是关键机器人导航方面例如机器人足球总结机器学习方法的种类监督学习非监督学习增强学习相关资源期刊 MachineLearningJournalofMachineLearningResearchNeuralComputationNeuralNetworksIEEETransactionsonN

人人文库> 全部分类> 应用文书 > 项目管理

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

机器学习导论第1章.ppt

文档简介

温馨提示

最新文档

评论

机器学习导论第1章.ppt

文档简介

温馨提示

最新文档

评论

相关文档