




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章机器学习基础算法建模机器学习分类算法回归算法集成学习算法聚类算法关联规则算法智能推荐算法机器学习人工智能包含了多个分支,如专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理等。机器学习是人工智能的一个重要组成部分,也是人工智能的基础技术,为人工智能提供解决问题的手段,是实现人工智能的一个重要途径。机器学习的相关名词解释机器学习实际上就是一种让计算机具有像人一样学习能力的技术,是从堆积如山的数据(也可称为大数据)中寻找出有用知识的数据分析技术。同时,在机器学习中存在着大量的相关名词。机器学习的相关名词解释——机器学习的类别机器学习根据处理数据的不同,可以分为有监督学习、无监督学习、半监督学习和强化学习。几乎所有类型的机器学习都有以下两个步骤。学习步骤通过归纳分析训练样本集来建立分类模型得到分类规则。预测步骤先用已知的测试样本集评估分类规则的准确率,若准确率是可以接受的,则使用该模型对未知类标签的待测样本集进行预测。机器学习的相关名词解释——机器学习的类别机器学习中的关键技术技术类别关键技术有监督学习回归:线性回归、KNN回归、Lasso回归等分类:逻辑回归、KNN、朴素贝叶斯、SVM、决策树、多层感知机等无监督学习异常值检测、K-means、DBSCAN、层次聚类等半监督学习半监督分类、半监督回归、半监督聚类和半监督降维等关联规则Apriori、FP-growth等集成学习Boosting、Bagging等深度学习全连接神经网络、卷积神经网络、循环神经网络、生成式对抗网络等智能推荐基于用户的协同过滤算法、基于物品的协同过滤算法等机器学习的相关名词解释——机器学习的类别有监督学习有监督学习的学习步骤是指计算机在已有数据标签信息的情况下,根据所给的知识和信息,学习出一个规则或模型的过程。预测步骤是根据学习到的规则或模型,对没有标签的知识和信息打上正确的标签的过程。机器学习的相关名词解释——机器学习的类别有监督学习的过程类似一位小朋友,他的父母告诉他什么是苹果,苹果有什么特征,然后这位小朋友通过听取父母的指导,总结出了识别苹果的规则,而后再拿一个水果,小朋友就能够判断拿出的水果是不是苹果。有监督学习的典型任务预测数值型标签的回归预测分类型标签的分类预测标签顺序的排序……机器学习的相关名词解释——机器学习的类别无监督学习无监督学习的学习步骤是指计算机在无标签信息的情况下,直接根据所给的知识和信息,学习出一个规则或者模型的过程。预测步骤是根据学习到的规则或模型,对没有标签的知识和信息打上正确的标签的过程。机器学习的相关名词解释——机器学习的类别无监督学习过程类似一位小朋友,他的父母将许多苹果、梨、香蕉放在一起,小朋友自己将这些水果进行归类,总结出了不同类别间的区别,而后再拿一个苹果、梨或香蕉,小朋友就能够判断出拿出的水果属于哪一个类别。无监督学习的典型任务聚类异常值检测……机器学习的相关名词解释——机器学习的类别无监督学习和有监督学习的区别最大的区别在于学习步骤的信息中是否有标签信息。有标签的则是有监督学习。无标签的则是无监督学习。机器学习的相关名词解释——机器学习的类别半监督学习半监督学习介于有监督学习和无监督学习之间,其学习步骤所使用的数据一部分是有标签的,另一部分无标签,而且无标签数据的数量远远大于有标签数据的数量,综合利用有标签的和无标签的数据,学习出一个规则或者模型。与有监督学习相比,半监督学习的学习成本较低,且能达到较高的准确率。机器学习的相关名词解释——机器学习的类别半监督学习的目的有效地利用大量无标签的数据,使这些数据发挥更多的价值,因为数据本身就蕴藏着大量有价值的信息,标签只是帮助提取信息的手段之一,如果数据无标签,那么也可以通过其他方式从数据中获取有价值的信息。半监督学习的典型任务半监督分类半监督回归半监督聚类半监督降维机器学习的相关名词解释——机器学习的类别强化学习强化学习的学习步骤是指计算机在无标签信息的情况下,从一开始进行完全随机的操作,通过不断的尝试,在错误中学习,最后找到规律,学习出一个规则或者模型的过程。预测步骤是根据学习到的规则或模型,对没有标签的知识和信息打上正确的标签的过程。机器学习的相关名词解释——机器学习的类别强化学习过程类似一位小朋友,他的父母将许多苹果、梨、香蕉放在一起,小朋友自己将这些水果进行归类,若归类正确,则他的父母奖励一颗糖,若归类错误,则他的父母拿走一颗糖,久而久之,他就会总结出不同类别间的区别,而后在拿一个苹果、梨或香蕉时,小朋友就能够判断出拿出的水果属于哪一个类别。强化学习的典型任务分类回归聚类降维……机器学习的相关名词解释——其他名词本章中涉及的机器学习名词除了监督学习、无监督学习、半监督学习和强化学习等常用名词之外,还有特征与标签、训练与预测、特征工程、性能、样本不平衡、过拟合、损失函数和正则化等。机器学习的相关名词解释——其他名词特征与标签在机器学习中,特征是指在进行预测时适用的输入变量,标签是指样本的“答案”或“结果”部分。一个样本中包含一个或多个特征,此外还有可能包含一个标签。如在垃圾邮件检测数据集中,特征可能包括主题行、发件人和电子邮件。在垃圾邮件检测数据集中,标签则可能是“垃圾邮件”或“非垃圾邮件”。机器学习的相关名词解释——其他名词训练与预测训练是使受训方获得一项行为方式或技能的过程。在机器学习中,训练是指算法通过迭代等方式,给出当前任务最优模型的过程。预测则是指在训练后的最优模型接收特征,输出结果的过程。机器学习的相关名词解释——其他名词特征工程在机器学习中,特征工程是数据处理的一项重要任务。特征工程是一个利用原始数据提取特征的过程,其作用是使这些特征能表征数据的本质特点,从而提高基于这些特征所建立模型的性能。特征提取效果越好,意味着构建的模型性能越出色。特征工程主要包括特征构建(FeatureConstruction)、特征选择(FeatureSelection)、特征提取(FeatureExtraction)。机器学习的相关名词解释——其他名词性能性能通常用于衡量某种产品的功能优劣,包括效率、质量等方面。在机器学习中,性能旨在说明训练后得出的模型在预测时的表现,不同的类别的算法得出的模型具有不同的性能评估方式。机器学习的相关名词解释——其他名词样本不平衡样本不平衡是机器学习中很常见的一种现象,它是指数据集中各类别的标签出现的频率具有很大的差距,这种情况将会影响模型的预测效果。样本不平衡现象可通过考虑类别权重或平衡采样的等方式进行解决。机器学习的相关名词解释——其他名词过拟合过拟合是很多机器学习算法的一种通病,它是指在模型训练迭代次数增加或不断优化,且训练精度或损失值继续改善的前提下,出现的测试精度或损失值不降反升的情况。目前,解决过拟合的方法有获取额外数据进行交叉验证、重新清洗数据和加入正则化项等。机器学习的相关名词解释——其他名词损失函数损失函数是关于模型计算结果与样本实际结果的正负实数函数,其作用是解释模型在每个样本实例上的误差。当损失函数的值越小时,代表着预测值和实际值越相近,即模型的拟合效果越好。损失函数主要有0-1损失函数、平方损失函数、绝对损失函数和对数损失函数等。机器学习的相关名词解释——其他名词正则化在机器学习中,很多被显式地用于减少测试误差的策略,统称为正则化,其作用是减少泛化误差。正则化常被用于处理过拟合问题。目前,正则化函数有很多种选择,不同的选择对权重向量的约束不同,取得的效果也不同,常用的有L0范数、L1范数和L2范数3种。机器学习的应用领域机器学习是人工智能的核心,也是使计算机具有智能的根本途径,已广泛应用于数据分析、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音与手写识别、战略游戏和机器人等领域。自然语言处理常用方法:词云机器学习的应用领域生物特征识别图片来源:/a/141217517_733611机器学习的应用领域常见的十个机器学习实际应用机器学习应用简介垃圾邮件检测根据邮箱中的邮件内容,识别哪些邮件属于垃圾邮件,哪些属于正常的邮件,帮助使用者归类垃圾邮件和非垃圾邮件,目前各大邮箱都具备该功能识别恶意软件根据软件的行为特征,识别哪些软件属于恶意软件,帮助使用者区分每天大量产生的恶意软件,避免计算机遭受攻击,如卡巴斯基实验室的恶意软件检测邮编识别根据信件上的手写邮编,识别出每一个手写字符所代表的数字,帮助程序阅读邮编并依据邮编中地理位置分发信件,已在各国邮局中广泛应用语音识别从用户的一段话中识别出用户想要表达的信息,帮助程序理解用户需求,改善人机互动,如手机的语音输入功能人脸识别从一堆包含面部信息的相片中识别出特定对象,帮助用户整理相片,或识别当前对象的身份,如高铁的人脸识别验票闸机机器学习的应用领域机器学习应用简介产品推荐依据用户的商品浏览历史、收藏和购买清单,识别出哪类商品是用户感兴趣和真正需要的,帮助商家依据用户需求做出精准推荐,如各大电商平台的推荐系统医学分析依据病人的资料及相关的病例资料库,预测病人可能的患病种类,为专业医疗人士提供支持股票分析根据一只股票现有的和以往的价格波动,预测该股票未来可能的价格走势,为金融分析提供支持天气预报
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司条线活动方案
- 公司纪念品策划方案
- 公司精神文明活动方案
- 公司节日年度策划方案
- 公司爱心卫生间活动方案
- 公司节约能源活动方案
- 公司果园维护活动方案
- 公司求婚惊喜策划方案
- 公司核心竞争力活动方案
- 公司芽庄旅游策划方案
- 2025年云南南方地勘工程有限公司招聘笔试参考题库含答案解析
- 杭州市富阳区卫健系统事业单位招聘笔试真题2024
- 2023-2024学年贵州省黔南州都匀市统编版三年级下册期末考试语文试卷
- 2025钢管租赁合同样本
- 2024年福建省厦门市思明区初中毕业班适应性练习(二)地理试卷
- 医学多学科诊疗制度
- 游泳救生员劳务合同协议
- 国家开放大学2025春《公共部门人力资源管理》形考任务1-4参考答案
- 本人饮酒免责协议书
- 2025年临床执业医师考试重要技能试题及答案
- 历史七年级历史下册期末测试卷(1~21课) 2024-2025学年七年级历史下(统编版2024)
评论
0/150
提交评论