版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能通识:新技术与创新实践主编:唐志航,罗雅博回归、分类与聚类算法简介PART01监督学习与非监督学习PART02目录CONTENTS回归、分类与聚类算法简介01回归、分类与聚类算法简介01
1.线性回归:最简单的起点线性回归是最简单也最常用的预测方法,就像我们在数学课上学过的画直线一样。生活中的例子:
•根据学习时间预测考试成绩。
•根据房屋面积预测房价。
•根据气温预测用电量。工作原理:想象你要预测房价。你发现房子越大,价格越高,这就是一种线性关系。线性回归就是在数据点中画一条最合适的直线,然后用这条直线来预测新房子的价格,如图3-2所示。一、回归算法:预测连续值01回归、分类与聚类算法简介图3-2线性回归示意图回归、分类与聚类算法简介01就像图中显示的,我们通过已知的房屋面积和价格数据点,画出一条最佳拟合直线,然后就能预测任何面积房屋的大概价格。2.其他回归方法简介•多项式回归:当关系不是直线而是曲线时使用,比如温度和冰淇淋销量的关系。•决策树回归:像玩“20个问题”游戏一样,通过一系列判断来预测结果。二、分类算法:预测类别分类算法像一个“分拣员”,把东西分到不同的类别里,比如邮件是垃圾邮件还是正常邮件。01回归、分类与聚类算法简介
1.决策树分类:像医生一样思考决策树就像医生诊断疾病的过程,通过问一系列问题来得出结论。模型结构可以直观地显示为一棵树。生活例子:决定是否去游泳
•第一个问题:今天天气好吗?如果天气不好→不去游泳如果天气好→继续问下一个问题
•第二个问题:水温合适吗?如果水温太冷→不去游泳如果水温合适→去游泳如图3-3所示通过决策树的可视化呈现,展示其如何通过一系列问题将数据分成不同类别的树状结构过程。01回归、分类与聚类算法简介图3-3决策树分类示意图例如,预测信用风险时,决策树可首先检查收入,然后是工作年限,最后是历史信用记录,最终给出“高风险”“中风险”或“低风险”的判断。01回归、分类与聚类算法简介
2.其他分类方法
•K近邻算法:根据“物以类聚”的原理,看看周围邻居是什么类别来判断。
•朴素贝叶斯:像侦探一样,根据各种线索的概率来推断结果。
•逻辑回归:虽然名字叫回归,但实际是计算属于某类别的概率。实际应用:
•邮箱自动识别垃圾邮件。
•银行判断信用卡交易是否异常。
•医院根据症状初步诊断疾病类型。01回归、分类与聚类算法简介三、聚类算法:发现隐藏的群体聚类算法像一个“群体发现者”,在没有标准答案的情况下,自动发现数据中的自然分组。
1.K-均值聚类:找到数据的“小圈子”
K-均值聚类就像在学校里观察学生自然形成的朋友圈,算法会自动找到相似特征的数据聚集在一起。工作步骤(用交友举例):
•先猜测会有几个朋友圈(比如3个)
•随机选择3个“圈子中心”
•每个学生加入离自己最近的圈子
•重新计算每个圈子的中心位置
•重复3~4步,直到圈子稳定不变
K-均值简单高效,易于实现,但需要预先指定K值,且受初始中心点的选择影响。下图展示聚类算法如何将相似数据点分组,形成不同的簇。01回归、分类与聚类算法简介图3-4K-均值聚类示意图01回归、分类与聚类算法简介
2.聚类的实际应用
•市场营销:根据购买行为将顾客分成不同群体,制定针对性营销策略
•社交网络:发现有共同兴趣的用户群体
•城市规划:根据居民特征划分社区类型01回归、分类与聚类算法简介四、如何选择合适的算法选择算法就像选择工具,不同的问题需要不同的工具及方法,如图3-5所示。选择合适的机器学习算法需要考虑多个因素,下图展示了机器学习算法选择流程图,帮助同学们理解如何根据问题类型选择合适的机器学习算法。01回归、分类与聚类算法简介01你想要什么样的答案?02你的数据是什么样的?03实际考虑因素:04生活中的算法选择例子:监督学习与非监督学习02监督学习与非监督学习02项目前景一、监督学习:有标签的学习什么是监督学习?01监督学习的学习过程02模型训练与评估03过度拟合问题04监督学习的应用0502二、非监督学习:发现数据中的秘密04非监督学习的应用03评估难题01什么是非监督学习?02非监督学习的主要任务监督学习与非监督学习02监督学习与非监督学习三、监督学习与非监督学习的比较通过上述对于监督学习以及非监督学习概念的了解,我们将两种学习的特点进行比较,见表3-1。02监督学习与非监督学习如图3-6所示,直观对比了两种主要学习范式的区别,展示了有标签数据与无标签数据的处理方式。图3-6监督学习与非监督学习比较02监督学习与非监督学习四、其他学习类型简介除了监督学习和非监督学习,还有其他值得了解的学习类型:半监督学习:结合少量有标签数据和大量无标签数据。这种方法在标注数据昂贵或困难的情况下特别有用,如医学图像分析。强化学习:通过尝试和错误来学习最佳行动策略。计算机(或“智能体”)在环境中执行动作,根据获得的奖励或惩罚调整策略。应用于游戏、机器人控制等领域。本章介绍了机器学习的基本概念和主要方法。我们学习了监督学习和非监督学习的区别,以及回归、分类和聚类三类基本算法。机器学习通过从数据中学习模式和规律,使计算机能够执行复杂任务而无须明确编程。02监督学习与非监督学习随着数据量的增长和计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 黑龙江省黑河市通北一中2025-2026学年物理高二第一学期期末考试试题含解析
- 河南省豫南市级示范性高中2026届化学高二第一学期期末考试模拟试题含解析
- 健康危险因素全程管理
- 成都职业技术学院《光电子学》2024-2025学年第一学期期末试卷
- 皮肤科湿疹急性期护理措施
- 麻醉科地塞米松用药指南
- 神算策略运营工作规划
- 儿科肺炎合并支气管炎康复训练方案
- 急诊科创伤性休克抢救规范培训手册
- 心包积液医学知识培训
- 20以内的加法口算练习题4000题 205
- 2024-2030年中国口腔显微镜行业应用动态与投资前景预测报告
- (课件)医疗设备应用-植入式心电监测器Reveal LINQ讲课
- 2025高考语文步步高大一轮复习讲义教材文言文点线面答案精析
- (新教材)统编人教版高中化学必修一全册教案
- DL∕T 333.2-2013 火电厂凝结水精处理系统技术要求 第2部分:空冷机组
- 人教版(PEP)小学英语-(三四五六年级)-单词表(附注音标)
- JTS-201-2011水运工程施工通则
- MOOC 大学英语听说译-河南理工大学 中国大学慕课答案
- 《水电工程岩爆风险评估技术规范》(NB-T 10143-2019)
- 胃瘘后期护理
评论
0/150
提交评论