版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能通识:新技术与创新实践回归、分类与聚类算法简介PART01监督学习与非监督学习PART02目录CONTENTS回归、分类与聚类算法简介01回归、分类与聚类算法简介01
1.线性回归:最简单的起点线性回归是最简单也最常用的预测方法,就像我们在数学课上学过的画直线一样。生活中的例子:
•根据学习时间预测考试成绩。
•根据房屋面积预测房价。
•根据气温预测用电量。工作原理:想象你要预测房价。你发现房子越大,价格越高,这就是一种线性关系。线性回归就是在数据点中画一条最合适的直线,然后用这条直线来预测新房子的价格,如图3-2所示。一、回归算法:预测连续值01回归、分类与聚类算法简介图3-2线性回归示意图回归、分类与聚类算法简介01就像图中显示的,我们通过已知的房屋面积和价格数据点,画出一条最佳拟合直线,然后就能预测任何面积房屋的大概价格。2.其他回归方法简介•多项式回归:当关系不是直线而是曲线时使用,比如温度和冰淇淋销量的关系。•决策树回归:像玩“20个问题”游戏一样,通过一系列判断来预测结果。二、分类算法:预测类别分类算法像一个“分拣员”,把东西分到不同的类别里,比如邮件是垃圾邮件还是正常邮件。01回归、分类与聚类算法简介
1.决策树分类:像医生一样思考决策树就像医生诊断疾病的过程,通过问一系列问题来得出结论。模型结构可以直观地显示为一棵树。生活例子:决定是否去游泳
•第一个问题:今天天气好吗?如果天气不好→不去游泳如果天气好→继续问下一个问题
•第二个问题:水温合适吗?如果水温太冷→不去游泳如果水温合适→去游泳如图3-3所示通过决策树的可视化呈现,展示其如何通过一系列问题将数据分成不同类别的树状结构过程。01回归、分类与聚类算法简介图3-3决策树分类示意图例如,预测信用风险时,决策树可首先检查收入,然后是工作年限,最后是历史信用记录,最终给出“高风险”“中风险”或“低风险”的判断。01回归、分类与聚类算法简介
2.其他分类方法
•K近邻算法:根据“物以类聚”的原理,看看周围邻居是什么类别来判断。
•朴素贝叶斯:像侦探一样,根据各种线索的概率来推断结果。
•逻辑回归:虽然名字叫回归,但实际是计算属于某类别的概率。实际应用:
•邮箱自动识别垃圾邮件。
•银行判断信用卡交易是否异常。
•医院根据症状初步诊断疾病类型。01回归、分类与聚类算法简介三、聚类算法:发现隐藏的群体聚类算法像一个“群体发现者”,在没有标准答案的情况下,自动发现数据中的自然分组。
1.K-均值聚类:找到数据的“小圈子”
K-均值聚类就像在学校里观察学生自然形成的朋友圈,算法会自动找到相似特征的数据聚集在一起。工作步骤(用交友举例):
•先猜测会有几个朋友圈(比如3个)
•随机选择3个“圈子中心”
•每个学生加入离自己最近的圈子
•重新计算每个圈子的中心位置
•重复3~4步,直到圈子稳定不变
K-均值简单高效,易于实现,但需要预先指定K值,且受初始中心点的选择影响。下图展示聚类算法如何将相似数据点分组,形成不同的簇。01回归、分类与聚类算法简介图3-4K-均值聚类示意图01回归、分类与聚类算法简介
2.聚类的实际应用
•市场营销:根据购买行为将顾客分成不同群体,制定针对性营销策略
•社交网络:发现有共同兴趣的用户群体
•城市规划:根据居民特征划分社区类型01回归、分类与聚类算法简介四、如何选择合适的算法选择算法就像选择工具,不同的问题需要不同的工具及方法,如图3-5所示。选择合适的机器学习算法需要考虑多个因素,下图展示了机器学习算法选择流程图,帮助同学们理解如何根据问题类型选择合适的机器学习算法。01回归、分类与聚类算法简介01你想要什么样的答案?02你的数据是什么样的?03实际考虑因素:04生活中的算法选择例子:监督学习与非监督学习02监督学习与非监督学习02项目前景一、监督学习:有标签的学习什么是监督学习?01监督学习的学习过程02模型训练与评估03过度拟合问题04监督学习的应用0502二、非监督学习:发现数据中的秘密04非监督学习的应用03评估难题01什么是非监督学习?02非监督学习的主要任务监督学习与非监督学习02监督学习与非监督学习三、监督学习与非监督学习的比较通过上述对于监督学习以及非监督学习概念的了解,我们将两种学习的特点进行比较,见表3-1。02监督学习与非监督学习如图3-6所示,直观对比了两种主要学习范式的区别,展示了有标签数据与无标签数据的处理方式。图3-6监督学习与非监督学习比较02监督学习与非监督学习四、其他学习类型简介除了监督学习和非监督学习,还有其他值得了解的学习类型:半监督学习:结合少量有标签数据和大量无标签数据。这种方法在标注数据昂贵或困难的情况下特别有用,如医学图像分析。强化学习:通过尝试和错误来学习最佳行动策略。计算机(或“智能体”)在环境中执行动作,根据获得的奖励或惩罚调整策略。应用于游戏、机器人控制等领域。本章介绍了机器学习的基本概念和主要方法。我们学习了监督学习和非监督学习的区别,以及回归、分类和聚类三类基本算法。机器学习通过从数据中学习模式和规律,使计算机能够执行复杂任务而无须明确编程。02监督学习与非监督学习随着数据量的增长和计算能力的提升,机器学习正在各行各业发挥越来越重要的作用,从智能手机应用到医疗诊断,从金融分析到自动驾驶。理解机器学习的基本原理,不仅有助于了解现代人工智能系统的工作机制,也为进一步学习和应用这一激动人心的技术奠定了基础。感谢欣赏THANKSYOU人工智能通识:新技术与创新实践神经网络基本原理与结构PART01图像识别的发展与思考PART02目录CONTENTS神经网络基本原理与结构01神经网络基本原理与结构01一、从生物神经元到人工神经网络1.人工神经元模型2.激活函数的作用01神经网络基本原理与结构二、神经网络的层次结构
1.多层神经网络的结构与功能神经网络通常由多层神经元组成,形成层级结构。最简单的神经网络包含三种类型的层:输入层:负责接收原始数据,如图像的像素值、文本的单词、声音的波形等。这一层就像人类的感官,接收外界信息。隐藏层:位于输入层和输出层之间,负责提取和转换特征。隐藏层越多,网络越“深”,能够学习的特征也越复杂。这些层就像人类大脑中处理和理解信息的区域。01神经网络基本原理与结构输出层:产生最终的预测结果,如图像中的物体类别、文本的情感倾向、语音的文字转录等。这一层就像人类做出最终决策的过程。如图4-2所示使用简单的图示展示输入层、隐藏层和输出层。想一想拼图游戏:输入层接收拼图碎片,隐藏层尝试不同的组合方式,输出层呈现完整的拼图图像。神经网络也是逐层构建对数据的理解,从简单到复杂。01神经网络基本原理与结构
2.深度神经网络的特点深度神经网络包含多个隐藏层,能够学习更复杂的模式。为什么深度如此重要?想象学习画画的过程:初学者先学习基本线条和形状(浅层特征),然后学习如何组合这些元素形成物体轮廓(中层特征),最后掌握光影、纹理和整体构图(高层特征)。深度网络也是如此,通过多层次的学习,逐步掌握数据中的各级特征。比如在识别猫的图像时,浅层可能识别边缘和简单纹理,中间层识别眼睛、耳朵等部位,深层则综合判断“这是一只猫”。这种层次化的学习方式是深度学习强大的关键。01神经网络基本原理与结构图4-2多层神经网络结构01神经网络基本原理与结构三、神经网络的学习过程01神经网络如何“学习”02梯度下降:寻找最优解的旅程03训练中的常见挑战01神经网络基本原理与结构四、常见神经网络架构随着研究的深入,科学家们设计了多种专用的神经网络架构来解决特定类型的问题:卷积神经网络(CNN)适合处理图像数据,它模仿人类视觉系统的工作方式,通过滑动的“视野窗口”(卷积核)扫描图像,提取局部特征并逐步组合。CNN广泛应用于人脸识别、物体检测和医学图像分析等领域。循环神经网络(RNN)擅长处理序列数据,如文本、语音和时间序列。它具有“记忆”功能,能够记住之前的信息并影响后续判断,就像你阅读文章时会根据前文理解当前句子一样。RNN及其变体(如LSTM、GRU)广泛应用于语音识别、机器翻译和文本生成等任务。01神经网络基本原理与结构生成对抗网络(GAN)包含两个相互竞争的网络:生成器(尝试创造逼真的数据)和判别器(尝试区分真实数据和生成数据)。通过这种“对抗”过程,生成器能够创造出越来越逼真的内容,如人脸图像、艺术作品等。变换器(Transformer)是近年来自然语言处理的革命性架构,它通过“注意力机制”同时处理序列中的所有元素,克服了RNN的长序列处理困难。ChatGPT等大语言模型正是基于Transformer架构构建的。图像识别的发展与思考02图像识别的发展与思考02项目前景一、图像识别图像识别的基本原理01图像识别的发展历程0202二、日常生活中的图像识别应用图像识别的发展与思考1智能手机中的人脸识别2医学图像辅助诊断3自动驾驶的“眼睛”02三、未来发展与思考
1.图像生成与创意应用近年来,深度学习不仅能“看懂”图像,还能“创造”图像。基于扩散模型的文本到图像生成技术(如DALL-E、StableDiffusion)允许用户通过文字描述生成各种逼真的图像,从风景到人物,从写实到抽象,展现了惊人的创造力。这些技术正在改变设计、艺术创作和媒体制作的方式。设计师可以快速生成概念草图;电影制作人可以创建概念艺术和场景可视化;普通用户也能将自己的创意想法转化为视觉作品。图像识别的发展与思考02图像识别的发展与思考
2.媒体鉴别能力与信息素养随着AI生成内容越来越逼真,区分真实与人工生成的内容变得日益困难。这带来了新的挑战:如何防止虚假信息传播?如何保护知识产权?如何培养公众的媒体鉴别能力?作为数字时代的公民,我们需要培养批判性思维和媒体素养,学会辨别真实与虚构内容。同时,技术和政策层面也需要发展相应的工具和规范,如数字水印、内容验证和道德准则,确保
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论