版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
工业互联网
IndustrialInternet01第五章工业大数据——上节回顾工业互联网架构回顾设备音频;设备辐射;……订单信息;客户需求变更;……机器触感;机器温度;……信息感知产品位置;机器人位置;人的位置;……视觉传感器(摄像头)温度传感器红外传感器压力传感器烟雾传感器……数据传输蓝牙通信蜂窝通信有线通信以太网卫星通信……数据处理机器学习数据挖掘数据融合人工智能大数据……决策应用服务安全管理……平台层2第五章工业人工智能——课时安排本章课时任务时间270分钟(6课时)主要学习内容人工智能背景(1课时);人工智能模型(3课时);工业大数据案例分析(2课时)。本课时主要目标了解工业人工智能的背景与发展历程;了解工业人工智能的基本流程。3第五章工业人工智能——背景什么是人工智能?第六章工业人工智能46.1监督机器学习5第六章工业人工智能——监督机器学习监督机器学习的定义
监督机器学习是根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。在监督学习中训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。简单理解:可以把监督学习理解为我们教机器如何做事情。6第六章工业人工智能——监督机器学习监督机器学习的类别监督学习任务主要包括分类和回归两种类型,在监督学习中,数据集中的样本被称为“训练样本”,并且每个样本都有一个输入特征和相应的标签(分类任务)或目标值(回归任务)7第六章工业人工智能——监督机器学习监督机器学习的类别分类(Classification):在分类任务中,目标是将输入数据分到预定义的类别中。每个类别都有一个唯一的标签。算法在训练阶段通过学习数据的特征和标签之间的关系来构建一个模型。然后,在测试阶段,模型用于预测未见过的数据的类别标签。
回归(Regression):在回归任务中,目标是预测连续数值的输出。与分类不同,输出标签在回归任务中是连续的。算法在训练阶段通过学习输入特征和相应的连续输出之间的关系来构建模型。在测试阶段,模型用于预测未见过的数据的输出值。8第六章工业人工智能——监督机器学习常见的监督机器学习算法
监督学习算法种类众多,有着极其广泛的应用,下面是一些常见的监督学习算法:支持向量机(SupportVectorMachine,SVM):SVM是一种用于二分类和多分类任务的强大算法。它通过找到一个最优的超平面来将不同类别的数据分隔开。SVM在高维空间中表现良好,并且可以应用于线性和非线性分类问题。决策树(DecisionTrees):决策树是一种基于树结构的分类和回归算法。它通过在特征上进行递归的二分决策来进行分类或预测。决策树易于理解和解释,并且对于数据的处理具有良好的适应性。逻辑回归(LogisticRegression):逻辑回归是一种广泛应用于二分类问题的线性模型。尽管名字中带有"回归",但它主要用于分类任务。逻辑回归输出预测的概率,并使用逻辑函数将连续输出映射到[0,1]的范围内。K近邻算法(K-NearestNeighbors,KNN):KNN是一种基于实例的学习方法。它根据距离度量来对新样本进行分类或回归预测。KNN使用最接近的K个训练样本的标签来决定新样本的类别。9第六章工业人工智能——监督机器学习支持向量机
支持向量机(SupportVectorMachine,简称SVM)是一种机器学习算法,广泛应用于分类和回归问题。SVM的主要思想是将数据映射到一个高维空间,通过在该空间中找到一个最优的超平面来实现分类。最优的超平面是指能够将不同类别的数据点分开且使得间隔最大化的超平面。将数据点分为不同类别的超平面称为决策边界,位于离决策边界最近的数据点称为支持向量。10第六章工业人工智能——监督机器学习支持向量机常用公式
当讨论支持向量机时,我们会遇到核函数,以下是几种常见的核函数11第六章工业人工智能——监督机器学习决策树
决策树是一种用于分类和回归的监督学习算法,在机器学习领域得到了广泛应用。它通过对数据集进行分析和划分,构建一个树状结构,从根节点到叶节点表示不同的决策规则。12第六章工业人工智能——监督机器学习决策树的特点
可解释性高:决策树的生成过程和最终的决策规则都很直观和可解释。根据决策树的树状结构,我们可以清楚地了解不同特征对决策的影响和重要程度。数据预处理简单:决策树在处理数据之前不需要进行特定的数据预处理,不需要对数据进行标准化或归一化等操作。决策树对缺失值和异常值也相对不敏感。能够处理分类和回归问题:决策树既可以用于分类问题,也可以用于回归问题。对于分类问题,叶节点表示不同的类别。对于回归问题,叶节点表示数值型的预测值。能够处理特征的非线性关系:决策树可以自由地处理特征之间的非线性关系,不需要事先进行特征转换或映射。13第六章工业人工智能——监督机器学习决策树常用公式
信息熵:信息增益是用来选择最佳分裂属性的指标信息增益:熵是衡量数据不确定性的一种度量基尼指数:用于衡量一个样本集合的纯度或不确定性
均方误差:均方误差用来衡量预测值与实际值之间的差异14第六章工业人工智能——监督机器学习逻辑回归
逻辑回归是一种广泛应用于二分类问题的线性模型。尽管名字中带有"回归",但它主要用于分类任务。逻辑回归输出预测的概率,并使用逻辑函数将连续输出映射到[0,1]的范围内。15第六章工业人工智能——监督机器学习逻辑回归常用公式
线性组合:逻辑回归通过特征和权重的线性组合来计算一个中间结果Sigmoid函数:将线性组合的结果通过Sigmoid函数映射到(0,1)区间内,得到事件发生的概率损失函数(CostFunction):逻辑回归使用对数损失(LogLoss)或交叉熵损失来衡量模型的预测值与实际值之间的差异:16第六章工业人工智能——监督机器学习K近邻算法常用公式
欧氏距离:曼哈顿距离:闵可夫斯基距离:17第六章工业人工智能——监督机器学习K近邻算法
K近邻(K-NearestNeighbors,KNN)算法是一种基于距离的分类算法,其基本思想是:给定一个训练数据集,对于一个新输入的点,在训练集中找到与该点距离最近(通常是欧氏距离)的K个点,然后根据这K个点的类别,通过投票的方式来预测新点的类别。18第六章工业人工智能——监督机器学习监督学习的应用场景
图像识别是监督学习在工业质检中最常见和重要的应用之一。通过训练模型,可以将正常产品和缺陷产品进行区分,并及时发现缺陷例如,在电子产品制造过程中,可以通过图像识别技术对电路板上焊点是否正常进行判断,从而提高产品制造过程中对焊点连接是否牢固等问题进行自动化判断。19第六章工业人工智能——监督机器学习监督学习的应用场景
除了图像识别之外,监督学习还可以应用于基于传感器数据的异常检测。传感器可以实时采集产品的各项数据,例如温度、压力、湿度等。通过对这些数据进行监督学习,可以建立模型来检测异常情况,例如温度过高、压力异常等。这种方法可以帮助企业及时发现产品制造过程中的问题,并采取相应措施进行调整和改进。20第六章工业人工智能——监督机器学习监督学习的应用场景
声音识别是监督学习在工业质检中的另一个重要应用场景。通过对声音进行监督学习,可以判断产品在工作过程中是否存在异常情况。例如,在汽车制造过程中,通过对发动机声音进行监测和识别,可以及时发现发动机是否存在故障或异常情况,并采取相应措施进行修复第六章工业人工智能216.2无监督机器学习22第六章工业人工智能——无监督机器学习无监督机器学习的定义
我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。在无监督学习中数据只有特征无标签,是一种机器学习的训练方式,它本质上是一个统计手段,在没有标签的数据里可以发现潜在的一些结构的一种训练方式。比起监督学习,无监督学习更像是自学,让机器学会自己做事情。23第六章工业人工智能——无监督机器学习无监督机器学习的分类
无监督学习的特点是在训练数据中没有标签或目标值,目标是从数据中发现隐藏的结构和模式,而不是预测特定的标签或目标,主要类别包括以下几种:聚类:聚类是将数据样本分成相似的组别或簇的过程。它通过计算样本之间的相似性度量来将相似的样本聚集在一起。降维:降维是将高维数据转换为低维表示的过程,同时尽可能地保留数据的特征。关联规则挖掘:关联规则挖掘用于发现数据集中项之间的关联和频繁项集。异常检测:异常检测用于识别与大多数样本不同的罕见或异常数据点。24第六章工业人工智能——无监督机器学习常用的无监督机器学习算法
K均值聚类:K均值聚类是一种常用的聚类算法,它将数据样本分成K个簇,使得每个样本与所属簇中心的距离最小化。主成分分析:PCA是一种常用的降维算法,它通过线性变换将高维数据投影到低维空间,以保留最重要的特征。关联规则挖掘:关联规则挖掘是一种发现数据集中项之间关联性的方法,它常用于市场篮子分析、购物推荐等领域。异常检测:异常检测算法用于识别与大多数样本不同的罕见或异常数据点。常见的方法包括基于统计的方法、基于聚类的方法和基于生成模型的方法等。25第六章工业人工智能——无监督机器学习k均值聚类
K均值聚类(K-MeansClustering)是一种经典的聚类算法,用于将数据点划分成K个不同的簇。K均值聚类算法的基本思想是:通过迭代的方式,将每个数据点分配到最近的簇中心,然后更新簇中心为该簇内所有点的均值,这个过程重复进行,直到收敛(即簇中心不再显著变化)。26第六章工业人工智能——无监督机器学习k均值聚类常用公式
损失函数:欧式距离的平方公式:27第六章工业人工智能——无监督机器学习主成分分析
主成分分析(PrincipalComponentAnalysis,PCA)是一种统计方法,用于通过正交变换将一组可能相关的变量转换为一组线性不相关的变量,这些新变量称为主成分。PCA可以用于降维、数据压缩、特征抽取、数据可视化等多种场景。28第六章工业人工智能——无监督机器学习主成分分析步骤
主成分分析主要包括标准化数据、协方差矩阵计算、特征值和特征向量的计算、选择主成分、构造新特征空间、解释结果几个步骤29第六章工业人工智能——无监督机器学习主成分分析常用公式
协方差矩阵:特征值问题:求解
其中λ是特征值,v是对应的特征向量。特征值排序:特征值从大到小排序,选择前k个最大的特征值对应的特征向量作为主成分。30第六章工业人工智能——无监督机器学习关联规则挖掘
关联数据挖掘(AssociationRuleMining)是一种在大规模数据集中寻找项目之间有趣关系(如频繁模式、关联、相关性)的挖掘过程。它试图识别出数据中的有意义的关联或相关性规则。关联数据挖掘在市场篮分析(MarketBasketAnalysis)、商品推荐、生物信息学等领域有广泛的应用。31第六章工业人工智能——无监督机器学习关联规则挖掘步骤
关联规则挖掘主要包括数据预处理、找到频繁项集、生成关联规则、评估关联规则几个步骤32第六章工业人工智能——无监督机器学习异常检测
异常检测(AnomalyDetection),也称为离群点检测,是识别数据集中的异常或不寻常模式的过程。在许多领域,如金融欺诈检测、网络安全、工业系统监控、医学诊断等,异常检测都非常重要。异常检测算法的目标是识别那些不符合数据正常行为的点。33第六章工业人工智能——无监督机器学习异常检测
异常检测主要包括数据预处理、特征选择、建立基线模型、检测异常、结果评估、处理反馈几个步骤34第六章工业人工智能——无监督机器学习无监督机器学习的应用场景
异常检测:在工业系统中,无监督学习可以用于监测设备状态,通过识别正常操作模式之外的异常行为,来预测和诊断潜在的故障。这有助于实现预测性维护,减少停机时间,并提高生产效率。35第六章工业人工智能——无监督机器学习无监督机器学习的应用场景
供应链优化:无监督学习可以分析供应链数据,发现库存水平、物流和需求模式,从而优化库存管理和物流调度。36第六章工业人工智能——无监督机器学习无监督机器学习的应用场景
过程优化:无监督学习可以分析工业过程中的数据,发现过程变量之间的复杂关系,从而优化生产过程,提高产品质量和降低资源消耗。第六章工业人工智能376.3遗传算法38第六章工业人工智能——遗传算法引言
生物物种作为复杂系统,具有奇妙的自适应、自组织和自优化力,这是一种生物在进化过程中体现的智能。遗传算法:着眼于对生物群体进化过程的模拟。
1975年约翰·霍兰德提出:
应用领域:函数优化机器人路径规划图像处理与模式识别机器学习智能控制等约翰·霍兰德(1929-)39第六章工业人工智能——遗传算法遗传算法的生物学基础
达尔文的进化论-适者生存原理每一物种在发展中越来越适应环境。物种每个个体的基本特征由后代所继承,但后代又会产生一些异于父代的新变化。在环境变化时,只有那些能适应环境的个体特征方能保留下来。孟德尔的遗传学说-基因遗传原理遗传以密码方式存在细胞中,并以基因形式包含在染色体内。每个基因有特殊的位置并控制某种特殊性质;所以,每个基因产生的个体对环境具有某种适应性。基因突变和基因杂交可产生更适应于环境的后代。经过存优去劣的自然淘汰,适应性高的基因结构得以保存下来。达尔文(1809-1882)孟德尔(1822-1884)40第六章工业人工智能——遗传算法遗传学基本概念与术语
基因重组/交叉:在有性繁殖过程中,控制不同性状的染色体基因重新组合;基因突变:染色体的某些基因位的组成或数目发生改变。
群体选择种群新种群淘汰的个体淘汰交配变异生物进化过程基因重组基因突变41第六章工业人工智能——遗传算法遗传学基本概念与术语
遗传算法(GeneticAlgorithm,GA)是一类借鉴生物界的进化规律(适者生存、优胜劣汰)演化而来的随机化搜索方法。群体选择种群新种群淘汰的个体淘汰交配变异生物进化过程遗传算法模型42第六章工业人工智能——遗传算法遗传算法与生物进化
群体种群环境染色体基因适应能力交叉突变进化结束搜索空间的一组有效解选择得到的新群体适应度函数可行解的编码串一个编码单元解的适应度值交换部分编码某些编码的数值改变算法结束生物进化遗传算法43第六章工业人工智能——遗传算法遗传算法的基本思想
遗传算法的基本思想遗传算法GA把问题的解表示成“染色体”,在算法中即是以一定方式编码的串。2.在执行遗传算法之前,给出一群“染色体”,也即假设解。3.把这些假设解置于问题的“环境”中,并按适者生存的原则,从中选择出较适应环境“染色体”进行复制,再通过交叉,变异过程产生更适应环境的新一代“染色体”群。这样,一代一代地进化,最后就会收敛到最适应环境的一个“染色体”上,它就是问题的最优解。
进化计算:遗传算法、进化策略、进化规划、遗传规划44第六章工业人工智能——遗传算法遗传算法的组成
一般的遗传算法由四个部分组成:编码机制种群初始化适应度函数遗传算子(选择、交叉、变异)遗传算法模型45第六章工业人工智能——遗传算法遗传算法的组成
编码机制:用遗传算法解决问题时,首先要对待解决问题的模型结构和参数进行编码,一般用字符串表示。解空间一个解的编码即染色体46第六章工业人工智能——遗传算法遗传算法的组成
种群初始化:随机初始化1234N...解的编号解的编码解的规模个体的编号个体的编码10001100000201011110013000000010141001110100……N000101001147第六章工业人工智能——遗传算法遗传算法的组成
适应度函数:用来评估个体优、劣的标准,适应度值越大的个体越优。个体的编号个体的编码编码适应度值10001100000x1f(x1)20101111001x2f(x2)30000000101x3f(x3)41001110100x4f(x4)…………N0001010011xNf(xN)48第六章工业人工智能——遗传算法遗传算法的组成
交叉操作:选中的两个父代个体交换某些基因位形成子代个体的过程。交叉概率PC:在种群中,个体被选择出进行交叉的概率。交叉方式:单点交叉、两点交叉、多点交叉、均匀交叉等。单点交叉:随机产生一个有效的交叉位置,染色体交换位于该交叉位置后的所有基因。1212交叉位PC父代个体子代个体连续改变染色体多个基因位上的遗传信息49第六章工业人工智能——遗传算法遗传算法的组成
变异操作:编码按小概率扰动产生的变化,类似于基因的突变。变异概率Pm:控制算法中变异操作的使用频率变异方式:单点变异、均匀变异、高斯变异等。单点变异:如果对于某一基因位,产生的随机数小于Pm,则改变该基因的取值。否则该基因不发生变异,保持不变。变异位Pm父代个体子代个体随机改变染色体某些基因位上的遗传信息50第六章工业人工智能——遗传算法遗传算法的组成
环境选择:经过交叉、变异后得到一个子代种群,从子代种群和父代种群中选择出下一代种群的过程,称为环境选择。选择方法:代替换,部分替换、精英选择、轮盘赌选择、锦标赛选择等。代替换部分替换第六章工业人工智能516.4粒子群算法52第六章工业人工智能——粒子群算法算法的提出
1995年,受到鸟群活动的规律性启发,RussellEberhart和JamesKennedy建立了一个简化模型,并最终形成了粒子群优化算法(ParticleSwarmOptimization,PSO),也可称为粒子群算法。53第六章工业人工智能——粒子群算法算法的提出
粒子群算法具有收敛速度快、简单易实现的优点,目前仍然受到众多研究者的青睐,不断扩展着它的应用领域。
作为一种新兴的群体搜索算法,粒子群算法得到了长足的发展,并成功应用于很多的领域,比如函数优化、图像处理、电力系统优化、医疗诊断等。54第六章工业人工智能——粒子群算法算法的基本原理
123455第六章工业人工智能——粒子群算法算法的基本原理
567856第六章工业人工智能——粒子群算法算法介绍
假设在D维搜索空间中,有m个粒子。(1)其中第i个粒子的位置向量表示为:(2)其飞行速度向量表示为:(3)第i个粒子搜索到的最优位置为:(4)整个粒子群搜索到的最优位置为:57第六章工业人工智能——粒子群算法算法介绍
粒子速度和位置的更新
其中w为惯性权重,
d=1,2,...,D,i=1,2...,m。 c1和c2,为两个正常数称为加速因子,rand1和rand2
为均匀分布于[0,1]的随机数。58第六章工业人工智能——粒子群算法速度更新示意图
惯性方向群体最优方向粒子个体最优方向第六章工业人工智能596.5蚁群算法60第六章工业人工智能——蚁群算法算法提出
Dorigo受蚂蚁觅食行为的启发在其博士论文中首次提出了蚂蚁系统(Antsystem)。 Dorigo等人进一步将蚂蚁系统发展为一种通用的优化技术,称为蚁群优化算法(AntColonyOptimiza-tion,AcO)。61第六章工业人工智能——蚁群算法算法基本原理
信息素(pheromone):信息素是一种由蚂蚁自身释放的易挥发的物质,能够实现蚁群内的间接通信。蚂蚁在寻找食物时,在其经过的路上会释放信息素,信息素可以被其它的蚂蚁感知,并且信息素的浓度越高,对应的路径越短。
正反馈:蚂蚁会以较大的概率选择信息素浓度较高的路径,并释放一定量的信息素,从而使距离较短路径的信息素浓素被加强,形成一个正反馈。62第六章工业人工智能——蚁群算法蚂蚁寻找最短路径示意图
最终选择信息素浓度较大的B路径63第六章工业人工智能——蚁群算法算法流程
ACO基本要素路径构建每只蚂蚁都随机选择一个城市作为其出发城市并维护一个路径记忆向量,用来存放该蚂蚁依次经过的城市。信息素更新当所有蚂蚁构建完路径后,算法将会对所有的路径进行全局信息素的更新。64第六章工业人工智能——蚁群算法路径构建
伪随机比例选择规则
65第六章工业人工智能——蚁群算法路径构建
66第六章工业人工智能——蚁群算法信息素更新
67第六章工业人工智能——蚁群算法信息素更新
第六章工业人工智能686.6模拟退火算法69第六章工业人工智能——模拟退火算法算法提出
模拟退火算法(SimulatedAnnealing)是基于MonteCarlo迭代求解策略的一种随机寻优算法,理论上是一个全局最优算法。其出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。起源:1953,Metropolis,固体退火过程 1983,Kirkpatrick成功应用于组合优化问题70第六章工业人工智能——模拟退火算法算法原理
统计力学表明材料中粒子的不同结构对应于粒子的不同能量水平。在高温条件下,粒子的能量较高,可以自由运动和重新排列。在低温条件下,粒子能量较低。如果从高温开始,非常缓慢地降温(这个过程被称为退火),粒子就可以在每个温度下达到热平衡。当系统完全被冷却时,最终形成处于低能状态的晶体。71第六章工业人工智能——模拟退火算法算法原理
统计力学的研究表明,在温度T,进行了充分转换之后,材料将达到热平衡。此时分子停留在状态r的概率满足Boltzmann分布:
72第六章工业人工智能——模拟退火算法算法原理
在同一个温度,分子停留在能量小状态的概率比停留在能量大状态的概率大。当温度相当高时,每个状态的概率基本相同,接近平均值1/|D|。当温度越低时,能量越低的状态的概率值越高。当温度趋于0时,分子停留在最低能量状态的概率趋于1。73第六章工业人工智能——模拟退火算法算法原理
金属物体状态能量最低的状态能量组合优化问题(可行)解最优解费用函数
类比第六章工业人工智能746.7强化学习75第六章工业人工智能——强化学习机器学习
机器学习监督学习:计算机获得简单的输入给出期望的输出,过程是通过一个“训练模型”,学习通用的准则来从输入映射到输出。无监督学习:没有给出标记用来学习算法,让它自己去发现输入的结构。无监督学习自己可以被当成一个目标或者一个实现结果的途径(特征学习)。强化学习:一个计算机程序与动态环境交互,同时表现出确切目标(比如驾驶一辆交通工具或者玩一个游戏对抗一个对手)。这个程序的奖惩机制会作为反馈,实现它在问题领域中的导航。76第六章工业人工智能——强化学习机器学习之间的区别
强化学习(reinforcementlearning)与监督学习、非监督学习的区别。没有监督者,只有奖励信号反馈是延迟的,不是顺时的时序性强,不适用于独立分布的数据自治智能体(agent)的行为会影响后续信息的接收77第六章工业人工智能——强化学习算法提出
思考:五子棋:棋手通过数学公式计算,发现位置1比位置2价值大,这是强化学习吗?这不叫强化学习,叫规划如果通过几次尝试,走位置1比走位置2赢棋的可能性大,得出经验,则为强化学习78第六章工业人工智能——强化学习强化学习模型
强化学习模型几个定义自治智能体Agent学习的主体,如小猫、小狗、人、机器人、控制程序等Agent的特点1、主动对环境做出试探2、环境对试探动作反馈是评价性的(好或坏)3、在行动-评价的环境中获得知识,改进行动方案,达到预期目的奖励信号(rewards)奖励信号R是一个标量信号表示agent在步骤T中所产生动作好坏Agent的任务是最大化累积奖励信号79第六章工业人工智能——强化学习强化学习模型
强化学习模型80第六章工业人工智能——强化学习强化学习模型
例子图中黄点是机器人,目的是走到绿色的方块reward+1000,黑色方块是墙壁,撞到reward-10,红色方块是陷阱,撞到reward-1000,其他reward+081第六章工业人工智能——强化学习强化学习模型
82第六章工业人工智能——强化学习强化学习模型
83第六章工业人工智能——强化学习强化学习模型
84第六章工业人工智能——强化学习强化学习强化学习基本要素
强化学习基本要素及其关系85第六章工业人工智能——强化学习强化学习强化学习基本要素
策略定义了agent在给定时间内的行为方式,一个策略就是从环境感知的状态到在这些状态中可采取动作的一个映射。可能是一个查找表,也可能是一个函数确定性策略:a=π(s)随机策略:π(a∣s)=P[At=a∣St=s]86第六章工业人工智能——强化学习强化学习强化学习基本要素
策略定义了agent在给定时间内的行为方式,一个策略就是从环境感知的状态到在这些状态中可采取动作的一个映射。可能是一个查找表,也可能是一个函数确定性策略:a=π(s)随机策略:π(a∣s)=P[At=a∣St=s]回报函数是强化学习问题中的目标,它把环境中感知到的状态映射为单独的一个奖赏回报函数可以作为改变策略的标准值函数:一个状态起agent所能积累的回报的总和。在决策和评价决策中考虑最多的是值函数环境模型模拟了环境的行为,即给定一个状态和动作,模型可以预测必定导致的下一个状态和下一个奖赏。模型一般用于规划规划是算出来的,强化学习是试出来的第六章工业人工智能876.8卷积神经网络88第六章工业人工智能——卷积神经网络神经网络
89第六章工业人工智能——卷积神经网络卷积神经网络提出的背景
大约二三十年前,神经网络曾经是机器学习领域特别热门的一个方向,这种基于统计的机器学习方法比起过去基于人工规则的专家系统,在很多方面显示出优越性。90第六章工业人工智能——卷积神经网络卷积神经网络提出的背景
但是后来,因为理论分析的难度,加上训练方法需要很多经验和技巧,以及巨大的计算量和优化求解难度,神经网络慢慢淡出了科研领域的主流方向。
值得指出的是,神经网络(如采用误差反向传播算法:BackPropagation,简称BP算法,通过梯度下降方法在训练过程中修正权重使得网络误差最小)在层次深的情况下性能变得很不理想(传播时容易出现所谓的梯度弥散GradientDiffusion或称之为梯度消失,根源在于非凸目标代价函数导致求解陷入局部最优,且这种情况随着网络层数的增加而更加严重,即随着梯度的逐层不断消散导致其对网络权重调整的作用越来越小),所以只能转而处理浅层结构(小于等于3),从而限制了性能。91第六章工业人工智能——卷积神经网络卷积神经网络提出的背景
于是,20世纪90年代,有更多各式各样的浅层模型相继被提出,比如只有一层隐层节点的支撑向量机(SVM,SupportVectorMachine)和Boosting,以及没有隐层节点的最大熵方法(例如LR,LogisticRegression)等,在很多应用领域取代了传统的神经网络。
显然,这些浅层结构算法有很多局限性:在有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定的制约。更重要的是,浅层模型有一个特点,就是需要依靠人工来抽取样本的特征。然而,手工地选取特征是一件非常费力的事情,能不能选取好很大程度上靠经验和运气。
能不能自动地学习一些特征呢?92第六章工业人工智能——卷积神经网络卷积神经网络提出的背景
早在1989年,YannLeCun(现纽约大学教授)和他的同事们就发表了卷积神经网络(ConvolutionNeuralNetworks,简称CNN)的工作。 CNN是一种带有卷积结构的深度神经网络,通常至少有两个非线性可训练的卷积层,两个非线性的固定卷积层(又叫PoolingLayer)和一个全连接层,一共至少5个隐含层。 CNN的结构受到著名的Hubel-Wiesel生物视觉模型的启发,尤其是模拟视觉皮层V1和V2层中SimpleCell和ComplexCell的行为。93第六章工业人工智能——卷积神经网络卷积神经网络应用
LeNet-5手写数字识别94第六章工业人工智能——卷积神经网络重点概念
卷积核(卷积滤波器)特征图(FeatureMap)C层是一个卷积层:通过卷积运算,可以使原信号特征增强,并且降低噪音S层是一个下采样层:利用图像局部相关性的原理,对图像进行子抽样,可以减少数据处理量同时保留有用信息F6层是经典神经网络:输入向量和权重向量之间的点积,再加上一个偏置。然后将其传递给sigmoid函数产生单元i的一个状态。95第六章工业人工智能——卷积神经网络卷积神经网络的衰落
在很长时间里,CNN虽然在小规模的问题上,如手写数字,取得过当时世界最好结果,但一直没有取得巨大成功。这主要原因是,CNN在大规模图像上效果不好,比如像素很多的自然图片内容理解,所以没有得到计算机视觉领域的足够重视。96第六章工业人工智能——卷积神经网络深度学习的崛起与应用
在2012年10月,GeoffreyHinton和他的两个学生在著名的ImageNet问题上用更深的CNN取得世界最好结果,使得图像识别大踏步前进。在Hinton的模型里,输入就是图像的像素,没有用到任何的人工特征。2012年6月,《纽约时报》披露了GoogleBrain项目,吸引了公众的广泛关注。这个项目是由著名的斯坦福大学的机器学习教授AndrewNg和在大规模计算机系统方面的世界顶尖专家JeffDean共同主导,用16,000个CPUCore的并行计算平台去训练含有10亿个节点的深度神经网络(DNN,DeepNeuralNetworks),使其能够自我训练,对2万个不同物体的1,400万张图片进行辨识。
在开始分析数据前,并不需要向系统手工输入任何诸如“脸、肢体、猫的长相是什么样子”这类特征。JeffDean说:“我们在训练的时候从来不会告诉机器:‘这是一只猫’(即无标注样本)。系统其实是自己发明或领悟了‘猫’的概念。”第六章工业人工智能976.9生成对抗网络98第六章工业人工智能——生成对抗网络生成对抗网络概述
生成对抗网络(GenerativeAdversarialNetwork,GAN)是非监督学习。GAN是IanGoodfellow在2014年提出,作为非监督深度学习算法推广。GAN的功能:给定一批样本,训练一个系统,能够生成类似的新样本。99第六章工业人工智能——生成对抗网络生成对抗网络组成
生成对抗网络,由两个网络组成,即生成器和判别器,生成器用来建立满足一定分布的随机噪声和目标分布的映射关系,判别器用来区别实际数据分布和生成器产生的数据分布。100第六章工业人工智能——生成对抗网络生成对抗网络应用
101第六章工业人工智能——生成对抗网络生成对抗网络应用
超分辨率图像重建102第六章工业人工智能——生成对抗网络生成对抗网络应用
图像去雨103第六章工业人工智能——生成对抗网络生成对抗网络应用
图像风格转移第六章工业人工智能1046.10循环神经网络105第六章工业人工智能——循环神经网络循环神经网络模型
循环神经网络(RecurrentNeuralNetwork,RNN)是一种对序列数据建模的神经网络,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不在无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。RNN模型的连接如图所示。VhUxWUnfoldyt-1VUxt-1ht-1WytxthtVUWWyt+1xt+1ht+1VUWyRNN模型结构图106第六章工业人工智能——循环神经网络循环神经网络的基本工作原理
循环神经网络的工程原理或是工作过程其实就是循环神经网络的训练算法,一种基于时间的反向传播算法BPTT(BachPropagationThroughTime)。BPTT算法是针对循环层设计的训练算法,它的基本原理和反向传播BP(BackPropagation)算法是一样的,也包含同样的三个步骤。1前向计算每个神经元的输出值。2反向计算每个神经元的误差项值,它是误差函数E对神经元j的加权输入的偏导数。3计算每个权重的梯度。107第六章工业人工智能——循环神经网络循环神经网络的应用——情感分析
情感分析(SentimentAnalysis),又称倾向性分析,意见抽取(OpinionExtraction),意见挖掘(OpinionMining),情感挖掘(SentimentMining),主观分析(SubjectivityAnalysis),它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。情感分析最常用的做法就是在文中找到具有各种感情色彩属性的词,统计每个属性词的个数,哪个类多,这段话就属于哪个属性。但是这存在一个问题,例如don'tlike,一个属于否定,一个属于肯定,统计之后变成0了,而实际上应该是否定的态度。再有一种情况是,前面几句是否定,后面又是肯定,那整段到底是中立还是肯定呢,为了解决这样的问题,就需要考虑上下文的环境。108第六章工业人工智能——循环神经网络循环神经网络的应用——语音识别
语音识别技术是一门交叉技术,近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,要实现语音识别,其实现过程如图所示。语音识别方法主要是模式匹配法,其包括两个阶段,其一是训练阶段,用户将词汇表中的所有词依次说一遍,并且将其特征矢量作为模板存入模型库;其二是识别阶段,将输入语音的特征矢量依次与模型库中的每个模板进行相似度比较,将相似度最高者作为识别结果的输出。语音识别过程109第六章工业人工智能——循环神经网络循环神经网络的应用——机器翻译
机器翻译(MachineTranslation,简称MT)是采用电子计算机来进行自然语言之间翻译的一门新兴实验性学科,是将一种源语言语句变成意思相同的另一种源语言语句,如将英语语句变成同样意思的中文语句。机器翻译也是计算语言学的一个应用领域,它的研究是建立在语言学、数学和计算技术这三门学科的基础之上,语言学家提供适合于机器进行加工的词典和语法规则,数学家把语言学家提供的材料进行形式化和代码化,计算技术专家给机器翻译提供软件手段和硬件设备,缺少上述任何一方面,机器翻译就不能实现。机器翻译效果的好坏,也完全取决于上述三方面的共同努力。机器翻译与语言模型的关键区别在于,机器翻译需要将源语言语句序列输入后,才进行输出,即输出第一个单词时,便需要从完整的输入序列中进行获取第二个单词、依次进行。110第六章工业人工智能——循环神经网络循环神经网络的应用——机器翻译
机器翻译如图所示。将整个句子输入循环神经网络后,这个时候最后一刻的输出就已经处理完了整个句子。机器翻译示意图111第六章工业人工智能——循环神经网络循环神经网络的应用
基于循环神经网络的语言模型
基于循环神经网络的语言模型就是把词依次输入到循环神经网络中,每输入一个词,循环神经网络就输出截止到目前为止,下一个最可能的词。例如,当依次输入:我-昨天-上学-迟到-了。神经网络的输出如图所示。RNN输入与输出示例112第五章工业大数据——本课小结本课时主要内容总结人工智能背景;人工智能模型;工业大数据案例分析。本课时主要目标了解工业人工智能的背景与发展历程;了解工业人工智能的基本流程。本课时小结工业互联网
IndustrialInternet113114第五章工业人工智能——课时安排本章课时任务时间270分钟(6课时)主要学习内容人工智能背景(1课时);人工智能模型(3课时);工业大数据案例分析(2课时)。本课时主要目标了解工业人工智能的背景与发展历程;了解工业人工智能的基本流程。第六章工业人工智能1156.6工业人工智能案例分析(一)
自然语言处理116第六章工业人工智能——背景图灵测试指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。117第六章工业人工智能——背景ChatGPT
118第六章工业人工智能案例—自然语言处理自然语言处理在本次课中,将会向大家展示关于工业人工智能的案例分析——自然语言处理。以下会介绍工业人工智能领域的实例:ChatGPT119第六章工业人工智能案例—自然语言处理自然语言处理——大语言模型大语言模型(英文:LargeLanguageModel,缩写LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。120第六章工业人工智能案例—自然语言处理大语言模型有多大?拿GPT来说,GPT其实出现了好几代,GPT3它有45个tb的训练数据,那么整个维基百科里面的数据只相当于他训练数据的0.6%。我们在这个训练的时候把这个东西称作语料,就语言材料,这个语料的量是可以说是集中到我们人类所有语言文明的精华在里面,这是一个非常非常庞大的一个数据库。121第六章工业人工智能案例—自然语言处理大语言模型历史
2018年的时候谷歌提出了Bert的模型,然后到GPT2,从340兆到10亿、15亿,然后到83亿,然后到170亿,然后到GPT31750亿的参数。但是到了2020年的5月,GPT3出来之后,其实就有了非常大的变化,GPT3的性能比GPT2好很多,它的数参数的数量级大概是GPT2-10倍以上。122第六章工业人工智能案例—自然语言处理大语言模型训练方式训练过程包括两个主要步骤:预训练和精调。在预训练阶段:模型从一个巨大的、多样化的数据集中学习,这个阶段允许模型学习一般的语言模式和表征。在精调阶段:模型在与目标任务或领域相关的更具体、更小的数据集上进一步训练。这有助于模型精调其理解,并适应任务的特殊要求。123第六章工业人工智能案例—自然语言处理常见的大语言模型
GPT-3(OpenAI):GPT-3是最著名的LLM之一,拥有1750亿个参数。目前OpenAI已经迭代到了GPT-4版本。
BERT(谷歌):BERT是另一个流行的LLM,对NLP研究产生了重大影响。该模型使用双向方法从一个词的左右两边捕捉上下文,使得各种任务的性能提高,如情感分析和命名实体识别。
T5(谷歌):T5是一个LLM,该模型将所有的NLP任务限定为文本到文本问题,简化了模型适应不同任务的过程。T5在总结、翻译和问题回答等任务中表现出强大的性能。
ERNIE3.0文心大模型(百度):百度推出的大语言模型ERNIE3.0首次在百亿级和千亿级预训练模型中引入大规模知识图谱,提出了海量无监督文本与大规模知识图谱的平行预训练方法。124第六章工业人工智能案例—自然语言处理自然语言处理——语义分析在这一部分中,我们将要介绍NLP领域的一个重要问题:语义分析。语义分析分为两个部分:词汇级语义分析以及句子级语义分析。125第六章工业人工智能案例—自然语言处理词汇级语义分析——词义消歧自然语言中一个词具有多种含义的现象非常普遍。在英语中,bank这个词可能表示银行,也可能表示河岸;而在汉语中,这样的例子就更可怕了,比如:126第六章工业人工智能案例—自然语言处理词汇级语义分析——监督的语义消歧方法监督学习的方法就是,数据的类别在学习之前已经知道。在语义消歧的问题上,每个词所有可能的义项都是已知的。有监督的语义消歧方法是通过一个已标注的语料库学习得到一个分类模型。常用的方法有:1.基于贝叶斯分类器的词义消歧方法2.基于最大熵的词义消歧方法3.基于互信息的消歧方法下面我们只介绍第二种方法127第六章工业人工智能案例—自然语言处理基于最大熵的词义消歧方法
在词义消歧中,最大熵模型的建模与训练如下图所示:128第六章工业人工智能案例—自然语言处理基于最大熵的词义消歧方法训练过后,我们将新的句子输入模型中,模型会给出一个概率分布(其实最大熵模型的输出就是一个概率分布),我们选取其中概率最大的结果作为模型输出,整个过程如下图所示:129第六章工业人工智能案例—自然语言处理句子级语义分析——格文法格文法是从语义的角度出发,即从句子的深层结构来研究句子的结构,着重探讨句法结构与语义之间关系的文法理论。130第六章工业人工智能案例—自然语言处理句子级语义分析——格文法在传统语法中,“格”是指主格、宾格等。然而在格文法中,格是深层格,是指句子中的体词(名词、代词等)和谓词(动词、形容词等)之间的及物性关系。这个概念有些难懂,我们举个例子:131第六章工业人工智能案例—自然语言处理句子级语义分析——语义角色标注法(SRL)基于格文法,提出了一种语义分析的方法——语义角色标注。语义角色标注方法分为如下三种:1.基于完全句法分析的语义角色标注2.基于局部句法分析的语义角色标注3.基于依存句法分析的语义角色标注但是无论那种方法,语义角色标注的过程都如下图所示:132第六章工业人工智能案例—自然语言处理基于完全句法分析的统计SRL方法
举个例子,我们原始的输入句子是:“警察已到现场,正在详细调查事故原因”那么我们的任务如下:133第六章工业人工智能案例—自然语言处理基于依存句法分析的统计SRL方法同样以“警察已到现场,正在详细调查事故原因”为例。由于句法分析方法发生了改变,所以与上述方法不同的是SRL的输入:134第六章工业人工智能案例—自然语言处理基于依存句法分析的神经网络SRL方法上述两种方法都是通过概率统计法进行SRL的方法(之前的两种方法属于左下角的概率统计方法)135第六章工业人工智能案例—自然语言处理自然语言处理——语义分析我们之前提到,神经网络法的主要目的是为了利用神经网络自动构建特征,那么我们很自然就可以想到,该种方法与概率统计法的主要区别就在于模型,神经网络模型架构如下:136第六章工业人工智能案例—自然语言处理自然语言处理——文本分类文本分类(TextClassification或TextCategorization,TC),或者称为自动文本分类(AutomaticTextCategorization),是指计算机将载有信息的一篇文本映射到预先给定的某一类别或某几类别主题的过程。文本分类系统如下图所示:137第六章工业人工智能案例—自然语言处理文本分类——文本预处理文本要转化成计算机可以处理的数据结构,就需要将文本切分成构成文本的语义单元。这些语义单元可以使句子、短语、词语或单个的字。本文无论对于中文还是英文文本,统一将最小语义单元称为“词组”。138第六章工业人工智能案例—自然语言处理文本分类——文本特征提取文本特征提取是自然语言处理中的重要步骤之一,其核心目标是从文本数据中抽取出能够描述文本内容的有用信息。这些信息可以用于文本分类、情感分析、信息检索等各种文本分析任务中。139第六章工业人工智能案例—自然语言处理文本分类——分类模型
TextCNN是利用卷积神经网络对文本进行分类的算法详细的原理图如下。140第六章工业人工智能案例—自然语言处理自然语言处理——情感分析情感分析是自然语言处理中常见的场景,比如淘宝商品评价,饿了么外卖评价等,对于指导产品更新迭代具有关键性作用。通过情感分析,可以挖掘产品在各个维度的优劣,从而明确如何改进产品。141第六章工业人工智能案例—自然语言处理情感分析——基于词典的情感分类步骤基于情感词典的方法,先对文本进行分词和停用词处理等预处理,再利用先构建好的情感词典,对文本进行字符串匹配,从而挖掘正面和负面信息。如图:142第六章工业人工智能案例—自然语言处理情感分析——情感词典情感词典包含正面词语词典、负面词语词典、否定词语词典、程度副词词典等四部分。一般词典包含两部分,词语和权重。143第六章工业人工智能案例—自然语言处理情感分析——情感词典文本匹配算法基于词典的文本匹配算法相对简单。逐个遍历分词后的语句中的词语,如果词语命中词典,则进行相应权重的处理144第六章工业人工智能案例—自然语言处理自然语言处理——自然语言生成(NLG)自然语言生成是一项复杂的任务,它要求计算机系统能够理解语境、掌握语法规则,并生成通顺、自然的文本。它不仅可以用于自动化报告生成、智能助手,还在创意写作、广告创意等领域展现了巨大的潜力。
以下是其步骤:145第六章工业人工智能案例—自然语言处理自然语言生成——内容确定作为第一步,NLG系统需要决定哪些信息应该包含在正在构建的文本中,哪些不应该包含。通常数据中包含的信息比最终传达的信息要多。146第六章工业人工智能案例—自然语言处理自然语言生成——文本结构确定需要传达哪些信息后,NLG系统需要合理的组织文本的顺序。例如在报道一场篮球比赛时,会优先表达“什么时间”“什么地点”“哪2支球队”,然后再表达“比赛的概况”,最后表达“比赛的结局”。147第六章工业人工智能案例—自然语言处理自然语言生成——句子聚合不是每一条信息都需要一个独立的句子来表达,将多个信息合并到一个句子里表达可能会更加流畅,也更易于阅读。148第六章工业人工智能案例—自然语言处理自然语言生成——语法化当每一句的内容确定下来后,就可以将这些信息组织成自然语言了。这个步骤会在各种信息之间加一些连接词,看起来更像是一个完整的句子。149第六章工业人工智能案例—自然语言处理自然语言生成——参考表达式生成(REG)这个步骤跟语法化很相似,都是选择一些单词和短语来构成一个完整的句子。不过他跟语法化的本质区别在于“REG需要识别出内容的领域,然后使用该领域(而不是其他领域)的词汇”。150第六章工业人工智能案例—自然语言处理自然语言生成——语言实现最后,当所有相关的单词和短语都已经确定时,需要将它们组合起来形成一个结构良好的完整句子。151第六章工业人工智能案例—自然语言处理工业人工智能案例——ChatGPT
ChatGPT(全名:ChatGenerativePre-trainedTransformer),是OpenAI研发的一款聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写论文、邮件、脚本、文案、翻译、代码等任务。152第六章工业人工智能案例—自然语言处理ChatGPT在工业自动化领域的探索
PLC(ProgrammableLogicController),全称可编程控制器,相当于微型计算机,通过接收指令控制各种类型的机械或生产过程,是制造业在工业自动化时代进行转型升级的核心设备,其应用领域涵盖了整个工业自动化过程的方方面面。ChatGPT与专业的PLC编程人员比,优势在什么地方呢?为何西门子选择PLC编程作为ChatGPT与工业自动化结合的突破口呢?153第六章工业人工智能案例—自然语言处理ChatGPT在工业自动化领域的探索一些业内用户就尝试过利用ChatGPT生成PLC代码,发现目前ChatGPT已经能够进行简单的代码编写,随后我们也进行测试,让ChatGPT用梯形语言生成西门子的S7-200PLC的程序,效果如下。154第六章工业人工智能案例—自然语言处理ChatGPT在工业自动化领域的探索
ChatGPT不仅根据指令写出了完整的逻辑结构,而且还在最后给了用户提示:需要根据不同需求进行更改。根据西门子的理想成果,未来ChatGPT在PLC编程上能够实现根据自然语言生成PLC代码,并且只需对其生成的程序进行检查测试,节省编写时间,并大大降低代码错误概率,节省代码修改时间。155第六章工业人工智能案例—自然语言处理ChatGPT在工业自动化领域的探索基于OPENAI的技术,企业有望实现PLC编程的自动化,并且提高PLC编程的效率,同时也会大大降低PLC编程的门槛。但是,需要明确的一点是,自动化编程技术需要有一个合理的框架和算法体系,才能在实际应用中发挥良好的效果。下面介绍一些主流PLC编程软件:156第六章工业人工智能案例—自然语言处理ChatGPT隐藏的风险与挑战自2023年3月11日韩国三星电子允许部分半导体业务部门员工使用ChatGPT开始,在短短20天内便爆出了三起机密资料外泄事件。这表明ChatGPT在释放企业劳动力和提高工作效率同时所带来的风险与挑战也是不可忽略的。具体表现在以下几方面:157第六章工业人工智能案例—自然语言处理ChatGPT隐藏的风险与挑战成本挑战:除了信息安全外,运行成本也是企业使用ChatGPT前需要考虑的重要条件之一。下面例举了两项主要成本仅供参考。第六章工业人工智能1586.6工业人工智能案例分析(二)
计算机视觉159第六章工业人工智能——案例分析计算机视觉的概念计算机视觉是人工智能的一个重要分支,它是研究计算机如何获取、处理、分析和理解数字图像的技术。简单来说,,计算机视觉的研究者试图让计算机拥有像人类一样感知视觉世界并从图像中了解场景和环境的能力。160第六章工业人工智能——案例分析图像与数字图像
✓
图像定义为二维函数f(x,y),其中x、y是空间坐标,f(x,y)是点(x,y)的幅值。✓
灰度图像是一个二维灰度(或亮度)函数f(x,y)。✓彩色图像由三个(如RGB)二维灰度(或亮度)函f(x,y)组成。161第六章工业人工智能——案例分析
✓
数字图像由二维的元素组成,每一个元素具有一个特定的位置(x,y)和分量幅值f(x,y),这些元素就称为像素。✓灰度图像每个像素的亮度用一个数值来表示,通常数值范围在0到255之间,0表示黑、255表示白,其它值表示处于黑白之间的灰度。✓彩色图像可以用红、绿、蓝三元组的二维矩阵来表示。通常,三元组的每个数值也是在0到255之间,0表示相应的基色在该像素中没有,而255则代表相应的基色在该像素中取得最大值。162第六章工业人工智能——案例分析图像分类与特征提取
将图像分类到不同的类别,如狗、猫、人等。它利用机器学习技术训练一个分类器,然后对新图像进行预测和分类。图像分类是计算机视觉最基本的任务。163第六章工业人工智能——案例分析
特征提取就是对图片进行数值处理,转换成计算机可理解的特征,常用特征提取方法有:HSV直方图、方向梯度直方图(HistogramofOrientedGradients,HOG)、局部二值模式(LocalBinaryPattern,LBP)。
HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(HexconeModel)。这个模型中颜色的参数分别是:色调(H),饱和度(S),亮度(V)。164第六章工业人工智能——案例分析
色调H:用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄色为60°,青色为180°,品红为300°;
饱和度S:取值范围为0.0~1.0;
亮度V:取值范围为0.0(黑色)~1.0(白色)。165第六章工业人工智能——案例分析
HSV特征提取就是将图像所有像素的RGB值转化为HSV格式,并将HSV值量化后一维展开。166第六章工业人工智能——案例分析
HOG特征描述符基于图像局部区域的梯度方向直方图来表示图像特征。它通过计算图像中不同方向上的梯度强度和方向,将它们组织成直方图的形式,从而形成特征向量。这个特征向量能够捕捉到图像中的边缘、纹理等结构信息,从而用于图像识别和目标检测等任务。最早由法国研究员Dalal等在CVPR-2005上提出,用于解决人体目标检测问题。167第六章工业人工智能——案例分析
主要步骤:灰度化和gamma校正->计算梯度->统计cell的梯度方向直方图->Block块内归一化->生成HOG特征。168第六章工业人工智能——案例分析
优点:1、HOG表示的是边缘(梯度)的结构特征,因此可以描述局部的形状信息;2、采取在局部区域归一化直方图,可以部分抵消光照变化带来的影响。3、由于一定程度忽略了光照颜色对图像造成的影响,使得图像所需要的表征数据的维度降低了。4、分块分单元的处理方法使得图像局部像素点之间的关系可以很好得到的表征。缺点:1、描述子生成过程冗长,导致速度慢,实时性差;2、很难处理遮挡问题;3、由于梯度的性质,该描述子对噪点相当敏感;4、只使用灰度图像,未考虑颜色信息。
169第六章工业人工智能——案例分析
LBP(LocalBinaryPattern,局部二值模式)是一种用来描述图像局部纹理特征的算子,它具有旋转不变性和灰度不变性等显著的优点。它是首先由T.Ojala,M.Pietikäinen和D.Harwood在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理特征。170第六章工业人工智能——案例分析
主要步骤:(1)首先将检测窗口划分为16×16的小区域(cell);(2)对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0,产生的8位二进制数即该窗口中心像素点的LBP值;(3)然后计算每个cell的直方图,即每个数字(假定是十进制数LBP值)出现的频率;然后对该直方图进行归一化处理。(4)最后将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是整幅图的LBP纹理特征向量。171第六章工业人工智能——案例分析图像分割
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大学(车辆工程)汽车造型设计试题及答案
- 2025年中职(助产)产前护理阶段测试题及答案
- 2025年中职市政工程施工(道路施工工艺)试题及答案
- 2025年高职(云计算技术应用)云服务器搭建试题及解析
- 2025年中职月球与行星科学(月球科学)技能测试题
- 2025年中职第二学年(康复技术)康复护理试题及答案
- 2025年中职环境工程(大气污染防治基础)试题及答案
- 2025年高职第一学年(眼视光学)低视力康复基础综合测试试题及答案
- 2026年郑州信息科技职业学院单招综合素质笔试参考题库附答案详解
- 2026年河南工业和信息化职业学院单招综合素质笔试备考题库带答案解析
- 2025 小学六年级语文下册 日积月累 经典名句情境应用课件
- 楼电梯维保及故障修复指南
- 视光学基础(第3版)课件 第五章 视力和视力检查
- 2025河南省公务员考试《公共基础知识》题库及答案1套
- 培训学校前台接待礼仪
- DB11∕T 695-2025 建筑工程资料管理规程
- 2025年开通新三板的试题及答案
- 未成年人网络保护的法律体系构建与权益保障研究毕业答辩
- 2025年天津大学管理岗位集中招聘15人备考题库及完整答案详解1套
- (一诊)成都市2023级高三高中毕业班第一次诊断性检测英语试卷(含官方答案及解析)+听力材料+听力音频
- 医院广告标识制作设计方案投标方案(技术标)
评论
0/150
提交评论