工业互联系统分析与设计 课件 第六章 工业人工智能(5、6课时)_第1页
工业互联系统分析与设计 课件 第六章 工业人工智能(5、6课时)_第2页
工业互联系统分析与设计 课件 第六章 工业人工智能(5、6课时)_第3页
工业互联系统分析与设计 课件 第六章 工业人工智能(5、6课时)_第4页
工业互联系统分析与设计 课件 第六章 工业人工智能(5、6课时)_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

工业互联网Industrial

Internet0□本章课时任务时间270分钟(6课时)主要学习内容人工智能背景(1课时);人工智能模型(3课时);工业大数据案例分析(2课时)。本课时主要目标第五章

工业人工智能——课时安排了解工业人工智能的背景与发展历程;

了解工业人工智能的基本流程。1第六章

工业人工智能INDUSTRY

406.6工业人工智能案例分析(一)自然语言处理ConectionBig

DataCloudcomputing口图灵测试指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一

些装置(如键盘)向被测试者随意提问。

进行多次测试后,如果机器让

平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并

被认为具有人类智能。第六章

工业人工智能——背景Machine

Z30%→passPersomX???PersonA3第六章

工业人工智能——背景□

ChatGPT4第六章工业人工智能案例一自然语言处理□自然语言处理在本次课中,将会向大家展示关于工业人工智能的案例分析——自

然语言处理。以下会介绍工业人工智能领域的实例:ChatGPT5第六章工业人工智能案例一自然语言处理□自然语言处理——大语言模型大语言模型(英文:

LargeLanguageModel,

缩写LLM),

也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们

在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。基础模型:超强能力,但不对ChatGPT对齐、可交流6第六章工业人工智能案例一自然语言处理口大语言模型有多大?拿

GPT

来说,

GPT

其实出现了好几代,GPT

3

4

5

个tb

的训练数据,那么整个维基百科里面的数据只相当于他训练数据的0.6%。

我们在这个训练的时候把这个东西称作语料,就语言材料,这个语料的

量是可以说是集中到我们人类所有语言文明的精华在里面,这是一个非

常非常庞大的一个数据库。Data-centricToolingHumanFirstHostingHuggingFacePlaygrounds&PromptEngineeringGenerationKnowledgeAnsweringTranslationGODELLargeLanguageModelsDialogGenerationNotebooks第六章工业人工智能案例一自然语言处理口大语言模型历史2018年的时候谷歌提出了

Bert的模型,然后到

GPT

2,从340

兆到

1

0

亿

、15亿,然后到83亿,然后到170亿,然后到

GPT31750

亿的参数。但是到了

2020

年的5月,GPT

3出来之后,其实就有了非常大的变化,

GPT

3的性能比

GPT

2

好很多,它的数参数的数量级大概是

GPT

2-10

倍T5Codex

⑤HyperCLOVA2-InstructGPTCodeGenMT-NLGGShardmT5FLANLaMDAAlphaCodeChinchillaSparrowFlan-T5Flan-PaLMLuminousNLLB11-12-GLMAlexaTMWeLMGPT-NeoX-20BTk-InstructCohereGPT-3

⑤AnthropicWebGPTrnie3.0

TitanGopherGLaMBLOOMmTOBLOOMZGalaticaxOPT-IML

02022UL2YaLM7-10-PythiauassVicunaPanGu-2BardERNIEBot以

。ChatGPT5

GPT45Ernie

3.0Jurassic-1PubliclyAvailablePanGu-a8第六章工业人工智能案例一自然语言处理□大语言模型训练方式训练过程包括两个主要步骤:预训练和精调。在预训练阶段:模型从一个巨大的、多样化的数据集中学习,这个阶段允许模型学习一般的语言模式和表征。在精调阶段:模型在与目标任务或领域相关的更具体、更小的数据集上进一

步训练。这有助于模型精调其理解,并适应任务的特殊要求。数据标注模型训练生文本标注数据自监督学习

精调Self-supervised

Learning

Fine-tuning预训练模型9预训练

Pre-training辅助任务标注数据模型口常见的大语言模型GPT-3(OpenAI)

:

GPT-3

是最著名的LLM

之一,拥有1750

亿个参数。目前OpenA

I已经迭代到了GPT-4版本。BERT

(

)

:

BERT是另一个流行的LLM,

对NLP

研究产生了重大

影响。该模型使用双向方法从一个词的左右两边捕捉上下文,使得各种任务

的性能提高,如情感分析和命名实体识别。T5

(

):T5

是一个LLM,

该模型将所有的NLP任务限定为文本到

文本问题,简化了模型适应不同任务的过程。T5

在总结、翻译和问题回答

等任务中表现出强大的性能。ERNIE

3.0

文心大模型(百度):百度推出的大语言模型ERNIE

3.0首

次在百亿级和千亿级预训练模型中引入大规模知识图谱,提出了海量无监督

文本与大规模知识图谱的平行预训练方法。

10第六章工业人工智能案例一自然语言处理第六章工业人工智能案例一自然语言处理□自然语言处理——语义分析在这一部分中,我们将要介绍NLP领域的一个重要问题:语义分析。语义分析分为两个部分:词汇级语义分析以及句子级语义分析。NLP

基础技术

NLP核心技术词汇表示和分析机器翻译文本生成搜索引擎短语表示和分析问答,聊天知识库智能客服句法语义表示和分析

信息检索

机器翻译语音助手篇章表示和词汇分析

信息抽取情感分析

商业智能用户画像

大数据

云计算机器学习深度学习

领域知识11□词汇级语义分析

词义消歧自然语言中一个词具有多种含义的现象非常普遍。在英语中,bank

这个词可能表示银行,也可能表示河岸;而在汉语中,这样的例子就更可怕了,比如:(1)

他打鼓很在行。

(9)她会用毛线打毛衣。(2)

他会打家具。

(10)他用尺子打个格。(3)

他把碗打碎了。

(11)他打开了箱子盖。(4)

他在学校打架了。

(12)她打着伞走了。(5)

他很会与人打交道。

(13)他打来了电话。(6)

他用土打了一堵墙。

(14)他打了两瓶水。(7)

用面打浆糊贴对联。

(15)他想打车票回家。(8)

他打铺盖卷儿走人了。

(16)他以打鱼为生。

12第六章工业人工智能案例一自然语言处理□词汇级语义分析——监督的语义消歧方法监督学习的方法就是,数据的类别在学习之前已经知道。在语义消歧的问题上,每个词所有可能的义项都是已知的。有监督的语

义消歧方法是通过一个已标注的语料库学习得到一个分类模型。常用的方法有:1.基于贝叶斯分类器的词义消歧方法2.基于最大熵的词义消歧方法3.基于互信息的消歧方法下面我们只介绍第二种方法第六章工业人工智能案例一自然语言处理13口基于最大熵的词义消歧方法在词义消歧中,最大熵模型的建模与训练如下图所示:他/P

很/D

会/V与/C

人/N打/V

交道/N

。/PU特征选取上下文特征:●

词形信息

●词性信息●

词形+词性信息特征函数/信息:

选取适当的特征函数(如考虑:上下文窗口大小等)第六章工业人工智能案例一自然语言处理称为归一化因子。

14最大熵模型训练语料其

中:□基于最大熵的词义消歧方法训练过后,我们将新的句子输入模型中,模型会给出一个概率分布

(其实最大熵模型的输出就是一个概率分布),我们选取其中概率最大的结果作为模型输出,整个过程如下图所示:第六章工业人工智能案例一自然语言处理输入:句

他/P对/D打

/V鼓/N

很/D

在行/N

。/PU(1)体打破很在行.②

会打家日.3

)

碗打碎了。4

在学

校打架了.(5)损会与人打交道

.6

)

土打了一堵墙.7

面打紫材贴联⑧

)的打错器几出人了.(9)她会用七线打

.(10)他用尺子打个格.(11)他打开了柏子盖(12)数打群伞走了,(13)他打来了电活.(14)他打了两瓶水(15)他想打牛原回家.(16)他C

打鱼为生.输出:概率最大为结果打

字的所有义项概率最大熵模型称

化因

。15格语法中的

格是深层格动

….主语谓语宾语定语状语补语语言单位词

词组传统语法中的格是表层结构□句子级语义分析

格文法格文法是从语义的角度出发,即从句子的深层结构来研究句子的结

构,着重探讨句法结构与语义之间关系的文法理论。第六章工业人工智能案例一自然语言处理语言(结构/语义)16□句子级语义分析——格文法在传统语法中,

“格”是指主格、宾格等。然而在格文法中,格是

深层格,是指句子中的体词(名词、代词等)和谓词(动词、形容词等)之间的及物性关系。这个概念有些难懂,我们举个例子:a.

John

broke

the

window.b.

The

hammer

broke

the

window.c.

The

window

broke.d.

John

broke

the

window

with

the

hammer.e.The

window

was

broken

by

John

.broke:主动词John:施事格the

window:受事格(客体格)the

hammer:工具格句子语义本质

17第六章工业人工智能案例一自然语言处理□句子级语义分析

语义角色标注法

(SRL)基于格文法,提出了一种语义分析的方法——语义角色标注。语义角色标注方法分为如下三种:1.基于完全句法分析的语义角色标注2.基于局部句法分析的语义角色标注3.基于依存句法分析的语义角色标注但是无论那种方法,语义角色标注的过程都如下图所示:句法分析-->候选论元剪除-->论元识别-->论元标注-->后处理(标注结果)

:问题

些、

等限元性论致复一重的除制删强制一多类分类标注过程两类分类问题识别真正的论选项的数目尽量减少候析析析分分分法法法句句句存部全依局完第六章工业人工智能案例一自然语言处理18口基于完全句法分析的统计SRL

方法举个例子,我们原始的输入句子是:“警察已到现场,正在详细调

查事故原因”那么我们的任务如下:IPNPVPVPVP

NP调查

事故

原因语义角色角色描述ARG0施事者ARG1受事者ARG2范围或程度AR93动作起点ARG4动作结束点ARGM-ADV状语ARGN6F爱盐者ARGMCND条件ARGN-DR方向ARGVLoC地点ARGMMR方式ARMPFP目的ARGM.TMP时间ARCM-TPC主题ARGMPRD次请词第六章工业人工智能案例一自然语言处理输

入:输

:A0

AM-TMP

AM-MNRA1警方

详细VPADVPADVPVPVpPUADVP19口基于依存句法分析的统计SRL方法同样以“警察已到现场,正在详细调查事故原因”为例。由于句法分析方法发生了改变,所以与上述方法不同的是SRL的输入:语义角色角色描述ARG0施事者ARG1受事者ARG2茫围或程度ARG3动作起点ARG4动作拮束点ARGM-ADV状语ARGWBMF爱益者ARGMCND条件ARON-DR方向ARGVLOC地点ARGMMR方式ARMPFP目的ARG4.TMP时间ARCM.TPC主题ARGMPRD次请词第六章工业人工智能案例一自然语言处理ROOTSBJVMOD已

到VMODVMOD正在

详细警察输

:输

入:

SBJROOT调查AM-TMP

AM-MNR

A1OBJNMOD事故PUOBJ现场20NLP基础技术语言语义语义分析语言结构句子

篇章规则法概率统计深度学习词汇级语义分析语言处理方法句子级语义分析口基于依存句法分析的神经网络SRL

方法上述两种方法都是通过概率统计法进行SRL的方法(之前的两种方法

属于左下角的概率统计方法)自然语言研究层面第六章工业人工智能案例一自然语言处理NLP

核心应用机器翻译阅读理解

信息抽取

问答系统序列标注语

型语义分析词

短语基本概念语料21第六章工业人工智能案例一自然语言处理□自然语言处理——语义分析我们之前提到,神经网络法的主要目的是为了利用神经网络自动构

建特征,那么我们很自然就可以想到,该种方法与概率统计法的主要区

别就在于模型,神经网络模型架构如下:输

UNESCOis

holding

its

meetings

in

ParisLexicalsemanticFeatures

ROorUNESCO

is

is

holdingnecrestcomnonancestorROOT

VCGlobalContext

RepresentationSyntacticPathRepresentation输出层

:表

:BiLSTM₃BiLSTMgmBiLSTMra22□自然语言处理——文本分类文本分类(Text

Classification或Text

Categorization,TC),或者称为自动文本分类(AutomaticText

Categorization),

是指计算机将载有信息的一篇文本映射到预先给定的某一类别或某几类别主题的过程。文本分类系统如下图所示:特征工程训练集

文本预处理

特征提取

文本表示

分类器第六章工业人工智能案例一自然语言处理23口文本分类——文本预处理文本要转化成计算机可以处理的数据结构,就需要将文本切分成构成

文本的语义单元。这些语义单元可以使句子、短语、词语或单个的字。

本文无论对于中文还是英文文本,统一将最小语义单元称为“词组”。网页中的<htmbapple,apples→applewent,going.gone—▶go特征提取

(FeatureExtraction)tf-idfword2vec

.

24清洗(Cleaning)无用的标签特殊符号停用词大写转小写建

模(Modeling)相似度算法分类算法第六章工业人工智能案例一自然语言处理原始文本(raw

data)网页文本新闻报告分

词(Segmentation)标准化(Normalization)StemmingLemmazationa,an,the,

的口文本分类——文本特征提取文本特征提取是自然语言处理中的重要步骤之一,其核心目标是从文

本数据中抽取出能够描述文本内容的有用信息。这些信息可以用于文本

分类、情感分析、信息检索等各种文本分析任务中。Deep

Learning-based

NLPDocuments第六章工业人工智能案例一自然语言处理DenseEmbeddingsHiddenLayersOutput

Unitsobtained

via

word2vec,doc2vec,GloVe,etc.25口文本分类

分类模型TextCNN

是利用卷积神经网络对文本进行分类的算法详细的原理图第六章工业人工智能案例一自然语言处理1-max

softmaxfunctionregularization

poolinginthis

layertogethertoformasinglefeaturevectoractivationfunctionconvolution3

region

sizes:(2,3,4)2fitersforeach

regionsizetotally6filters2featuremaps

for

6

univariate

2

classeslike

this

movie

very

mucheachvectorsregionsizeconcatenated如

。Sent

matrix7en26第六章工业人工智能案例一自然语言处理□自然语言处理——情感分析情感分析是自然语言处理中常见的场景,比如淘宝商品评价,饿了

么外卖评价等,对于指导产品更新迭代具有关键性作用。通过情感分析,

可以挖掘产品在各个维度的优劣,从而明确如何改进产品。27□情感分析

基于词典的情感分类步骤基于情感词典的方法,先对文本进行分词和停用词处理等预处理,

再利用先构建好的情感词典,对文本进行字符串匹配,从而挖掘正面和

负面信息。如图:积极、消极词汇

否定词、程度副词整理加入

整理加入输入句子

预处理

自动分词

入·

情感词典

判断规则·→情

类第六章工业人工智能案例一自然语言处理基于情感词典的文本情感分类28□情感分析

情感词典情感词典包含正面词语词典、负面词语词典、否定词语词典、程度副词词典等四部分。一般词典包含两部分,词语和权重。第六章工业人工智能案例一自然语言处理知网情感分析用词语集

台湾大学NTUSD褒贬义词典(清华大学李军)

我们整理的行业词汇知网情感分析用词语集

台湾大学NTUSD褒贬义词典(清华大学李军)

我们整理的行业词汇否定词表1否定词表2我们整理的否定词程度副词表1程度副词表2我们整理的程度副词积极情感词表消极情感词表否定词表程度副词表载入情感词典构建情感词典29口情感分析

情感词典文本匹配算法基于词典的文本匹配算法相对简单。逐个遍历分词后的语句中的词

语,如果词语命中词典,则进行相应权重的处理向量词组

断-

词性类别消极词语检测前一词语前一词语为程度副词1.前一词语为否定词2.前一词语为消极词一3.后一词语为消极词其他否

语。其他前一词语为否定词第六章工业人工智能案例一自然语言处理前一词语为程度副词检测前后词语积极词语×权重

一-1+

重-1一权重+1x

权重一输入句子结巴分词输出最终权值30第六章工业人工智能案例一自然语言处理□自然语言处理——自然语言生成

(NLG)自然语言生成是一项复杂的任务,它要求计算机系统能够理解语境、掌握语法规则,并生成通顺、自然的文本。它不仅可以用于自动化报告

生成、智能助手,还在创意写作、广告创意等领域展现了巨大的潜力。以下是其步骤:NLG

的6个步骤1②

3

4内容确定

文本结构

句子聚合

语法化ContentDeterminationTextStructuringSentenceAggregationLexicalisation5

6参考表达式生成

语言实现REG

LinguisticRealisation31执行者!

执行者

执行者鼓据文本描述自

动建模活动

活动

据技行者

技行者

执行者□自然语言生成

内容确定作为第一步,NLG系统需要决定哪些信息应该包含在正在构建的文

本中,哪些不应该包含。通常数据中包含的信息比最终传达的信息要多。第六章工业人工智能案例一自然语言处理酸通执行者132第六章工业人工智能案例一自然语言处理□自然语言生成——文本结构确定需要传达哪些信息后,NLG系统需要合理的组织文本的顺序。例如在报道一场篮球比赛时,会优先表达“什么时间”“什么地点”“哪2

支球队”,然后再表达“比赛的概况”,最后表达“比赛的结局”。NLP应用语义分析句法分析词法分析复杂NLP

务文档句子短语词汇汉字语言单元统

一语义表示空间33□自然语言生成——句子聚合不是每一条信息都需要一个独立的句子来表达,将多个信息合并到

一个句子里表达可能会更加流畅,也更易于阅读。[cls]

[sep]白

切鸡白

[sep]第六章工业人工智能案例一自然语言处理34□自然语言生成

语法化当每一句的内容确定下来后,就可以将这些信息组织成自然语言了。这个步骤会在各种信息之间加一些连接词,看起来更像是一个完整的句子。instructionYour

task

is

to

evaluatethe

generated

text

from..hypothesis第六章工业人工智能案例一自然语言处理OutputOutputs:Explanation:

[….]Score:[…]referencessourcesLLMS35意图标签:航班意图Softmax分类器正则表达式

特征

S

通过注意力机制整合h₁

h₂

h₃h₄

h₅双向LSTM正则表达式实例X₁

X₂

X₃

X₄

X₅flights

from

Boston

to

Miami□自然语言生成

参考表达式生成

(REG)这个步骤跟语法化很相似,都是选择一些单词和短语来构成一个完整的句子。不过他跟语法化的本质区别在于“REG

需要识别出内容的领

域,然后使用该领域(而不是其他领域)的词汇”。第六章工业人工智能案例一自然语言处理/^flights?from/

36第六章工业人工智能案例一自然语言处理□自然语言生成——语言实现最后,当所有相关的单词和短语都已经确定时,需要将它们组合起来形成一个结构良好的完整句子。Language文字语言37第六章工业人工智能案例一自然语言处理□工业人工智能案例——ChatGPTChatGPT(全名:

Chat

GenerativePre-trained

Transformer)

,

是OpenAI

研发的一款聊天机器人程序,于2022年11月30日发布。ChatGPT

是人工智能技术驱动的自然语言处理工具,它能够基于在预训

练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进

行互动,真正像人类一样来聊天交流,甚至能完成撰写论文、邮件、脚

本、文案、翻译、代码等任务。38第六章工业人工智能案例一自然语言处理□ChatGPT在工业自动化领域的探索PLC(Programmable

Logic

Controller),全称可编程控制器,相

当于微型计算机,通过接收指令控制各种类型的机械或生产过程,是制

造业在工业自动化时代进行转型升级的核心设备,其应用领域涵盖了整

个工业自动化过程的方方面面。

ChatGPT

与专业的PLC编程人员比,优

势在什么地方呢?为何西门子选择PLC

编程作为ChatGPT

与工业自动化

结合的突破口呢?39□

ChatGPT在工业自动化领域的探索一些业内用户就尝试过利用ChatGPT

生成PLC

代码,发现目前

ChatGPT

已经能够进行简单的代码编写,随后我们也进行测试,让

ChatGPT用梯形语言生成西门子的S7-200PLC的程序,效果如下。好的,这皇一个简单的西门子S7-400

PLC程序,使用LD

语言来实现十字路口的红缘灯控制,它将缘灯持

续30秒,红灯持续20秒,黄灯持续3秒,//绿灯A10.0■90,0TINTO00000//黄灯AT0■40.1TMT

130001/红灯AT1=90.2TOM

T

20000//循环AT2=数0.0请注意,这只是一个简单的示例程序,您可能需要根据您的具体需求进行修改.第六章工业人工智能案例一自然语言处理请帮我编写西门子S7-400

PLC的程序,来实现十字路口的红缘灯控制,30s绿灯,红灯20s,黄灯J3s.使用LD语吉40第六章工业人工智能案例一自然语言处理□

ChatGPT在工业自动化领域的探索ChatGPT

不仅根据指令写出了完整的逻辑结构,而且还在最后给了

用户提示:需要根据不同需求进行更改。根据西门子的理想成果,未来

ChatGPT

在PLC编程上能够实现根据自然语言生成PLC代码,并且只需

对其生成的程序进行检查测试,节省编写时间,并大大降低代码错误概率,节省代码修改时间。41主流PLC编程软件软件介绍西门子博图TIA

Portal博图TIA(TotallyIntegratedAutomation)Portal是西门子推出的一种全新的集成自动化工程软件,支持多种编程语言和硬件平台,包括S7-300,S7-400,S7-1200和S7-1500等系列PLC控制器。西门子step7西门子STEP7是基于SimaticS7系列PLC控制器的应用软件,主要包含SimaticManager和SimaticProgrammer两个部分:SimaticManager提供了PLC程序、人机界面、网络连接和诊断等各种工程工具的集成。而SimaticProgrammer则支持多种编程语言,以满足广泛的应用需求。三姜GXWorks三菱GXWorks是三菱电机推出的一款面向PLC编程的集成开发环境(IDE),支持多种编程语言,可以同时支持多种三萎电机的PLC控制器系列,例如FX,Q,L,iQ-R,iQ-F系列等,并且能够无缝协作。欧姆龙CX-ProgrammerCX-Programmer主要用于编写、调试和维护OmronPLC的程序代码,井提供了图形化界面及多种编程语言,如蛇形图、命令表等,支持包括CJ系列、CS/CV系列、CP系列等多种OmronPLC系列。施耐德UnityProXLUnityProXL作为施耐德电气PLC控制器编程软件的核心,支持多种编程语言,并提

供了图形化界面、仿真和调试功能,使得编程工作更加快捷和高效。支持多种PLC硬

件平台,例如Modicon系列PLC。基于OPEN

AI的技术,企业有望实现PLC编程的自动化,并且提高PLC编程的效率,同时也会大大降低PLC编程的门槛。但是,需要明确的

一点是,自动化编程技术需要有一个合理的框架和算法体系,才能在实

际应用中发挥良好的效果。下面介绍一些主流PLC编程软件:第六章工业人工智能案例一自然语言处理□

ChatGPT在工业自动化领域的探索42第六章工业人工智能案例一自然语言处理□

ChatGPT隐藏的风险与挑战自2023年3月11日韩国三星电子允许部分半导体业务部门员工使用

ChatGPT

开始,在短短20

天内便爆出了三起机密资料外泄事件。这表明

ChatGPT

在释放企业劳动力和提高工作效率同时所带来的风险与挑战也

是不可忽略的。具体表现在以下几方面:数据隐私泄露技术更新安全系统漏洞攻击43□

ChatGPT隐藏的风险与挑战成本挑战:除了信息安全外,运行成本也是企业使用ChatGPT

前需要考虑的重要条

件之一。下面例举了两项主要成本仅供参考。系统集成和应用成本·

将ChatGPT技术

整合到企业系统

中,需要大量的

工程实现和集成,

包括服务器的购

买、系统定制、

接口对接、测试

和调整等过程。

这些过程不仅需

要技术团队的投

入,还需要具体

的经费和时间成

本。人才培养成本●使用ChatGPT

术需要具备一定

的算法知识和自

然语言处理的背

景。企业需要培

养适应ChatGPT

术的人才,为其

提供培训和挖掘

潜力,不仅需要

一定的成本,也

需要时间投入。第六章工业人工智能案例一自然语言处理44第六章

工业人工智能6.6

工业人IN

U智ST能R

4.例0

分析(二)计算机视觉ConectionBig

DataCloudcomputing口计算机视觉的概念计算机视觉是人工智能的一个重要分支,它是研究计算机如何获取、

处理、分析和理解数字图像的技术。简单来说,,计算机视觉的研究者试

图让计算机拥有像人类一样感知视觉世界并从图像中了解场景和环境的第六章

工业人工智能——案例分析能

力。46□图像与数字图像√图像定义为二维函数f(x,y),其中x、y是空间坐标,f(x,y)是点(x,y)

。√灰度图像是一个二维灰度(或亮度)函数f(x,y)。√彩色图像由三个(如RGB)二维灰度(或亮度)函f(x,y)组成。第六章

工业人工智能——案例分析y

·47√数字图像由二维的元素组成,每一个元素具有一个特定的位置(x,y)和分量幅值f(x,y),这些元素就称为像素。√灰度图像每个像素的亮度用一个数值来表示,通常数值范围在0到255之间,0表示黑、255表示白,其它值表示处于黑白之间的灰度。√彩色图像可以用红、绿、蓝三元组的二维矩阵来表示。通常,三元组的每个数值也是在0到255之间,0表示相应的基色在该像素中没有,而255则代表相应的基色在该像素中取得最大值。第六章

工业人工智能——案例分析y48训练图片评估分类器分类器新图片□图像分类与特征提取将图像分类到不同的类别,如狗、猫、人等。它利用机器学习技术训

练一个分类器,然后对新图像进行预测和分类。图像分类是计算机视觉最

基本的任务。第六章

工业人工智能——案例分析抽取图像

特征特征表示特征表示学习类别49特征提取就是对图片进行数值处理,转换成计算机可理解的特征,常用特征提取方法有:HSV直方图、方向梯度直方图

(HistogramofOriented

Gradients,HOG)、局部二值模式

(Local

Binary

Pattern,LBP)。HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(HexconeModel)。这个模型中颜色的参数分别是:色调

(H),

饱和度

(S),

亮度

(V)。第六章

工业人工智能——案例分析50色调H:用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄

色为60°,青色为180°,品红为300°;饱和度S:

取值范围为0.0~1.0;亮度V:

取值范围为0.0(黑色)~1.0(白色)。第六章

工业人工智能——案例分析Hue511第六章

工业人工智能——案例分析HSV特征提取就是将图像所有像素的RGB值转化为HSV格式,并将HSV值量化后一维展开。H:2°0.24V:

0.55大约在HSV

空间中的这个位置52HOG特征描述符基于图像局部区域的梯度方向直方图来表示图像特征。它通过计算图像中不同方向上的梯度强度和方向,将它们组织成直方

图的形式,从而形成特征向量。这个特征向量能够捕捉到图像中的边缘、纹理等结构信息,从而用于图像识别和目标检测等任务。最早由法国研究员Dalal

等在CVPR-2005上提出,用于解决人体目标检测问题。第六章

工业人工智能——案例分析53Normalisegamma&colourCompute

gradientsCellAccumulate

weighted

votesfor

gradient

orientation

overspatial

cellsBlockNormalise

contrast

withinoverlapping

blocks

of

cellsof

BlocksCollect

HOGs

for

all

blocksover

detection

window主要步骤:灰度化和gamma校正

-

>计算梯度

-

>统计cell

的梯度方向直方图->Block

块内归一化-

>生成HOG特征。Inputimage第六章

工业人工智能——案例分析Feature

vector,f=Overlap54优

:1、HOG表示的是边缘(梯度)的结构特征,因此

可以描述局部的形状信息;2、采取在局部区域归一化直方图,可以部分抵消

光照变化带来的影响。3、由于一定程度忽略了光照颜色对图像造成的影

响,使得图像所需要的表征数据的维度降低了。4、分块分单元的处理方法使得图像局部像素点之

间的关系可以很好得到的表征。缺

:1、描述子生成过程冗长,导致速度慢,实时性差;2、很难处理遮挡问题;3、由于梯度的性质,该描述子对噪点相当敏感;4、只使用灰度图像,未考虑颜色信息。第六章

工业人工智能——案例分析55LBP(Local

Binary

Pattern,

局部二值模式)是一种用来描述图像局部纹理特征的算子,它具有旋转不变性和灰度不变性等显著的优点。

它是首先由T.0jala,M.Pietikäinen

和D.Harwood

在1994年提出,用

于纹理特征提取。而且,提取的特征是图像的局部的纹理特征。第六章

工业人工智能——案例分析(a)原始图像

(b)LBP

图谱56第六章

工业人工智能——案例分析主要步骤:(1)首先将检测窗口划分为16×16的小区域

(cell);(2)对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行

比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否

则为0,产生的8位二进制数即该窗口中心像素点的LBP值;(3)然后计算每个cell

的直方图,即每个数字(假定是十进制数LBP值

)

出现的频率;然后对该直方图进行归一化处理。(4)最后将得到的每个cell的统计直方图进行连接成为一个特征向量,

也就是整幅图的LBP纹理特征向量。44326111819283

204174250000IIII(01111100)10=12457□图像分割√在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣,这些部分一般称为目标或前景。√

为了辨识和分析目标,首先需要将有关区域分离提取出来,在此基础上

对目标进一步利用,如进行特征提取和测量,最后才是识别。√

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术第六章

工业人工智能——案例分析和过程。58基本思路:从简到难,逐级分割·控制背景环境,降低分割难度;·注意力集中在感兴趣的对象,缩小不相干图像成分的干扰。第六章

工业人工智能——案例分析提取轮廓车牌定位车牌识别59·分割的三大类方法√

根据区域间灰度不连续搜寻区域之间的边界,即基于边缘检测的图

像分割;√

以像素性质的分布进行阈值处理,即基于阈值的图像分割;√

直接搜寻区域进行分割,即基于区域的图像分割。第六章

工业人工智能——案例分析60基于边缘检测的图像分割算法是通过检测包含不同区域的边缘来解决分割问题。它可以说是人们最先想到也是研究最多的方法之一。Prewitt和Sobel算法是最常用的两种边缘检测算法,

Prewitt

算法比

Sobel算法简单,但Sobel算法能够有效抑制噪声。第六章

工业人工智能——案例分析梯度算法的结果Prewitt算法Sobel算法61阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值作比较,最后将像素根据比较

结果分到合适的类别中。因此,该方法最为关键的一步就是按照某个准

则函数来求解最佳灰度阈值。原始图像9247332阈值低,对亮区效果好,暗区差473325阈值高,对暗区效果好,亮区差第六章

工业人工智能——案例分析7332562第六章

工业人工智能——案例分析分水岭分割方法,是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,灰度值高的区域可以

被看成是山峰,灰度值低的区域可以看成是山谷。我们向每一个山谷中

灌注不同颜色的水。随着水位的升高,不同山谷的水就会相遇汇合,为

了防止不同山谷得到水汇合,我们需要在水汇合的地方构建起堤坝。不

停的灌水,不停的构建堤坝直到所有的山峰都被水淹没。我们构建好的

堤坝就是对图像的分割。63目标航迹运动参数测量信息□目标跟踪与图像理解目标跟踪,就是指在图像序列中持续地估计出感兴趣的运动目标所在区域(

位置),形成运动目标的运动轨迹;有时还需要估计出运动目标的某些运动

参数(比如速度、加速度等)。第六章

工业人工智能

-案例分析多帧连续图像

目标跟踪器64目标跟踪的表示方法:》点表示:在图像中用一个点或点集来表示被跟踪目

标,这些点一般取为目标的质心、角点等。这种表示

方式通常使用在目标区域相对整个图像比较小或者目

标为只有几个到十几个像素的点目标的情况下。基本几何形状表示:目标被表示为一个矩形区域或椭圆区域,这种表示法可以描述目标的平移、仿射变

换或者投影变换,并且对刚体和非刚体目标都可以表

示。第六章

工业人工智能——案例分析65》

关节模型表示:当目标可以认为是由各个部位通过结点衔接到一起的时候,就可以用关节模型来表示,

而各个部位则可以用几何形状来表示。>

轮廓表示:目标的外边界称为轮廓,而轮廓内的区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论