版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
AI赋能未来:三大场
景深度解析目
录
CONTENTS01
人脸识别全景透视02
Apollo
RT6智驾揭秘03
AI对话与生成魔法人脸识别全景透视人脸识别的五大阶段广泛应用领域
技术框架概述人脸识别系统包含图像获取、人脸检
测、预处理、特征提取和识别匹配五
大阶段。每个阶段都至关重要,共同
构成了人脸识别的完整流程。人脸识别技术广泛应用于金融服务、
公安刑侦、自助服务和小区安保等领
域,为社会安全和便捷生活提供了有
力支持。从摄像头采集图像到最终确认身份,
人脸识别技术通过一系列复杂的处理
步骤,实现了高效准确的身份识别。人脸识别五大阶段速览图像获取与检测技术要点图像获取图像获取是人脸识别的第一步,通过摄像头或摄影机采集图像,为后续的人脸检测提供基础数据。硬件设备的质量直接影响图像的质量和可用性。人脸检测人脸检测利用机器学习算法,根据人脸的轮廓、肤色、纹理等特征,
在图像中定位人脸区域。OpenCV
提供的分类器能够高效完成这一任
务。预处理阶段对人脸图像进行扶正、增强和归一化操作,以解决光照、焦距、噪声等问题,确保图像质量和一致性。基于五官的特征提取通过分析人脸五官的大小、形状和间距等特征,提取关键数据。这种方法简单直观,但易受表情和姿态影响。基于模板的特征提取利用人脸五官的几何特征定义模板,通过能量函数优化参数,实现精确的特征提取。这种方法适用于复杂环境。基于代数方法的特征提取利用代数变换提取人脸图像特征,如特征脸方法,通过PCA
降维,捕捉人脸的主要变化,提高识别效率。预处理与特征提取策略预处理的重要性识别匹配通过计算特征向量与数据库中人脸图像的相似度,实现身份
识别。相似度越高,识别结果
越可靠。FisherFace算法结合PCA和LDA,既保留主要特征,又考虑分类特征,提高
了识别的准确性和鲁棒性。EigenFace
算法基于PCA降维,提取特征脸。该算法对光照条件敏感,但在
理想环境下识别效果良好。识别匹配与OpenCV三大算法代码实现详细解释关键代码,从图像读取到检测结果的显示,帮助听众快速掌握人脸检测的实现方法。案例背景通过实际案例展示如何使用OpenCV
进行静态图像的人脸检测,包括安装库、加载分类器、读取图像等步骤。案例:静态图像人脸检测实战构建检测函数编写人脸检测函数,加载预训练的分类器,为后续的人脸识别提供基础。生成训练集收集人脸图像数据,生成训练集,为模型训练准备数据。模型训练使用LBPH算法对训练集进行训练,生成人脸识别模型。身份识别利用训练好的模型进行实时身
份识别,通过置信度判断识别
结果。案例:LBPH身份识别全流程Apollo
RT6智驾揭秘技术突破Apollo
RT6以25万元的成本实现了城市复杂路况的无人驾驶,创造了量产无人车成本新低,推动了无人驾驶的商业化进程。项目历程从2013年百度启动无人驾驶项目到2022年Apollo
RT6发布,见证了无人驾驶技术的快
速发展和迭代。Apollo
RT6进化里程碑高精定位通过先进的定位技术,为无人驾驶车辆提供精确的全局坐标,确保行驶方向的准确性。决策规划根据感知数据,规划最优行驶路径,生成精确的轨迹,指导车辆行驶。执行控制通过精确的控制算法,实现车辆的转向、制动等操作,确保行驶的安全性和
稳定性。智能感知利用多种传感器,实时感知周围环境,包括
障碍物、车道线等信息,为决策提供数据支
持。四步闭环工作原理硬件冗余Apollo
RT6配备了七重硬件冗余系统,包括架构、传感器、计算单元等,确保在单点故障
时仍能安全运行。软件冗余软件层面搭载了故障诊断和风险降级体系,实时监测系统状态,及时处理潜在故障。安全理念全冗余设计体现了Apollo
RT6对安全的极致追求,为无人驾驶的广泛应用提供了坚实保障。整车全冗余安全体系平台特点
商业价值星河平台将AI算法、自动驾驶套件与车辆工
基于星河平台,百度能够快速开发出满足不程深度融合,实现了底盘、线控、域控制器
同场景需求的无人驾驶车辆,推动无人驾驶的统一设计。
的大规模商业化落地。星河平台技术架构检测效果通过实际测试,展示了YOLO
算
法在夜间场景下的车辆检测效果,验证了其高效性和准确性。数据处理将1000张图像按7:2:1比例划分为训练、验证和测试集,为模型
训练和评估提供数据支持。案例背景使用YOLOv8
算法在BDD100K数据集上进行夜间车辆检测,展
示了算法在复杂环境下的应用。案例:YOLO夜间车辆检测Al对话与生成魔法核心能力DeepSeek
在文生文、文生图、文生视频、
代码生成、思维导图等领域表现出色,展
现了强大的生成能力。技术基础依托自然语言处理、深度学习和大数据分
析技术,DeepSeek
能够实现跨模态生成和
实时交互。应用范围DeepSeek
广泛应用于内容创作、办公自动
化、创意设计等多个领域,为用户提供了高
效便捷的解决方案。未来展望随着技术的不断进步,DeepSeek将在更多
领域发挥更大的作用,推动人工智能的发展DeepSeek
核心能力地图实际应用通过实际案例展示了DeepSeek
在文生文和大
纲生成方面的强大能力,为内容创作提供了
新的思路。文生文功能DeepSeek
能够根据用户输入的关键词或主题,快速生成高质量的文本内容,如诗歌、
新闻报道等。大纲生成DeepSeek
可以生成PPT
大纲,并与Kimi
软件
联动,自动生成完整的PPT,提高工作效率。文生文与大纲生成实例游戏开发结合PyCharm,DeepSeek
生成的代码可以直接运行,快速开发出简单的游戏,如俄罗斯方块。代码与游戏一键生成代码生成DeepSeek
能够根据用户需求生成可运行的Python
代码,降低了编程门槛,提高了开发效率。思维导图生成DeepSeek
生成的Markdown
大纲可以导入Xmind,快速生成思维导图,帮助用户梳理知识体系。视频生成结合即梦Al,DeepSeek
可以将文字描述和静态图片渲染成动态视频,为创意设计提
供了新的工具。实际案例通过实际案例展示了DeepSeek在思维导图和视频生成方面的应用,激发了用户的创造思维导图与视频联动01020304文生图功能3D
卡通风格中国农村少女美国女孩豆包能够根据用户输入的文生成3D
卡通风格的哪吒图像生成中国农村少女图像,体生成美国女孩图像,展示了字描述,快速生成对应的图,展示了豆包在卡通形象生现了豆包对不同文化背景和豆包在生成不同风格和场景像,展现了强大的生成能力成方面的独特能力。人物特征的精准把握。图像方面的灵活性。豆包文生图三连击■M■题显臣量器疆影模型架构ChatGPT
基于Transformer
解码器架构,通过自注意力机制并行处理token
序列,提高了处理效率。代码实现通过加载预训练模型和生成对话的代码示例,展示了ChatGPT
的使用方法和生成效果。ChatGPT原理解析总结与展望
技术总结人脸识别、Apollo
RT6和DeepSeek
展示了AI在感知、决策和生成领域的强大能力,为未来发展奠定了基础。跨学科融合强调跨学科融合的重要性,通过结合不同领域的技术,推动人工智能的
创新和发展。未来展望展望未来,AI
将在更多垂直场景落地,为社会带来更多的便利和变革。第十二章
案例应用
12.1
人脸识别人脸识别过程
人脸识别函数
OpenCV案
例二
:识别出某一幅图像中的人脸身份信息CONTENTS目录案例
一
:检测某一幅图像
中的人脸区域0102
03
04人脸识别过程人脸识别过程人脸识别五阶段概览人脸识别系统包含五大阶段:图像获取、人脸检测、图像预处理、特征提取与
人脸识别,具体如图1所示。图像获取通过摄像头采集图像,人脸检测定位人脸区域
,预处理优化图像质量,特征提取提取关键特征,人脸识别则将特征与数据库比对完成身份判定。图像获取
人脸检测
人脸图像预处
理图
1人脸识别系统流程图人脸特征
提取人脸识别图像获取与人脸检测图像获取图像获取是人脸识别的第一步,通常通过摄像头或摄影机完成。摄像头的分辨率和帧率对图像质量有直接影响,高质量的图像获取设备能够提供更清晰、更稳定的图像,为后续的
人脸检测和识别提供更好的基础。分类器名称说
明haarcascade_frontalface_default.xml正面人脸分类器(默认)haarcascade_frontalface_alt2.xml正面人脸分类器(Har方法)haarcascade_profileface.xml侧脸分类器haarcascade_smile.xml笑脸分类器haarcascade_eye.xml眼睛分类器haarcascade_lefteye_2splits.xml左眼分类器haarcascade_fullbody.xml身体分类器人脸检测在已获取的图像中,采用机器学习算法,根据人脸的轮廓、肤色、纹理、结构
或直方图等特征检测图像中的人脸区域。
目前,opencv
python
扩展库提供了正面
人脸、侧脸、笑脸、眼睛、身体等分类器
,分类器名称和分类器说明见表1。表1
opencv-python扩展库包含的分类器及其说明人脸图像预处理经过第2步检测到的人脸图像容易受距离、焦距、光线、噪声等因素影响,导致出现人脸图像大小不一致、图像模糊、图像曝光过度
等情况。为了保证人脸大小、位置及人脸图像质量一致,必须对人脸
图像进行人脸扶正、人脸图像增强和归一化等预处理操作。●
基于模板的特征提取该方法利用人脸五官的几何特征定义一个人脸模板,这些几何特征可以通过虹膜中心、内眼中心
、外眼中心、鼻尖点、鼻孔点、耳屏点、耳下点、口角点、头顶点、眉内点和眉外点等关键点获得。人脸关键点分布如图2所示。
图2
人脸72关键点分布图人脸图像特征提取●
基于五官的特征提取该方法通过对人脸的五官
眉毛、眼睛、耳朵、鼻子、嘴巴
大小、形状,以及五官之间的距离、角度等特征数据来提取,这种方法容易受人脸表情和人脸姿态的影响。人脸图像特征提取●
基于代数方法的特征提取方法这类方法利用代数变换来提取人脸图像特征,无须提取眼睛、鼻子、嘴巴、眉毛等五官几何特征,其中比较经典的方法是特征脸方法。特征脸方法依据K
L变换,可以将协方差矩阵分解,将原始图像变换到一个新的维数较低的特征空间。它通过计算机矩阵的特定值和特征向量,利用人脸图像的代数特征信息来提
取人脸五官特征。人脸识别经过人脸特征提取阶段后,获得人脸图像特征数据向量,我
们
就可以采用机器学习方法将这些特征向量与人脸数据库中存在的人脸图像进行逐
个匹配、相似度计算。相似度越高,就越可能是我们要识别的人脸;相似
度越低,则越可能不是我们想要找的人脸。OpenCV算法三大核心算法简介目前,opencv-python扩展库提供三种人脸识别算法:
EigenFace(特征脸)算法、线性判别分析FisherFace算法和LBPHFace算法。一
、
EigenFace
算法基于PCA
降维技术,通过计算人脸图像的协方差矩阵的特征向量,得到“特征脸”
。每张人脸都可以表示为这些特征向量的线性组合,从而实现人脸的识别与分类。该算法对光照和表情变化较为敏感。二
、
FisherFace算法结合了PCA
和LDA
算法的优点,通过最大化类间距离和最小化类内距离来提高人
脸识别的准确性。该算法在处理多类别人脸识别时表现出色,适用于中小规模的人脸库。三
、LBPHFace
算法基于局部二值模式直方图,对图像的局部纹理特征进行编码,形成直方图作为特
征向量。该算法对光照、旋转等变化具有较强的鲁棒性,适用于各种复杂场景。EigenFace算法EigenFace
原理EigenFace
算法利用PCA
算法对人脸图像的协方差矩阵进行特征值分解,得到特征向量即“特征脸”。每张人脸都可以表示为这些特征向量的线性组合,通过计算特征向量
之间的距离来判断是否为同一人。局限性EigenFace
算法对光照条件、人脸表情和姿态等变化较为敏感。由于其主要捕捉图像的主成分变化,因此在光照不均匀或表情变化较大的情况下,识别准确率会显著下降O
FisherFace算法FisherFace原理FisherFace算法是由现代统计学奠基人之一罗纳德
·
费希尔(Ronald
Fisher)提出的,故称为FisherFace算法。FisherFace
算法是基于线性判别分析(Linear
Discriminant
Analysis,LDA)算法实现的。
LDA
算法的基本思想是:将高维样本数据投影到最佳分类的低维向量空间,保证数据在新的
子空间中类间距离更大和类内距离更小。优点FisherFace算法结合了PCA
和LDA
算法的优点,既保留了原始人脸空间数据绝大部分的
主要特征,又考虑到原始图像不同类别的分类特征,并在此基础上实现了原始人脸空间向特
征空间的转换,最终形成FisherFace特征向量。LBPHFace算法LBPH(Local
Binary
Patterns
Histograms,局部二进制编码直方图是基于提取图像特征的LBP算子。该算法的主要原理如下:第1步:使用LBP
算子提取图像特征,这样可以获取整个图像的LBP图像O第2步:将LBP图像分为若干区域,获取每个区域的LBP直方图,从而得
到整个图像的LBP直方图,即得到人脸图像特征向量。LBPHFace
算法的优点①该算法能够在一定范围内减少因为没完全对准人脸区域而造成的误差。②可以根据不同的区域赋予不同的权重系数,如人脸图像往往在图像的中心区域,因此,中心区域的权重往往大于边缘区域的权重。③LBPHFace
算法不受光照、缩放、旋转和平移等因
素的影响,识别准确率高,通用性能好。OpenCV
扩展库含有人脸识别包opencv
contrib
python,该包提供了上述三种人脸识别方法对应的函数,主要包括EigenFaceRecognizer_create、FisherFaceRecognizer_create、
LBPHFaceRecognizer_create
人脸识别模型函数,具体见表2。表2OpenCV扩展库的三种人脸识别模型函数函
数
名说
明EigenFaceRecognizer_createEigenFace人脸识别模型函数FisherFaceRecognizer_createFisherFace人脸识别模型函数LBPHFaceRecognizer_createLBPHFace人脸识别模型函数检测某一幅图像中的人脸区域案例
一
:案例一:检测某一幅图像中的人脸区域人脸检测就是从采集到的图像Picture01.jpg中检测出有人脸的区域。我们从网上下载他人训练好的人脸分类器haarcascade_frontalface_default.xml,
并把Picture01.jpg和haarcascade_frontalface_default.xml放至源程序所在的文件夹下。人脸检测流程图如图3所示。导入人脸分类器读取测试图像将图像转换成灰度图未检测到人脸图像中某个矩形区域是否有人脸?检测到人脸画出人脸矩形框图3
人
脸
检
测
流
程
图01.02.03.04.05.06.07.08.09.10.11.import
cv2import
numpy
as
NpFaceCascade=cv2.CascadeClassifier('haarcascade_frontalface_default.xml’)
Img
=cv2.imread('Picture01.jpg')Gray=cv2.cvtColor(Img,cv2.COLOR_BGR2GRAY)Faces=faceCascade.detectMyltiScale(Gray,1.3,5)for(x,y,w,h)in
Faces:cv2.rectangle(Img,(x,y),(x+w,y+h),(0,0,0),1)cv2.imshoow('Pic',Img)cv2.waitKey(0)cv2.destroyAllwindows()案例一:检测某一幅图像中的人脸区域人脸检测的具体操作步骤如下:第1步:安装opencv-python
扩展库。pip3
installopencv-python第2步:根据人脸检测流程图编写参考代码。参考代码12.1实现人脸检测:
案例一:检测某一幅图像中的人脸区域在代码12.1中,第3行代码用来构建人脸分类器FaceCascade;
第4行代码用来读取源代码所在的文件夹下的Picture.jpg文件;第5行代码把图像转换
成灰度图;第6行代码对灰度图Gray
按搜索窗口比率系数1.3、相邻矩阵最小
个数为5的扫描方式检测人脸,并返回检测到的人脸矩形向量数组;第7、8行
代码用于遍历已检测到的向量数组,在图像Img
中画出相应的人脸矩形框;第
行代码用于显示绘制有人脸矩形框的图像。识别出某一幅图像中的人脸身份信息案
例二
:训练人脸识别模型人脸检测否相似度大于某个阈值?是输出人脸身份信息案例二:识别出某一幅图像中的人脸身份信息现有4人人脸图像信息,请通过LBPHFace算法准确识别出待测试的人脸身份信息。人脸身份识别流程:先采集4人人脸图像(每个人有8张人脸图像),并进行人脸样本训练,然
后随机拍照进行人脸身份识别,如图4所示。图4
人
脸
身
份
识
别
流
程
图显示“人脸信息未识别”随机拍照获得一幅图像准备4人人脸图像人脸识别案例二:识别出某一幅图像中的人脸身份信息根据上述人脸身份识别流程图,我们把人脸身份识别分成4步,详细步骤如下:第1步:构建一个人脸检测分类函数Get_Face_Cascade。构建一个人脸检测分类函数Get_Face_Cascade(Model_File),
为后期实现人脸检测提供接口。注意:这里的Model_File应输入从OpenCV扩展库下载的人脸模型训练集的路径,名
称
为haarcascade_frontalface_default.xml。参考代码12.2
构建人脸检测分类函数Get_Face_Cascade,
返回人脸向量:01.02.03.04.05.06.07.import
cv2import
osimport
numpy
asNp#定义一个人脸检测分类函数,函数名为Get_Face_Cascadedef
Get_Face_Cascade(Model_File):#通过CascadeClassifier函数加载预先训练好的级联库Model_FileFaceCascade=cv2.CascadeClassifier(Model_File)return
FaceCascade01.02.03.04.05.06.07.08.09.10.11.12.13.14.15.import
cv2importos#引入操作系统接口库,该库包含文件目录读取函数#定义人脸身份数据训练集函数,函数名为Get_Faces_Traindef
Get_Faces_Train(File_Path,Model_File):#向量Images用于存放人脸图像数据Images
=[]#向量Ids用于存放人脸身份编号信息Ids
=[]#向量Names用于存放人脸身份姓名信息Names
=[]#调用Get_Face_Cascade函数获得检测到的人脸向量FaceCascade=Get_Face_Cascade()#利用OS把每幅图片的路径保存到ImgPaths里ImgPaths=[os.path.join(File_Path,f)forf
inos.listdir(File_Path)]#遍历File_Path下所有目标人物图像文件案例二:识别出某一幅图像中的人脸身份信息第2步:生成目标人脸数据训练集。构建一个函数Get_Faces_Train(File_Path,Model_File)来生成目标人脸数据训练集,通常采用目标对象的人脸数据和身份数据作为人脸识别模板的训练集。注:此处的File_Path为用于训练的人脸图片存放的路径。参考代码12.3
生成目标人脸数据训练集:26.27.28.29.30.31.32.33.34.35.36.37.#因为一个人的照片有很多张,所以录入过的名字就不再录入了if
Name
not
in
Names:Names.append(Name)Faces=FaceCascade.detectMultiScale(img_numpy,1.3,3)for(x,y,w,h)in
Faces:Images.append(img_numpy[y:y+h,x:x+w])Ids.append(id)#保存人脸图像数据Images.append(img_numpy[y:y+h,x:x+w])#保存人脸身份信息数据Ids.append(id)return
Images,Ids,Names#调用Get_Faces_Train函数生成目标人脸身份数据集,返回人脸图像和身份编
号Images,Ids=Get_Faces_Train('data/persons/,'haarcascade_fontalface_
default.xml')16.17.18.19.20.21.22.23.24.25.for
File_Path
in
ImgPaths:#读入人脸图像PIL_img=Image.open(FilePath).convert('L’)#打开图像并转换成灰
度图img_numpy=Np.array(PIL_img,'uint8')#把图像转换为数组#把文件的名字以“_”为标准进行划分,得到人脸对应的序号Id(图片命名方
式为“姓名_序号_第几张图片”,例如,吴京序号0第2张照片命名方式为“吴
京_0_2”)Id
=int(os.path.split(FilePath)[1].split("_")[1])#操作同上,得到并保存人脸姓名Name
=os.path.split(FilePath)[1].split("_")[0]案例二:识别出某一幅图像中的人脸身份信息案例二:识别出某一幅图像中的人脸身份信息第3步:训练人脸身份模型。采
用LBPHFace
算法对第2步获得的人脸图像训练样本集进行训练。参考代码12.4训练人脸身份模型:01.import
cv202.#创建LBPHFace人脸识别模型FaceRecognizer03.FaceRecognizer=cv2.face.LBPHFaceRecognizer_create()04.#对人脸图像数据、身份数据进行训练05.FaceRecognizer.train(Images,Np.array(Ids))06.#将训练好的人脸分类模型进行保存,文件名为LBPFaceRec.xml07.FaceRecognizer.save('data/Models/LBPHFaceRec.xml')案例二:识别出某一幅图像中的人脸身份信息第4步:利用训练好的人脸身份模型来测试新的人脸。通过读取一幅人脸图像来识别该人脸,并显示这个人的身份信息。(函数中的路径请根据自己的设置来填写。)参考代码12.5实现人脸身份识别:13.
Faces=FaceCascade.detectMultiScale(Test_Gray,1.3,3)14.
x,y,w,h=Faces[0]15.
#调用predict函数测试图像,在人脸数据库中进行人脸评分16.
Score=FaceRecognizerTest.predict(Test-Gray[y:y+h,x:x+w])17.#如果评分小于95分,就认为识别成功,并输出识别出的人脸对应的id与姓名18.if
Score<95:19.
print(id)20.
print(Names[id])21.
print(Score)22.else:23.
print(Score)24.
print("人脸信息未识别")01.import
cv202.
#引入人脸分类器,存放在FaceCascade中03.
FaceCascade
=Get_Face_Cascade(Model_File)04.
#创建LBPHFace人脸识别模型FaceRecognizerTest05.
FaceRecognizerTest=cv2.face.LBPHFaceRecognizer_create()06.
#读取人脸识别模型LBPHFaceRec.xml07.
FaceRecognizerTest.read('data/Models/LBPHFaceRec.xml')08.
#测试人脸图像Test_People.jpg09.
Test_Image=cv2.imread('data/Test_People.jpg')10.
#把测试人脸图像Test_Image转换成灰度图11.
Test_Gray=cv2.cvtColor(Test_Image,cv2.COLOR_BGR2GRAY)12.#对读取的灰度图像进行人脸检测,把结果放在Faces中98%52%人脸库43%案例二:识别出某一幅图像中的人脸身份信息人脸识别测试效果如图5所示:图5
人脸识别测试效果第十二章
案例应用
12.2无人驾驶车Apollo
RT6目
录C
ONTENTS》01
Apollo
RT6进化史》02
Apollo
RT6无人驾驶车工作原理》
03Apollo
RT6无人驾驶车整车全冗余系统技术
》
04
Apollo
星河平台技术》05
案例
采用YOLO
算法检测小轿车Apollo
RT6进化史从阿波龙到RT6的六年跃迁项目启动2013年,百度公司启动无人驾驶汽车项目,开启智能交通探索之旅。阿波龙落地2018年10月,首台阿波龙无人驾驶小巴在武汉龙灵山公园投入运营,迈出商业化第一步。技术迭代2019年
8月,第二代阿波龙亮相重庆智博会,2021年2月
,广州黄埔区推出自动驾驶MaaS
平台,技术不断升级。RT6
发布2022年7月,第六代无人车Apollo
RT6如右图所示发布
,成本仅25万元,刷新量产无人车成本纪录,开启大规模
商用新阶段。Apollo
RT6无人驾驶
车工作原理和国外的自动驾驶车相比,Apollo
RT6无人驾驶车最大的特点在于自身可以智能感
知周围环境并做出相应的精确反应,最终完
成自动到达目的地的使命。Apollo
RT6无人驾驶车完成无人驾驶行
为,需要经过高精定位、智能感知、决策规
划、执行控制四个步骤,如图1所示。Apollo
RT6无人驾驶车工作原理图1
百度ApolloRT6无人驾驶汽车
工作原理示意图Apollo
RT6无人驾驶车整车全冗余系统技术Apollo
RT6无人驾驶车整车全冗余系统技术作为Apollo
最新一代无人驾驶系统,ApolloRT6具备更强的4级——高级自动驾驶能力,全车配备了38个车外传感器,包含8个激光雷达、6个毫米波雷达、12个超声波雷达、12个摄像头等设备。百度Apollo
RT6无人驾驶汽车如图2所示图2百度Apollo
RT6无人驾驶汽车OApollo
RT6无人驾驶车整车全冗余系统技术为了支撑这些传感器设备,百度Apollo
RT6提升了算力水平,匹配算力达到1200tops(TeraOperations
Per
Second,处理器运算能力单位。在多传感器融合、高计算力的背后,百度的核
心目标是真正实现无人驾驶车量产。为了保证整车安全,Apollo
RT6主要从硬件和软件两个层面来实现整车全冗余。①硬件方面有七重全冗余整车系统,包括架构冗余、传感器冗余、计算单元冗余、制动系统
冗余、转向系统冗余、电源冗余及行业首创的双5G
通信冗余。②软件方面搭载了整车自动驾驶系统一体的故障诊断及风险降级体系。Apollo星河平台架构平台理念星河平台将人工智能、自动驾驶技术与车辆工程深度融合,涵盖线控底盘、域控制器、传感器套
件及软件栈。快速研发支持快速衍生不同场景车型,通过模块化设计缩短研发周期、降低边际成本,推动无人驾驶商业
化。感知:传感器
算力:计算机架构的变革算力:决策+底层基础域控制器中央计算单元人工智能汽车Apollo星河平台架构图3
星河平台整体框架图YOLO
算法检测案例YOLO
算法原理简介YOLO(You
Only
Look
Once)是目标检测的主流算法,即只需要看一次图像就可以识别出图像中的物体类别和位置信息。经过美国UItralytics公司的深入研究和不断更新,YOLO算法已升级
到YOLOv8版本,并于2023年1月10日发布,它可以完成图像分类、物体检测、实例分割等任务OYOLO
算法也是基于监督学习算法,每张图像的监督信息是它所包含的每个物体的5个特征值
,包括物体的中心位置(x,y)、
高(h)、宽(w)
及物体类别信息。YOLO
算法的检测是基于整张图像的,并且会一次性输出所有检测到的目标类别、目标位置等信息。而在YOL
O之前,常用的算法是先通过不同尺寸大小的窗口在图像上进行滑动,对每个物体进行检测和识别,通过设计不同大小的窗口,让这些窗口按照最小的步长滑动,把窗口里所有的图像放到分类器中一一进行检测。YOLO算法工作原理第1步:分割图像。将图像分割为aa个格子(grid),
每个格子的大小尺寸都是相等的。第2步:每个格子生成一个边界框(bounding
box)。让aa个格子都检测出B
个边界框,每个边界框都有5个特征值,分别为物体的中心位置坐标值、y坐标值、高(h)、宽(w)
及这次预测的
置信度。每个格子有多个边界框,但只能识别出一个物体,因此每个格子需要预测物体的类别,而边界框不需要。详细地说,我们现有aa
个格子,每个格子有B个边界框,如果分类器可以识别出A种不同物体,
那
么整个图像的真实数据(ground
truth)为aa(B5+A)
个。图4和图5是一张720像素1280像素的图像,把其分成66的格子,每个小方格尺寸为120213,小车的尺寸为121142,展示了计算x,y,w,h的真实数据的过程。groundtruth信息:物体中心X1相对坐标=71/213=0.34;
物体中心Y1相对坐标=60/120=0.50;
物体的相对宽度W1=142/1280=0.11
物体的相对高度H1=121/720=0.17置信度PYOLO算法工作原理图5
YOLO划分格子、检测小车图(2)图4
YOLO划分格子、检测小车图(1)YOLO算法工作原理YOLO
算法检测小轿车的工作原理如图6所示。bounding
boxes+confidence7x7grid
on
input
final
detectionsclassprobability
map图6YOLO算法检测小轿车原理图BDD100K
数据集简介2018年,美国加州大学伯克利分校AI
实验室发布了计算机视觉领域到目前为止规模最大、最多样化的开源视频数据集——BDD100K
数据集。该数据集由10万个视频组成,每个视频大约长40s,分辨率为720P,
帧速率为3Ofps,
总时长超过1100小时。视频序列还包括GPS
位置、IMU
数据和时间戳,视频带有由手机记录的GPS/MU
信息,以显示粗略的驾驶轨迹。这些视频来自美国不同地区、不同的天气状况、不同时间段的场景。该实验室还对每个视频第10s的关键视频帧进行采样,得到10万张图片图片尺寸为
1280像素720像素,并对每张图片标注被检测对象中心坐标、
y
坐标、高度、宽度和置信度特
征值。BDD100K数据集中的12张数据图如图7所示,数据集与当前主流数据集的对比详见表1。特
点样本
集KITTICityScapesApolloScapeMapillartBDD100K序列数22504N/A100000图像数14999700014390625000120000000是否覆盖多个
城市NoYesNoYesYes是否涉及不同天气NoNoNoYesYes是否涉及多个时间段NoNoNoYesYes是否覆盖多个
场景YesNoNoYesYesBDD100K
数据集简介表1
显示了BDD100K数据集和当前主流数据集的对比结果图7
BDD100K数据集中的12张数据图00ca8821-db8033d5.jpg00c50078-6298b9c1.jpg00ce6f6d-50bbee62.jpg00ccf2e8-ac055be6.jpg00ccf2e8-f8c69860.jpg00ca8821-17667a58.jpg00cb28b9-08a22af7.jpg00c87627-b7f6f46c.jpg00ccf2e8-59a6bfc9.jpgYOLO算法检测小车案例考虑到该数据集数据量巨大、需要较高的计算机配置等因
素,特从该数据集中选取1000张图像数据,按照7:2:1的
比例进行训练、验证和测试实验。其中,700张图像数据作为训练数据
集,200张图像数据作为验证数据集,100张图像数据作为测试样本集。YOLO
夜晚场景小车检测实景如图8所示。图8
YOL0夜晚场景小车检测实景图YOLO算法检测小车案例小车检测详细步骤如下:第1步:随机选取1
000张图像数据,分配700张图像作为训练数据集,选取200张图像作为
验证数据集,剩下100张图像作为测试样本集。第2步:对700张图像数据进行训练,训练出合理的小车检测模型。小车训练代码见附录B
中
的参考代码121。第3步:采用第2步训练出的小车检测模型对100个测试样本进行测试。小车检测代码见附录
B
中的参考代码126。BDD
100K小车检测效果评价如图
所示。100metrics/mAP50-95(B)0.50.40.30.050
100val/box_loss100val/dfl_loss100train/box_loss100YOLO算法检测小车案例metrics/precision(B)100metrics/mAP50(B)0.80.60.40.20.050100val/cls_loss1000
100train/dfl_loss50图9
BDD100K小车检测效果评价4.03.53.02.52.01.5train/cls_lossmetrics/recall(B)100第十二章
案例应用
录CONTENTSAl聊天机器人概览DeepSeek
文生文案例DeepSeek+Kimi
生成PPT案例DeepSeek+Pycharm
生成游戏案例目》01》02》03》04录C
ONTENTSDeepSeek+Xmind
生成思维导图案例DeepSeek+
即梦Al
生成视频案例豆包文生图案例基于Transformer
的生成式对话模型案例目》05》
06》07》08Al聊天机器人概览主流AI聊天机器人目前市场上常见的AI聊天机器人有DeepSeek、豆
包
、Kimi
、
腾讯元宝和ChatGPT等。其中,DeepSeek
凭借自然语言处理、机器学习与深度学习等核心技
术,在推理、自然语言理解与生成、图像与视频分析等多个领域表现出色,能够为
用户提供更精准、更个性化的服务。Al聊天机器人全景速览Al聊天机器人定义AI聊天机器人是一种基于自然语言处理技术的智能交互工具,能够根据用户输入的文字描述,快速生成文本、图像、视频、音频等多种形式的媒体内容,满足不
同场景下的信息需求。DeepSeek
文生文案例DeepSeek
文生文案例DeepSeek
可以通过深度思考和联网搜索生成报告、散文、诗歌等不同形式的文章,包括但不限
于小红书图文、日报、海报等。文生文可以通过文
字生成相对应的文本。场景1:如果输入“写一篇关于‘春天’的诗歌,
100个字”,几秒就能生成一篇关于“春天”的中文
诗歌;如果输入“搜索出今天发生的10条人工智能
最火新闻,用于生成日报”,几秒就搜索出人工智
能10条最火的新闻,
DeepSeek
文生文如图1所示2.AI医疗在药物研发和诊疗中的突破5.
中国具身智能大会
(CEAI2025)开幕6.上海市智算云产业发展计划目标2000亿元7.
中关村论坛医学Al创新与发展论坛召开8.AI
制药企业英矽智能和晶泰科技新进展9.
人民网发布智能硬件“AI之眼”10.AI在资本市场受热捧,医疗板块大涨需要确认每个条目都有对应的网页引用,并确保没有重复。例如,网页3中的AI医疗包括药物研发、诊疗辅助和资本市场反应,可能需要分
为两条,但用户要求10条,可以分开。同时,件,应单独列出。网页5中的阿里巴巴开源模型以下是2025年3月28日关于Al领域的十大
热点新闻整理,按领域分类归纳:中国移动15:476
■
蟹常男
65
·生成一篇描写春天的诗歌,10...樱花踮起脚尖在墙头摇落最后一片雪柳枝蘸着南风写信墨迹未干,绿意就爬过惊醒了露珠的镜子蒲公英把秘密缝进行囊第一朵野花正推开冰的窗图1
DeepSeek文生文示例DeepSeek+Kimi
生成PPT案例DeepSeek软件
Kimi软件可以生成PPT、短视频等。首先,通过DeepSeek
生成某个主题的PPT
大纲,然后根据这个PPT
大纲使用Kimi软件
PPT助手功能生成相应的PPT。场景2:生成一份关于“人工智能的应用”的
PPT。首先,通过DeepSeek
生成制作“关于‘人工
智能应用’PPT大纲”内容;然后,使用Kimi软
件
PPT
助手功能根据这个PPT
大纲生成相应的PPT,
如图2所示。中国移动16:49DeepSeek+Kimi
生成PPT案例图2
DeepSeek生成“人工智能应用”PPT大纲及生成的PPTDeepSeek+Pycharm
生成游戏案例DeepSeek软件
Pycharm
软件可以开发多款游戏。首先,使用DeepSeek
生成相应的Python
代码;然后,把这个代码放到Pycharm软件上(提前安装游戏所需要的库),直接运行
即可,俄罗斯方块游戏代码及游戏界面如图3所
示
。场景3:生成俄罗斯方块游戏。DeepSeek+Pycharm
生成游戏案例图3
DeepSeek+PyCharm
生成俄罗斯方块游戏DeepSeek+Xmind生成思维导图案例DeepSeek
软件
Xmind
软件可以为用户生成思维导图。首先,使用DeepSeek
生成某个方向的某种格式
大纲
(md
格式大纲);然后,使用Xmind
软件导入这
个
md
格式的大纲。场景4:为人工智能的应用场景生成思维导图。第1步:在DeepSeek
上输入:“帮我整理一个人工智能应用场景的大纲,要求大纲结构清晰、逻辑合理、
大约60字,并适合用来制作思维导图,输出
md
格式的
大纲”,如图4所示。#人工智能应用场景##1
.
智慧城市-交通优化-环境监测##2
.
医疗健康-辅助诊断-影像分析##3
.
金融科技-智能风控-量化交易##4
.
工业制造智能质检预测维护##5
.
教育创新自适应学习-虚拟助教##6
.
零售消费-智能推荐无人零售##7
.
交通物流-自动驾驶-路径规划##8
.农业生态-精准种植
智能灌溉=DeepSeek+Xmind
生成思维导图案例图4
DeepSeek生成人工智能应用场景大纲及.md文件工
23456789101112131415161718192021222324252627282930313233o
图
扫喉DIc|□
当□人工智装应周场条=DeepSeek+Xmind
生成思维导图案例第2步:打开Xmind
软件,通过文件导入人工智能应用场景大纲
md
文件,不到10秒钟就生成人工智能应用场景思维导图,如图5所示。精准种植8.农业生态7.交通物流6.零售消费5.教育创新虚拟助教1.智慧城市2.医疗健康3.金融科技4.工业制造图5DeepSeek生成人工智能大纲思维导图人工智能
应用场景自动驾驶路径规划智能推荐无人零售智能风控量化交易智能质检预测维护辅助诊断影像分析交通优化环境监测自适应学习智能灌溉DeepSeek+
即梦AI生成视频案例DeepSeek+
即梦Al生成视频案例DeepSeek
即梦Al可以生成视频和动画。首先,用DeepSeek
生成视频的文字描述,然后,通过即梦Al
把DeepSeek
生成的文字描述和用户提供的图片生成用
户想要的视频或动画。场景5:生成小女孩在雪地里欢快玩雪的视频。第1步:通过DeepSeek
生输入:"为5岁的小女孩
生成在雪地上欢快玩雪的文字,80字,用于生成视频”
,生成的文字描述如图6所示。中国移动08:57日a
红常品
83小女孩雪地欢快玩雪场景印。同时要注意年龄,5岁的小女孩动作应该是
天真活泼的,比如略咯笑、拍手、蹦蹦跳跳。可能还需要一些比喻,让文字更生动,比如把
雪人比作圆肚皮将军,或者雪花像糖霜。颜色
方面,红棉袄、黄围巾、胡萝卜鼻子,这些色
彩对比鲜明,适合视频画面。还要注意字数,确保达到80字左右,可能需要分句更详细,加入更多动词和形容词。比如描述她如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年安徽国防科技职业学院高职单招职业适应性考试备考题库带答案解析
- 财险承保课件
- 2026年渤海理工职业学院单招综合素质考试备考题库带答案解析
- 护理文书规范书写与质量控制
- 医院药房人员礼仪与患者体验
- 2026年黑龙江旅游职业技术学院高职单招职业适应性考试备考题库有答案解析
- 慢性病患者的长期护理策略
- 2026年河北化工医药职业技术学院单招综合素质笔试备考题库带答案解析
- 护理人员在护理管理中的职责
- 医院导诊服务礼仪案例分析
- 电力企业突发事件应急处置案例分析
- 《性病防治知识讲座》课件
- 残疾人社区康复区建设方案模版(3篇)
- 山林地租赁合同书范例
- 钢筋工安全晨会(班前会)
- 2024版《中医基础理论经络》课件完整版
- 游戏公司运营风险控制预案
- 山东省临沂市2024-2025学年高二数学上学期期中试题
- DZ∕T 0248-2014 岩石地球化学测量技术规程(正式版)
- JTJ-T-257-1996塑料排水板质量检验标准-PDF解密
- 残疾人法律维权知识讲座
评论
0/150
提交评论