版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目五《可视化数据服务》VisualDataService项目导入CONTENTS目录项目背景及需求01Projectbackgroundandrequirements项目分解02Projectbreakdown职业岗位介绍03JobIntroduction项目背景及需求比如某电商公司的可视化工程师通过优化销售数据展示方式,帮助市场部提前发现了爆款商品趋势,这就是可视化价值的生动体现面对海量的数据,我们如何快速有效的得到数据中所传递的信息?同样的数据,可以用一张表格或者一张图片呈现,很明显,通过图形化方式呈现以后,信息更清晰明了的显示出来了。这就是数据可视化的意义所在。本章介绍了数据可视化的基础、基本图形类型和基本绘图流程。通过分阶段任务的方式,讲解了如何利用matplotlib库实现基本图形的绘制。让我们一起来探索数据可视化的内容,理解数据可视化的基本原理,掌握图形绘制的基本流程,让数据信息全面展现!项目分解21在数据可视化部分,选择开源票据数据集作为我们的可视化数据集,可以更好的体验票据数据可视化。该数据集为Kaggle平台上的开源数据集,数据集文本内容为英文购物小票。在完成图像标注后,研究员想了解标注数据的数据分布情况,探索数据的基本信息。在完成语音标注后,研究院想了解标注数据的数据分布情况,探索数据的基本信息。3职业岗位介绍数据可视化工程师通常需要具备如下的能力:01运用可视化工具对数据进行可视化展示;02进行企业相关产品数据可视化分析工作;03设计可视化方案,实现数据可视化分析服务。CONTENTS目录知识目标01Knowledgeobjectives能力目标02Abilitygoals素养目标03Literacygoals知识目标掌握基本图形类型及绘制;掌握数据可视化的原理和基本原则;掌握布局设置和画布创建及参数设置。010203目标能力目标具备根据不同数据选择适合的可视化方案的能力;具备使用可视化工具对数据进行可视化展示的能力;具备对可视化后数据进行分析的能力;010203目标目标素养目标具有强烈的责任心和吃苦耐劳精神;具有良好的职业道德和职业素养。0102目标感谢观看主讲教师:侯佳丽Thankyouforwatching项目五《数据可视化服务》主讲教师:候佳丽Datavisualizationservice任务一:票据数据可视化CONTENTS目录任务需求01Taskrequirements可视化需求02VisualizationrequirementS票据数据可视化03VisualizationofBillData任务需求面对海量的数据,我们如何快速有效的得到数据中所传递的信息?同样的数据,可以用一张表格或者一张图片呈现,很明显,通过图形化方式呈现以后,信息更清晰明了的显示出来了。这就是数据可视化的意义所在。任务需求在数据可视化部分,选择开源票据数据集作为我们的可视化数据集,可以更好的体验票据数据可视化。该数据集为Kaggle平台上的开源数据集,数据集文本内容为英文购物小票。数据可视化需求研究员想了解训练数据的数据情况,探索数据的基本信息:数据集内有多少张图像样本?
1数据集内最多和最少的文本框个数是多少?图像样本分别具有什么性质?3数据集图像的文本标签长度分布情况如何?5数据集中有哪些类别?和其他项目对比有什么区别?2数据集内图像的字符分布情况如何?4数据集图像的分辨率分布情况如何?6票据数据可视化操作1:
利用平台,读取数据集内测试集与训练集的样本数量。1.查看数据集的数量引用数据集中存储了可视化数据集,为开源票据数据集,后续也可以进一步探索标注阶段的数据集#标注数据集地址#训练图像文件夹地址TRAIN_DIR='/data/54JHKL/OCR_EDA_Data/OCR_Data/train/imgs'#测试图像文件夹地址TEST_DIR
='/data/54JHKL/OCR_EDA_Data/OCR_Data/test/imgs'#训练图像标注文件地址TRAIN_JS_PATH
='/data/54JHKL/OCR_EDA_Data/OCR_Data/train.json'#测试图像标注文件地址TEST_JS_PATH
='/data/54JHKL/OCR_EDA_Data/OCR_Data/test.json'#输出数据集数量(完成程序)
完成程序提示:利用"Os"程序库内函数读取数量。完成"notebook
文档”上的程序回顾pycocotoolspycocotools库(python
api
tools
of
COCO)
是专用于COCO数据集格式的加载、解析与可视化的工具。getImgIds(imgIds=[],catIds=[])获取图像id(可选参数为imgIds,catIds)。若设置catIds参数,则可以根据类别id获取该类别下的图像idloadImgs(ids=[])根据图像id获取图像信息getCatIds(catNms
=[])获取类别id(主要参数catNms),可根据类别名获取类别idloadCats(ids
=
[])根据类别id获取类别信息getAnnIds(imgIds=[],catIds=[])获取标注id(主要参数imgIds,catIds),可根据图像id,类别id获取标注idloadAnns(ids=[])根据标注id获取标注信息showAnns(anns)显示标注信息票据数据可视化票据OCR的coco
类
的json标签文件包含以下“3”个大部分:"iscrowd":0,"category_id":0,"bbox":[72,198,431,29"area":12499,72,198,503,198,503,227,72,2271,"image_id":0,"id":e,"textAttribute":"AIK
HUAT
HARDWARE",
"order":1"images":t"file_name":"X51887339643.jg",
"height":1659,"width":591,"segm_file":"X51087339643.txt","id":0},{"file_name":"X51006620191.jpg",
"height":1979,"width":884,"segm_file":"X51086620191.txt","id":1{"filename":"X51086414675.jpg","height":7016,"width":4961,"segm_file":"x51086414675.txt","id":2{"file_name":"x5185605285.jpg","height":1481,"width":697,"segm_file":"x51805605285.txt",
"id":3"categories":["id":0,}"name":"text""segmentation":["annotations":[},},数据集图像信息数据集类别信息数据集标注信息"categories""annotations""images"票据数据可视化对比两个不同项目json
标签文件内的"categories
"标签部分,有什么区别?口罩检测项目的类别标签票据OCR项目的类别标签OCR的任务中,类别只有一个“text”票据数据可视化操作2:
利用平台程序,读取数据集内的类别信息。#
#获取数据集类别(完成程序)完成程序在下方完成程序,获取训练数据集类别感知传感器包括视觉传感器、激光传感器、雷达传感器等类型。视觉传感器:即摄像头,摄像头分为单目视觉和双目(立体)视觉两类。比较知名的视觉传感器提供商有以色列的Mobileye,加拿大的PointGrey,德国的Pike等。激光传感器:分为单线和多线。每多一线,成本相应上涨,当然检测效果也相对更为出色。比较知名的激光传感器提供商有美国的Velodyne和Quanergy,德国的Ibeo等。国内有速腾聚创和禾赛科技。雷达传感器:雷达传感器已经在汽车上得到了广泛使用,应该是车厂Tier1的强项。知名的供应商当然是博世、德尔福、电装等。票据数据可视化如何统计文本框数量?票据数据可视化操作3:
利用平台程序,使用pycocotools的方法统计训练集和测试集的文本框数量。3.统计训练集和测试集的文本框数量#统计训练集和测试集的文本框数量(完成程序)
完成程序使用pycocotools的方法统计训练集和测试集的文本框数量提示:标注信息记录了每个文本框的相关信息票据数据可视化"annotations"
中包含了数据集主要的标注信息。右图截取的是某图像内的一个文本框的标注标签信息标注框的位置图像编号文本框标签编号文本内容当前图像编号下的文本框顺序编号票据数据可视化除了利用pycocotools
的相关方法,还可以直接读取json文
件
,统计
'annotations‘字段中标注信息的个数。"annotations”
为json
字典元素内的"key",而对应的
"value
"为一个列表,列表内的每一个元素用新的字
典
"{}"存储
一
个标签成员,所以我们可以通过提取annotations的
"value",
判断其长度来得到文本框标
签的数量。票据数据可视化操作4:
利用平台程序,直接读取训练集与测试集的json文件,统计训练集和测试集的文本框数量。提示:利用字典的相关操作票据数据可视化下图表示同一张图像中有多个文本框:可以通过“image_id”来判断文本框是否为同一张图像。票据数据可视化操作5:
完成平台上的程序,查找训练集文本框最多和最少的图像。方法一:利
用pycocotools的方法获取图像上的标注信息。方法二:通过解析json
文件,以读取字典的形式获取图像上的标注信息。票据数据可视化操作6:
完成平台程序,统计训练集中各个字符出现的数量以及每个标注文本长度。读取文本中的每一个字符,统计字符的数量。使用len()方法计算文本的长度小票中的字符包括:abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789通过读取“textAttribute”的值,获取文本信息票据数据可视化操作7:
完成平台程序,统计训练集中图像的分辨率分布与标注框的大小分布。
读取“images”字段,分别统计图像的高和宽读取“annotation”字段,统计每个标注信息的标注框大小感知传感器包括视觉传感器、激光传感器、雷达传感器等类型。视觉传感器:即摄像头,摄像头分为单目视觉和双目(立体)视觉两类。比较知名的视觉传感器提供商有以色列的Mobileye,加拿大的PointGrey,德国的Pike等。激光传感器:分为单线和多线。每多一线,成本相应上涨,当然检测效果也相对更为出色。比较知名的激光传感器提供商有美国的Velodyne和Quanergy,德国的Ibeo等。国内有速腾聚创和禾赛科技。雷达传感器:雷达传感器已经在汽车上得到了广泛使用,应该是车厂Tier1的强项。知名的供应商当然是博世、德尔福、电装等。任务思考题哪些因素决定了数据样本中的文本框数量?统计文本框个数的分布情况可以得到数据集的什么信息?思考为什么要统计字符出现的频次?为什么要查看图像内的字符长度分布情况?数据可视化的目的感谢观看主讲教师:侯佳丽Thankyouforwatching项目五《数据可视化服务》主讲教师:候佳丽Datavisualizationservice任务二:可行驶区域的数据可视化CONTENTS目录任务需求01Taskrequirements可视化需求02VisualizationrequirementS可行驶区域数据可视化03Visualizationofdrivableareadata任务需求
在自动驾驶和智能交通系统的研发中,准确识别可行驶区域是确保行车安全的关键基础。
本次任务将基于BDD100K数据集,对可行驶区域标注数据进行系统性可视化分析,为模型训练提供数据质量保障。
本任务使用pycocotools解析COCO格式标注文件,基于Matplotlib实现多维度数据可视化,结合图像处理技术进行标注结果叠加展示。需要对数据分布特征进行分析,统计"direct"(主路)和"alternative"(辅路)两类标注数据的样本量分布,分析单张图像中标注道路数量的分布规律。
通过matplotlib.patches可视化多边形标注区域,检测标注异常(如区域断裂、边界偏差等情况)。计算标注区域占图像总面积的比例,对比不同类别标注区域的面积分布特征。数据可视化需求2.
图像上可行驶区域是如何标注的?1.
可行驶区域标注数据中有哪几种类别?每个类别下有多少张图像?3.图像中道路数量的分布是怎样的?一张图像最多标记了几条道路?4.探究每个类别的标注覆盖范围。在完成图像标注后
,研究员想了解标注数据的数据分布情况
,探索数据的基本信息:数据可视化需求在完成图像标注后
,研究员想了解标注数据的数据分布情况
,探索数据的基本信息:1.可行驶区域标注数据中有哪几种类别?每个类别下有多少张图像?图像上可行驶区域是如何标注的?2.3.图像中道路数量的分布是怎样的?一张图像最多标记了几条道路?探究每个类别的标注区域覆盖范围。4.利用条形图显示每个类别的数量在图像上绘制出可行驶区域利用条形图显示道路数量的分布情况使用散点图或者条形图绘制出标注区域覆盖范围,观察分布情况。可行驶区域可视化操作1:
打开
“任务4:
可行驶区域的数据可视化”
中的EDA.ipynb
,运行
“数据集数量”和
“数据集类别”的程序。1.数据集中每个文件夹里面的文件是什么?02012.数据集中有哪些类别?如何获得这些类别?可行驶区域可视化在标注阶段
,我们标注的数据集较少(仅60张)
,
可视化效果较差
,后期也可以探索标注阶段生成的数据集
因此我们从BDD100K数据集中选择了1000张训练数据
,
300张测试数据(已标注好)
进行可视化分析。colormap图像图像mask图像COCO格式的标注文件后续主要分析训练集的分布情况可行驶区域可视化回顾COCO格式的标注文件标注信息:可以根据图像id和类别id检索标注信息图像信息
:每个图像对应一个id类别信息:每个类别对应一个id语义分割标注结果也能导出成COCO数据集格式,便于探究标注信息。
标注基本信息可行驶区域可视化pycocotools库的常用方法方法说明getImgIds(imgIds=[],catIds=[])获取图像id(可选参数为imgIds,catIds)。若设置catIds参数,则可以根据类别id获取该类别下的图像idloadImgs(ids=[])根据图像id获取图像信息getCatIds(catNms
=[])获取类别id(主要参数catNms),可根据类别名获取类别idloadCats(ids
=
[])根据类别id获取类别信息getAnnIds(imgIds=[],catIds=[])获取标注id(主要参数imgIds,catIds),可根据图像id,类别id获取标注idloadAnns(ids=[])根据标注id获取标注信息showAnns(anns)显示标注信息可行驶区域可视化pycocotools库的常用方法初始化COCO工具后
,
可以使用如下代码查看方法说明可行驶区域可视化操作2~操作3
:参考pycocotools库的使用方法
,
完成操作2和操作3
,统计每个类别的图像数量
,
并在图像上绘制可行驶区域。showAnns()是如何绘制出标注区域的?showAnns()绘制标注区域时采用的是matplotlib.patches库中绘制多边形的方式参考
“任务活页”或者notebook上的提示可行驶区域可视化matplotlib绘制多边形matplotlib.patches库里面的一些对象
,可以用于绘制多边形、正方形、椭圆形、箭头等
,如:0102matplotlib.patches.Polygon()可以绘制多边形matplotlib.patches.Arc()可以绘制椭圆形可行驶区域可视化操作4:
打开patches.ipynb
,
学习绘制形状的方法。0102创建一个画布绘制一个多边形将多边形放入画布中可行驶区域可视化如果我们要在图像上将标注的可行驶区域以“多边形”的形式绘制出来
,
需要获取标注区域的xy坐标注意:这是一
个嵌套列表COCO格式文件中标注信息的
‘segmentation’
中存储了标注区域外围像素
点坐标。
以[x,y,x,y]的形式存储坐标值
,
并且起始点和终点的坐标值一样。可行驶区域可视化操作5:
打开EDA.ipynb
,将plot_images()函数补充完整
,利用Polygon绘制多边形
,
显示标注区域。
然后运行后续程序,同时显示多张图像的可行驶区域。分析图中的道路的标注特点
,是否有错标的情况呢?可行驶区域可视化图像中可行驶道路数量的分布情况
,
需要知道如下信息:1.
一张图像中最多标记了几条可行驶道路有哪几种道路标记情况
,每种标记情况下有多少张图像2.一张图像上有多少条标注信息
,表示一张图像上有多少条可行驶的道路2条可行驶道路4条可行驶道路可行驶区域可视化操作6:
打开EDA.ipynb
,
完成程序
,统计每张图像上的标注信息个数;
运行后续程序
,
可视化道路数量分布情况。补充程序参考
“任务活页”或者notebook上的提示查看可视化图像
,分析图像中呈现的信息可行驶区域可视化每个类别的标注区域覆盖范围:标注区域的面积是多少?所有图像的标注区域分布情况?标注区域占整个图像的比例?标注信息的area中
存储了标注区域的
像素面积。可行驶区域可视化操作7:
完成程序
,统计每个类别下所有图像的标注区域面积;
并根据统计结果绘制散点图、
条形图查看标注区域覆盖范围。查看可视化图像
,分析图像中呈现的信息可行驶区域可视化操作8:
完成程序
,计算标注区域占整个图像的比例。感谢观看主讲教师:侯佳丽Thankyouforwatching项目五《数据可视化服务》主讲教师:候佳丽Datavisualizationservice任务三:ASR标注数据的可视化CONTENTS目录任务需求01Taskrequirements可视化需求02VisualizationrequirementSASR标注数据可视化03ASRannotationdatavisualization任务需求在语音识别(ASR)、语音合成(TTS)、说话人识别等语音技术的研究与应用中,语音标注数据的可视化分析
是确保数据质量、优化模型性能的关键环节。其重要性主要体现在以下几个方面:1.提升数据质量,优化模型训练。2.理解语音特征,优化算法设计。3.支持语音技术的关键应用4.提高标注效率,降低人工成本5.支持学术研究与工业落地可视化需求在完成语音标注后
,研究员想了解标注数据的数据分布情况
,探索数据的基本信息:01判断语音振幅;02分析语音是低声、大声或者噪音;03通过语音基频分析语音数据属于男声、女声。可视化需求数据可视化的需求分析:01判断语音振幅;02分析语音是低声、大声或者噪音;03通过语音基频分析语音数据属于男声、女声。绘制振幅图绘制音强图绘制基频分析图在完成语音标注后,研究员想了解标注数据的数据分布情况,探索数据的基本信息:ASR标注数据的可视化在商汤教育平台下载ASR语音标注数据集ASR标注数据的可视化振动物体离开平衡位置的最大距离,叫做振动的“振幅”,振幅是用来表示振动强弱的物理量,振幅大,则振动强度大;振幅小,则振动强度小。步骤9:
打开“任务5-3:
ASR
标注数据的可视化”中的amplitude.ipynb
文件,运行程序。结果如下图所示:全部声音振幅声音片段振幅amplitudeampitudeASR标注数据的可视化在上节中我们已经介绍了音强的基本概念,也使用praat工具获取了音强数据。接下来我们使
用python
库来绘制音强的折线图,使用2组数据绘图。其中一组数据是正常声,另一组为白噪声。步骤9:
打开“任务5-3:
ASR
标注数据的可视化”中的intensity.ipynb文件,运行程序。
结果如下图所示:120正常声白噪音100802000.00.5
1.5
intensity
[dB]2.0
2.5time
[s]ASR标注数据的可视化音强为20-50分贝时属于安静,大声说话为60-70分贝,开始感到吵的声音为70分贝,开始破坏耳蜗细胞的声音为105分贝。从图中可以看出红色曲线的音高在80-90分贝之间,因此这
个音频让人感觉吵;绿色曲线的音高是20-80分贝之间,大多分布在50-70分贝之间,因此这
个音频是大声说话。120正常声白噪音100802000.00.5
1.5
ASR标注数据的可视化在上节中我们已经介绍了基频的基本概念,也使用Praat工具获取数据并绘制了基频图,接下来我们使用python库来绘制基频的折线图,使用2组数据绘图。步骤9:
打开“任务5-3:
ASR
标注数据的可视化”中的pitch.ipynb文件,运行程序。
结果如下图所示:ASR标注数据的可视化男声的平均基频为100~150Hz,
女声的平均基频为250~500Hz。因此可以判断红色的是女声,蓝色的是男声。步骤10:动手绘制所有数据集的振幅图、音强图、基频图,并分析可视化结果。感谢观看主讲教师:侯佳丽Thankyouforwatching项目五《数据可视化服务》主讲教师:候佳丽DataVisualizationServices项目总结CONTENTS目录项目总结01ProjectSummary知识拓展02KnowledgeExpansion练习03practice项目总结本项目旨在让学生和读者理解数据可视化的意义和实现方法。项目以图像、音频等不同数据类型的标注数据可视化为例,通过设置三个任务分别完成票
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026教育培训行业监管政策变化与转型路径研究
- 2026教育共享经济模式研究及资源匹配与平台治理分析报告
- 2026教育产业园区招商策略与生态建设研究报告
- 2026摩托车行业市场供需调节分析及投资分布规划研究文档
- 2026戈斯达黎加微观仪器行业市场深度调研及发展趋势与投资前景预测研究报告
- 2026急救便携ECMO设备技术攻坚与应急体系建设关联分析报告
- VTE预防措施及护理要点
- 脑出血微创手术患者的呼吸道护理
- 2026-2030食材配送产业市场深度分析及前景趋势与投资研究报告
- 2026-2030中国高压锅炉管行业发展策略及竞争趋势预测报告
- 2026年广铁集团招聘公告分数线笔试试题
- 2026年许昌禹州市招聘巡防队员80名笔试参考试题及答案解析
- 2026-2030中国石墨烯防腐涂料行业市场发展趋势与前景展望战略分析研究报告
- 昌吉回族自治州奇台县公共基础辅警考试笔试题库及答案
- 2026广东广州市公安局招聘警务辅助人员248人笔试备考试题及答案解析
- 护理记录对特殊患者(如过敏)的记录疏漏案例
- 污水管网施工高温天气作业安全方案
- 2026年科学中考热点试题及答案
- 2026年液氢储罐液位测量技术应用
- 第11课 少年当自强(课件) 小学道德与法治二年级下册
- (二检)2026年宝鸡市高三高考模拟检测(二)历史试卷
评论
0/150
提交评论