人工智能通识 课件 第九章 AI辅助数据表示与数制转换_第1页
人工智能通识 课件 第九章 AI辅助数据表示与数制转换_第2页
人工智能通识 课件 第九章 AI辅助数据表示与数制转换_第3页
人工智能通识 课件 第九章 AI辅助数据表示与数制转换_第4页
人工智能通识 课件 第九章 AI辅助数据表示与数制转换_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能通识:新技术与创新实践数据表示的本质与AI的关系PART01AI工具对数据自动转换的底层逻辑PART02实战:利用AI工具自动生成进制转换代码PART03目录CONTENTS实战:利用AI图像识别工具解析二维码PART04数据表示的本质与AI的关系01数据表示的本质与AI的关系01在计算机科学的殿堂中,二进制的地位堪比文字之于文学、音符之于音乐。这种看似简单的0和1组合系统,不仅是计算机运行的基础,也是当代人工智能得以实现的底层支撑。为何二进制如此重要?其与AI系统又有着怎样的内在联系?一、二进制:计算机与人工智能的共同基石01二进制的技术优势02从二进制到AI03AI对二进制运算的超越与依赖数据表示的本质与AI的关系01人类通过感官直接感知世界的图像、声音和文字,而AI大模型则需要将这些信息转换为可计算的数字表示。这种转换过程不仅是AI工作的基础,也揭示了AI与人类认知的本质差异。二、AI如何理解多媒体数据1.图像数据的AI处理2.文本数据的AI理解3.音频数据的AI处理AI工具对数据自动转换的底层逻辑02AI工具对数据自动转换的底层逻辑02项目前景光学字符识别(OpticalCharacterRecognition,OCR)技术实现了从图像到文本的自动转换,是AI辅助数据表示转换的典型应用。当我们使用扫描仪将纸质文档数字化,或用手机应用识别文字时,OCR技术正在幕后默默工作。一、OCR技术02

1.OCR工作流程及关键技术

OCR系统通常包含以下处理阶段:

•图像预处理:包括灰度化、二值化、去噪、倾斜校正等,为后续识别创造良好条件。例如,将彩色扫描件转为黑白图像,并调整亮度、对比度,使文本更加清晰。

•页面分析与版面识别:将文档分割为文本块、图片、表格等区域,确定文本的阅读顺序。这一步使系统能处理复杂布局的文档。

•字符分割:将文本块进一步分割为单个字符或连续笔画,这在识别连笔草书等文字时尤为关键。

•特征提取:提取每个字符的形状特征,如笔画数量、交叉点、封闭曲线等。

•字符识别:基于提取的特征,通过分类器(如CNN或Transformer)将字符图像映射到对应的Unicode编码。

•后处理:利用语言模型和上下文信息,校正识别错误,提高准确率。例如,将“杲子”修正为更可能的“果子”。

OCR系统,尤其是中文OCR,越来越多地采用端到端深度学习方法,跳过传统的字符分割步骤,直接从文本行图像预测文字序列,大大提高了准确率和鲁棒性。AI工具对数据自动转换的底层逻辑02

2.编码转换

OCR过程中最关键的步骤是将图像中的字符形状映射到对应的字符编码。这一过程涉及多种编码体系:

•图像编码:字符图像本身通过二进制形式存储,每个像素以RGB值或灰度值表示。

•字符编码:识别结果需要以Unicode等编码形式表示,确保跨平台兼容性。

•语言编码:对于多语言文档,系统需要正确识别语言类型,并应用相应的语言规则。在中文OCR中,这种编码转换尤为复杂,因为中文字符集庞大(超过20000个汉字),且字形变化多样。现代中文OCR系统通常使用大规模预训练模型,通过学习数百万汉字样本,建立了从图像特征到汉字编码的映射关系。AI工具对数据自动转换的底层逻辑02

3.OCR应用案例与技术进步

OCR技术的应用场景不断扩展:

•文档数字化:将纸质档案、书籍转换为可搜索、可编辑的电子文档,大大提高了信息检索效率。

•身份证件识别:自动提取身份证、驾照、护照等证件上的个人信息,简化注册和验证流程。

•场景文本识别:识别自然场景中的文字,如路牌、店铺招牌,为增强现实和导航系统提供支持。

•手写文字识别:将手写笔记转换为电子文本,保留思想的同时提高可检索性。

OCR技术的进步体现了AI如何通过数据表示转换,架起物理世界与数字世界的桥梁,使信息在不同载体间自由流动。AI工具对数据自动转换的底层逻辑02AI工具对数据自动转换的底层逻辑自动语言翻译技术实现了不同语言间的信息转换,是AI数据表示转换的另一重要应用。从早期的规则基础系统到现代的神经网络翻译,这一领域的发展展示了AI如何处理语言这一复杂的人类符号系统。二、自动语言翻译1.神经机器翻译的工作原理2.跨语言数据表示的挑战与解决方案3.数据表示视角下的跨语言转换02AI工具对数据自动转换的底层逻辑数据可视化是将抽象数字信息转换为直观图形表示的过程。在大数据时代,AI辅助的数据可视化技术正帮助人们从海量数据中提取有价值的见解。三、数据可视化1智能数据可视化的核心流程2数据转换的多层次映射3可视化智能化趋势实战:利用AI工具自动生成进制转换代码0303实战:利用AI工具自动生成进制转换代码实验目的:1.学习如何利用AI工具(DeepSeek)生成进制转换代码。2.比较手动计算与AI生成代码的结果。3.理解AI如何理解和实现数学算法。4.通过实践掌握进制转换的原理与方法。一、实验目的与准备03实战:利用AI工具自动生成进制转换代码实验准备:•计算机一台,已安装浏览器。•DeepSeek账号或其他大语言模型平台。•纸笔(用于手动计算进制转换)。•Python解释器或在线Python环境(如JupyterNotebook、GoolgeColab等),本次试验选择GoogleColab在线环境或者可以选择本地Python环境。03实战:利用AI工具自动生成进制转换代码步骤1:手动计算进制转换示例选择以下几个典型的进制转换问题进行手动计算:1.将十进制数57转换为二进制。2.将二进制数10110转换为十进制。3.将十进制数173转换为十六进制。4.将十六进制数2AF转换为二进制。记录手动计算过程和结果,注意保留中间步骤。例如,将十进制57转换为二进制的过程:二、实验步骤03实战:利用AI工具自动生成进制转换代码57÷2=28余128÷2=14余014÷2=7余07÷2=3余13÷2=1余11÷2=0余1从下往上读余数:111001步骤2:利用DeepSeek生成进制转换代码登录DeepSeek平台,输入以下提示:

请生成Python代码,实现以下进制转换功能:03实战:利用AI工具自动生成进制转换代码1.十进制转二进制2.二进制转十进制3.十进制转十六进制4.十六进制转二进制对每个功能,请提供两个版本:-使用Python内置函数的简洁版本-不使用内置函数,通过算法实现的详细版本请为代码添加详细注释,解释每个步骤的原理。观察DeepSeek生成的代码,如图9-2所示,分析代码结构和实现逻辑。03实战:利用AI工具自动生成进制转换代码图9-2DeepSeek生成的对应转换代码03实战:利用AI工具自动生成进制转换代码生成内容如下所示:

进制转换工具(内置函数版和算法实现版)十进制转二进制1二进制转十进制2十进制转十六进制3十六进制转二进制403实战:利用AI工具自动生成进制转换代码这个代码提供了完整的进制转换功能,每个功能都有两个版本实现:1.使用Python内置函数的简洁版本2.通过算法手动实现的详细版本每个函数都有详细的注释解释其工作原理,并且处理了负数、前导零等边界情况。最后的测试代码可以验证所有功能的正确性。步骤3:测试和验证DeepSeek生成的代码将DeepSeek生成的代码复制到Python环境中运行,使用步骤1中的示例数据进行测试:03实战:利用AI工具自动生成进制转换代码1.测试十进制57转换为二进制运行代码截图如图9-3所示。03实战:利用AI工具自动生成进制转换代码2.测试二进制10110转换为十进制运行代码截图如图9-4所示。03实战:利用AI工具自动生成进制转换代码3.测试十进制173转换为十六进制运行代码截图如图9-5所示。03实战:利用AI工具自动生成进制转换代码4.测试十六进制2AF转换为二进制运行代码截图如图9-6所示。03实战:利用AI工具自动生成进制转换代码记录程序输出结果,与手动计算结果进行比对,验证正确性。步骤4:扩展实验———优化和改进向DeepSeek按照如下格式提出进一步的优化要求:

我注意到你生成的代码[描述观察到的问题或限制]。请对代码进行以下改进:1.增加输入验证,确保输入格式正确。2.优化算法效率,特别是在处理大数字时。3.增加对负数的处理支持。4.添加更多进制转换功能(如八进制)。测试运行改进后的代码,评估性能提升和功能扩展。例如,上一步骤中DeepSeek生成的代码分为简洁版和不使用内置函数的算法两个版本,且在测试时没有使用题目要求的数据,可以将此描述成问题,效果如下所示:03实战:利用AI工具自动生成进制转换代码03实战:利用AI工具自动生成进制转换代码将修改生成的代码继续复制导入在线Python平台GoolgeColab运行,查看结果,此处不再提供运行截图,同学们可以自行实验。通过这一实践环节,学生不仅能够掌握进制转换的基本原理和方法,还能体验AI工具在编程学习中的应用,同时培养算法思维和代码分析能力。实验过程中的手动计算与程序验证相结合,有助于加深对数据表示本质的理解。实战:利用AI图像识别工具解析二维码0404实战:利用AI图像识别工具解析二维码实验目的:•探索AI图像识别技术在数据编码解析中的应用。•理解二维码和文字的数字化表示原理。•体验不同模式数据转换过程。•分析AI识别技术的优势与局限性。实验准备:•智能手机(安装微信或其他支持扫码功能的应用)。•计算机(用于查看和分析结果)。•打印或显示的二维码和文字样本。•不同难度级别的识别材料(如清晰印刷文字、手写文字、不同颜色背景的二维码等)。一、实验目的与准备04实战:利用AI图像识别工具解析二维码实验部分一:二维码解析探究步骤1:二维码的生成与结构分析1.访问在线二维码生成网站(如草料二维码)。2.输入不同类型和长度的信息生成二维码:•短文本信息(如“人工智能技术”),生成二维码如图9-8所示。二、实验内容与步骤04实战:利用AI图像识别工具解析二维码图9-8段文本信息二维码04实战:利用AI图像识别工具解析二维码•网址链接(如学校官网),本文以DeepSeek官网地址为例,如图9-9所示。•较长文本段落(观察二维码复杂度变化),如图9-10所示。04实战:利用AI图像识别工具解析二维码04实战:利用AI图像识别工具解析二维码•包含特殊字符的文本,如图9-11所示。3.观察并记录•不同内容生成的二维码在复杂度和密度上的差异。•信息量增加对二维码结构的影响。•二维码的基本组成部分(定位图案、校正图案、数据区等)。步骤2:二维码识别测试1.使用微信“扫一扫”功能对生成的二维码进行扫描。2.设计并测试不同场景下的识别效果:04实战:利用AI图像识别工具解析二维码04实战:利用AI图像识别工具解析二维码•正常条件:直接对屏幕/打印件扫描。•角度变化:倾斜不同角度扫描。•距离变化:远近距离扫描。•光线变化:在不同光线条件下扫描。•部分遮挡:遮挡二维码的部分区域后扫描。•损坏测试:在二维码上做小面积涂抹后扫描。3.记录每种条件下的识别结果:•成功/失败•识别速度(快/中/慢)•识别过程中遇到的问题04实战:利用AI图像识别工具解析二维码步骤3:二维码内部编码分析通过研究二维码的编码原理,我们发现不同类型数据在二维码中采用不同的编码模式,以优化信息存储效率:•数字编码模式:纯数字内容采用最高效的编码方式,每3个数字使用10位二进制表示,相比其他类型数据节省约60%空间。因此,纯数字的二维码(如产品编号、电话号码)在相同信息量下体积最小,黑色模块数量最少。•字母数字混合模式:包含数字、大写字母和特定符号的内容,每2个字符使用11位二进制表示,编码效率次之。这类二维码(如网址、简短英文)具有中等密度。04实战:利用AI图像识别工具解析二维码•字节编码模式:用于编码任意8位字节数据,包括小写字母、非ASCII字符等,每个字符使用8位表示。这是编码汉字、日文等非拉丁字符的常用模式,但编码效率较低,导致二维码模块数量增加。•汉字编码模式:专门针对中、日、韩文字优化,每个汉字使用13位编码,比通用字节模式节省空间,但支持的字符集有限。实验中我们观察到:相同长度的内容,纯数字生成的二维码比含汉字的二维码模块数量少约30~40%,表明数据类型对二维码密度有显著影响。04实战:利用AI图像识别工具解析二维码实验部分二:OCR文字识别步骤1:OCR基础识别测试1.准备不同类型的文字样本:•印刷体中文(宋体、黑体、楷体等不同字体),可以直接扫描课本中的文字。•印刷体英文(不同字体与大小),打开英语课本进行扫描。•手写体中文(规范字迹和潦草字迹),扫描自己的作业本或者笔记。•手写体英文,扫描下图。04实战:利用AI图像识别工具解析二维码04实战:利用AI图像识别工具解析二维码2.使用微信“扫一扫”功能中的长按识别文字功能,对各类样本进行识别。3.对于每个样本,记录:•识别准确率(正确识别的字符数/总字符数)•常见错误类型(如形近字混淆、多字少字等)•识别速度的差异步骤2:多样环境下的OCR测试1.在不同环境条件下测试OCR识别效果:•不同光线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论