《人工智能基础》课件-4.1让机器识文断字:文字识别探_第1页
《人工智能基础》课件-4.1让机器识文断字:文字识别探_第2页
《人工智能基础》课件-4.1让机器识文断字:文字识别探_第3页
《人工智能基础》课件-4.1让机器识文断字:文字识别探_第4页
《人工智能基础》课件-4.1让机器识文断字:文字识别探_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能基础AI

INTElLIGENCE项目4人工智能的关键技术任务4.1让机器识文断字:文字识别探CONTENTS目录01020304任务导入任务分析知识技能任务实施PARTTWO任务导入101任务导入周一清晨,某互联网公司行政专员小李刚到岗,就收到了部门总监的紧急任务:需在上午10点前将20份纸质客户档案中的关键信息(姓名、联系方式、合作意向)提取并整理成电子表格。这些档案包含印刷体填写的规范信息和部分手写补充内容,人工逐份录入不仅耗时费力,还容易出现录入错误。借助文字识别技术,可快速实现图像到结构化数据的转化,高效完成信息提取与整理工作,解决传统人工录入的效率与准确率难题。PARTTWO任务分析201任务分析

本任务通过“客户档案信息智能提取”场景,掌握文字识别技术的核心应用能力,实现从“人工手动录入”到“AI智能提取”的高效转型。具体分析如下:1.系统学习文字识别技术体系,明确其定义、分类、核心流程及主流工具;2.掌握图像采集与预处理的关键方法,确保输入图像满足文字识别的精度要求;3.熟练操作百科融创平台的文字识别相关功能节点,完成从图像输入到文字提取、结果输出的全流程搭建;4.验证识别结果的准确性,对识别误差进行人工校对与优化,确保结构化数据的完整性与可靠性。PARTTWO知识技能3知识技能知识点1知识点2知识点3文字识别是指利用计算机对图像中的印刷体、手写体文字进行检测、定位、识别和理解,将图像形式的文字转化为计算机可处理的文本格式的技术。它跨越了图像与文本的界限,实现了非结构化信息向结构化信息的转化,是信息自动化处理的关键技术之一。(1)按文字类型划分:分为印刷体文字识别和手写体文字识别。印刷体识别适用于书籍、文档、海报等标准化文字,识别准确率较高;手写体识别又分为规整手写体和自由手写体,后者因书写风格差异大,技术难度更高。(2)按文字语种划分:包括中文识别、英文识别、日文识别等单一语种识别,以及多语种混合识别,可满足跨语言信息处理需求。(3)按识别场景划分:分为通用场景识别(如普通文档、网页截图)和特定场景识别(如身份证、银行卡、车牌、票据等结构化信息载体)。(1)政务办公:身份证、户口本、营业执照等证件信息自动录入,减少人工录入工作量,提高政务办理效率。(2)金融服务:银行卡信息识别、票据扫描录入、信用卡申请资料审核等,实现金融业务自动化处理。(3)教育领域:试卷扫描阅卷、作业批改、古籍文字数字化录入,助力教育信息化建设。(4)日常生活:手机拍照翻译、名片信息提取、文档扫描存档,为用户提供便捷的信息处理工具。(5)企业管理:合同、发票等办公文档数字化归档,方便检索与管理,降低纸质存储成本。文字识别的定义文字识别的分类文字识别的应用场景知识技能知识点4(1)百度OCR:基于百度AI技术,提供通用文字识别、证件识别、票据识别等多种服务,支持API调用和在线使用,识别准确率高,适用于企业与个人用户。(2)腾讯云OCR:涵盖证件、票据、文档等多场景识别能力,支持批量处理和自定义模板,具备高稳定性和安全性,广泛应用于企业级场景。(3)阿里云OCR:提供丰富的识别接口,支持中文、英文等多语种识别,适配不同分辨率图像,可与阿里云其他服务无缝集成。(4)微信小程序“传图识字”:轻量化在线工具,支持拍照或上传图片识别文字,操作简单,适合个人日常快速识别需求。(5)豆包AI文字识别:集成于豆包AI助手,支持图片、文档中的文字提取,可直接将识别结果用于编辑、翻译等后续操作,实现“识别-处理”一站式服务。主流文字识别工具PARTTWO任务实施5

本任务将通过百科融创平台,搭建一款支持“文本输入-智能响应-多形式反馈”的机器人对话系统。该系统可接收用户文本输入,通过自然语言处理技术生成贴合语境的回复,并同步以文字显示和语音播报的形式反馈给用户,具体步骤如下:步骤1.登录百科融创平台打开浏览器,输入百科融创AI通识教育平台官网地址(/index/ai-cognitive/ai/),按下Enter键进入平台首页,如图4-1-1所示。首页展示了平台核心功能、服务领域及成功案例,为用户提供直观的入口指引。图4-1-1百科融创平台首页示意图若未注册账号,需先单击“登录/注册”按钮,进入注册界面(如图4-1-2所示),填写相关信息完成注册;已有账号则直接输入账号密码登录,登录后进入AI通识教育平台界面,如图4-1-3所示。图4-1-2注册界面图4-1-3AI通识教育平台界面步骤2.进入AI通识教育平台模块首页在AI通识教育平台界面中,单击“开始体验”按钮,进入平台智能认知模块首页,如图4-1-4所示。该界面左侧为“节点库”,包含实现各类功能的节点,中间为画布编辑区,用于放置节点并建立逻辑关联。

该页面是搭建机器人对话系统的核心操作区,各功能模块分工明确:左侧“项目管理”功能区:用于创建、保存、管理项目,是系统搭建的起点;左侧“节点库”功能区:包含基础节点、技术方向分类节点等,是实现各类功能的核心组件库;中间“画布编辑区”:用于放置功能节点、建立逻辑关联,是系统的“搭建舞台”;上方“功能开关”与“节点搜索”:可快速开启/关闭核心功能、搜索目标节点,提升操作效率;右侧“控制台”:用于查看系统运行状态、数据流速度等,便于测试与调试。图4-1-4百科融创AI通识教育平台首页示意图步骤3.创建并命名空白项目在平台首页左侧导航栏的“项目管理”功能区,单击“空白项目”按钮进入项目编辑页面。单击页面上方的“项目保存”按钮,弹出“项目保存”窗口,在“项目名称”文本框中输入项目名称“4-1机器人对话”,单击“保存新项目”按钮,完成项目的创建与命名,如图4-1-5所示。项目创建后,会自动保存到“项目列表”中,后续可通过“项目管理”功能区的“项目列表”按钮快速找到并打开该项目,方便多次编辑与优化。图4-1-5创建项目步骤4.添加功能节点并关联逻辑

在“项目管理”功能区,单击“项目列表”按钮找到新创建的项目,单击项目名称“4-1机器人对话”进入项目编辑界面。1)添加基础节点根据机器人对话系统“输入-处理-输出”的核心流程,需从左侧节点库中筛选并添加输入类、逻辑类、交互类、输出类四类功能节点,拖动节点至中间画布的合适位置,避免节点重叠,确保布局清晰:

在左侧导航栏的“基础节点”功能区中,单击“输入控件”按钮,在弹出的列表中选择“文本输入框”选项,将其拖动至编辑画布的合适位置,如图4-1-6所示。该节点用于接收用户输入的对话文本,是系统与用户交互的“入口”,支持手动输入文字并触发提交。图4-1-6添加文本输入框在“技术方向分类”功能区中,单击“自然语言处理”按钮,在弹出的列表中选择“机器人对话”选项,将其拖动至画布,如图4-1-7所示。图4-1-7添加机器人对话在“基础节点”功能区中,单击“输出控件”按钮,在弹出的列表中选择“文字输出”选项,将其拖动至编辑画布的合适位置。在“技术方向分类”功能区中,单击“语音技术”按钮,在弹出的列表中选择“语音播报”选项,将其拖动至画布。在“基础节点”功能区中,单击“路由控件”按钮,在弹出的列表中分别选择“二合一”“一分三”选项,将其拖动至编辑画布的合适位置,如图4-1-8所示。图4-1-8添加文字显示2)关联功能节点单击节点右上角的“输出端口”,按住鼠标左键拖动至目标节点的“输入端口”,完成节点间的逻辑连接。操作方式为:单击节点右上角的蓝色“输出端口”,按住鼠标左键拖动至目标节点的黄色“输入端口”,释放鼠标即可完成连接,具体关联步骤如下::将“文本输入框”的输出端口连接至“二合一”节点的输入端口,实现用户输入文本向逻辑整合模块的传递;将“二合一”节点的输出端口连接至“机器人对话”节点的文字输入端口,让整合后的输入文本进入对话处理模块;将“机器人对话”节点的输出端口连接至“一分三”节点的输入端口,使生成的回复内容进入结果分发模块;将“一分三”节点的多个输出端口,分别连接至“文字显示”“语音播报”等节点的输入端口,实现回复结果的多形式输出。所有节点关联完成后,机器人对话系统的功能结构图如图4-1-9所示。建议关联完成后,整体检查一遍连接关系,确保无漏连、错连,必要时可拖动节点调整布局,使逻辑关系更直观图4-1-9机器人对话功能结构图步骤5.测试机器人对话场景在编辑画布中,找到“文本输入框”节点,右键单击节点内的输入区域,输入需要对话的文字(如“今天的天气真好啊!

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论