已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章信息资源管理的技术,5.1信息资源采集技术5.2信息资源压缩技术5.3信息资源存储技术5.4信息资源共享技术,5.1信息资源采集技术,信息生成的数字化过程,主要是文本、图像、音视频和数据等的计算机采集过程。,汉字输入到计算机,人工键入,自动输入,语音识别输入,汉字识别输入,手写体识别,印刷体识别,联机,脱机,文本,5.1信息资源采集技术,5.1.1文本生成1、键盘录入智能ABC、紫光、拼音加加、五笔字型2、语音识别语音特征提取模式匹配(识别算法)声学模型语言模型,清华大学电子工程系语音技术课题组,研发的非特定人汉语识别系统的识别精度,达到948(不定长数字串)和968(定长数字串)。,特定人语音识别系统非特定人语音系统多人的识别系统,小词汇量语音识别系统中等词汇量的语音识别系统大词汇量语音识别系统,5.1信息资源采集技术,识别系统分类,从说话的方式,孤立词语音识别系统连接词语音识别系统连续语音识别系统,5.1信息资源采集技术,语音识别技术的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现,特别是近几年来迅速发展的语音信号处理专用芯片(ApplicationSpecificIntegratedCircuit,ASIC)和语音识别片上系统(SystemonChip,SOC)的出现。,5.1信息资源采集技术,1920年代生产的“RadioRex”玩具狗可能是最早的语音识别器AT&T贝尔实验室开发的Audrey语音识别系统卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx电话通信的语音拨号汽车的语音控制工业控制及医疗领域个人数字助理智能玩具家电遥控,汽车语音智能识别系统,3、手写输入手写输入方法,是把要输入的汉字写在一块叫书写板的设备上。汉字识别的方法基本上分为结构识别、统计识别以及神经网络方法等几大类。联机手写识别系统采用的是结构识别方法。优点是区分相似字的能力强,缺点是抗干扰能力差。汉王联机手写识别系统,目前在中国的嵌入式中文手写技术市场上汉王占有90%以上的市场份额。,手写识别-JHWRjHWR手写识别系统以先进的大容量字典技术为基础,是一种能够在任何时间、任何地点,向任何人实时、准确的提供手写识别服务的高效便捷手段,非常符合信息时代动态更新和个性化查询的需求。手写识别-eJHWR运用句法结构自学习算法和基于特征统计算法的多核心融和技术。具有识别率高,识别速度快,无笔顺限制,数据字典大小可缩扩等特点。,5.1信息资源采集技术,4、OCR识别OCR是OpticalCharacterRecognition的简称,指光学字符识别技术。是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。,OCR识别技术,扫描输入图像,图像版面的分析和理解,基于单字图像的特征选择和提取,将被分类的模式赋予识别结果,图像的预处理,基于单字图像特征的模式分类,图像的行切分和字切分,良好的硬件支持,识别结果的编辑修改后处理,常用软件:尚书六号、清华紫光OCR辨识系统、蒙恬认识王、丹青中英文文件辨识系统“尚书六号”使用步骤:扫描图像文件打开尚书六号读取扫描好的图像文件被识别图片的预处理开始进行识别识别校对完成后,进行保存,5.1信息资源采集技术,5.1.2图像扫描图像扫描常用设备有扫描仪、图像采集卡、数码相机等。,1扫描仪1)、什么是扫描仪扫描仪是指把图像或文字用扫描方式数字化后输入计算机的一种设备。2)、扫描仪的种类a.平板式扫描仪它是由步进电机带动扫描头对图片进行自动扫描。其特点是扫描精度较高、使用方便、成像稳定,它适用于图稿幅面不太大,精度要求较高的场合。,b.手持式扫描仪它是以手动的方式推动扫描仪对图片进行扫描。其特点是体积小、携带方便、价格便宜,但由于手推进速度均匀性问题,容易造成图像失真。它适用于图稿幅面小、精度要求不太高的场合。c.滚筒式扫描仪它是采用扫描头固定、滚动式走纸机构移动图纸而自动完成扫描。它适用于大型工程图的输入,例如A0、A1大幅面图稿输入。,3)、扫描仪的结构扫描仪主要由上盖、原稿台、光学成像部分、光电转换部分、机械传动部分组成。,5)、CCD扫描仪与CIS扫描仪的比较,4)、扫描仪的工作原理利用光电元件将检测到的光信号转换为电信号,再将电信号通过模拟数字转换器转化为数字信号传输到计算机中。无论何种类型的扫描仪,它们的工作过程都是将光信号转变为电信号。所以,光电转换是他们的核心,5.1信息资源采集技术,5.1.3音频采集和生成音频是一种典型的连续时间型号计算机每隔固定的时间对波形的幅值进行采样,用得到的一系列数字化量来表示声音。在某一个特定的时刻对音频信号的测量叫做采样每秒钟采样的次数叫做采样频率,单位为HZ在数字音频中,把表示声音强弱的模拟电压用数字表示,把某一幅度范围内的电压用一个数字表示,这就是量化把声音数据写成计算机数据格式,这称之为编码,5.1.3音频采集和生成计算机必须有相应的输入输出设备才能进行声音信号的处理。1、声卡的工作原理声卡的工作原理其实很简单,我们知道,麦克风和喇叭所用的都是模拟信号,而电脑所能处理的都是数字信号,声卡的作用就是实现两者的转换。从结构上分,声卡可分为模数转换电路和数模转换电路两部分,模数转换电路负责将麦克风等声音输入设备采到的模拟声音信号转换为电脑能处理的数字信号;而数模转换电路负责将电脑使用的数字声音信号转换为喇叭等设备能使用的模拟信号。,2、声卡的性能指标1).采样频率它是指单位时间内采样的次数。常用的采样频率为:11.025kHz(语音效果)22.05kHz(音乐效果)44.1kHz(高保真效果)2).量化位数它是指每一个采样点用几位二进制数来表示。常用的量化位数有16、32、64位。量化位数越多,音质就越好。,3).声道数声道数分为单声道和双声道(立体声)。声音文件字节数=录音时间(采样频率量化位数声道数)/8例如:一个语音文件,其采样频率为11.025kHz,量化位数为16,单声道,则一分钟的语音数据量为:60*(11.025*103*16*1)/8=1.26MB,3、语音合成语音合成技术是让计算机能够产生高清晰度、高自然度的连续语音。语音合成有二种方式:再生一个预先存入的语音信号;采用数字信号处理的方法,模拟声门发声。,5.1信息资源采集技术,5.1.4视频采集视频卡是基于PC机的一种多媒体视频信号处理平台,它汇集了视频源、音频源的信号,经过捕获、压缩、存储、编辑和特技、输出处理等,可产生非常漂亮的画面。视频卡的功能还包括图像的放大修整、像素显示调整、捕捉特定画面、若干视频源图像混合等。,视频卡的种类很多1.视频采集卡(视频捕捉卡)(模拟采集卡和数字采集卡)2.视频转换卡(PC-TV或VGA-TV,TV-VGA)3.视频叠加卡(卡拉OK歌词的叠加)4.MPEG解压缩卡(电影回放卡)5.视频压缩卡,视频采集卡共分为两大类:一类是模拟采集卡,另一类是数字采集卡。数字采集卡均采用了IEEE1394作为标准的数字接口.带有硬件CODEC的1394编辑卡,特点是:生成的速度快、编辑质量高,功能也比较强大,但价格昂贵。软件CODEC,特点是:价格较低,但由于是用软件实现编解码,所以处理速度相对来讲要慢得多,对计算机的配置要求也比较高;,5.1信息资源采集技术,5.1.5自动识别技术自动识别技术就是应用一定的识别装置,通过被识别物品和识别装置之间的接近活动,自动地获取被识别物品的相关信息,并提供给后台的计算机处理系统来完成相关后续处理的一种技术。自动识别技术包括:条码技术、磁条磁卡技术、IC卡技术、光学字符识别、射频技术、声音识别技术、视觉识别技术等。,1、自动识别技术的分类自动识别系统根据识别对象的特征可以分为两大类,分别是数据采集技术和特征提取技术。数据采集技术的基本特征是需要被识别物体具有特定的识别特征载体。特征提取技术则根据被识别物体的本身的行为特征来完成数据的自动采集。,2、条码技术条码是由一组规则排列的条、空构成不同的图形符号。条码分为一维条码、二维条码。EAN条码是国际通用符号体系,它们是一种定长、无含义的条码,主要用于商品标识。EAN128条码是一种连续型、非定长有含义的高密度代码,用以表示生产日期、批号、数量、规格、保质期、收货地等更多的商品信息。PDF417条码是一种高密度、高信息含量的条码,其特点为:信息容量大、编码应用范围广、保密防伪性能好、译码可靠性高、条码符号的形状可变。条码成本较低、适于大量需求且数据不必更改的场合。,3、光学字符识别OCR4、磁条(卡)技术磁条技术的优点是数据可读写,数据存储量能满足大多数需求,便于使用,成本低廉。很容易磨损,安全性较低。在很多领域得到了广泛应用,如信用卡、银行ATM卡等。,5、IC卡识别技术IC(IntegratedCard)卡,将可编程设置的IC芯片放于卡片中。IC卡从嵌装的芯片划分可成两大类,存储器卡和智能卡。按照数据读写方式,IC卡又可分为接触式IC卡和非接触式IC卡两类。,IC卡(接触式)和磁卡比较有以下特点:安全性高;存储容量大;防磁,抗干扰能力强,可靠性比磁卡
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海东消防培训题库及答案
- 2025年飞行员招聘面试参考题库及答案
- 2025年认证咨询师招聘面试题库及参考答案
- 2025年作业分析师招聘面试题库及参考答案
- 2025年驾驶员招聘面试题库及参考答案
- 2025年若干产品专员招聘面试题库及参考答案
- 2025年母婴产品销售专员招聘面试参考题库及答案
- 2025年医疗行业项目经理招聘面试题库及参考答案
- 2025年营销副总裁招聘面试参考题库及答案
- 2025年基本面分析师招聘面试参考题库及答案
- 5.1认识方程+教学设计-2025-2026学年北师大版数学七年级上册
- 2024年卫生高级职称面审答辩(内科学)(副高面审)模拟试题及答案
- 2025年物流师(中级)职业技能鉴定试卷题型解析
- 入院记录课件模板
- 2025年自动驾驶卡车在快递物流配送中的应用前景及市场前景报告
- 2025年《治安管理处罚法》新修订课件
- 母乳喂养技术课件教学
- 开展村干部评选活动方案
- 2025年河南理工大学计算机导论试题
- 供应商准入资格评估表模板
- 软骨素市场发展前景及投资可行性分析报告(2025-2026年)
评论
0/150
提交评论