



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模式识别可用于文字和语音识别、遥感和医学诊断等方面。 文字识别 汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋。所以在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我过得到普及的应用。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了联机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。 语音识别 语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术,该方法在语音识别时识别速度较快,也有较高的识别率。 指纹识别 我们手掌及其手指、脚、脚趾内侧表面的皮肤凹凸不平产生的纹路会形成各种各样的图案。而这些皮肤的纹路在图案、断点和交叉点上各不相同,是唯一的。依靠这种唯一性,就可以将一个人同他的指纹对应起来,通过比较他的指纹和预先保存的指纹进行比较,便可以验证他的真实身份。一般的指纹分成有以下几个大的类别:环型(loop),螺旋型(whorl),弓型(arch),这样就可以将每个人的指纹分别归类,进行检索。指纹识别基本上可分成:预处理、特征选择和模式分类几个大的步骤。 遥感 遥感图像识别已广泛用于农作物估产、资源勘察、气象预报和军事侦察等。 医学诊断 在癌细胞检测、X射线照片分析、血液化验、染色体分析、心电图诊断和脑电图诊断等方面,模式识别已取得了成效。四、模式识别技术的近乎无限的发展潜力 模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。 1、语音识别技术 语音识别技术正逐步成为信息技术中人机接口(Human Computer Interface, HCI)的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。 2、生物认证技术 生物认证技术(Biometrics)本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。国际数据集团(IDC)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100亿美元的市场规模。 3、数字水印技术 90年代以来才在国际上开始发展起来的数字水印技术(Digital Watermarking)是最具发展潜力与优势的数字媒体版权保护技术。IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。模式识别在数字家庭娱乐中的应用第一部分是互动电视。互动电视从形式上分为三个部分,一个是用户接入端,IPTV机顶盒,还有节目发送共享端,现在的电视台、网络电视视频网站,还有就是用户移动端,现在移动互联网是比较火的方向,我主要介绍一下在用户接入端还有用户移动端这方面可能会用到的技术。第二部分是自然交互娱乐。这是一个产品的展望,语音控制的一个应用,我通过说话来控制电视。还有一个炒的比较火就是智能播放,我想听什么给我放什么,最好电视智能终端我想看什么节目能给我看什么节目。现在通过一些比如说人脸识别,再细分一下根据你的情绪控制识别来给你推荐或者是根据你用户行为,你的用户习惯给你推荐一些你比较感兴趣的节目。这里边用到的主要技术一个就是语音技术,还有一个是人脸识别,还有一个是机器学习方面的东西,是节目推荐,根据你的行为分析。这里我讲到就是视频检索技术,用户移动端这边主要是用户交互这方面的,还有一个图象检索技术以及人脸搜索还介绍一些比较好玩的AR应用。互动电视谷歌TV现在已经有的卖了,但是卖的不是很好,还有一个雅虎TV,谷歌TV是由WIFI网络,可以做视频点播,第二屏幕一些体验,还有一些社交,包括节目一些分享等等。他现在有一个智能终端,他跟索尼合作,也卖自己的电视。雅虎TV他是给几大厂商合作,包括LG、三星几大厂家,有点相统一电视标准的一些意思,也有他的开放平台WTK,基于它的开放平台,用户可以自己开发一些可以免费、可以收费,他有一个平台。视频检索技术视频检索技术应该说有着广泛的应用,我讲电视主要讲广告方面,广告检测跟广告替换,广告的应用很广,我们以前做过一个东西是关于广告方面的录制,通过片头检测,节目录制还有节目检测这个地方,这个在家庭电视方面应用可以作为广告推荐。这个图实际上就是一个广告检索的一个应用的例图。我可以根据不同的人群做一些广告,为细分人群播放下去,这是视频复制检索一个直接应用。这个广告检测这部分它的应用其实还是比较多,一个是广告去除,在录制节目的时候,我把新比如说我流媒体播放的时候把不想要的广告去掉,替换成其他一部分的广告。还有一部分就是广告检测,像广电总局,我一些禁播的广告是否还在播放,还有一些广告厂家,比如说这个广告十秒,是否给我播放7、8秒,播放次数、播放时间等一些检测。广告替换、广告管理等等。视频检索技术是我来了视频流,把它分成音视频,然后对音视频分别进行特征提取,包括一个基本的特征,比如我图象处理方面的一些特征,还包括一些分段的一些特征,比如关键帧检测。音频方面包括端点检测,一些音频的分类,就是它单帧特征还有分段特征,还包括一些检索、搜索的一些模块。然后搜索完之后,就可以实现在线监测或者在线检测的一个东西。用户移动端的话这个地方比较新,像一些图象检索、人脸搜索这些新技术还没有很成熟用到移动端。说iPhone5把人脸识别API已经开放了,如果做这方面开放可以直接调用一下。图象检索1.流程实际上现在图象检索我个人把它分为主要两大部分,1)是小图象的精准检索,再一个是互联网比较大数据的检索,像谷歌的图片搜索、微软Bin搜索引擎之类。他个大的搜索比小的搜索其实在这个处理过程中有一点不同,都可以分为离线数据库,特征提取、索引建立,在线就是这块进来,特征提取,然后在数据库当中去搜索,最后得到它的一个匹配的一个结果。2)大的数据库,它的技术一般分为特征提取、聚类、特征压缩、建立索引,据我所知这个地方还是一个文字搜索为主。小的数据库比如说RSH(音)等一些检索方法。这是以前开发图象检索比较好玩的一个东西,大家可以看一下。2.图像检索是现有PC端的一些应用,因为现在电视这方面智能终端接了WIFI网络,很多PC端的应用都可以移到智能终端这块来做。比如说电子商务这块给图像检索相结合,就是比较早期就是WWW.LIKE.COM。它是根据象四限,比如说包,我搜索之后可以看到一些相应的场景。在这点上,比如我看电视的时候,我看一个广告的话可以用手机拍下我感兴趣东西,直接上传这张图片可以返回商品一些信息。图像检索这块在社交这块的应用,还有Face Search这块,我主要介绍它在社交电视这块可以应用,比如说像PicTriev,我上传一张图片,他可以反馈给大致年龄,是男是女这些之类,如果得到这些信息可以做一些广告的推荐之类的东西。这是谷歌图片搜索脸部特写,他支持图片和文字的方式,相信大家都玩过这个东西。Kinect介绍前段时间做过3D的东西,觉得Kinect比较好玩,Kinect是微软研制一种体感输入设备,据我所知为数不多自然交互应用比较成功的产品。主要用在游戏方面,成熟可能还谈不上。XBOX360去年年底推出之后,今年会议上已经卖掉800多万台。大家对这种自然交互式的新型游戏非常感兴趣,它比索尼PS Move和PS Eye这种手持设备更受环欢迎。Kinect有两个摄象头计算前景的深度信息,还有一个捕捉颜色的信息,人们的视频信息用于人们的行为分析还有人脸提取。这个地方还有一排麦克风阵列,用来提取人得声音进行识别。下面还有旋转马达来简单校正一下,这个就是XBOX360一个外设。XBOX介绍其实是通过红外技术,通过深度摄象头把它转为深度信息,这是原始图片信息,这是转化成红外信息,主要实现前景背景分离。未来趋势计算机发展的时代,未来摇控器,这种趋势未来可能是肢体自然交互一个变化。我个人
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学五年级英语上册Unit3单元语音速记与巧练(含答案)
- 建筑工程成本控制与预算管理
- 图形图像处理广告设计之广告设计基础07课件
- 建筑工程项目建筑拆除与清理方案
- 水痘麻疹预防课件
- 在C4D中创建简单几何小人围观小人轻松造45课件
- 助产技术上海济光护理助产专业教学库41课件
- 2025版复合材料护栏施工安全协议
- 2025版凯悦酒店消防安全隐患整改监督合同
- 2025版新能源汽车经销商合作协议范本
- 肌张力障碍演示课件
- 锅炉安全技术规程标准(TSG 11-2020)
- 员工薪资调整审批表
- 中医妇科学:女性的生殖脏器
- 除锈剂MSDS参考资料
- 不等式及其基本性质说课课件
- 明渠均匀流计算公式
- 《纯物质热化学数据手册》
- 中国儿童严重过敏反应诊断与治疗建议(2022年)解读
- 电动力学-同济大学中国大学mooc课后章节答案期末考试题库2023年
- 2023年山东威海乳山市事业单位招聘带编入伍高校毕业生12人笔试备考题库及答案解析
评论
0/150
提交评论