第一讲-语音识别概述_第1页
第一讲-语音识别概述_第2页
第一讲-语音识别概述_第3页
第一讲-语音识别概述_第4页
第一讲-语音识别概述_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音识别简介语音识别语音识别研究机构语音识别的应用语音信号处理的范畴语音信号处理的研究方向商业技术报告语音识别ASR的定义ASR的流程ASR的分类ASR的学科特点ASR的历史ASR的定义两个不同层次的理解ASR:AutomaticSpeechRecognition,让机器把人说的语音翻译成文字自动语音理解(ASU):在语音识别的基础上,理解人所说的文字意义目标:理解任何人在任何环境下的语音,模仿人的听觉能力ASR的信号流框图Front-endanalysis语音识别分类按词汇量大小小词汇量(30)、中词汇量(100)大词汇量(无限量)发音是否连续:孤立词、连续语音按与说话人的关系:SD,SI按说话方式:朗诵语音、口语语音按应用目标:通用、专用按实现方法:计算机软件,嵌入式系统,计算机网络,电话网络,无线网络返回学科特点:交叉学科SignalProcessingAcousticsPatternrecognitionCommunicationandinformationtheoryLinguisticsPhysiologyandpsychologyComputerScienceandtechnologyCognitivescienceHistoryWhatwasthefirstsuccessstoryofspeechrecognition?“RadioRex”inthe1922,wasthefirstsuccessstoryinthefieldofspeechrecognitionlittletoydognamed"Rex”VoicerecognitionHistory1936-AT&T’sBelllabsstartedstudyofspeechrecognition(fundedbyDARPA)1950s-Isolateddigit,syllables,phonemes,smallvocabulary1960s

Japan,HardwaresystemsUseofdynamicprogrammingReddy(CMU):continuousspeechrecognitionHistory(con’t)1970s,significantmilestonesIsolatedwordbecameviableandusable:usingpattern-recognition,DPandLPCIBM’seffortsinlargevocabularyAT&TBellLabs’seffortsinSIASR,->clusteringalgorithms1978–speakandspelltoybyTI

History(con’t)1980s,Focusonconnectedwordrecognitiontwo-levelDP(NEC),One-passmethod,LevelbuildingShiftfromtemplate-basedapproachestostatisticalmodelingmethods–HMMApplyingANNinthelate1980sSystems:SPHINX(CMU),BYBLOS(BBN),SRI(LincolnLabs)History(con’t)1990s,FocusoncontinuousASR

ReducetheeffectofnoiseRobustnessOn-linelearning(Speakeradaptation)NaturallanguagefrontendstoASRIBMViaVoiceDevelopmentplatform:VBVoice(Pronexus)1997–DragonSystemsHistory(con’t)21c:TechnologytodealwithenvironmentvariationASRformulti-languagesEmbeddedSystemChallengesofspeechrecognitionEaseofuseRobustperformanceAutomaticlearningofnewwordsandsoundsGrammarforspokenlanguageControlofsynthesizedvoicequalityIntegratedlearningforspeechrecognitionandsynthesis研究机构CMU:UWUCLAPurdueUniversityStanfordUniversityUniversityofPittsburgh研究机构清华大学:刘加,曹志刚、葛余博、蔡莲红中国科技大学:戴礼荣、戴蓓倩哈尔滨工业大学:韩纪庆安徽科大讯飞信息科技股份有限公司

福建省海峡天音信息技术有限公司金耳麦-言丰科技研究机构IBM(HumanLanguageTechnologiesResearch)

http:///hlt/IBMIndiaResearchLab:http:///irl/projects/speech/Microsoft:/speechPronexusIntelMore应用领域语音听写系统ViaVoiceDragonSystemsVoxNaut:开放式多语言语音服务平台(,Italy)易说语音输入系列海峡天音PattekASR中科院自动化所普通话95%应用领域(续)智能人机界面语音信息服务政策咨询、航班信息、交通信息查询股票信息查询公安的刑事侦察辅助电话监听:具有关键语音发现能力声纹身份侦察医疗临床应用身份认证:信息安全应用领域(续)嵌入式产品应用电话、移动通信工具提供语音服务的交换机具有语言交互能力的机器人智能导游器具有语言沟通能力的智能玩具………典型产品金立语音王A320德赛西威“EICC”车载高效人机互动系统SpeechMagic天朗分布式语音识别系统WindowsXP语音识别技术嵌入式语音识别语音识别芯片金立语音王A320能听会说的小秘书.让您操作起来轻松自在,个性十足语音朗读功能涵盖了未接来电、未读信息、时间、日期及星期的语音播报。让您闭着眼睛听信息,舒适惬意语音播号功能省却了您翻找电话本的麻烦,轻轻说出名字,即刻拨出电话语音命、点歌台功能让您通过语音轻松到达指定菜单德赛西威“EICC”车载高效人机互动系统支持普通话对菜单的选择、功能的控制等功能,使得人和车通过设定的语言逻辑进行对话,提高驾驶高效性及安全性语音识别专用芯片SensoryRSC一4x系列凌阳语音识别单片机SPCE061AICRouteLD3320A应用范例运用到XBOX游戏中美国开通旅游交互语音识别服务包括股市行情,星座运情,交通指南,球赛结果以及其他可以在电话上获取的服务语音识别及合成芯片在玩具索尼公司的电子狗Aibo

,零售价2200美元,且是限量生产(年产1万只)。东莞银辉爱赛比,开发费用180多万美元,零售价人民币3600元AreasofspeechprocessingCoding,transmission,enhancement

SpeechRecognitionSpeechsynthesis(TTS)Speakerrecognition/IdentificationLanguagerecognitionSpeechunderstandingandvocaldialogVariationsinspeakerandspeakingconditionsEmotionRecognitiononspeechInformationRetrieval语音信号处理研究新方向VoiceprintforIDDigitalspeechForensicMultimediaInformationRetrievalEmotionAnalysisonspeechVariousApplicationVoiceprintforIDSpeakerIdentificationWhoareyou?One-to-manymatchSpeakerVerificationAreyouSam?One-to-onematchAdvantagesLowcostDistanceHighacceptabilityDisadvantagesNotthemostsecureofthebiometrictechnologiesHumanvoicechangesovertimeDigitalspeechForensicWhatdidSamsay?ItisreallysaidbySam

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论