




已阅读5页,还剩67页未读, 继续免费阅读
硕士学位论文-基于模糊理论的语音关键词识别.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学校代码:10270学号:042200635硕士学位论文论文题目基于模糊理论的语音关键词识别学院数理信息学院专业通信与信息系统研究方向语音信号处理研究生姓名指导教师完成日期二七年四月摘要摘要关键词识别是语音识别研究中的一个重要领域,其目的是从连续语音中检测并确认给定的若干个特定关键词。连续语音识别与之相比,资源耗费大,速度慢,抗噪能力不强,这导致连续语音识别短期内难以突破。本文对关键词识别算法进行了深入研究。针对聚类过程中出现的类间交叠现象,本文采用模糊模式识别,很好地解决了此问题,并对仿生模式识别算法进行了一些改进。本文的工作主要集中在以下几个方面:本文以汉语音节作为识别基元,为了准确地检测出每一个音节,采用一种基于能频积的二次端点检测方法,能很好地检测出单个音节。简单介绍了所提取的特征,其中时域特征能量和过零率用来进行端点检测,而在建模过程中采用频域特征Mel倒谱系数和短时谱临界带特征矢量,因为频域特征跟时间无关,所以从特征提取的角度避免了动态时间规整的复杂计算。完善了仿生模式识别过程中高维超椭球建模的方法,推导出了高维超椭球的方程和判别函数,考虑到其实现的复杂性,用小超球链来代替超椭球,大大简化了算法。另外对仿生模式识别中所存在的类间交叠现象进行了分析,并提出了解决办法。(1)提出了类内隶属度的概念,通过比较类内隶属度的大小来判别落入交叠区域的样本的归属;(2)在超球和超椭球两种情形下,提出了基于距离、基于体积和基于判别函数的隶属函数,并从可行性和算法的复杂度两方面进行了比较,确定了一个最优的隶属函数,而且给出了完整的判别算法;(3)对识别结果的确认进行了详细的说明,因为有了类内隶属度的概念,所以直接用隶属度跟阈值进行比较就可实现对结果的确认。实验表明,采用模糊模式识别算法以后,系统拒识率降低了11个百分点。关键词:关键词:关键词识别,语音识别,仿生模式识别,模糊模式识别,端点检测,隶属函数AbstractKeywordspottingisanimportantareainspeechrecognition.Itsobjectiveistoidentifyandverifyafewspecifiedkey-wordsincontinuousspeech.Comparingwithkeywordspottingcontinuousspeechrecognitionneedmoreresourcesanditsprocessspeedisloweranditsmorevulnerabletonoise.Socontinuousspeechrecognitionisnotsuitableinmanyapplicationsandkeywordspottingispreferred.Thispaperconductsanin-depthstudyofkeywordspottingalgorithm.Fortheoverlappingbetweencategoriesinclusteringprocessafuzzypatternrecognitionalgorithmisproposedandsuccessfullysolvestheproblemmoreoveritmakessomeimprovementsinbionicpatternrecognitionalgorithm.Themainworkofthispaperfocusesonthefollowingaspects:Chinesesyllableisrecognitionunitinthispaper.Inordertodetecteverysyllableaccuratelyatwicedetectionbasedontheenergy-frequency-valueisproposedanditcandetectsinglesyllable.Featuresextractedisbrieflyulated.Forexampleshort-timeenergyandzero-crossrateareusedforendpointdetectionMel-frequencycepstrumcoefficientandcritical-bandfeaturevectorisusefulinthemodelingprocess.Asfeaturesinfrequencydomainhavenothingtodowithtimesocomplexcalculationofdynamictimewarpingisavoidable.Modelingofmultidimensionalhyper-ellipsoidhasbeenperfectedinbionicpatternrecognitionequationanddiscriminantfunctionofmultidimensionalhyper-ellipsoidiseduced.Consideringthecomplexityofrealizationsmallchainofhypersphereinsteadofhyper-ellipsoidcangreatlysimplifyalgorithm.Inadditionthispaperanalysestheoverlappingbetweencategoriesandproposedsolutions.(1)Aconceptofdegreeofmembershipwithcategoryisproposed.Theattributionofsamplesfallsintotheoverlappingregionisdeterminedbycomparingthedegreeofmembership.(2)Membershipfunctionsbasedondistancevolumeanddiscriminantfunctionareproposedinhypersphereandhyper-ellipsoidcases.Aftercomparedthesemembershipfunctionsfromfeasibilityandcomplexityofalgorithmthispapercomestoanoptimummembershipfunctionfinallyandproposesawholerecognitionalgorithm.(3)Theconfirmationoftheidentificationresultsisdetailedlydescribed.Becauseofthedegreeofmembershiptheconfirmationisrealizedbycomparingthedegreeofmembershipwiththreshold.Theexperimentsshowthattherejectionratereduces11percentbyapplyingfuzzypatternrecognitionalgorithm.Keywords:keywordspottingspeechrecognitionbionicpatternrecognitionfuzzypatternrecognitionendpointdetectionmembershipfunction硕士学位论文基于模糊理论的语音关键词识别1目录目录摘要.IAbstract.III目录.1第一章引论第一章引论.11.1什么是关键词识别.11.2连续语音识别与关键词识别的关系.21.3关键词识别的意义.21.3.1应用实例.21.3.2应用背景.31.4国内外发展动态.41.4.1算法进展.41.4.2现有语音检索系统.51.5性能评价问题.61.6关键词识别的基本问题.71.7论文工作.8第二章特征提取与选择第二章特征提取与选择.92.1语音识别的基元.92.2端点检测.112.2.1基于能频积的二次端点检测.112.3特征提取.122.3.1语音信号短时分析和基本特征参数.时域参数.频域参数.142.3.2特征参数的距离度量.182.4小结.19第三章模式识别第三章模式识别.21硕士学位论文基于模糊理论的语音关键词识别23.1几种常用算法的介绍.213.2仿生模式识别.233.2.1仿生模式识别基本原理.243.2.2多维空间几何分析及其理论介绍.253.2.3仿生模式识别算法实现.273.3高维超椭球的困难.313.4椭球建模时的一个思考.323.5小结.32第四章模糊模式识别第四章模糊模式识别.334.1模糊理论的引入.334.2模糊理论概述.344.2.1模糊理论的发展和现状.344.2.2模糊集的概念.354.2.3模糊理论的应用前景、范围.364.3模糊聚类分析.374.4模糊模式识别.374.4.1模糊模式识别直接方法的基本原理.384.4.2模糊模式识别直接方法的一般应用步骤.394.4.3构造隶属函数的准则.414.4.4隶属函数的构造.4超球的隶属函数.4超椭球的隶属函数.444.4.5模糊模式的明确化.484.4.6识别结果的确认.504.5遗留的问题.524.6小结.52第五章第五章系统实现系统实现.535.1系统框图.535.1.1训练系统.535.1.2识别系统.54硕士学位论文基于模糊理论的语音关键词识别35.2结果分析.545.2.1实验一.545.2.2实验二.555.2.3实验三.575.3小结.58第六章第六章总结与展望总结与展望.596.1总结.596.2存在的问题以及研究方向.59参考文献.61硕士学位论文基于模糊理论的语音关键词识别1第一章引论第一章引论1.1什么是关键词识别什么是关键词识别关键词识别(KeywordRecognition,KWR)或关键词检出(KeywordSpotting,KWS)就是在连续的、无限制的自然语音流中识别出一组给定的词关键词。关键词识别应用于一些具有特定要求的场合,由于速度、高检出率或其它特定的要求,人们并不需要系统识别出整个句子,更不需要理解整个句子,而只关注那些包含特定词(称为“关键词”)的句子。比如,对一些特殊人名、地名和词语进行电话监听,又比如通过人名进行自动分机接驳服务等等。根据一些应用的特殊需要,关键词识别有区别于其它自动语音识别的地方。有的应用需要限定或假设一个句子只能含有一个关键词(如自动分机接驳),而有的应用则不希望有这样的限定(如电话监听)。有的应用希望“宁错勿漏”(如电话监听),而有的则希望“宁漏勿错”(如自动分机接驳)。关键词集内的词没有被检出,称为“漏识(amiss)”,而将关键词集外的词识别成一个集内的词,称为“误警(falsealarm)”或“虚报”。对于一个特定的关键词识别器,漏识率和误警率不可能同时达到最低。因而相对于其它的语音识别器,关键词检出需要在漏识率和误警率之间找到平衡点。一个较为理想的关键词识别系统应该具有如下特征:1)任意人。关键词识别系统对不同人的说话有一定的适应能力。2)词表可随意定制。开发者可以利用应用程序接口(ApplicationProgrammingInterface,API),方便地提供词表定制工具,使得使用者无需具备专业知识就可以方便地定义自己的词表;对新定义的词表,系统无需重新训练,立刻可以使用。3)单选或多选性。句中关键词个数可以设定,使用者可以根据具体的应用情况,方便地指定一句话中是仅含该关键词,还是含多个关键词。4)良好的拒识性能。利用其良好的拒识性能,识别系统将根据具体情况报出所识别出的关键词,不会因使用者设定的句子中可以含有的关键词数目而强行虚报。5)关键词识别应具有很低的漏识率和误警率。6)良好的折中性。可以根据具体应用需要,方便地调整,以在漏识率和误警率之间达到很好的平衡。硕士学位论文基于模糊理论的语音关键词识别21.2连续语音识别与关键词识别的关系连续语音识别与关键词识别的关系关键词识别是语音识别的一个研究方向,与连续语音识别(ContinuousSpeechRecognition,CSR)之间存在着密切的关系。首先,关键词识别的任务是在连续的无限制的自然语音流中识别出给定的词,因而它首先是一种连续语音识别;但它又不要求把整个语音流全部识别出来,因此可以说关键词识别是连续语音识别的一个分支。其次,它无法对发出自然语音流的发音人提出任何要求,因此关键词识别又不同于连续语音识别。由于存在下列差异,基于词识别的KWS与CSR常常被当作两个完全不同的问题来处理:1)模型的训练问题:CSR模型往往要用不同发音人(可以包括使用者在内)的大量数据进行训练;KWS则无法由被识别的人对模型进行一定的训练。2)词表问题:CSR要求每个待识别的词是一个有限词表中的一个;而KWS允许输入语音流包含任何词,它的词表是开放的。3)语法或词法问题:CSR要求输入语音中的词的序列受限于一个有限状态语法网络;而KWS则无此要求。4)发音人的态度:一般地讲,CSR系统的使用者能够意识到他们正与机器进行交流,他们希望自己所说的话被机器识别,因此他们一般持合作的态度;但在KWS系统中,说话人常常是毫无觉察的。5)环境:CSR系统由于用户的配合往往在比较好的环境中使用,而KWS的环境则有可能有很大噪音。1.3关键词识别的意义关键词识别的意义1.3.1应用实例应用实例关键词识别的特殊性决定了研究KWS问题的重要性。在此先看一个实例。80年代,美国ATT的BELL实验室在California的Hayward进行了一个大规模的非特定人孤立词语音识别实验1,要求打电话的用户孤立地说出collectcalling-cardpersonthird-number及operator五个词中的一个。如果用户精确地按要求说了,那么识别率可以达硕士学位论文基于模糊理论的语音关键词识别3到99%2。但实际情况并非如此,大约20%的发音夹杂有词表外发音和诸如气流声等非语音发音,比如“ahIwanttomakeacollectcallplease”。大多数的识别算法没有顾及和解决这样的问题,因此必须修改现有的算法使其能够识别出嵌入在语音中的某些特定词,这就是关键词识别。ATT的BELL实验室在假定用户所说的一句话是“背景信号、其它语音、一个关键词、其它语音、背景信号”这样的序列的前提下,采用新的识别算法即KWS算法,使得嵌入语音流中的关键词识别率可以高达87.1%。1.3.2应用背景应用背景KWS有着广泛的应用领域。一个重要的应用是国防监听。在出于国家安全的考虑对电话网络进行监听时,要耗费大量的人力和时间;再者,由于人的精力是有限的,有时也会把极其重要的内容忽略掉。而关键词识别器(KeywordSpotter或KeywordRecognizer)可以日夜监控着电话网络,一旦发现有某些关键词出现,及时预警,跟踪目标。这可以节省人力,同时高性能的KWS真正密切监控。另外一个重要的应用是语音信箱的消息分类(MessageClasscification)。当接收到语音消息时,通过对其关键词的检索与识别,把它们按关键词的性质分类,Rose等人的技术正是为了这一目的的3。按内容检索(Content-Addressed)是关键词识别的又一重要应用。随着计算机硬件和多媒体技术飞速发展,信息的存储将采取越来越自然的方式,比如以声音和图像的形式存储,但所需的代价是存储量大和检索缓慢。在硬件成本日益降低的前提下,存储量问题很容易得到解决;但人工检索却是一个令人头疼的问题。KWS可以解决这一问题。我们可以列出自己所关心领域的一组关键词,KWS就可以把所有相关的存储语音都调出来。如果关键词的输入再由检索者以语音命令的形式给出,那么信息的按内容检索就能够以完全自然的方式进行。早在20世纪70年代,美国军方和国家安全局即将关键词识别技术同说话人识别相结合共同应用于检测系统。随着语音识别技术的进一步发展和普及,20世纪80年代中期以后,关键词识别技术已延伸到通讯领域、计算机语音检索系统、自动化控制方面,并已有实用系统问世,如智能转接系统、语音信箱的消息分类等。KWS的应用远不止这些。几乎可以说,在所有语音识别的应用中都会用到关键词识别硕士学位论文基于模糊理论的语音关键词识别4的一些技术。比如先识别出关键词,再根据语法或词法进行其它语音的识别,最终达到自然语音理解;又如通过某些关键词识别中的预处理和后处理技术,提高语音识别的顽健性。1.4国内外发展动态国内外发展动态1.4.1算法进展算法进展对关键词识别的研究最早始于70年代美国军方的战场检测系统。1973年,Bridle的文章揭开了关键词研究的序幕4,但那时只是“给定词”的识别,“关键词”的提法是1977年由Christiansen首先采用的5,他利用信号的线性预测编码(LPC)表示对连续语音中的关键词进行检测和定位,没有使用语法或词法信息,该方法对四个词和十个数字的词表取得了很好的效果。真正的关键词识别研究是在80年代。美国ITT(国际电话电报公司)国防通讯部的Higgins与Wohlford、ATT的BELL实验室Wilpon以及美国BBN系统和技术公司的Rohlicek等对关键词识别的研究做出了重大贡献。90年代以后,关键词识别技术的研究重点是结合其它模式识别方法,进行性能提高和方法改进,以及改进搜索识别算法提高速度等。最新的进展有使用韵律特征(ProsodicFeature)6、改进语言模型78、结合中文特点910、拒识集外词(OutofVocabulary)11等方面。特别是在中文语音识别中,韵律特征尤为重要。韵律特征主要包括:音长、能量、基音、音调。从采用的核心算法来看,关键词识别主要基于以下三种框架:1.动态时间规整(DynamicTimeWarping,DTW)算法这是一种基于模式匹配的方法,该方法在早期的关键词识别系统中经常采用。Myers等人利用基于DTW的局部最小算法对关键词识别和连接词识别进行了研究12,但没有系统的实现。Higgins与Wohlford用模板连接的方法实现了KWS13,并提出了补白(filler)模板的概念,结果表明,如果词表的显式知识没有那么重要的话,则使用补白模板就很重要。随着对隐马尔可夫模型(HiddenMarkovModel,简称HMM)和人工神经网络研究的深入,DTW算法越来越不受重视,但是将DTW与神经网络相结合还是有着较好的应用前景。2.HMM框架用HMM来描述语音信号的产生是80年代语音信号数字处理的一项重大进展,目前基于HMM的语音识别技术运用相当广泛,其中以美国ATT实验室的L.R.Rabiner为首的一硕士学位论文基于模糊理论的语音关键词识别5组科学家对HMM的研究尤为细致1415。实验证明,基于HMM算法的关键词识别系统具有较高的识别率和较高的抗噪能力,因此它的使用范围也十分广泛,许多公司、研究机构都采用HMM作为语音的研究方法。3.人工神经网络关于用人工神经网络进行关键词识别的研究,从80年代中期开始陆续有介绍,通常采用的是常规系统与神经网络的混合系统,有的是多个神经网络构成的系统,还有的是用各种不同的神经网络构成的系统。其中美国卡内基梅隆大学计算机科学院研究的混合神经网络动态规划关键词识别系统16采用多状态延时神经网络(Time-DelayNeuralNetwork)作为基本结构。该系统对宽带语音测试的优度指数(FigureofMerit,FOM)为82.5%,对电话频带语音的FOM值为81.3%。由于该系统对宽带语音和电话语音两者性能比较接近,说明它在低质量有噪声的语音环境下也能很好地进行关键词识别。目前国外语音研究机构对关键词识别的研究相当重视,不少公司,如BELL实验室、MIT的Lincoln实验室17、CMU的计算机科学学院、Dragon系统公司18、Microsoft、IBM以及日本的Toshiba公司19等,都在不断地推陈出新他们的研究成果。许多国家的大学,针对自己国家的语音特点也都在进行这方面的研究,包括美国、德国、韩国和日本等等。国内对关键词识别研究很少,发表的文章更是寥寥无几,直至90年代中期,国内两年一次的全国人机语音通讯学术会议NCMMSC上还没有一篇关于KWS的文章20。大约从97年以后对关键词识别的研究才逐渐全面展开,目前像中科院自动化所、声学所、清华大学、上海交通大学21、哈尔滨工业大学、浙江大学22、南京大学等科研院校以及科大讯飞、炎黄新星、捷通华声等公司都开展了这方面的研究,在理论研究和实用化方面都取得了可喜的成果,其中走在最前列的要数清华大学。如清华大学的郑方等提出了一个中心距离连续概率模型(CenterDistanceContinuousProbilityModel,CDCPM)23,它是一种改进的HMM。1.4.2现有语音检索系统现有语音检索系统在现有的语音检索系统中,很多都是利用语音识别技术,但是早期的系统在词汇、语音限制方面比较强,在实际应用中往往有很强限制,下面列举几个有代表性的系统:1.ZBroadcastNewsRetri24该系统通过语音识别的方法,基于HMM模型,但它只能是特定人的。该系统可以采取自然语言查询,通过文本口语,系统把这些发音通过词典映射为音素描述,然后跟每个语言硕士学位论文基于模糊理论的语音关键词识别6文档计算获取状态值(RetriStatusValue)来检索。也可以通过输入文本关键词进行检索,然后输出一个检索的列表,如文件名和起止时间。2.bridgeVideoMailRetri(VMR1996)25系统用35个预选定的关键词做检索,在一个很好的关键词识别器下,识别率接近90%。该系统也是基于HMM关键词识别技术,用HTKtool对这15个人建立特定说话人的整词模型和单音子填充模型,HMM为3状态模型。3.SpeechBot搜索引擎(CompaqHPLab)26Speechbot是一个基于内容检索的音频视频搜索引擎,语言识别器是建立在CMU的Sphinx-327语言识别系统的基础上的,它将音频转为标注(transcription),在这个基础上进行关键词的检索,能够将包含特定主题和内容的音频视频文件搜索出来,主要是广播新闻。该系统即使在transcription不是很准确的情况下,仍然能够得到比较好的查询性能。4.最新成果LH公司的SPARK和VoiceExpress、IBM公司的ViaVoice系列、Dragon系统公司的NaturallySpeaking、Philips公司的FreeSpeech、中国科学院自动化研究所国家模式识别实验室(NLPR)的FlyingTalk-X、声硕科技股份有限公司的说亦通、Microsoft新推出的WindowsVista也安装了语音识别系统,还有NuanceCommunications公司的NaturallySpeaking,这可以说是世界上最先进的语音识别软件了。1.5性能评价问题性能评价问题美国国家安全局(NationalSecurityAgency,NSA)曾提出了一个时序协议:若X是假设关键词(Higgins28称之为假想命中)而Y是正确的(即实际的)关键词,如果X的中间帧落在Y的边界之内,则称X的时序是可接受的。ATT的BELL实验室根据这个协议,做了如下的定义29:1.如果X的时序是可接受的并且X等于Y,则X是识别正确的;2.如果X的时序是可接受的并且X不等于Y,则X是识别错误的;3.其它所有情况下,称X是一个误警且称Y为漏识。定义识别正确率(accuracyrate)为正确识别的关键词数占关键词总数的百分比,通常称为检测正确率,简记为dP。定义误警率(falsealarmrate)为每小时每个关键词的误警数,简记为fakwhr或fakw-hr。硕士学位论文基于模糊理论的语音关键词识别7然而系统的性能并非仅通过上面的参数孤立地加以评价。事实上,后处理中的拒识(Rejection)也是一个评价参数。在一定的误警率下,拒识率与正确率中间有一个折中的问题,拒识越多,虽然误识会越少,但正确率也就降低。而拒识率、正确率以及误识率均是在一定的误警率前提下讨论的(这称为系统的一个操作点),ROC(ReceiverOperatingCharacteristic)曲线可以很好地描述它们之间的关系30。ROC曲线是关键词的检测正确率dP与与误警率fakwhr之间的关系曲线,显而易见该曲线是一条单调不降的阶梯型曲线。BBN系统和技术公司的Rohlicek等人把系统的质量因数(FOM,FigureofMerit)定义为某一特定的误警率范围内(通常为010fakwhr)ROC曲线的平均值,即在某一特定的误警率范围内的平均关键词检测正确率。这一性能评价标准被大多数关键词识别研究者所认同和接受。虽然后来Marcus提出了更复杂的评价方法31,但基本的思路与上面的FOM定义一样。1.6关键词识别的基本问题关键词识别的基本问题1.特征提取众所周知,未经处理的语音信号的数据量非常之大,这就需要去除语音信号的相关性,用较少的数据最有效的表征语音信号。正如许多系统需要将时域信号变换到频域后再对其进行分析一样,识别系统首先需要将语音信号变换到特征空间中,然后再针对特征矢量序列进行训练和检测。因此,通过变换可以去掉语音信号中的大量冗余,使其所携带的语义信息集中映射到特征空间,其次可以将在时域空间很难分开的模式样本变得更加线性可分32。2.模式划分模式划分问题即选用什么样的参考模板,选择什么样的模板参数。如同人类学习语言一样,要想让机器理解人类口述的语言,识别系统首先需要机器通过某种方式认识它们。最直接的途径就是让机器记住关键词和填料所对应的所有语音波形,因为存储量的原因这种方法显然是无法实现的。即使是经过特征抽取后的语音信号数据量仍然很大,于是,人们很自然地想到可以结合人的发声机理用少数几个参数来描述它们,即对关键词和填料建模来有效表征语义信息,同时减少存储量。3.时间对准在关键词识别中,对于同一个词,由于发音速度不同,使得每一次所存储的语言对于时间轴而言并不是一一对应的,即存在时间对不准问题,因而无法直接通过计算它们之间的欧硕士学位论文基于模糊理论的语音关键词识别8氏距离得到其相似度(或失真测度)。同样,在识别系统中计算识别语音与参考模型之间的失真测度时也存在这个问题,因为首先说话人在训练和识别阶段的说话速度不可能保持一致,其次通常采用的参考模型并没有消除时间变量,而仍是一个与时间密切相关的序列或模型。目前,对于以特征模板作为参考模板的识别系统主要采用动态规整33的思想解决该问题,此外,HMM通过状态分割也可以解决时间对准问题。1.7论文工作论文工作本论文的工作是进行语音关键词识别的研究,采用仿生模式识别与模糊模式识别相结合的方法,仿真实现一个小词汇量的语音关键词识别系统。作者做了如下工作:(1)对语音的识别基元进行了分析,确定了以汉语音节作为识别基元。(2)为了准确地划分汉语音节,采用了一种二次检测的端点检测方法,提高了端点检测正确率。(3)针对建模过程中出现的类间交叠现象,引入模糊理论,构建了一个类内隶属函数,较好地解决了类间交叠这一问题。(4)在仿生模式识别的实现中采用球链代替椭球,大大减少了算法的复杂度。本文篇章安排如下:第二章介绍特征提取与选择;第三章介绍模式划分方法;第四章介绍模糊模式识别;第五章为系统结构介绍及实验结果分析;第六章进行工作总结和展望。硕士学位论文基于模糊理论的语音关键词识别9第二章特征提取与选择第二章特征提取与选择2.1语音识别的基元语音识别的基元语音识别基元的选择在语音识别尤其是连续语音识别中是很重要的环节。识别基元的选择应该基于如下两个原则:1)具有灵活性,用它可以组成其它的语音或语法单位;2)具有稳定性,它应该在不同的语音环境和语言环境中相对稳定。灵活性希望基元尽可能地小,如音素;而稳定性则希望基元尽可能地大,如词甚至词组。此外基元的选择还需考虑搜索时间和模型存储开销。汉语的语音识别和关键词识别必须考虑汉语的特点。汉语是一种音节性强的语言,一个汉字对应一个音节,而且音节的结构是比较典型的声韵(Initial-Final,IF)结构,声母和韵母
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江苏腾海物业管理有限公司招聘国有企业人员10人笔试参考题库附带答案详解
- 2025年河北顺德投资集团有限公司公开招聘劳务派遣人员10名笔试参考题库附带答案详解
- 2025国机集团总部及京内企业管培生招聘笔试参考题库附带答案详解
- 2025四川成都市青白江区区属国有企业招聘43人笔试参考题库附带答案详解
- 地铁施工安全培训心得课件
- 固定资产的取得课件
- 固安县安全生产培训课件
- 地球是人类的家园课件
- 回延安优翼课件
- 医护关系学科研究
- 综合实践 探索年月日的秘密(教案)北师大版数学三年级上册
- 2025年医师三基考试试题及答案(上半年)
- 基孔肯雅热主题班会课件
- 2025年全国企业员工全面质量管理知识竞赛试题及答案
- 锁骨下盗血综合征伴锁骨下动脉闭塞的护理查房
- 磷化铝管理办法
- 水下激光探测-洞察及研究
- 2025年海底捞企业面试题及答案
- 小学体育家长会课件
- 教育的人口功能
- 抗凝剂皮下注射技术临床实践指南2024版
评论
0/150
提交评论