声纹鉴定技术基本知识介绍.doc_第1页
声纹鉴定技术基本知识介绍.doc_第2页
声纹鉴定技术基本知识介绍.doc_第3页
声纹鉴定技术基本知识介绍.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

声纹鉴定技术基本知识介绍 作者:金恬 文章来源:本站原创 点击数:5 更新时间:2010-11-1 声纹鉴定技术基本知识介绍 科技的进步不断推动着刑侦技术的发展,声纹鉴定是目前发展较为迅速的一个领域,涉及语音、语言、生理、心理、信号处理、统计等多个学科。在生物认证领域,唯有机器自动声纹鉴定的性能在某些条件下与人类相当,甚至超过人类。为使大家对声纹鉴定有所了解,现将相关的概念、应用、发展及现状等作简单介绍。一、声纹鉴定的概念(一)声纹鉴定的定义声纹鉴定,也称为说话人识别,是一项根据语音中反映说话人发音和言语的特征,识别说话人身份的技术。语音中既包含说话人先天的发音差异,又包含后天的言语习惯。声纹鉴定的核心是通过预先录入的语音样本,提取这些独一无二的特征并保存在数据库中,应用时将检材的特征与数据库中的进行匹配,从而确定说话人的身份。(二)声纹鉴定的特点与其他生物认证如指纹、掌纹、虹膜等一样,声纹也有不会遗失、无须记忆和使用方便等特点。首先,以声音作为识别特征,因其非接触性和自然性,用户容易接受,也易于采集。其次,所用的设备成本不高。对输入设备如麦克风等没有特别要求;特征提取、模型匹配只需普通计算机即可完成。再次,对于远程应用和移动互联环境的身份验证,声音恐怕是最方便快捷的生物特征。(三)声纹鉴定的分类声纹鉴定任务根据鉴定方式的不同,可以分为三类:说话人辨认,是指从给定样本集中把检材所属的说话人区分出来;说话人确认,是针对单个用户的样本,判断检材是否属于所声称的用户;说话人探测跟踪,是指对一段包含多个说话人的语音,正确标注和提取特定说话人的语音。对说话人辨认可进一步分为闭集辨认和开集辨认两种:闭集辨认,是指所测试的说话人肯定是在数据库中出现过的;开集辨认,指的是所测试的说话人还有可能是数据库中没有出现过的,难度大于闭集辨认。此外,声纹鉴定任务从对语音的要求上可以分为与文本无关的和与文本有关的两种:与文本无关的,是指语音样本不要求特定的语种和内容,即样本与检材之间并不要求一致;与文本有关的,是指语音样本由用户按照给定的文本朗读得到,样本应与检材相一致。(四)声纹鉴定的方法目前,声纹鉴定的基本方法主要有两类:1、视听检验,是指通过听辨韵律、言语习惯等,观察分析检材与样本中相同或相近的音节、词语在语谱图上的声学特征,做出肯定或否定的定性结论,主要为公安、司法等部门采用;2、模式识别,是指利用计算机技术,将语音样本参数化训练用户模型,鉴定时将检材提取同样的特征参数,与各用户模型计算概率相似度,做出有关相似程度的定量结论,在商业语音产品中得到了广泛的应用。二、声纹鉴定的应用目前声纹鉴定在公安、司法和金融等机构都有迫切的需求,主要体现在:(一)侦查破案。对于各种电信诈骗、绑架、电话人身攻击等案件,声纹鉴定帮助对嫌疑人的查证,如通过嫌疑人的声音进行案件串并,快捷准确地确认嫌疑人是否为犯罪人。同时,利用声纹鉴定系统可以实现在海量通话信息中搜寻目标嫌疑人实施监听。在美国,有关机构还利用这一技术来判断监外执行人员是否在其寓所中。(二)声纹密码。金融机构、政府单位及重要部门希望能将声纹作为加密的辅助手段。如银行账户管理中的密码盗用问题,政府社保部门的社保金冒领问题,重要部门的门禁安全控制问题等,都需要用到声纹这一方便经济的加密手段,而对用户来说,这并未增加负担。(三)网络服务。在互联网应用及通信领域,声纹鉴定可以应用于诸如声音拨号、电话购物、数据库访问、信息服务、语音电子邮件、电子商务、计算机远程登录等;在呼叫应用上,当顾客以电话方式对呼叫中心提出请求时,系统能够根据话音判断其身份,提供更个性化的服务。(四)国防安全。声纹鉴定可以辨认出电话交谈过程中是否有关键说话人的出现,继而对交谈的内容进行处理。另外,当通过电话发出军事指令时,可以对发出命令的人的身份进行确认。声纹鉴定有着广泛的应用前景,可应用在需要进行身份认证的各种领域。随着互联网的蓬勃发展以及音频数据的爆炸式增长,声纹鉴定也应用到了语音检索中。三、声纹鉴定的发展以人类语音作为身份认证的手段,据说是从1660年英国查尔斯一世之死的判决开始的,这是首次利用语音作为推断犯人作案的线索。其后,随着技术的发展,电话克服了距离的障碍,录音克服了时间的障碍,从而使得对说话人语音个性的分析得到了关注。对声纹鉴定的研究始于20世纪30年代。从1937年开始,以C. A. Lindbergh先生的儿子被拐骗事件为开端,对语音的说话人个性开展了科学的测量和研究。1945年,美国贝尔实验室的L. G. Kersta目视观察语谱图匹配,提出了“声纹”的概念,第一次介绍了采用上述方法进行声纹鉴定的可能性。1966年,美国法院第一次采用此方法进行了取证。早期的工作主要基于人耳听辨实验和探讨听音识别的可能性方面。随着研究手段的改进,通过机器自动识别人的声音逐渐成为现实,学者的研究重点也转移到了以机器自动模式识别为主的声纹鉴定上。从20世纪70年代末开始,声纹鉴定的研究重点转向对各种声学参数的线性或非线性处理以及新的模式匹配方法上。由于考虑到了人耳的听觉感知机理,加上大量统计技术的运用,取得了较好的识别效果和噪声稳定性。进入90年代以后,现代信号处理技术的应用迅速成为目前与文本无关的声纹鉴定中的主流技术,将声纹鉴定研究带入一个新的阶段。2000年左右,Reynolds提出了统一背景模型下的最大后验概率结构,为声纹鉴定从实验室走向实用做了重要贡献:这一结构降低了对样本的依赖,只需较少量的样本就可以实现自动声纹鉴定,并且减弱了录音条件失配的影响。自20世纪60年代以来,声纹鉴定所处理的语音已经从小规模语料库(包含较少的说话人)、干净语音和受限文本发展到今天的大规模语料库(包含很多的说话人)、任意内容的文本以及各种真实环境下的语音。四、声纹鉴定的现状经过40多年的研究,声纹鉴定的研究早已从实验室系统转移到了实用系统。20世纪80年代以来,有很多商用的声纹鉴定产品问世,如美国的Home Shopping Network(家庭购物网络),同时采用与文本有关的说话人确认和语音识别来进行基于电话语音的订货;苹果公司于1999年10月份在Mac OS9操作系统中加入声纹密码功能,利用语音进行个人计算机的使用控制。国内的声纹鉴定产品包括言丰-声纹识别器、模识Pattek ASR3.0/TSP说话人识别、得意声纹识别引擎、中科信利说话人识别引擎(TSIE)、北极星声纹识别技术等。从1996年起,为了评估声纹鉴定的研究水平,美国国家标准及技术署开始举办世界性的评测。它为参赛者提供统一的数据平台、评测规则以及评估标准,因而可以在众多的声纹鉴定系统中进行性能的比较,可以说代表了当今声纹鉴定领域的最高水平。迄今累计有超过40个国际著名研究机构和大学参加了评测,包括美国卡耐基-梅隆大学、美国麻省理工学院、美国斯坦福大学、捷克博诺技术大学、清华大学、中国科学技术大学、中科院自动化所、中科院声学所等。值得一提的是,我国研究人员多次在评测中取得优异成绩。如清华大学、中国科学技术大学、中科院声学所的相关实验室均在历次评测中取得了很好的名次。目前,中国科学技术大学讯飞语音实验室正承担着总参谋部“智能语音处理”预研项目,现已取得阶段性成果。我国在声纹鉴定方面的研究起步较晚。近二十年来,此领域的研究得到国家(特别是国家863和973计划)的重视和支持,在国防和公安领域的应用大大推动了研究的进步和成果的应用,目前我国多数公安机关配备的VS99声纹仪就是一例。VS99声纹仪以视听检验为声纹鉴定的主要方法,兼有录音、语音增强、完整性检验等功能,操作简单,使用方便。五、声纹鉴定的难点虽然声纹鉴定的研究已有半个世纪,但仍存在一些困难,与无条件的实用化要求还有一段距离,主要表现在:(一)语音噪声的多样性。实际案件中的录音环境往往十分复杂,背景噪声既是对声纹鉴定的严重干扰,又是案件侦破的有用信息。如何剥离和充分利用多种多样的噪声是一项需要长期探索的课题。(二)语音信号的漂移性。与指纹、DNA等不同的是,声纹不是固定不变的,常常与说话人所处的环境、情绪、健康状

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论