声纹库建设的若干思考_第1页
声纹库建设的若干思考_第2页
声纹库建设的若干思考_第3页
声纹库建设的若干思考_第4页
声纹库建设的若干思考_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

声纹库建设的若干思考

一、声纹技术的发展声特征是人体最重要的生物特征之一,具有很强的稳定性和个人特异性。语音作为证据用于司法鉴定方面,我国在1988年由中国刑事警察学院文检系率先成立了全国第一个声纹鉴定实验室,引进了美国KAY公司生产的7800型声谱仪。1989年,公安部物证鉴定中心(时为公安部第二研究所)成立了以案件鉴定为目的的声纹鉴定实验室,并引进新一代KAY-5500声谱仪,推动了声纹技术在办案实践中的应用。我国司法声纹鉴定技术经过20年的发展,以公安部物证鉴定中心、最高人民检察院检察信息技术中心、广东省公安厅、司法部司法鉴定中心等为代表的司法鉴定技术水平已经取得长足进步。近年来在声纹自动识别领域,我国也涌现出国际一流研发团队,已经具备开展国际前沿技术研究、引领声纹信息在公安领域实现大范围使用的实力。二、声音自动识别技术(一)声纹鉴定技术应用分析20世纪40年代初,美国贝尔实验室发明了声谱仪,并且首先开始了声纹鉴定技术研究工作,并于60~70年代取得重要进展,取得99.65%的正确率。此后声纹鉴定逐渐成为案件侦查的一个重要技术。目前声纹鉴定技术分为专家鉴定和自动识别两大领域。专家鉴定方面,主要采用语音学分析方法,应用语音学及统计分析技术,通过语音工作站测量、分析说话人的语音声学特征(如声源特征、发音时的声道形状特征、发音时的口腔及双唇特征以及语音信号时变频谱特征等),然后采用统计判别方法对说话人语音是否同一作出判定。语音学分析法是目前国内外司法领域说话人普遍采用的方法,我国开展声纹鉴定的机构绝大多数均采用此方法。(二)参测系统测试声纹自动识别也称语音信号处理法,其基本原理(见图1)是由系统对说话人语音的特征参数进行分离提取和线性或非线性处理,建立语音模型,然后由系统运算进行模式匹配,确定出与其最接近的若干已知说话人语音,得出相似度的结果,其结果是多选的。还可以进一步细分为说话人辨认(SpeakerIdentification)和说话人确认(SpeakerVerification)。声纹自动识别技术近几年在美国等国家深受重视,例如美国国家标准技术署(NationalInstituteofStandardandTechnology,NIST)举办的说话人识别评测,就是针对实际应用需求,测试环境多、复杂度大,这些测试能够准确体现参测系统在接近真实环境中的实际表现,被认为是国际上水平最高、最严谨、最公平、结果最权威的说话人语音识别系统测试。受邀参加评测的均为世界顶级专业研究开发机构,包括美国麻省理工大学(MIT)、意大利都灵理工大学(LPT)、法国科学研究中心(LIMSI)等。近几年,我国清华大学、中国科学院声学所、科大讯飞语音实验室也参加了测试。根据2008、2010年NIST举办的全球说话人识别评测结果,以科大讯飞为代表的我国声纹自动识别技术已经达到国际领先水平。衡量声纹自动识别系统水平的一项重要指标是在一定库容量下的等错误率,等错误率越低说明准确度越高。目前国内外不同声纹自动识别系统水平参差不齐,好的系统在NIST所制定的覆盖3000多人、10多个语种以及各种信道的复杂情况测试集合上,对于2~3分钟语音声纹识别的等错误率已经降到2.65%,达到实际应用要求,成为司法说话人鉴定系统一个必不可缺的部分。它能够准确快速筛选嫌疑人,并提供可靠的相似概率,其结果与专家鉴定结论相互印证,极大提高了案件侦破的效率和准确率。但是目前多数系统在解决海量数据、不同信道以及噪声影响等关键技术方面效果还不理想,离实际应用还有一些差距。三、噪声库的构建和应用(一)声纹库建设及其应用随着近年来电信诈骗、绑架、敲诈勒索等案件呈现不断上升趋势,声纹特征在公共安全领域的应用价值日益突显。但目前相对于指纹和DNA而言,我国声纹的采集、建库及管理应用能力等方面还有较大差距。当前,如何在大量人群中快速准确地排查到犯罪嫌疑人,成为破案关键所在。据文献报道,美、英等发达国家均建有犯罪人员语音库,可以通过声纹自动识别技术快速锁定犯罪嫌疑人,将侦查范围缩至极小,案件的侦破效率很高。声纹库建设是我国公安机关“三项建设”的重要内容之一,是集成了现代化声纹技术、信息技术和科学管理的重要公安业务基础性工作,能够为处置重大突发事件、侦破重大、疑难案件提供特殊而重要的技术支撑。与指纹库、DNA库类似,声纹库建设是一项有着重要实战价值的工作,具体表现在声纹特征具有非接触式采集的优点,和已有DNA库和指纹库相关结合,可形成立体生物特征库,建成后直接为多警种服务,是利用高科技手段在侦破案件和诉讼活动中应用的一个新的增长点,将能有效提高公安机关侦查破案的效率和能力,成为落实科技强警的重要实践之一。声纹库建设过程为:基于标准的声纹信息采集流程,对被采集人员的声纹进行采集入库。声纹库的典型应用模式是:当获得检材后,基于声纹检索技术,从声纹库中获得与检材声纹最相似的前若干候选(列表),这些候选(列表)提交给鉴定专家进行进一步的声纹鉴定以确定目标人或为案件侦查提供重要线索。声纹库建设及应用模式如图2所示。(二)声音准备工作的主要内容声纹建库的内容,参考指纹库及DNA库的建设经验,主要包括以下四部分内容,下面逐一展开说明。1.完善声纹采集规范首先必须确保入库声纹的质量。因此需要通过科学、系统的研究来制定针对自然人的声纹信息标准采集流程,同时需要研制声纹采集的标准设备,并建立可操作的声纹采集标准流程,形成公共安全行业标准,为声纹库建设提供标准支撑,也确保采集入库的各个声纹能够发挥应有的价值。根据声纹自动识别技术现状及未来趋势分析,声纹采集规范的制定应该特别注重以下几个方面:(1)有效克服信道差异对识别结果的干扰,比如采用多通道同时录音的方式提高声纹采集精度,且多个信道的组合能够有效覆盖目前各种主流信道;(2)充分考虑声纹信息采集内容的完整性;(3)采集过程要有明确的可操作性。2.声纹检索技术高性能声纹检索引擎是声纹库建设及价值发挥的核心。声纹库建设中,必须基于目前声纹识别领域的最新进展,并且针对基于一个声纹检材片段在百万级声纹库中进行检索以确定目标嫌疑人范围这一特殊任务,组织有实力的技术团队进行针对性攻关。明确声纹检索的关键指标,即在有限候选前提下,声纹检索的召回率能够达到多少。根据未来可能实际应用场景的预测和评估,声纹检索的性能应达到在包含50万个自然人声纹的声纹库中,基于30秒有效语音以上的检材,声纹检索引擎所给出的前100候选中,包含真正目标人的召回率在98%以上。要达到上述声纹检索性能,必须解决以下技术问题:(1)文本无关的声纹识别;(2)研究细节区分性算法来处理声纹的相似性;(3)提高声纹检索的信道鲁棒性;(4)检索速度及可扩展性问题,针对一个检材在百万级声纹库中的声纹检索任务,耗时需要达到100秒以内。3.声纹信息收集和检索系统声纹库管理系统也是声纹库建设的重要工作,根据前期研讨结果,声纹库管理系统拟采用省、部两级联动的声纹库存储管理系统及声纹检索引擎,在各个基层信息采集室部署专业声纹采集设备,并在市局部署声纹检索应用客户端。整套系统各环节分工定义如图3所示。声纹信息采集终端:主要部署在各基层信息采集室中。采集系统按照标准声纹采集流程执行,要求填写被采集人基本信息,具体包括姓名、身份证号、籍贯、口音、文化水平、声音特点(如沙哑、尖、浑厚)等,采集端同时集成对所采集声纹信息的质量评估功能,以确保所采集的声纹信息达到入库要求。最终合格的声纹信息(以多通道录音数据形式)及附带标注信息,通过专网上传汇总到所在省级声纹库中。省级声纹库管理中心:配备声纹库管理系统及声纹检索引擎服务器集群。声纹库管理系统负责管理和保存本省所有被采集人员的声纹信息。声纹检索引擎服务器负责从上传的多通道录音数据中提取出用于声纹检索的声纹信息,并上传到部级声纹库管理中心。声纹检索引擎服务器同时处理各应用终端提交的声纹检索任务。部级声纹库管理中心:配备声纹库管理系统及声纹检索任务调配系统,负责保存全国声纹信息(不包括语音数据部分)以及对应的身份等信息,以便作为省级声纹库管理中心的备份。负责声纹检索任务调配系统、处理各省中心提交的跨省声纹检索协查任务。声纹应用终端:主要部署在各市局点,提供声纹信息查找、下载及声纹检索任务提交和检索结果查看功能。当某个地市出现了需要进行声纹检索的需求时,可以上传检材,并指定检索范围(全省还是全国)和已知犯罪嫌疑人身份信息(如籍贯范围、年龄范围、性别等),即可向省声纹库管理中心提交声纹检索任务。4.声纹信息采集入库工作在相关核心技术及声纹管理系统建设完成后,即可依据相关法律,实施被采集人员的声纹信息采集入库工作。这项工作是一项持续的工作,甚至对于某些被采集人员存在重复采集的可能。关于被采集人员的界定以及采集方式等,需要进一步研究并得到国家相关政策及法律法规的支持。(三)两年来,声音收集工作的开展2009年以来,我国声纹库建设工作已经取得如下进展:1.声纹信息查询表公安部物证鉴定中心已组织编写了声纹库建设应用的标准体系表,内容涵盖声纹信息采集、管理、传输、存储和比对查询等。已立项并编写完成了《声纹鉴定术语》、《声纹信息采集技术规范》、《声纹自动识别系统测试规范》等三个标准草案稿。2.知识产权数据的采集公安部物证鉴定中心与科大讯飞公司合作研发生产了具有自主知识产权的采集语音数据专用样机,可以同时获得8个通道的声音数据,且通过精细设计8个通道的相关参数,实现对实际中可能使用的50个主流信道的覆盖度达到75%以上。3.专业人员用于声音收集的开发应用科学理论2011年4月,由公安部物证鉴定中心优选国内10家单位的专家就声纹库建设规划、技术路线、关键技术和实战应用等问题进行研讨论证。4.声纹检索引擎实现实用科大讯飞公司基于联合因子分析技术框架,先后研发了基于高阶泰勒展开的噪声估计、基于正反例的敏感区域得分规整算法、基于多通道录音的稳定声纹提取、基于语音识别结果的文本相关声纹比对等各项核心技术,最终声纹检索引擎达到实用水平,顺利通过了公安部物证鉴定中心2011年5月组织的基于真实案例的声纹识别模拟实战测试。以上工作进展为我国声纹库建设工作奠定了良好的工作基础。四、声纹库的建设综上所述,声纹库建设应用项目是公安机关业务需求急、科技含量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论