CN113767431B 语音检测的方法和系统 (思睿逻辑国际半导体有限公司)_第1页
CN113767431B 语音检测的方法和系统 (思睿逻辑国际半导体有限公司)_第2页
CN113767431B 语音检测的方法和系统 (思睿逻辑国际半导体有限公司)_第3页
CN113767431B 语音检测的方法和系统 (思睿逻辑国际半导体有限公司)_第4页
CN113767431B 语音检测的方法和系统 (思睿逻辑国际半导体有限公司)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2021.10.27PCT/GB2020/05127020WO2020/240169EN2020.12.03US2010040249A1,2010.02.18为装置的用户提供了一种自身语音检测的方法。使用所述装置的第一传声器检测第一信对所述第二信号进行滤波以获得所述第二信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音清晰度的所述分量进行比度的所述分量与所述第二信号的处于所述语音2对所述第一信号进行滤波以获得所述第一信号的处于语音对所述第二信号进行滤波以获得所述第二信号的处于所述语音将所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语仅在表示有声语音的信号分量存在于所述第一信号中的时间段期间号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音清晰度的所述分量在第一带通滤波器中对所述第一信号进行滤波以获得所述第一信号的处于所述语音在第二带通滤波器中对所述第二信号进行滤波以获得所述第二信号的处于所述语音其中所述第一带通滤波器和所述第二带通滤波器具有包括5Hz至15Hz的频率范围的相将所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音形成所述第一信号的处于所述语音清晰度的所述分量的确定所述第一信号的处于所述语音清晰度的所述分量的所述累积分布函数与所述第二信号的处于所述语音清晰度的所述分量的所述累积分布并且其中如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音清晰度的所述分量之间的差值超过阈值则确定所述语音并非由所述装置的所述用户产生包括如果所述第一信号的处于所述语音清晰度的所述分量的所述累积分布函数与所述第二信号的处于所述语音清晰度的所述分量的所述累积分布函数之间的所述差在多个帧中的每一者中获得所述第一信号的处于所述语音清晰度的所述分量和所述3使用所述多个帧期间相应信号的幅度逐帧地形成将所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音从所述第一信号的处于所述语音清晰度的所述分量中减去所述第二信号的处于所述并且其中如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音清晰度的所述分量之间的差值超过阈值则确定所述语音并非由所述装置的所述用户产生包括如果从所述第一信号的处于所述语音清晰度的所述分量中减去所述第二在多个帧中的每一者中获得所述第一信号的处于所述语音清晰度的所述分量和所述从所述第一信号的处于所述语音清晰度的所述分量中逐帧地减去所述第二信号的处从逐帧地计算的多个值形成从所述第一信号的处于所述语音清晰度的所述分量中减去所述第二信号的处于所述语音清晰度的所述分量的9.根据权利要求1或2所述的方法,其中所述装输入,所述输入用于从所述装置的第一传声器接收表示空气传导语所述装置的骨传导传感器接收表示骨传导语音的第至少一个滤波器,所述至少一个滤波器用于对所述第一信号进信号的处于语音清晰度的分量并对所述第二信号进行滤波以获得所述第二信号的处于所处理器,所述处理器用于如果所述第一信号的处于所述语音清晰其中所述至少一个滤波器包括至少一个带通滤波器以用于对所述第一信号进行滤波其中所述至少一个带通滤波器具有包括5Hz至15Hz的4至少一个低通滤波器,所述至少一个低通滤波器用于在所述所述第一信号和所述第二信号进行滤波之前对所述第一信号和所述第二信号进行低通滤对所述第一信号进行滤波以获得所述第一信号的处于语音对所述第二信号进行滤波以获得所述第二信号的处于所述语音将所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语仅当确定所述装置被佩戴或手持时,才至少执行将所述第一信号的处于度的所述分量与所述第二信号的处于所述语音清晰度的所述分量进行仅当在表示语音的所述第一信号中检测到预定声音关键词时,如果执行说话者识别的结果是确定所述语音是由登记用述第一信号执行语音识别。5输入,所述输入用于从装置的第一传声器接收表示空气传导语至少一个滤波器,所述至少一个滤波器用于对所述第一信号进信号的处于语音清晰度的分量并对所述第二信号进行滤波以获得所述第二信号的处于所处理器,所述处理器用于如果所述第一信号的处于所述语音清晰说话者识别块,所述说话者识别块用于如果所述第一信号的处于述分量与所述第二信号的处于所述语音清晰度的所述分量之间的所述差值未超过所述阈其中所述系统被配置为仅当确定所述装置被佩戴或手持号的处于所述语音清晰度的所述分量与所述第二信号的处于所述语音清晰度的所述分量其中所述系统被配置为仅当在表示语音的所述第一信号中检测到预定声音关键词时,31.根据权利要求28或29所述的系统,其中所述系统被配置为如果执行说话者识别的6使得可以执行任何口头命令,而在一些情况下可以忽略并非由佩戴配件的人员说出的语[0010]将所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述[0011]如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所并从所述装置的骨传导传感器接收表示骨传导语第一信号的处于语音清晰度的分量并对所述第二信号进行滤波以获得所述第二信号的处7[0017]根据本发明的第三方面,提供了一种检测对说话者识别[0022]将所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所述[0023]如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所[0024]如果所述第一信号的处于所述语音清晰度的所述分量与所述第二信号的处于所所述装置的骨传导传感器接收表示骨传导语音的第第一信号的处于语音清晰度的分量并对所述第二信号进行滤波以获得所述第二信号的处述第二信号的处于所述语音清晰度的所述分的所述分量与所述第二信号的处于所述语音清晰度的所述分量之间的所述差值未超过所8合下文讨论的实施例来应用各种等效技术,并且所有此类等同物将被视为由本公开所涵定个体的信息以用于标识或认证的目的。语音识别是指一种用于确定所说内容和/或含义理器16的一个部件可以是智能电话10的应用程9[0055]图2还示出了收发器18,其被提供用于允许智能电话10与外部网络进行通信。例[0057]图2还示出了音频处理电路20以用于根据需要对由传声器12检测到的音频信号执[0058]图2示出无线耳机30包括收发器32,其允许无线耳机30例如使用蓝牙或另一种短[0059]图2还示出了无线耳机30包括第一传感器34和第二传感器36,这将在下面更详细种语音可操作性的智能电话或另一种便携式电子装置(例如平板计算机或膝上型计算机、于口头命令的含义的信号然后返回到智能电话[0064]在本文所述的实施例中,可以确定检测到的语音是否是佩戴配件30的人员所说发送语音信号用于说话者识别和/或语音识别。如果确定检测到的语音不是佩戴配件30的[0065]图3是示出根据本公开的方法、具体是一种用于佩戴可佩戴装置的用户的自身语[0066]本质上可以使用相同的方法来检测手持诸如移动电话之类的手持装置的人员是的语音引起并且通过佩戴者的头部的骨和/或软组织传输的起并且通过佩戴者的头部的骨和/或软组织传输的接[0071]如果所述方法用于检测手持诸如移动电话之类的手持装置的人员是否是说话人二传感器可以采用被定位在手持装置内(因此在图1速度计可以检测由用户的语音引起并通过佩戴者的骨和/或软组织传输的接触振动。当手检测由佩戴者的语音引起并通过用户的手臂和手的骨和/或软组织传输的接触[0072]在图3的步骤50中,所述方法然后包括使用可佩戴装置30的第一传声器72检测表[0073]在图3的步骤52中,所述方法还包括使用可佩戴装置30的骨传导传感器74检测表[0076]因此,图5示出了用于对由传声器72和骨传导传感器74生成的信号进行滤波以使得所述信号对于自身语音检测的目的更有用的滤预期第二信号仅在佩戴者的语音包含有声语音期间才包含重要[0080]可以通过例如以下各项标识有声语音:使用例如使用Praat软件根据黄金参考进零滞后具有更高的自相关);执行线性预测译码(LPC)分析(因为初始反射系数是有声语音何或所有项。[0081]在图3的方法的步骤54中,对第一信号进行滤波以获得第一信号的处于语音清晰[0082]在图3的方法的步骤56中,对第二信号进行滤波以获得第二信号的处于语音清晰[0083]图6是更详细地示出第一清晰度滤波器96和第二清晰度滤波器98的形式的示意频率例如可以在1kHz的范围内。经低通滤波的信号被传递到包络检测器112以用于检测滤波后信号的包络。所得包络信号可以任选地被传递到抽取器114,然后传递到带通滤波器具有5Hz至15Hz之间或5Hz至10H[0086]在图3的方法的步骤58中,将第一信号的处于语音清晰度的分量与第二信号的处[0087]在图3的方法的步骤60中,如果第一信号的处于语音清晰度的分量与第二信号的中只有在生成指示第一信号表示有声语音的标志时才执行比较,或者可以拒绝无声语音,并且只有滤波后第一信号的表示有声语音的那些片段才可以被传递到比较[0093]存在不同的方法用于在第一信号的处于语音清晰度的分量与第二信号的处于语[0094]图9是示出来自图5的比较和判定块100的第一形式的示意图,其中第一信号的处分量)由第二清晰度滤波器98生成并传递到比较和判定块100的第二输入1[0095]然后将第一输入120处的信号传递到块124,在所述块中形成经验累积分布函数[0097]图10示出了在类似于图7的情况下计算的两个ECDF,其中这两个信号大致上是相此还可以看出,这两个ECDF(即,由第一信号形成的ECDF152和由第二信号形成的ECDF统已经被训练以区分从佩戴者自己的语音和非佩[0125]如参考图3的方法的步骤60所讨论的,如果由第一信号的处于语音清晰度的分量和第二信号的处于语音清晰度的分量生成的ECDF之间的统计距离超过阈值θ,则确定语音第二信号的处于语音清晰度的分量生成的ECDF之间的统计距离未超过阈值θ,则可以确定分量)由第二清晰度滤波器98生成并传递到比较和判定块100的第二输入1[0127]在减法器164中从第二输入162处的信号中减去第一输入160处的信号,并且将差值Δ传递到比较块166。在一些实施例中,将在每一帧中计算的差值[0129]具体地,图13示出了可以设置在可佩戴装置上的第一传感器200和第二传感器[0130]来自第一传感器200和第二传感器202的信号被传递到佩戴检测块204,所述佩戴[0133]当所述方法用于检测手持诸如移动电话之类的手持装置的人员是否是说话人员[0136]在该示例性系统中,来自第一传感器200的信号也被传递到声音关键词检测块功率待机模式唤醒并将所述装置置于可进行语[0138]如果来自比较和判定块100的输出信号指示检测到的语音并非由佩戴可佩戴装置[0139]然而,如果来自比较和判定块100的输出信号指示检测到的语音是由佩戴可佩戴到说话者识别系统而生成的模型的特征进行比较。如果比较发现语音特征与模型足够相声器也可以充当第二传感器202)生成的信号并将信号特征与登记用户的耳朵的声学模型[0144]技术人员将认识到,上述设备和方法的一些方面可以被体现为例如位于诸如磁的实施例将实施于DSP(数字信号处理器)、ASIC(专用集成电路)或FPGA(现场可编程门阵列)上。因此,代码可以包括常规的程序代码或微代码,或(例如)用于设置或控制ASIC或地由专用硬件部件(诸如定制定义电路)来实现和/或至少部分地由一个或多个软件处理器

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论