CN112863532B 回音抑制装置、回音抑制方法以及存储介质(松下电器(美国)知识产权公司)_第1页
CN112863532B 回音抑制装置、回音抑制方法以及存储介质(松下电器(美国)知识产权公司)_第2页
CN112863532B 回音抑制装置、回音抑制方法以及存储介质(松下电器(美国)知识产权公司)_第3页
CN112863532B 回音抑制装置、回音抑制方法以及存储介质(松下电器(美国)知识产权公司)_第4页
CN112863532B 回音抑制装置、回音抑制方法以及存储介质(松下电器(美国)知识产权公司)_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(12)发明专利(22)申请日2020.11.11H04M9/08(2006.01)(56)对比文件nonlineardistortioncombinedlinearandnonlinearresidual(IWAENC).2016,1-5.回音抑制装置、回音抑制方法以及存储介质(57)摘要信号的非线性回音抑制部;以及,从非线性回音回音X(a)非线性回音模型非线性回音非线性回音2第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,利用表示输出到扬声器的通话接收信号以及所述输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据所述通话接收信号以及所述输入信号的至少其中之一推测所述输入信号中包含的所述非线性回音信号;非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述第一线性回音抑制部的输出信号抑制所述非线性回音信号;第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。2.根据权利要求1所述的回音抑制装置,其特征在于,所述非线性回音模型,利用教师数据,将所述通话接收信号以及所述输入信号的至少其中之一作为输入,将所述非线性回音信号作为输出进行学习,其中,将所述通话接收信号以及所述输入信号的至少其中之一和从所述第一线性回音抑制部的输出信号抑制所述残留线性回音信号的所述第二线性回音抑制部的输出信号作为所述教师数据,而且,所述第一线性回音抑制部从所述输入信号抑制线性回音信号。3.根据权利要求1所述的回音抑制装置,其特征在于,所述非线性回音模型为神经网络。4.根据权利要求1至3中任一项所述的回音抑制装置,其特征在于,所述非线性回音推测部,利用表示所述通话接收信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号推测所述输入信号中包含的所述非线性回音信号。5.根据权利要求1至3中任一项所述的回音抑制装置,其特征在于,所述非线性回音推测部,利用表示所述通话接收信号以及所述输入信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号以及所述输入信号推测所述输入信号中包含的所述非线性回音信号。6.根据权利要求1至3中任一项所述的回音抑制装置,其特征在于,所述非线性回音推测部,利用表示所述通话接收信号以及所述第一线性回音抑制部的输出信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号以及所述第一线性回音抑制部的输出信号推测所述输入信号中包含的所述非线性回音信号。7.根据权利要求1至3中任一项所述的回音抑制装置,其特征在于,所述第一线性回音抑制部包含自适应滤波器和减法部,所述自适应滤波器通过将滤波系数与所述通话接收信号进行卷积生成表示所述输入信号中包含的所述通话接收信号的成分的模拟线性回音信号,所述减法部从所述输入信号减去所述模拟线性回音信号,所述非线性回音推测部,利用表示所述通话接收信号以及来自所述自适应滤波器的所述模拟线性回音信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号以及来自所述自适应滤波器的所述模拟线性回音信号,推测所述输入信号中包含的所述非线性回音信号。38.根据权利要求1至3中任一项所述的回音抑制装置,其特征在于,所述非线性回音推测部,利用表示所述输入信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述输入信号推测所述输入信号中包含的所述非线性回音信9.根据权利要求1至3中任一项所述的回音抑制装置,其特征在于还包括:校正部,计算出用于使所述非线性回音抑制部的输出信号以及所述第二线性回音抑制部的输出信号之中的任意一个输出信号最小化的可变增益,并利用计算出的所述可变增益校正通过所述非线性回音推测部推测的所述非线性回音信号。第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,根据输出到扬声器的通话接收信号以及所述输入信号的至少其中之一,推测所述输入信号中包含的非线性回音信号;非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述输入信号抑制所述非线性回音信号;第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。11.一种回音抑制方法,其特征在于包括以下步骤:让第一线性回音抑制部通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;让非线性回音推测部,利用表示输出到扬声器的通话接收信号以及所述输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据所述通话接收信号以及所述输入信号的至少其中之一推测所述输入信号中包含的所述非线性回音信号;让非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述第一线性回音抑制部的输出信号抑制所述非线性回音信号;让第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。12.一种回音抑制方法,其特征在于包括以下步骤:让第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;让非线性回音推测部,根据输出到扬声器的通话接收信号以及所述输入信号的至少其中之一,推测所述输入信号中包含的非线性回音信号;让非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述输入信号抑制所述非线性回音信号;让第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。13.一种存储介质,是存储了回音抑制程序的非暂时性计算机可读取的存储介质,其特征在于,使计算机作为以下构成而发挥其作用:第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振4幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,利用表示输出到扬声器的通话接收信号以及所述输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据所述通话接收信号以及所述输入信号的至少其中之一推测所述输入信号中包含的所述非线性回音信号;非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述第一线性回音抑制部的输出信号抑制所述非线性回音信号;第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。14.一种存储介质,是存储了回音抑制程序的非暂时性计算机可读取的存储介质,其特征在于,使计算机作为以下构成而发挥其作用:第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,根据输出到扬声器的通话接收信号以及所述输入信号的至少其中之一,推测所述输入信号中包含的非线性回音信号;非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述输入信号抑制所述非线性回音信号;第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。5回音抑制装置、回音抑制方法以及存储介质[0001]本发明涉及一种抑制通过麦克风获取的输入信号中包含的线性回音信号(echo扬声器再生经过了通过网络线路的时间和在通话接收方的空间传输的时间的自身发出的[0003]例如,日本专利公开公报特开2017-191992号公报公开的回音抑制装置,在扬声器再生通话接收信号之际,在因通话接收信号的电平过大(highlevelofthecall某个频率值的再生信号的功率大于预先决定的阈值时,并且,在该频率值为m(m=2、及其周边的频率值对应的增益系数接近0的值作为第二增益系数而求出,在除此之外的情通话接收信号以及所述输入信号的至少其中之一推测所述输入信号中包含的所述非线性音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成6分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。附图说明[0008]图1是表示在输入信号中没有包含因扬声器失真引起的非线性回音的情况下、麦克风信号、回音消除器输出信号以及回音抑制器输出信号的示意图。[0009]图2是表示在输入信号中包含因扬声器失真引起的非线性回音的情况下、麦克风信号、回音消除器输出信号以及回音抑制器输出信号的示意图。[0010]图3是表示本发明的第一实施方式的通话装置的构成的示意图。[0011]图4是表示从第一实施方式的回音抑制装置的各个部输出的信号的一个例子的示意图。[0012]图5是用于说明本发明的第一实施方式的回音抑制装置的动作的流程图。[0013]图6是表示本发明的第一实施方式的学习装置的构成的示意图。[0014]图7是表示从第一实施方式的学习装置的各个部输出的信号的一个例子的示意[0015]图8是表示包含1/3倍频带噪声(octavebandnoise)的通话接收信号的振幅谱的示意图。[0016]图9是表示在图8所示的通话接收信号被扩音之际用麦克风获取的输入信号中包含的非线性回音信号的正确值(correctvalue)以及推测值的振幅谱的示意图。[0017]图10是表示包含女性的声音的通话接收信号的振幅谱的示意图。[0018]图11是表示在图10所示的通话接收信号被扩音之际用麦克风获取的输入信号中包含的非线性回音信号的正确值以及推测值的振幅谱的示意图。[0019]图12是表示对来自现有的回音抑制装置的输出信号以及来自第一实施方式的回音抑制装置的输出信号进行频率解析的结果的示意图。[0020]图13是表示包含男性的声音的输入信号的振幅的时间变化和相对于输入信号的回音抑制量(ERLE)的时间变化的示意图。[0021]图14是表示本发明的第二实施方式的通话装置的构成的示意图。[0022]图15是表示本发明的第三实施方式的通话装置的构成的示意图。[0023]图16是表示本发明的第四实施方式的通话装置的构成的示意图。[0024]图17是表示本发明的第五实施方式的通话装置的构成的示意图。[0025]图18是表示本发明的第六实施方式的通话装置的构成的示意图。[0026]图19是表示本发明的第七实施方式的通话装置的构成的示意图。具体实施方式[0027](本发明的基础知识)[0028]回音消除是通过自适应滤波器(adaptivefilter)推测回音信号并通过从用麦克风收音的信号中减去所推测出的回音信号来消除回音的技术。回音是从扬声器被扩音的声音的直接声音和反射声音的叠加。为此,在扬声器与麦克风之间的传输特征可以用FIR(FiniteImpulseResponse)滤波器来表现。FIR型自适应滤波器以近似到传输特征的方式进行学习,并通过将滤波系数与通话接收信号进行卷积来生成回音的推测值即模拟回音信7号(pseudoechosignal)。作为自适应滤波器的学习算法,有基于LMS(LeastMeanSquare)法、NLMS(NormalizedLMS)法以及ICA(Inde[0029]另一方面,回音抑制是推测频域中的回音的功率谱并且通过从用麦克风收音的信号的功率谱中减去所推测出的回音的功率谱来抑制回音的技术。回音抑制器例如通过谱减法(spectrumsubtractionmethod)或维纳滤波法(wienerfilteringmethod)来抑制回音。由于在上述的回音消除自适应滤波器的学习需要花费时间,在刚接通电源以及回音路径发生了变动之际有可能会产生残留回音。而且,在扬声器或者麦克风产生的杂音或者发送声音信号会引起自适应滤波器的错误学习,在模拟回音信号可能会产生推测误差,残留回音有可能增加。为此,回音抑制器通常在回音消除器的后期阶段以补偿回音抑制为目的而被使用。[0030]由于现有的回音消除器以及现有的回音抑制器用于在线性模型推测回音,存在难以抑制掺杂了因扬声器失真之类的非线性杂音的非线性回音的问题。在被用于笔记本电脑或者便携式视频会议系统的设备中,由于从小口径扬声器放音大音量的声音,因扬声器失真引起的非线性回音的影响显著,有可能无法舒适地进行通话。[0031]而且,上述日本专利公开公报特开2017—191992号公报中公开的技术,难以抑制诸如谐波失真(harmonicdistortion)之类的没有被包含在通话接收信号中的频率成分的非线性回音信号。[0032]而且,上述日本专利公开公报特开2010-103875号公报中公开的技术,难以抑制宽带失真成分,也难以抑制在整数倍的频率值以外的频率值产生的失真成分。[0033]为了解决以上的问题,本发明的一实施方式涉及的回音抑制装置包括:第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,利用表示输出到扬声器的通话接收信号以及所述输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据所述通话接收信号以及所述输入信号的至少其中之一推测所述输入信号中包含的所述非线性回音信号;非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述第一线性回音抑制部的输出信号抑制所述非线性回音信号;以及,第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。[0034]根据该构成,利用表示输出到扬声器的通话接收信号以及输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号以及输入信号的至少其中之一推测输入信号中包含的非线性回音信号,利用所推测出的非线性回音信号,从第一线性回音抑制部的输出信号抑制非线性回音信号。因此,可以稳定地抑制通过麦克风获取的输入信号中包含的非线性回音信号。[0035]而且,通过第二线性回音抑制部,从抑制了非线性回音信号的输出信号抑制残留线性回音信号。因此,可以使第二线性回音抑制部稳定地工作,并能提高线性回音信号的抑制性能。所述通话接收信号以及所述输入信号的至少其中之一作为输入,将所述非线性回音信号作8为输出进行学习,其中,将所述通话接收信号以及所述输入信号的至少其中之一和从所述第一线性回音抑制部的输出信号抑制所述残留线性回音信号的所述第二线性回音抑制部的输出信号作为所述教师数据,而且,所述第一线性回音抑制部从所述输入信号抑制线性回音信号。[0037]根据该构成,因为第一线性回音抑制部和第二线性回音抑制部仅抑制线性回音信号不抑制非线性回音信号,可以将通过第一线性回音抑制部以及第二线性回音抑制部抑制了线性回音信号的信号作为非线性回音信号用于教师数据。[0038]而且,因为将通话接收信号以及输入信号的至少其中之一、第二线性回音抑制部的输出信号作为教师数据而使用来学习非线性回音信号,可以将因扬声器引起的复杂的失真正确地模型化,能提高非线性回音信号的推测精度。[0040]根据该构成,可以通过神经网络实现非线性回音模型。[0041]而且,在所述的回音抑制装置,也可以是,所述非线性回音推测部,利用表示所述通话接收信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号推测所述输入信号中包含的所述非线性回音信号。[0042]根据该构成,因为利用表示通话接收信号与非线性回音信号之间的关系性的非线性回音模型根据通话接收信号推测非线性回音信号,可容易地根据通话接收信号推测非线性回音信号。[0043]而且,在所述的回音抑制装置,也可以是,所述非线性回音推测部,利用表示所述通话接收信号以及所述输入信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号以及所述输入信号推测所述输入信号中包含的所述非线性回音信号。[0044]根据该构成,因为不是根据通话接收信号而是根据通话接收信号以及输入信号来推测非线性回音信号,能提高非线性回音信号的推测精度。[0045]而且,在所述的回音抑制装置,也可以是,所述非线性回音推测部,利用表示所述通话接收信号以及所述第一线性回音抑制部的输出信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号以及所述第一线性回音抑制部的输出信号推测所述输入信号中包含的所述非线性回音信号。[0046]根据该构成,因为不是根据通话接收信号而是根据通话接收信号以及第一线性回音抑制部的输出信号来推测非线性回音信号,能提高非线性回音信号的推测精度。[0047]而且,在所述的回音抑制装置,也可以是,所述第一线性回音抑制部包含通过将滤波系数与所述通话接收信号进行卷积生成表示所述输入信号中包含的所述通话接收信号的成分的模拟线性回音信号的自适应滤波器、和从所述输入信号减去所述模拟线性回音信号的减法部,所述非线性回音推测部,利用表示所述通话接收信号以及来自所述自适应滤波器的所述模拟线性回音信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述通话接收信号以及来自所述自适应滤波器的所述模拟线性回音信号,推测所述输入信号中包含的所述非线性回音信号。[0048]根据该构成,因为不是根据通话接收信号而是根据通话接收信号以及来自第一线性回音抑制部的自适应滤波器的模拟线性回音信号来推测非线性回音信号,能提高非线性9回音信号的推测精度。[0049]而且,在所述的回音抑制装置,也可以是,所述非线性回音推测部,利用表示所述输入信号与所述非线性回音信号之间的关系性的所述非线性回音模型,根据所述输入信号推测所述输入信号中包含的所述非线性回音信号。[0050]根据该构成,因为利用表示输入信号与非线性回音信号之间的关系性的非线性回音模型,根据输入信号推测非线性回音信号,可容易地根据通话接收信号推测非线性回音信号。[0051]而且,在所述的回音抑制装置,也可以是还包括:校正部,计算出用于使所述非线性回音抑制部的输出信号以及所述第二线性回音抑制部的输出信号之中的任意一个输出信号最小化的可变增益,并利用计算出的所述可变增益校正通过所述非线性回音推测部推测的所述非线性回音信号。[0052]根据该构成,因为校正非线性回音信号的推测误差,能提高非线性回音信号的抑制性能。[0053]本发明的另一实施方式涉及的回音抑制装置包括:第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,根据输出到扬声器的通话接收信号以及所述输入信号的至少其中之一,推测所述输入信号中包含的所述非线性回音信号;非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述输入信号抑制非线性回音信号;以及,第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,抑制所述残留线性回音信号。[0054]根据该构成,根据输出到扬声器的通话接收信号以及输入信号的至少其中之一推测输入信号中包含的非线性回音信号,利用所推测出的非线性回音信号从输入信号抑制非线性回音信号。因此,可以稳定地抑制通过麦克风获取的输入信号中包含的非线性回音信[0055]而且,通过第二线性回音抑制部抑制残留线性回音信号。因此,可以使第二线性回音抑制部稳定地工作,并能提高线性回音信号的抑制性能。[0056]本发明的另一实施方式涉及的回音抑制方法,让第一线性回音抑制部通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;让非线性回音推测部,利用表示输出到扬声器的通话接收信号以及所述输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据所述通话接收信号以及所述输入信号的至少其中之一推测所述输入信号中包含的所述非线性回音信号;让非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述第一线性回音抑制部的输出信号抑制所述非线性回音信号;让第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。[0057]根据该构成,利用表示输出到扬声器的通话接收信号以及输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号以及输入信号的至少其中之一推测输入信号中包含的非线性回音信号,利用所推测出的非线性回音信号,从第一线性回音抑制部的输出信号抑制非线性回音信号。因此,可以稳定地抑制通过麦克风获取的输入信号中包含的非线性回音信号。[0058]而且,通过第二线性回音抑制部,从抑制了非线性回音信号的输出信号抑制残留线性回音信号。因此,可以使第二线性回音抑制部稳定地工作,并能提高线性回音信号的抑制性能。[0059]本发明的另一实施方式涉及的回音抑制方法,让第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;让非线性回音推测部,根据输出到扬声器的通话接收信号以及所述输入信号的至少其中之一,推测所述输入信号中包含的所述非线性回音信号;让非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述输入信号抑制非线性回音信号;让第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,抑制所述残留线性回音信号。[0060]根据该构成,根据输出到扬声器的通话接收信号以及输入信号的至少其中之一推测输入信号中包含的非线性回音信号,利用所推测出的非线性回音信号从输入信号抑制非线性回音信号。因此,可以稳定地抑制通过麦克风获取的输入信号中包含的非线性回音信[0061]而且,通过第二线性回音抑制部抑制残留线性回音信号。因此,可以使第二线性回音抑制部稳定地工作,并能提高线性回音信号的抑制性能。[0062]本发明的另一实施方式涉及的存储介质,是存储了回音抑制程序的非暂时性计算机可读取的存储介质,使计算机作为以下构成而发挥其作用:第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,利用表示输出到扬声器的通话接收信号以及所述输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据所述通话接收信号以及所述输入信号的至少其中之一推测所述输入信号中包含的所述非线性回音信号;非线性回音抑制部,利用通过所述非线性回音推测部推测出的所述非线性回音信号,从所述第一线性回音抑制部的输出信号抑制所述非线性回音信号;第二线性回音抑制部,通过推测没有被所述第一线性回音抑制部抑制的残留线性回音信号的振幅成分,从所述非线性回音抑制部的输出信号抑制所述残留线性回音信号。[0063]根据该构成,利用表示输出到扬声器的通话接收信号以及输入信号的至少其中之一与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号以及输入信号的至少其中之一推测输入信号中包含的非线性回音信号,利用所推测出的非线性回音信号,从第一线性回音抑制部的输出信号抑制非线性回音信号。因此,可以稳定地抑制通过麦克风获取的输入信号中包含的非线性回音信号。[0064]而且,通过第二线性回音抑制部,从抑制了非线性回音信号的输出信号抑制残留线性回音信号。因此,可以使第二线性回音抑制部稳定地工作,并能提高线性回音信号的抑制性能。[0065]本发明的另一实施方式涉及的存储介质,是存储了回音抑制程序的非暂时性计算机可读取的存储介质,使计算机作为以下构成而发挥其作用:第一线性回音抑制部,通过推测由麦克风获取的输入信号中包含的线性回音信号的振幅成分以及相位成分,从所述输入信号抑制线性回音信号;非线性回音推测部,根据输出到扬声器的通话接收信号以及所述所述非线性回音信号;第二线性回音抑制部,通过推测没有被所[0071]非线性失真是在系统的输入/输出关系不成比例关系的情况下产生的失真的总调失真(IntermodulationDistortion),谐波失真是在诸如2f1以及2f2之类的输入信号的整数倍的频率产生失真,互调失真是在诸如f1+f2以及f2—f1之类的输入信号的和及差的附近的频域增大。而且,会产生因音圈超出应滤波器的系数为w(k),自适应滤波器的抽头数为N,模拟回音y(k)可以用下述的公式(1)[0076]上述的公式(1)意味着通过使通话接收信号的相位和振幅变化的线性和来表现模(a)之间的音响耦合量(acousticcouplingamount)Ag(@),基于下述的公式(2)计算出维纳滤波器Gwiener(a)。[0082]为了证明上述的内容,本发明的发明人实施了确认非线性回音的影响评估的实所使用的扬声器的最低共振频率f0附近的中[0083]图1是表示在输入信号中没有包含因扬声器失真引起的非线性回音的情况下、麦[0084]在图1以及图2中,实线表示从麦克风输出的麦克风信号(输入信号),虚线表示回器以及回音抑制器完全不能抑制非线性回音的情况。此外,在图1以及图2中,如果关注[0086]现有的回音抑制技术的本质问题在于因为用线性模型推测回音所以无法表现非实施方式的回音抑制装置的各个部输出的信号的一于扩音型的免提通话系统、扩音型的双向通信会议系统以及对讲机系统等。[0088]图3所示的通话装置具备回音抑制装置1、输入端子11、扬声器12、麦克风13以及输出端子22。[0089]输入端子11,将从通话接收方的通话装置(未图示)接收到的通话接收信号x(k)输出到回音抑制装置1。[0090]扬声器12将所输入的通话接收信号x(k)向外部输出。在此,在从扬声器12输出的声音是用麦克风13收音的情况下,通话接收方的讲话者说出的声音从通话接收方的扬声器延迟而再生,从而产生所谓的音响回音。在此,回音抑制装置1抑制从麦克风13输出的被包含在输入信号xic(k)中的音响回音信号。此时,音响回音信号包含线性回音信号以及非线性回音信号。[0091]麦克风13被配置在讲话者所在的空间内,用于收音讲话者的声音。麦克风13将表示收音的声音的输入信号xmic(k)输出到回音抑制装置1。[0092]输出端子22输出通过回音抑制装置1抑制了线性回音信号以及非线性回音信号的输入信号ygs(k)。[0093]另外,输入端子11以及输出端子22被连接到通信部(未图示)。通信部,经由网络将输入信号ygs(k)发送到通话接收方的通话装置(未图示),并经由网络从通话接收方的通话装置(未图示)接收通话接收信号x(k)。网络例如是互联网。[0094]回音抑制装置1具备回音消除器14、快速傅立叶变换部15、16、非线性回音模型存储部17、非线性回音推测部18、非线性回音抑制部19、回音抑制器20以及快速傅立叶逆变换[0095]输入端子11将通话接收信号x(k)输出到扬声器12、回音消除器14以及快速傅立叶变换部15。[0096]回音消除器14,通过推测由麦克风13获取的输入信号xic(k)中包含的线性回音信号的振幅成分以及相位成分,从输入信号xm:e(k)抑制线性回音信号。回音消除器14是第一线性回音抑制部的一个例子。如图4所示,回音消除器14仅抑制从麦克风13输出的输入信号xmic(k)中包含的线性回音信号。[0097]回音消除器14具备未图示的自适应滤波器以及减法部。[0098]自适应滤波器,通过将滤波系数与通话接收信号进行卷积,生成表示由麦克风13获取的输入信号xm:c(k)中包含的通话接收信号的成分的模拟回音信号。[0099]减法部,计算来自麦克风13的输入信号xmic(k)和来自自适应滤波器的模拟回音信号之间的误差信号,并将计算出的误差信号输出到自适应滤波器。自适应滤波器,基于输入的误差信号校正滤波系数,并通过将校正的滤波系数与通话接收信号进行卷积来生成模拟回音信号。自适应滤波器,利用自适应算法以使误差信号变为最小的方式校正滤波系数。作为自适应算法,例如,可采用归一化最小均方法(NLMS(NormalizedLeastMeanSquare)法)、仿射投影法或者递归最小二乘法(RLS(RecursiveLeastSquare)法)。[0100]而且,减法部,通过从来自麦克风13的输入信号xmic(k)减去来自自适应滤波器的模拟回音信号,从输入信号xmic(k)抑制线性回音信号。而且,减法部将抑制了线性回音信号的输入信号yBc(k)输出到快速傅立叶变换部15。[0101]快速傅立叶变换部15快速地进行离散傅立叶变换。快速傅立叶变换部15将从回音消除器14输入到非线性回音抑制部19的时域的输入信号yBc(k)变换为频域的输入信号ygC(@)。快速傅立叶变换部15将通过回音消除器14仅抑制了线性回音信号的频域的输入信号YBc(a)输出到非线性回音抑制部19。[0102]快速傅立叶变换部16快速地进行离散傅立叶变换。快速傅立叶变换部16将输入到非线性回音推测部18的时域的通话接收信号x(k)变换为频域的通话接收信号X(a)。快速傅立叶变换部16将频域的通话接收信号X(a)输出到非线性回音推测部18以及回音抑制器[0103]非线性回音模型存储部17预先存储非线性回音模型,该非线性回音模型表示向扬声器12输出的通话接收信号以及由麦克风13获取的输入信号的至少其中之一与非线性回音信号之间的关系性。另外,第一实施方式的非线性回音模型存储部17预先存储表示通话接收信号与非线性回音信号之间的关系性的非线性回音模型。非线性回音模型例如是神经网络。[0104]非线性回音模型,利用教师数据,将通话接收信号以及输入信号的至少其中之一作为输入,将非线性回音信号作为输出进行学习,其中,将通话接收信号以及输入信号的至少其中之一和从回音消除器的输出信号抑制线性回音信号的回音抑制器的输出信号作为教师数据,其中,回音消除器从输入信号抑制线性回音信号。第一实施方式的非线性回音模将从回音消除器的输出信号抑制线性回音信号的回音抑制器的输出信号作为教师数据,其中,回音消除器从通话接收信号和输入信号抑制线性回音信号。[0105]非线性回音推测部18,根据输出到扬声器12的通话接收信号X(a)以及输入信号xmic(k)的至少其中之一推测输入信号YBC(a)中包含的非线性回音信号X~(a)。具体而言,非线性回音推测部18利用非线性回音模型,根据通话接收信号X(o)以及输入信号xmic(k)的至少其中之一推测输入信号YBC(a)中包含的非线性回音信号X(a),其中,非线性回音模型表示输出到扬声器12的通话接收信号X(o)以及输入信号xmie(k)的至少其中之一与非线性回音信号之间的关系性。另外,第一实施方式的非线性回音推测部18利用表示通话接收信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号X(a)推测输入信号中包含的非线性回音信号Xm(a)。[0106]非线性回音推测部18从非线性回音模型存储部17读取非线性回音模型。非线性回音推测部18,通过将从快速傅立叶变换部16输出的通话接收信号X(a)输入到非线性回音模型,从非线性回音模型获取非线性回音信号X(a)。非线性回音推测部18将利用通话接收信号X(o)推测出的非线性回音信号X(a)输出到非线性回音抑制部19。[0107]非线性回音抑制部19,利用由非线性回音推测部18推测出的非线性回音信号X(o),从输入信号YEC(o)抑制非线性回音信号X~(a)。具体而言,非线性回音抑制部19,利用由非线性回音推测部18推测出的非线性回音信号X(a),从回音消除器14的输出信号抑制非线性回音信号X(a)。[0108]非线性回音抑制部19,基于下述的公式(4),从推测出的非线性回音信号X(a)和来自回音消除器14的输入信号YBC(a)计算出维纳滤波器G(a)。信号YBC(a)获得抑制了非线性回音信[0111]YL-Es(a)=[0112]非线性回音抑制部19将仅抑制了非线性回音信号X(a)的输入信号YL-Es(a)输[0113]回音抑制器20,通过推测未被回音消除器14抑制的残留线性回音信号的振幅成分留线性回音信号的振幅成分,从非线性回音抑制部19的输出信号YL-s(a)抑制残留线性[0114]回音抑制器20,通过频谱减法或者维纳滤波法抑制残留线性回音信号。回音抑制器20,利用仅有回音信号的空间或者相干函数(coherencefunction),针对每个频率推测线性回音抑制部19的输出信号YL-Es(a)以及通话接收信号X(a),来计算抑制增益。回音抑制器20,通过将计算出的抑制增益乘以非线性回音抑制部19的输出信号,来抑制未被回音消除器14抑制的残留线性回音信号。回音抑制器20,将仅从输入信号YL-Es(a)留线性回音信号的输入信号yS(a)输出到快速傅里叶逆变换部21。从回音抑制器20输入到输出端子22的频域的输入信号ys(a)转换为时域的输入信号yES之间的关系性的非线性回音模型,根据通话接收信号X(o)推测输入信号中包含的非线性制通过非线性回音推测部18推测出的非线性回音信号X(信号的振幅成分,从来自非线性回音抑制部19的输入信号YL-s(a)抑制残留线性回音信号。回音抑制器20将仅从输入信号YL-Es(a)抑制了残留线性回音信号的输入信号ys(a)输出到快速傅里叶逆变换部21。快速傅里叶逆变换部21将时域的输入信号ygs(k)输出到输信号。因此,可以使回音抑制器20的动作稳定,并且能提高线性回音信号[0124]其次,对第一实施方式的非线性回音模型的学习方法进行说明。[0125]图6是表示本发明的第一实施方式的学习装置的构成的示意图。图7是表示从第一实施方式的学习装置的各个部输出的信号的一个例子的示意图。[0126]图6所示的学习装置具备非线性回音模型制作装置2、输入端子31、扬声器32、麦克风33以及输出端子39。[0127]输入端子31将从通话接收方的通话装置(未图示)接收到的通话接收信号x(k)输出到回音抑制装置1。[0128]扬声器32将输入的通话接收信号x(k)向外部输出。[0129]麦克风33被配置在讲话者所处的空间内,用于收音讲话者的声音。麦克风33将表示收音的声音的输入信号xm:c(k)输出到非线性回音模型制作装置2。[0130]输出端子39输出通过非线性回音模型制作装置2抑制了线性回音信号的输入信号[0131]另外,输入端子31、扬声器32、麦克风33以及输出端子39的构成与图3中的输入端[0132]非线性回音模型制作装置2具备回音消除器34、快速傅立叶变换部35、36、回音抑制器37、快速傅立叶逆变换部38、非线性回音模型学习部40以及非线性回音模型存储部41。[0133]回音消除器34,通过推测由麦克风13获取的输入信号xic(k)中包含的线性回音信号的振幅成分和相位成分,从输入信号xic(k)抑制线性回音信号。回音消除器34的构成与图3所示的回音消除器14的构成相同。回音消除器34将抑制了线性回音信号的输入信号yEC(k)输出到快速傅立叶变换部35。[0134]快速傅立叶变换部35快速地进行离散傅立叶变换。快速傅立叶变换部分35将从回音消除器34输入到回音抑制器37的时域的输入信号yBc(k)变换为频域的输入信号YC(a)。快速傅立叶变换部35将通过回音消除器34仅抑制了线性回音信号的频域的输入信号YEC(a)输出到回音抑制器37。[0135]快速傅立叶变换部36快速地进行离散傅立叶变换。快速傅立叶变换部36将输入到回音抑制器37的时域的通话接收信号x(k)变换为频域的通话接收信号X(a)。快速傅立叶变换部36将频域的通话接收信号X(a)输出到回音抑制器37以及非线性回音模型学习部[0136]回音抑制器37,通过推测未被回音消除器34抑制的残留线性回音信号的振幅成分,从输入信号YEC(a)抑制残留线性回音信号。回音抑制器37将从输入信号YBC(a)仅抑制了残留线性回音信号的输入信号ys(a)输出到快速傅里叶逆变换部21以及非线性回音模型学习部40。[0137]快速傅立叶逆变换部38快速地进行离散傅立叶逆变换。快速傅立叶逆变换部38将从回音抑制器37输入到输出端子39的频域的输入信号ys(a)转换为时域的输入信号yES(k)。快速傅立叶逆变换部38将输入信号ys(k)输出到输出端子39。[0138]非线性回音模型学习部40,利用教师数据使非线性回音模型进行学习,该非线性回音模型将通话接收信号X(a)以及输入信号xm:e(k)的至少其中之一作为输入,将非线性回音信号作为输出,其中,将通话接收信号X(a)以及输入信号x:c(k)的至少其中之一、从回音消除器34的输出信号YEc(o)抑制残留线性回音信号的回音抑制器37的输出信号Y(@)作为教师数据,其中,回音消除器34从输入信号xmic(k)抑制线性回音信号。第一实施方式的非线性回音模型学习部40,利用教师数据使非线性回音模型进行学习,该非线性回音模型将通话接收信号X(a)作为输入,将非线性回音信号作为输出,其中,将通话接收信号X(a)、从回音消除器34的输出信号YBc(a)抑制残留线性回音信号的回音抑制器37的输出信号YS(a)作为教师数据,其中,回音消除器34从输入信号xmic(k)抑制线性回音信号。[0139]非线性回音模型是将通话接收信号的振幅谱X(a)和回音消除器34以及回音抑制器37的残留回音振幅谱Ygs(a)作为教师数据进行事先学习的神经网络。回音消除器34以及回音抑制器37仅能抑制线性回音信号。为此,回音消除器34以及回音抑制器37的输出信号(残留回音信号)大致等于非线性回音信号。如此,非线性回音模型学习部40可以将通话接收信号的振幅谱与非线性回音信号的振幅谱之间的关系性模型化。[0140]另外,作为机器学习例如有,利用对输入信息赋予了标签(输出信息)的教师数据学习输入与输出之间的关系的有教师学习、仅根据无标签的输入构建数据的结构的无教师学习、即处理有标签也处理无标签的部分有教师学习、通过试行错误来学习使报酬最大化的行动的强化学习等。而且,作为机器学习的具体方法,不仅存在神经网络(包含利用多层神经网络的深度学习),还存在遗传算法、决策树、贝叶斯网络或者支持向量机(SVM)等。在非线性回音模型的机器学习中,可以利用以上列举的具体例子中的任意一个。[0141]非线性回音模型学习部40将已学习的非线性回音模型存储到非线性回音模型存储部41。[0142]非线性回音模型存储部41存储通过非线性回音模型学习部40学习的非线性回音模型。[0143]另外,图3所示的回音抑制装置1也可以具备非线性回音模型学习部40。在这种情况下,回音抑制装置1还可以具备用于切换学习模式和回音抑制模式的模式切换部。在通过模式切换部切换到学习模式的情况下,回音消除器14将输出信号输出到回音抑制器20。非线性回音模型学习部40也可以将通过回音消除器14以及回音抑制器20抑制了线性回音信号的输入信号YS(a)和通话接收信号X(o)作为教师数据,使非线性回音模型进行学习。[0144]而且,通过学习装置已学习的非线性回音模型也可以预先存储到回音抑制装置1的非线性回音模型存储部17。而且,回音抑制装置1也可以接收通过学习装置已学习的非线性回音模型,并更新被存储在非线性回音模型存储部17的非线性回音模型。[0145]其次,对比较了第一实施方式的回音抑制装置1的回音抑制量和现有的回音抑制装置的回音抑制量的模拟结果进行说明。[0146]首先,用于模拟的神经网络(非线性回音模型)将短时间傅立叶变换的振幅谱作为输入/输出特征量。[0147]图8至图11是表示用神经网络推测非线性回音信号的振幅谱的例子的示意图。图8是表示包含1/3倍频带噪声的通话接收信号的振幅谱的示意图,图9是表示在图8所示的通话接收信号被扩音之际用麦克风获取的输入信号中包含的非线性回音信号的正确值以及推测值的振幅谱的示意图。图10是表示包含女性的声音的通话接收信号的振幅谱的示意图。图11是表示在图10所示的通话接收信号被扩音之际用麦克风获取的输入信号中包含的非线性回音信号的正确值以及推测值的振幅谱的示意图。[0149]如图9以及图11所示,可以得出神经网络能高精度地推测用实线表示的非线性回[0150]其次,对利用已学习的神经网络的第一实施方式的回音抑制装置1和现有的回音[0151]图12是表示对来自现有的回音抑制装置的输出信号以及来自第一实施方式的回[0152]如图12所示,第一实施方式的回音抑制装置1对于非线性回音信号即谐波失真获于315Hz的线性回音信号也获得了与现有的回音抑制装置相比较高出大约15dB的抑制效后期阶段的回音抑制器20的音响耦合量的[0153]其次,对第一实施方式的回音抑制装置1以及现有的回音抑制装置针对具有人的声音之类的复杂的频率构造的输入信号的回音抑制量的评估结果进行说明。[0155]图13是表示包含男性的声音的输入信号的振幅的时间变化和对于输入信号的回[0156]第一实施方式的回音抑制装置1获得了与现有的回音抑制装置相比较高出大约[0159]上述的第一实施方式的非线性回CN112863532B说明书15/21页并省略其说明。逆变换部21。[0163]麦克风13将输入信号xm:e(k)输出到回音消除器14并经由快速傅立叶变换部23将叶变换部23将频域的输入信号xm:c(a)输出到非线性回音推测[0165]非线性回音模型存储部171预先存储表示输出到扬声器12的消除器的输出信号抑制残留线性回音信号的回音抑制器的输出信号作为教师数据,而且,[0167]第二实施方式的非线性回音模型的学习方法,将通话接收信号X(o)和频域的输回音模型学习部40,利用教师数据,使将通话接收信号X(入信号xm:c(@)、从回音消除器34信号。[0168]非线性回音推测部181,利用表示通话接收信号以及输入信号与非线性回音信号回音推测部181,通过将从快速傅立叶变换部16输出的通话接收信号X(a)以及从快速傅立叶变换部23输出的输入信号xic(o)输入到非线性回音模型,从非线性回音模型获取非线性回音信号X(a)。非线性回音推测部181将利用通话接收信号X(a)以及输入信号xmic(a)推测出的非线性回音信号X(a)输出到非线性回音抑制部19。有所不同。即,在第二实施方式,非线性回音推测部181,利用表示通话接收信号以及输入信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号X(o)以及输入信号xmic(a)推测非线性回音信号X(a)。[0171]在第二实施方式,因为根据通话接收信号以及输入信号推测非线性回音信号,所以能进一步提高非线性回音信号的推测精度。[0173]上述的第一实施方式的非线性回音推测部18,利用表示通话接收信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号推测输入信号中包含的非线性回音信号。与此相对应,第三实施方式的非线性回音推测部,利用表示通话接收信号以及回音消除器的输出信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号以及回音消除器14的输出信号推测输入信号中包含的非线性回音信号。[0174]图15是表示本发明的第三实施方式的通话装置的构成的示意图。[0175]图15所示的通话装置具备回音抑制装置1B、输入端子11、扬声器12、麦克风13以及输出端子22。另外,在第三实施方式中,对于与第一实施方式相同的构成赋予相同的符号,并省略其说明。[0176]回音抑制装置1B具备回音消除器14、快速傅立叶变换部15、16、非线性回音模型存储部172、非线性回音推测部182、非线性回音抑制部19、回音抑制器20以及快速傅立叶逆变换部21。[0177]快速傅立叶变换部15将通过回音消除器14仅抑制了线性回音信号的频域的输入信号YC(①)输出到非线性回音抑制部19以及非线性回音推测部182。[0178]非线性回音模型存储部172预先存储表示输出到扬声器12的通话接收信号以及回音消除器的输出信号与非线性回音信号之间的关系性的非线性回音模型。非线性回音模型例如是神经网络。[0179]第三实施方式的非线性回音模型,利用教师数据,将通话接收信号以及回音消除器的输出信号作为输入、将非线性回音信号作为输出进行学习,其中,就通话接收信号、回音消除器的输出信号、从回音消除器的输出信号抑制残留线性回音信号的回音抑制器的输出信号作为教师数据,并且,回音消除器从输入信号抑制线性回音信号。[0180]第三实施方式的非线性回音模型的学习方法,将通话接收信号X(o)和回音消除器34的频域的输出信号YC(a)输入到图6所示的非线性回音模型学习部40。而且,第三实施方式的非线性回音模型学习部40,利用教师数据,使将通话接收信号X(a)以及回音消除器34的频域的输出信号YC(a)作为输入、将非线性回音信号作为输出的非线性回音模型进行学习,其中,将通话接收信号X(a)、回音消除器34的频域的输出信号YC(a)、从回音消除器34的频域的输出信号YC(a)抑制残留线性回音信号的回音抑制器37的输出信号YBc(a)作为教师数据,而且,回音消除器34从输入信号xmic(k)抑制线性回音信号。[0181]非线性回音推测部182,利用表示通话接收信号以及回音消除器的输出信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号X(a)以及回音消除器14的频域的输出信号YC(a)推测输入信号中包含的非线性回音信号Xm(a)。[0182]非线性回音推测部182从非线性回音模型存储部172读取非线性回音模型。非线性回音推测部182,通过将从快速傅立叶变换部16输出的通话接收信号X(a)以及从快速傅立叶变换部15输出的输入信号YBC(a)输入到非线性回音模型,从非线性回音模型获取非线性回音信号X(a)。非线性回音推测部182将利用通话接收信号X(a)以及输入信号YBC(a)推测出的非线性回音信号X(a)输出到非线性回音抑制部19。[0183]另外,关于第三实施方式的回音抑制装置1B的动作,只有图5所示的步骤S2的处理有所不同。即,在第三实施方式,非线性回音推测部182,利用表示通话接收信号以及回音消除器14的输出信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号X(a)以及回音消除器14的频域的输出信号YBC(a)推测非线性回音信号X(a)。[0184]在第三实施方式,因为根据通话接收信号以及回音消除器的输出信号推测非线性回音信号,所以能进一步提高非线性回音信号的推测精度。[0186]上述的第一实施方式的非线性回音推测部18,利用表示通话接收信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号推测输入信号中包含的非线性回音信号。与此相对应,第四实施方式的非线性回音推测部,利用表示通话接收信号以及来自回音消除器的自适应滤波器的模拟线性回音信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号以及来自回音消除器的自适应滤波器的模拟线性回音信号推测输入信号中包含的非线性回音信号。[0187]图16是表示本发明的第四实施方式的通话装置的构成的示意图。[0188]图16所示的通话装置具备回音抑制装置1C、输入端子11、扬声器12、麦克风13以及输出端子22。另外,在第四实施方式中,对于与第一实施方式相同的构成赋予相同的符号,并省略其说明。[0189]回音抑制装置1C具备回音消除器14、快速傅立叶变换部15、16、24、非线性回音模型存储部173、非线性回音推测部183、非线性回音抑制部19、回音抑制器20以及快速傅立叶逆变换部21。[0190]回音消除器14具备自适应滤波器141以及减法器142。自适应滤波器141,通过对滤波系数和通话接收信号进行卷积,生成表示输入信号中包含的通话接收信号的成分的模拟线性回音信号。减法器142从输入信号中减去模拟线性回音信号。[0191]快速傅立叶变换部24快速地进行离散傅立叶变换。快速傅立叶变换部24将输入到非线性回音推测部183的时域的模拟线性回音信号变换为频域的模拟线性回音信号。快速傅立叶变换部24将频域的模拟线性回音信号输出到非线性回音推测部183。[0192]非线性回音模型存储部173预先存储表示输出到扬声器12的通话接收信号以及来自回音消除器的自适应滤波器的模拟线性回音信号与非线性回音信号之间的关系性的非线性回音模型。非线性回音模型例如是神经网络。[0193]第四实施方式的非线性回音模型,利用教师数据,将通话接收信号以及模拟线性回音信号作为输入、将非线性回音信号作为输出进行学习,其中,将通话接收信号、来自回音消除器的自适应滤波器的模拟线性回音信号、从回音消除器的输出信号抑制残留线性回音信号的回音抑制器的输出信号作为教师数据,并且,回音消除器从输入信号抑制线性回音信号。[0194]在第四实施方式的非线性回音模型的学习方法,将通话接收信号X(o)和来自回音消除器34的自适应滤波器的模拟线性回音信号输入到图6所示的非线性回音模型学习部40。而且,第四实施方式的非线性回音模型学习部40,利用教师数据,使将通话接收信号X(@)以及模拟线性回音信号作为输入、将非线性回音信号作为输出的非线性回音模型进行学习,其中,将通话接收信号X(a)、来自回音消除器34的自适应滤波器的模拟线性回音信号、从回音消除器34的输出信号YB(a)抑制残留线性回音信号的回音抑制器37的输出信号YBS(a)作为教师数据。并且,回音消除器34从输入信号xmic(k)抑制线性回音信号。[0195]非线性回音推测部183,利用表示通话接收信号以及来自自适应滤波器的模拟线性回音信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号X(w)和来自自适应滤波器141的模拟线性回音信号推测输入信号中包含的非线性回音信号XNN[0196]非线性回音推测部183从非线性回音模型存储部173读取非线性回音模型。非线性回音推测部183,通过将从快速傅立叶变换部16输出的通话接收信号X(a)以及从快速傅立叶变换部24输出的模拟线性回音信号输入到非线性回音模型,从非线性回音模型获取非线性回音信号X(a)。非线性回音推测部183,将利用通话接收信号X(a)以及模拟线性回音信号推测出的非线性回音信号X(a)输出到非线性回音抑制部19。[0197]另外,关于第四实施方式的回音抑制装置1C的动作,只有图5所示的步骤S2的处理不同。即,在第四实施方式,非线性回音推测部183,利用表示通话接收信号以及来自回音消除器的自适应滤波器的模拟线性回音信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号X(o)以及来自回音消除器14的自适应滤波器141的模拟线性回音信号来推测非线性回音信号X(a)。[0198]在第四实施方式,因为根据自通话接收信号以及从来回音消除器14的自适应滤波器141的模拟线性回音信号来推测非线性回音信号,所以能进一步提高非线性回音信号的推测精度。[0200]上述的第一实施方式的非线性回音推测部18,利用表示通话接收信号与非线性回音信号之间的关系性的非线性回音模型,根据通话接收信号推测输入信号中包含的非线性回音信号。与此相对应,第五实施方式的非线性回音推测部,利用表示输入信号与非线性回音信号之间的关系性的非线性回音模型,根据输入信号推测输入信号中包含的非线性回音信号。[0201]图17是表示本发明的第五实施方式的通话装置的构成的示意图。[0202]图17所示的通话装置具备回音抑制装置1D、输入端子11、扬声器12、麦克风13以及输出端子22。另外,在第五实施方式中,对于与第一、二实施方式相同的构成赋予相同的符[0203]回音抑制装置1D具备回音消除器14、快速傅立叶变换部15、16、23、非线性回音模型存储部174、非线性回音推测部184、非线性回音抑制部19、回音抑制器20以及快速傅立叶逆变换部21。[0204]麦克风13将输入信号xm:e(k)输出到回音消除器14并经由快速傅立叶变换部23将其输出到非线性回音推测部184。[0205]快速傅立叶变换部23快速地进行离散傅立叶变换。快速傅立叶变换部23,将输入到非线性回音推测部184的时域的输入信号xmic(k)变换为频域的输入信号xm:c(a)。快速傅立叶变换部23将频域的输入信号xm:c(a)输出到非线性回音推测部184。[0206]非线性回音模型存储部174预先存储表示由麦克风13获取的输入信号与非线性回音信号之间的关系性的非线性回音模型。非线性回音模型例如是神经网络。[0207]第五实施方式的非线性回音模型,利用教师数据,将输入信号作为输入,将非线性回音信号作为输出进行学习,其中,将由麦克风获取的输入信号和从回音消除器的输出信号抑制残留线性回音信号的回音抑制器的输出信号作为所述教师数据,而所述回音消除器从输入信号抑制线性回音信号。[0208]在第五实施方式的非线性回音模型的学习方法,将频域的输入信号xmic(a)输入到图6所示的非线性回音模型学习部40。而且,第五实施方式的非线性回音模型学习部40,利用教师数据,使将输入信号X.e(a)作为输入、将非线性回音信号作为输出的非线性回音模型进行学习,其中,将输入信号x;c(a)和从回音消除器34的输出信号YBC(a)抑制残留线性回音信号的回音抑制器37的输出信号YBC(a)作为所述教师数据,而回音消除器34从输入信号xmic(k)抑制线性回音信号。[0209]非线性回音推测部184,利用表示输入信号与非线性回音信号之间的关系性的非[0210]非线性回音推测部184从非线性回音模型存储部174读取非线性回音模型。非线性回音推测部184通过将从快速傅立叶变换部23输出的输入信号xmic(a)输入到非线性回音模型,从非线性回音模型获取非线性回音信号X(a)。非线性回音推测部184将利用输入信号xmi(a)推测出的非线性回音信号X(a)输出到非线性回音抑制部19。[0211]另外,关于第五实施方式的回音抑制装置1D的动作,只有图5所示的步骤S2的处理不同。即,在第五实施方式,非线性回音推测部184利用表示输入信号与非线性回音信号之间的关系性的非线性回音模型,根据输入信号x;c(a)推测非线性回音信号。[0212]在第五实施方式,即使是仅根据由麦克风13获取的输入信号,也可以推测非线性回音信号。[0214]在上述的第一实施方式,通过非线性回音推测部18推测出的非线性回音信号被输出到非线性回音抑制部19.与此相对应,在第六实施方式,利用非线性回音抑制部19的输出信号校正通过非线性回音推测部18推测出的非线性回音信号的推测误差。[0215]图18是表示本发明的第六实施方式的通话装置的构成的示意图。[0216]图18所示的通话装置具备回音抑制装置1E、输入端子11、扬声器12、麦克风13以及输出端子22。另外,在第六实施方式中,对于与第一实施方式相同的构成赋予相同的符号,并省略其说明。[0217]回音抑制装置1E具备回音消除器14、快速傅立叶变换部15、16、非线性回音模型存储部17、非线性回音推测部18、非线性回音抑制部19、回音抑制器20、快速傅立叶逆变换部21以及校正部25。[0218]校正部25,计算出用于使非线性回音抑制部19的输出信号最小化的可变增益,并利用计算出的可变增益校正通过非线性回音推测部18推测出的非线性回音信号。此时,校正部25以使非线性回音抑制部19的输出信号接近0的方式计算可变增益。而且,校正部25将计算出的可变增益乘以通过非线性回音推测部18推测出的非线性回音信号。由此,校正部25校正通过非线性回音推测部18推测出的非线性回音信号的推测误差。[0219]另外,关于第六实施方式的回音抑制装置1E的动作,在图5所示的步骤S2和步骤S3之间添加了新的处理。即,在第六实施方式,在步骤S2的处理之后,音抑制部19的输出信号最小化的方式计算出可变增益,并利用计算出的可变增益校正通过非线性回音推测部18推测出的非线性回音信号。[0220]在第六实施方式,因为利用非线性回音抑制部19的输出信号校正通过非线性回音推测部18推测出的非线性回音信号的推测误差,所以能提高非线性回音信号的推测精度,使回音抑制性能得以提高。特别是第六实施方式在非线性回音模型为固定值的情况下更有[0221]另外,上述的第二至第五实施方式的回音抑制装置1A至1D也可以具备第六实施方式的校正部25。[0223]在上述的第一实施方式,通过非线性回音推测部18推测出的非线性回音信号被输出到非线性回音抑制部19.与此相对应,第七实施方式,利用回音抑制器20的输出信号校正通过非线性回音推测部18推测出的非线性回音信号的推测误差。[0224]图19是表示本发明的第七实施方式的通话装置的构成的示意图。[0225]图19所示的通话装置具备回音抑制装置1F、输入端子11

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论