智能音箱声场自适应定位系统设计与实现_第1页
智能音箱声场自适应定位系统设计与实现_第2页
智能音箱声场自适应定位系统设计与实现_第3页
智能音箱声场自适应定位系统设计与实现_第4页
智能音箱声场自适应定位系统设计与实现_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能音箱声场自适应定位系统设计与实现【摘要】随着信息技术的快速发展,人们对于音视频环境也有了更高的要求,伴随着互联网技术的崛起,超高清视频空前发展,而市场急需与之匹配的能够实现根据听音环境而自动匹配的智能音箱系统。开发一种能自动识别声场环境,调整音箱声道音量、声道平衡及声场定位,精准设置视觉与听觉同步,让听音者所在位置自适应调整为俗称“皇帝位”的最佳效果位置,实现声场精准定位的智能音频产品。结合互联网、物联网、AI人工智能技术,产业发展,开发出国内先进智能音频系列产品,提升产品品质与档次。实现智能音频产品市场占有率提升,以点带面,带动智能音频产业快速发展,增强国际竞争能力,带动产业经济发展。【关键词】物联网;超高清视频;智能音箱;智能音频产品;声场定位;声像定位;数字娱乐。当今万物互联的信息时代,智能手机、互网络、物联网等万物互联的载体已经渗入到我们生活的方方面面,无处不在,远程办公、AI虚拟现实、数字娱乐等新兴产业更是如雨后春笋般蓬勃发展。而这些在越来越逼真的超高清视频显示,在用户体验高逼真视觉享受的同时,对声像同步的听觉享受追求更加强烈。然而,我国的音频产业发展比快速发展的超高清视频技术发展相对滞后,为了享受高逼真视觉与听觉声像同步体验,必须购买昂贵的专业音响,并且人工调试音箱摆放位置、听音者位置才能真正享受声像同步的震撼效果。相应的调试需要专业人员才能完成,消费者无法做到,制约了高保真高端音箱的普及。随着人工智能、人脸识别技术的发展,使自适应调整声像最佳效果位置得以实现,利用人脸识别技术,能够确定人的位置,通过音箱系统麦克风单元收集听音环境声波反射数据、DSP处理器,调整声道平衡、数字滤波、调整混响效果、确定声场相位、精准自适应定位,随时都能享受声像同步逼真的数字娱乐带来的高品质享受。、智能音箱声场自适应定位系统的设计原理为让本自适应定位系统能精准判断所在听音环境声波放射状况,先短按音箱系统的功能按键,播放音箱系统预先录制一段扫频信号,有麦克风采集直达声与方式声,并将这些信息输入系统Soc处理器,经过计算确定最佳听音条件,调整音箱左右声道平衡度、音箱大小,使听音者达到声像最佳效果位置,以便满足听音者所需的“皇帝位”,达到声像精准定位效果。本文中Soc处理器控制系统的设计原理是在Android或其他操作系统的软件环境下进行软件编写。二、智能音箱声场自适应定位系统的硬件设计硬件系统框图如图1所示。图1系统硬件设计图1智能音箱声场自适应定位系统的硬件是由主机与音箱系统组成,其中主机主要由Soc处理器、电源、摄像头、WiFi/BT、模数转换器、DDR/eMMC、功能按键、功率放大器等组成,音箱系统为无源音箱组成。其中输入电源经降压后一路经开关后供功率放大器供电,另一路经过DC/DCbuck降压为5V,再经低压电压Buck调整为Soc处理器需要的各种电压,最终形成稳定的电压供Soc处理器及周边电路模块使用。摄像头采集各种信息后输入给Soc处理器分析处理并经过预先编程的特定算法分析处理,再调整内置DSP的功率放大器音效参数,实现声音精准定位,精准自适应定位,声像同步逼真的数字娱乐享受。(一) 电源电路设计在设计电源电路时可以根据Soc处理器及周边电路所需求的电压值,设计不同的Buck调压器输出不同的电压提供系统所需电源。(二) 自适应环境调整音效设计通过图1所示按键或麦克风输入语音指令,播放预先存储与Soc存储器的一段20Hz至20KHz扫频信号,经扬声器发出声音、经过环境发射回来的声波后,再有麦克风录音,录制到Soc处理器经模数转换成数字信号进行分析比对直接录音与经反射后的声音,建立所在的听音环境模型,以此为依据,调整功放音效达到与环境最佳匹配效果。实现自动自适应调整功放音效达到与环境最佳匹配效果,达到自适应声场定位。三、智能音箱声场自适应定位系统的软件设计声场定位关键的因素是听音环境的直达声,直达声越多定位越清晰,但是,要达到好的听音体验,需要合适的混响效果,就必须平衡反射声与直达声的比例。Soc处理器改进了信号处理能力。将降噪消回音麦克风阵列算法、环绕声立体声音效算法、声场定位算法等存储于Flash内,Soc处理器对采集的外部信息计算分析,以此为依据进行精准控制功率放大器内置DSP音量、声道平衡度、混响效果、环绕效果等,达到声场精准定位的目的。(一)语音降噪及环境声波反射参数采集处理要想通过软件实现对音箱功放参数调整,首先要对音箱所处听音环境声波反射参数、环境混响效果进行信号采集建模,以便进一步优化处理。如图2所示,通过对喇叭输出实时信号回踩,经模数转换成数字信号,输入Soc处理器,再根据输入与输出的变量函数由预先编程的语音降噪算法,降噪、消回音,以便麦克风能有效识别输入的语音指令,执行所需要的功能指令,同时麦克风接收喇叭发出的播放的20Hz-20KHz扫频信号,以及经环境放射后回传的信号,比对建模,以此为依据,调整Soc与DSP数字功放音效参数,最终实现声场的精准定位。(二) 人脸识别算法设计通过上述方法建立听音环境模型及声场环境参数后,要想听音者获得最佳的听音效果,必须知道听音者所处环境先对位置,以便进一步细调音效参数。图2所示,摄像头捕捉到听音者信息后,送Soc处理器分析处理,通过人脸识别技术可以很快定位听音者与各音箱相对位置,为上述调整音效参数提供了依据。(三) 声场定位处理流程为了理解声场定位原理,首先需要了解影响声场定位的主要因素:1人可以通过双耳效应定位,利用双耳接收到的声音到达左右耳朵时间差别,再通过脑神经系统构建的3D虚拟空间定位声音所处空间位置。2人脑可以通过声强效应来判断声源位置,如果一人的左右耳中心为中轴线,左右耳收到的声音强度一样大,人脑可以判断声源在正前方,如果右耳声音强度比左耳大,人脑能感知声音在右侧,同理也可以感知声音左侧的场景。3相位差也是影响声场定位的重要因素。人耳对于800Hz到10KHz频率方位感比较敏感,而低于700Hz频率声波方位感不敏感。4人耳的“耳郭效应”对声场定位也起到了关键作用,这种影响通常在4KHz以上频率比较明显。5人耳对声场定位,通常1.4KHz以上对声音强度影响比较大,对于1.4KHz以下,时间差对判断声场定位影响比较大。根据上述影响声场定位的主要因素,软件处理流程如下:如图2所示,音频信号经EqualizerEQ调整,音量调整,经多段DRC自动增益控制减少失真处理,经AGL自动增益限制,经THD&MakeupGain失真度与增益精细调整,根据声场定位算法处理,输出信号给Amp功率放大器,最后经喇叭实现电能与声能转换。要实现环境自适应定位功能,首先可以通过语音或功能按键方式,让系统预播放一段预测在内存的20Hz—20KHz扫频信号,通过麦克风采样喇叭信号,经数模转换后送Soc处理器,Soc处理器软件虚拟的计量器,可以测试反射声与直达声的时间差,通过Cameras模块人脸识别,确定人处于系统先对位置,最后由Soc小系统ControlSignal控制信号控制系统各电路模块参数,使声音定位准确,输出高品质音质效果。1.智能音箱声场自适应定位系统设计的实现为了实现音箱声场自适应定位,本系统通过声场定位算法技术,实现自适应精准定位。在高清视频的数字娱乐环境下,人们对音质的要求越来越高,必须满足声音定位准确、声像同步,而传统音箱技术需要专业人员经过繁琐的调试,无法满足市场需求。使音箱成为实现高品质的万物互联新时代的声音为入口,解决传统音箱系统声音受环境影响而导致声场定位不准的问题,使音频发展得到质的飞跃。结语:在当今万物互联的信息环境下,智能音箱快速发展,使传统的音箱技术得到了革命性的突破。通过对听音环境的反射情况进行建模,精细化处理音效,弥补了超高清视频等虚拟现实对高品质声像定位的不足。从而满足人们对高逼真音视频的需求,适应数字娱乐高速发展的需求,拓展该领域产品海外市场,创造高额经济利益。通过该项技术的智能音箱产品的推广与普及,使以声音为入口的万物互联的数字娱乐向高品质的超高清视频看齐,从而推动数字娱乐产业快速发展,促进我国经济发展。参考文献肖景和,赵健,高保真音响电路与家庭影院迎新系统.人民邮电出版社2000,I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论