版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
陪伴机器人的硬件和软件设计案例目录TOC\o"1-3"\h\u7146陪伴机器人的硬件和软件设计案例 126995第1章陪伴机器人的硬件设计 132751.1系统硬件总设计 187971.2树莓派设计 2144741.3Arduino控制板设计 3123621.4电机驱动模块设计 475241.5ReSpeaker4-MicsPiHAT 439571.6本章小结 410708第2章软件系统设计 5294272.1文件结构 6207562.2API的调用 7173162.3功能实现流程 9227362.4本章小结 10第1章陪伴机器人的硬件设计本章节将详细地阐述该陪伴机器人的硬件设计,本人将该硬件设计分为系统硬件总设计、树莓派设计、Arduino控制板设计、电机驱动模块设计、ReSpeaker4-MicsPiHAT等,总计五部分。1.1系统硬件总设计硬件设计以树莓派和Arduino控制板为控制模块,通过继电器与独立电源为陪伴型机器人进行供电。控制模块可通过外接列麦克风、红外及射频编解码模块、UPS电源扩展板等模块,用以扩张机器人的功能。具体框图如图3-1所示。图3-1系统硬件总设计框图1.2树莓派设计树莓派是一款基于\t"/item/%E6%A0%91%E8%8E%93%E6%B4%BE/_blank"ARM的微型电脑主板,以SD/MicroSD卡为内存硬盘,卡片主板周围有1/2/4个USB接口和一个10/100以太网接口(A型没有网口),可连接键盘、鼠标和网线,同时拥有视频模拟信号的电视输出接口和HDMI高清视频输出接口,具备所有PC的基本功能,只需接通电视机和键盘,就能执行如电子表格、文字处理、玩游戏、播放高清视频等诸多功能。系统所使用树莓派版本为RaspbeeryPi3B+,采用BCM2837B0型号CPU构建,其具有以下几个主要特性:1)1.4GHz64位4核ARMCortex-A53CPU2)双频802.11ac无线网卡和蓝牙2.23)更快的以太网(千兆以太网overUSB2.0)4)1GLPDDR25)PoE支持(Power-over-Ethernet,withPoEHAT)6)改进PXE网络与USB大容量存储启动。1.3Arduino控制板设计图3-2Arduino控制板连线图图3-2Arduino控制板连线图1.4电机驱动模块设计图3-3电机驱动电路连线图电机驱动模块用于驱动两个大功率减速电机,模块采用独立电源供电,具有稳压限流等功能,IO与Arduino连接,用于控制电机正反转动及调速,电机由PWM进行调速,内置霍尔传感器,可精确测量电机转速,电路如图3-3所示。图3-3电机驱动电路连线图1.5ReSpeaker4-MicsPiHAT基于RaspberryPi的ReSpeaker4-Mic阵列是一款适用于AI和语音应用的RaspberryPi的四通道麦克风扩展板。该板是基于AC108开发的,是一款高度集成四通道ADC,具有用于高清晰度语音捕获,I2S/TDM输出,拾取3米半径的声音的语音设备。此外,这款4-Mics版本提供了LED环,其中包含12个APA102可编程LED。使用4个麦克风,具有VAD(语音活动检测),DOA(到达方向),KWS(关键字搜索),通过LED环显示方向等功能。主要特征如下:1)RaspberryPi兼容(支持RaspberryPiZero和ZeroW,RaspberryPiB+,RaspberryPi2B和RaspberryPi3B)2)4个麦克风3)3米半径的语音捕捉4)2个Grove接口5)12个APA102板载指示灯6)软件算法:VAD(语音活动检测),DOA(到达方向)和KWS(关键词搜索)。1.6本章小结本章主要详细描述了陪伴型机器人的硬件设计部分,分析了各个硬件的使用。
第2章软件系统设计作为总系统设计的两大部分之一的软件系统设计尤为重要,本设计所使用的系统为基于树莓派的Linux系统,在该系统中创建机器人所需要的人机交互界面,以及安装各类API接口,以便用户通过语音交互的方式进行操纵机器人。本章将主要描述软件系统的软件环境配置以及API接口的调用方式。2.1文件结构图4-1文件目录图4-1文件目录相应目录的功能描述如下:1)code:存放语音识别、语音合成、功能函数代码文件2)input:存放对话录音文件3)process:存放程序运行时产生的输出文件4)output:存放语音合成的音频文件5)error:存放错误处理代码和错误输出文件6)common_voice:存放一些常用提示音7)photograph:存放拍照生成的照片8)music:存放播放音乐时下载的音乐文件9)snowboy:存放snowboy唤醒功能相关文件10)The_main.py:主程序对于一些比较常用的提示音,通过语言合成函数直接生成后存放在common_voice目录里,在程序运行过程中可直接调用,提高程序运行的流畅性。对于播放音乐时下载的音频文件,由于文件较大,长期积累会占用大量的内存空间,所以每次播放完都会进行清除。为了提高主程序代码的可读性,将一些功能函数封装成模块的形式存放在code目录里,使主程序的逻辑更为清晰。2.2API的调用该软件一些主要功能的实现依赖于第三方提供的API,这些API接口功能丰富、操作简便,可以自定义生成所需的数据,对于整个软件功能的实现起着至关图4-2调用API的流程框图申请A图4-2调用API的流程框图申请API向url发送请求接收url返回数据将数据进行本地处理调用系统资源实现功能2.2.1百度AI开放平台图4-3百度语音合成参数配置百度AI开放平台能够提供出色的语音识别和语音合成服务,只需将一段音频文件或一段文字上传至该平台,该平台就会返回相应的识别结果或合成的语音音频,同时还可以对返回的音频文件进行设置,如音色、语速、语调和文件类型等,且配置方式极为简便,如图4-3所示。图4-3百度语音合成参数配置2.2.2青云客API青云客是一个免费的智能聊天API接口,可根据上传的文本语义自动生成回复,同时还具有讲笑话、讲故事等多种扩展功能。该API接口操作简便,无需密图4-4青云客API钥,只需生成固定格式的url后发送请求即可。该API如图4-4所示。图4-4青云客API2.2.3网易云音乐API图4-5网易云音乐API网易云音乐API可以根据收到的请求返回特定音乐的播放地址,该API接口可设置的参数仅有一个,即音乐榜单,平台会根据榜单中的音乐排行返回可用浏览器打开的播放地址,获取播放地址后可调用Linux系统指令从该网站下载音乐文件,然后进行播放,如图4-5所示。图4-5网易云音乐API2.3功能实现流程该软件的功能实现主要分两部分,一部分是内容识别,即通过麦克风进行录音后将音频文件上传至百度AI开放平台进行识别,然后将返回的结果进行解析,判断语音输入内容是否为指令。如果不是指令则认为是普通聊天,将识别内容上传至智能聊天平台,将聊天平台返回的文本数据再上传至百度AI开放平台合成语音,最后调用系统播放器播放合成的语音文件,实现聊天功能。另一部分则是特殊功能的实现,如拍照、播放音乐、查询天气和做出相应动作等,这一部分又可具体分为树莓派指令和Arduino指令,树莓派指令主要是调用连接在树莓派系统上的外部设备,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中国农民丰收节知识竞赛
- 2026年高校图书馆捐赠管理岗招聘面试图书捐赠流程
- 双联双评工作方案
- 文化娱乐实施方案
- 学校典型创建工作方案
- 人社精防工作方案
- 基于大数据的2026年智慧零售转型方案
- 会员应用平台建设方案
- 2025年电力行业投资动向与新能源替代分析方案
- 陈家擂台建设规划方案
- 梁裂缝修补方案
- J17J177 钢丝网架珍珠岩复合保温外墙板建筑构造
- 实习律师面试宝典
- 2023年05月山东济南新旧动能转换起步区管委会所属事业单位公开招聘工作人员(14人)笔试历年高频考点试题含答案详解
- 2023届高考作文复习:寓言类材料作文审题立意写作课件(共17张PPT)
- 2023年河南地矿职业学院单招考试职业适应性测试模拟试题及答案解析
- YY/T 0681.11-2014无菌医疗器械包装试验方法第11部分:目力检测医用包装密封完整性
- GB/T 2653-2008焊接接头弯曲试验方法
- 大型设备说明-涂胶显影机第1台
- 气胸的急救及护理
- 科技创新引领新时代-三次科技革命及其影响下的社会发展-高三统编版(2019)历史一轮复习
评论
0/150
提交评论