【基于科大讯飞云平台的语音识别技术研究4800字(论文)】_第1页
【基于科大讯飞云平台的语音识别技术研究4800字(论文)】_第2页
【基于科大讯飞云平台的语音识别技术研究4800字(论文)】_第3页
【基于科大讯飞云平台的语音识别技术研究4800字(论文)】_第4页
【基于科大讯飞云平台的语音识别技术研究4800字(论文)】_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

科大讯飞云平台推出的在线语音识别sdk,为开发者提供了移动互联网智能(1)语音识别包语音识别包可以用于语音听写、离线语音听写、语音转写、实时语音转语音唤醒、离线命令词识别。语音听写可以把一段小于60秒的语音转换成对应的文字信息,并实时返回。语音转写可以把一段在5小时以内的语音转换成对应数据结果。离线语音听写可以将一段小于20秒的语音转换成对应i的文字信息。(2)语音合成包的应用配上“嘴巴”。离线语音合成高品质版是让离线语音合成的发音人音色、自然度表现更佳。音库订制是赋予产品声音形象,提供可订制的合成整套服务,(3)语音分析包(1)树莓派开发板工高至1080p的高清视频。MICROHDMIPORTSSupporting2×4Kdisplays搭载1.5GHz的64位四核处理器(BroadcomBCM2711,QuadcoreCortex-A72(ARMv8)64-bitSoC@1.5GHz);VideoCoreVIGPU,支持H.265(4Kp60decode),H.264(1080p60decode,108LPDDR4内存;全吞吐量千兆以太网(PCI-E通道);支持Bluetooth5.0,BLE;存储系统增加了双倍数据速率支持;先前版本的micr型中变更为USBType-C接□;驱动电流增加至3A。(2)树莓派安装测试指令对车载屏幕的显示内容进行切换和调节。安装ubuntu系统的步骤如下,第一步解压下载的系统镜像压缩文件,得到img镜像文件,之后将SD卡插入读卡器后,连上电脑,接着解压并运行Win32DiskImager工具,在软件中选择系统镜像的img文件,“Device”下选择SD卡的盘符,最后点击“Write”,然后就开始安装系统了,安装结束后会弹出操作完成后先将安装好系统的SD卡插入树莓派开发板,再将usb接口的键盘和3派已经正常启动了。键盘输入“sudoaptupdate”测试是否安装成功。如图2-2接下来将在树莓派开发板上下载科大讯飞的语音识别SDK,通过运行科大讯飞的SDK,在ubuntu系统里,通过visualstudio进行程序编写,调用科大讯飞由于树莓派安装科大讯飞的SDK是收费项目,但是适用于电脑的科大讯飞语音识别SDK是免费使用的,所以接下来的运行我们就在电脑上进行了,在电脑上中装载Ubuntu,装载好后下载科大讯飞的语音识别SDK,在程序中加入我们设1.3基于科大讯飞云平台的语音识别研究及结构分析们生成对应的SDK库,选择Linux系统,创建完成后,给应用添加相应的AI技下载语音识别的SDK。这一步完成后接下来我们就要在Ubuntu系统中运行科大讯飞的SDK。首先在下载好语音识别SDK后,我们需要来运行程序,看是否能够成功运行,按照有语音识别SDK使用文档运行,输入两条命令语句,一条是进入SDK内samples/iat_online_sample目录source64bit_make.sh,运行成功后进入sdkbin目录下运行./iat_online_sample即可看到运行结果,但是在运行之后我们出现了一个问题,就是找不到limbsc.so这个文件,通过查询资料后,我们将lib下的64位放到/usr/local/lib/,然后执行sudoldconfig,就可以正常运行了,结果如图3-1所示。hucatxiachucatxia-virtual-machine:~/Linux_iat1227_tts_online1227_5fc72b###########################################演示示例选择:是否上传用户词表?0:不使用语音听写结束中美数控。的安装有了进一步的了解,对Ubuntu也有了更深的理解,通过以上操作最后我5应的结果,语音识别得到的结果如下图所示。第一个本设计询问今天的天气怎么样?经过科大讯飞的在线语音识别进行了实时识别,语音识别完成后,识别到正确准确的信息后会与我们设定的答案进行匹配,之后会反馈给我们信息,我们设定的语音识别识别到天气后就会回答今天是晴天,所以当语音识别准确完成后就会反馈回来今天是晴天,并且进行语音WARN][1616488355.019526299]:[GPSR接下来我们测试了20组数据,看看识别效果如何,我们把这20次的识别结果进行了统计,这20次识别结果是我们在外接麦克风进行的,我们最终都能够准确的识别,发现对于天气怎么样都能够准确地识别,识别率是100%,识别时间是0.11s左右。识别速度较快。序号语音信息识别信息是否正确1天气天气是2天气天气是3天气天气是4天气天气是5天气天气是6天气天气是7天气天气是8天气天气是9天气天气是天气天气是天气天气是天气天气是天气天气是天气天气是天气天气是天气天气是6天气天气是天气天气是天气天气是天气天气是第二个本设计询问速度是多少?经过科大讯飞的在线语音识别进行了实时识别,语音识别完成后,识别到正确准确的信息后会与我们设定的答案进行匹配,之后会反馈给我们信息,我们设定的语音识别识别到速度后后就会回答速度是100km每小时,所以当语音识别准确完成后就会反馈回来速度是100km每小时,并且进行语音播报。WARN][1616488646.619325005]:[GPSRKeywordCB]-Whatisth接下来我们测试了20组数据,看看识别效果如何,我们把这20次的识别结果进行了统计,这20次识别结果是我们在外接麦克风进行的,我们最终都能够准确的识别,发现对于速度是多少都能够准确地识别,识别率是100%,识别时间是0.12s左右。识别速度较快。表2-2统计20次速度语音识别结果统计序号语音信息识别信息是否正确1是2是3是4是5是6是7是8是9是是是是是是是是是是是是第三个我们询问的是现在是几点?经过科大讯飞的在线语音识别进行了实开始录音.开始录音...WARN][1616488440.239528164]:[GPSRKeywordCB]Whattimeisitnow接下来我们测试了20组数据,看看识别效果如何,我们把这20次的识别结果进行了统计,这20次识别结果是我们在外接麦克风进行的,我们最终都能够准确的识别,发现对于现在是几点都能够准确地识别,识别率是100%,识别时序号语音信息识别信息是否正确1时间时间是2时间时间是3时间时间是4时间时间是5时间时间是6时间时间是7时间时间是8时间时间是9时间时间是时间时间是时间时间是时间时间是8时间时间是时间时间是时间时间是时间时间是时间时间是时间时间是时间时间是时间时间是另一个实验,就是在不连接麦克风进行一个语音序号语音信息是否正确识别1天气否2天气否3天气否4天气是5天气否6天气否7天气否8天气否9天气否天气是天气否天气否天气否天气否天气否天气否天气否天气否天气否序号语音信息是否正确91否2否3否4是5否6是7否8否9否否否否否否否否否否否序号语音信息是否正确1时间否2时间否3时间否4时间否5时间否6时间否7时间否8时间是9时间否时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论