



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于avconv转码工具的微信小程序语音识别功能实现简介:最近在做基于微信小程序的语音识别功能模块时,遇到了一个比较头疼得事情,由于腾讯AI开放平台的接口只支持PCM、WAV、AMR和SILK四种音频格式,而微信小程序录音的音频文件是mp3格式的(此处就是踩得第一大坑了,刚开始看到开发文档是的时候心里还暗喜了一波,因为微信小程序录音文件就可以设置为SILK格式,这样岂不是可以不费吹灰之力就搞定了想想有点头疼的语音识别啦~然而我们终究还是太年轻~折腾了半天,在真机测试的时候发现木有半点反应,调试发现没有生成录音文件,真的是丈二和尚摸不着头脑的赶脚,最后查了一番资料才知道微信小程序在真机上只能设置成acc和mp3格式的),那么这里就不得不进行音频格式转化了。
最近在做基于微信小程序【垃圾分类引导指南】的语音识别功能模块时,遇到了一个比较头疼得事情,由于腾讯AI开放平台的接口只支持PCM、WAV、AMR和SILK四种音频格式,而微信小程序录音的音频文件是mp3格式的(此处就是踩得第一大坑了,刚开始看到开发文档是的时候心里还暗喜了一波,因为微信小程序录音文件就可以设置为SILK格式,这样岂不是可以不费吹灰之力就搞定了想想有点头疼的语音识别啦~然而我们终究还是太年轻~折腾了半天,在真机测试的时候发现木有半点反应,调试发现没有生成录音文件,真的是丈二和尚摸不着头脑的赶脚,最后查了一番资料才知道微信小程序在真机上只能设置成acc和mp3格式的),那么这里就不得不进行音频格式转化了。
此次分享废话不多说,直接上每一步的代码,首先上一波流程图微信小程序端语音页面代码如下 Js部分的话,先引入wx.getRecorderManager()然后,在录音开始事件中进行录音参数设置及开启录音最后,在停止录音事件里进行停止录音操作,并监控停止录音事件,获取到录音文件,使用wx.uploadFile()方法将录音文件传给后端,后端处理完成后返回最终处理信息并展示
后端代码采用avconv进行音频转化,这里采用腾讯语音识别-echo版Api接口来进行语音识别,具体实现如下
接收录音文件并进行转码 对接腾讯语音识
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目风险评估中的定量与定性方法试题及答案
- 2025年初期大学英语四六级考试试题
- 沈阳中考生地试题及答案
- 华三java面试题及答案
- 御泥坊java面试题及答案
- 逐步深入的网络题库试题及答案
- 软考网络工程师优势特长试题及答案
- 深入了解信息系统项目管理试题
- 变革2025年西方政治制度试题及答案
- 政治身份与社会结构的互动研究试题及答案
- 理论联系实际谈一谈如何维护政治安全?参考答案1
- 2025届安徽省合肥市A10联盟高三下学期最后一卷历史试题(B卷)
- 2024吉林省农村信用社联合社招聘笔试历年典型考题及考点剖析附带答案详解
- 2024-2025学年度部编版一年级语文下学期期末试卷(含答案)
- DB13(J)-T 8496-2022 城市污水处理厂提标改造技术标准
- 2025至2030中国锂电池粘结剂市场竞争状况及融资并购研究报告
- 聋校语文课程标准解读
- 河南省百师联盟2024-2025学年高二下学期4月联考数学试题(原卷版+解析版)
- 2025-2030中国IDC行业发展趋势与前景展望战略研究报告
- 合伙人商业保密协议书9篇
- 工程保修的管理措施和承诺
评论
0/150
提交评论