版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能大语言模型应用教程模块11通义千问语音模型应用学习
目标
了解国产大语言模型Qwen-Audio-Chat;
理解掌握大语言模型语音交互原理;
会按照部署Qwen-Audio-Chat大模型;
会进行Qwen-Audio-Chat大模型Demo程序的安装部署与测试;
会使用Qwen-Audio-Chat大模型开发语音问答应用;
培养严谨、求实、创新的科学精神,培养分析解决问题的能力;
树立标准化意识,遵循开发流程,规范编写代码。11.2通义千问语音模型应用设计目标开发环境原理学习实验步骤11.311.411.111.1设计目标设计一个语音模型的应用Audio-Chat,实践语音模型的Chat场景,程序分为前端和后端两部分,前端程序运行在浏览器中,录音后上传至后端,后端调用通义千问语音模型将语音转为文本,再以此文本向大语言模型提问得到答案后,最后把语音对应的文本和答案返回给前端显示。设计目标11.2开发环境开发环境硬件:服务器、NVIDIA24G显存以上的推理卡或32G内存(CPU也可运行)软件:Python、大规模音频语言模型Qwen-Audio、Node.js(V18.0以上)11.3原理学习系统功能概要1.文本问题问答Qwen-Audio是一个大语言音频模型,以Qwen-7B的预训练模型作为基础语言模型,并整合Whisper-large-v2音频编码器,所以除了能接收语音输入外,也可以针对文本问题进行推理回答,对语音的回答也是先转文本再推理。2.音频问题问答在客户端录音,形成的音频流上传到后台,后台使用Qwen-Audio模型将音频翻译成文本,然后再以文本为输入,调用Qwen-Audio模型以文生文方式获取答案。系统架构语音模型应用(Audio-Chat)服务分为三层:基础设施层服务器端客户端。基础设施层:由服务器、推理卡、网卡等硬件组成,提供应用运行的载体和算力保证,操作系统、推理卡驱动、CUDA等也归为基础设施层,为应用提供了GPU计算的软件计算服务。Qwen-Audio-Chat模型可以运行在GPU或CPU上,如果采用GPU运行Qwen-Audio-Chat模型,经过实践,需要至少17G的GPU内存,所以需要至少24G内存的推理卡(如RTX3090、RTX4090)。如果采用CPU运行Qwen-Audio-Chat模型,则需要32G内存和尽量多核数的CPU,因为CPU的浮点计算效率远低于GPU,所以如果用于调试程序的GPU内存小于24G,可考虑用CPU进行推理,缺点在于效率较低。系统架构服务器端:由大语言模型Qwen-Audio-Chat、Python虚拟环境、TransformersAI组件以及OpenAI兼容http接口组成实现Qwen-Audio-Chat模型的装入、推理和对外服务能力。系统架构客户端:运行在浏览器中的HTML5+Javascript代码,由React.js开发,采用js-audio-recorder组件录制音频,通过OpenAI组件调用后台的服务。系统架构软件运行原理11.4实验步骤安装部署1.语音模型运行环境安装(1)代码准备gitclone/QwenLM/Qwen-AudiocdQwen-Audio(2)环境创建condacreate-nqwen-audiopython=3.10-ycondaactivateqwen-audio(3)安装基础依赖库pipinstall-rrequirements.txt-i/pypi/simple(4)安装Demo程序依赖库pipinstall-rrequirements_web_demo.txt-i/pypi/simple(5)验证PyTorch是否安装成功python-c"importtorch;print(torch.cuda.is_available())"安装部署(1)#linux下使用wget命令下载wget/model_download.pypythonmodel_download.py--e--repo_id\Qwen/Qwen-Audio-Chat--tokenYPY8KHDQ2NAHQ2SG(2)Windows下直接在浏览器打开链接下载2.模型下载安装部署3.运行demo安装部署3.运行demo应用开发服务器端程序由Python开发,分为两部分,一个是接收客户端请求的API接口程序qwen_audio_api.py,另一个负责模型运算的qwen_audio_service.py。1.服务器端开发客户端程序采用React.js开发,React.js程序开发调试在Node.js环境下进行,Node.js从/下载安装
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025浙江台州市社会发展工程管理有限公司招聘1人笔试历年参考题库附带答案详解
- 2025河北燕煤新能源有限公司社会招聘4人笔试历年参考题库附带答案详解
- 2025广西南宁经济技术开发区专业技术岗招聘9人笔试历年参考题库附带答案详解
- 2025年安徽省应急管理厅直属事业单位公开招聘工作人员笔试历年典型考题及考点剖析附带答案详解
- 2025年北京怀柔区事业单位招聘退役大学生士兵和面向符合政府安排工作条件退役士兵笔试历年典型考题及考点剖析附带答案详解
- 2025山东莒南县财金投资有限公司招聘总笔试历年参考题库附带答案详解
- 呼吸内科慢性阻塞性肺疾病急性加重期护理流程
- 2026年烟台市口腔医院公开招聘高层次人才实施考试备考题库及答案解析
- 鼻咽癌放射治疗护理措施
- 外墙面涂料粉刷施工方案
- 公司物料清单(BOM表)
- 文档雷雨第四幕
- 一年级两位数不进位不退位加减法口算题
- 2023年物流系统设计形成性考核册答案
- 第九版精神病学第一章-绪论课件
- 房屋拆除工程投标施工组织设计方案
- 第3章-工业机器人静力学及动力学分析概要课件
- 人教版体育与健康三年级-接力跑教案
- 大学生心理健康教育第八章-恋爱和心理健康-PPT课件
- 成都市医学重点学科评估指标体系
- 木门生产加工手册8页
评论
0/150
提交评论