




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《数据标注实训(中级)》课程教案课题:语音采集与质检实训教学目的:执行标准化语音采集流程(设备/环境/发音);实施语音质检规则排查杂音、破音等问题;评估语音数据的可用性并优化采集方案。课型:新授课课时:本章安排8个课时。教学重点:重点:实施语音质检规则排查杂音、破音等问题。教学难点:难点:评估语音数据的可用性并优化采集方案。教学过程:教学形式:讲授课,教学组织采用课堂整体讲授和分组演示。教学媒体:采用启发式教学、案例教学等教学方法。教学手段采用多媒体课件、视频等媒体技术。板书设计:本课标题语音采集与质检实训课次4授课方式理论课□讨论课□习题课□其他□课时安排8学分共2分授课对象普通高等院校学生任课教师教材及参考资料1.《数据标注实训(中级)》;电子工业出版社。2.本教材配套视频教程及学习检查等资源。3.与本课程相关的其他资源。教学基本内容教学方法及教学手段课程引入智能音箱的灵敏响应离不开高质量的语音数据。本章聚焦多方言语音采集规范与质检标准,学习降噪处理、发音校验等技术,确保语音数据清晰可用,推动语音识别模型优化。参考以下形式:1.衔接导入2.悬念导入3.情景导入4.激疑导入5.演示导入6.实例导入7.其他形式4.1认识语音采集语音采集是语音标注中常见的任务类型,其主要目的是为特定场景下的语音智能技术落地提供基础数据。语音采集的任务,简单来说就是录语音。语音的录制通常采用普通录音设备即可,例如手机录音、录音笔等。采集得到的语音数据通常被用于AI语音识别、唤醒、对话等不同领域。一般来说,语音采集对于环境、语种、语速等都是有严格要求的,并且不同的任务细节要求也是不同的,但整体的采集方式、原则及属性要求等是大同小异的。常见的要求有如下几方面:(1)语音采集要注意选择合适的内容且语速适中;(2)采集过程中要避免错读、多读、漏读、咳嗽、卡顿等情况;(3)要保持口齿清晰,口音要地道;(5)语音采集的环境要安静;(6)录音过程中要避免离话筒过近,避免喷麦;(7)要确保录音内容完成,不可出现切音或截音等情况。事实上,关于语音采集的细致要求还有很多,这里不一一介绍。4.2语音采集标注规范(一)任务目标本任务的主要目标为:在满足规定要求的环境内用普通话朗读给定材料,并录制语音。本次语音采集总体要求。(二)具体说明针对本次语音采集的具体要求如下。1.录音者要求(1)录音者(或其监护者)必须事先了解录音要求(录音方法、录音环境、朗读要求、合格标准)。(2)语音素材要选择小学语文课本原文,不可以选择儿童绘本相关内容等素材。(3)录音者需要签署授权协议书。(4)录音。2.朗读要求使用普通话朗读所有句子,具体如下。(1)录音者发音要自然、流利、清晰;不可以压低嗓子、用耳语方式或夸张语气录音。(2)录音者严禁使用变声、模仿等说话方式。(3)录音者要语速适中,避免语速太快而含糊不清,或者慢到一字一顿。(4)录音时为了防止喷麦,建议嘴部尽量与录音设备保持10厘米~20厘米不等的距离,尽量保持固定距离,否则会导致声音不稳,忽远忽近。嘴部尽量不要紧贴在录音设备上。(5)录音时,录制内容应以原文(句)为准。如果遇到朗读不通顺或错字等影响正常朗读的句子,则可以稍作修改。(6)避免因感冒导致的严重鼻音或沙哑嗓音。3.录音设备与环境手机或录音笔均可。在录音过程中,要注意以下几点。(1)提前将录音设备摆放好,在录制过程中不得移动。(2)提前试录,确保录制的语音符合要求。(3)应该选择安静的室内录音,语音中不可以出现除录音者以外的人声,以及其他明显噪音、回音(不包含录音者中途换气的声音)。(4)为了避免回声,不要在空旷的场地录音。4.语音数据格式录音者可以使用为WAV格式,采样率为16kHz、16bit/s。(三)基本标注原则(1)单条语音时长范围为15秒~20秒(包含15秒及20秒)。(2)所有录音必须使用普通话。(3)录音吐字要清晰,避免出现结巴、大舌头等情况。(4)录音时注意区分平翘舌发音。(5)录音环境保证无回声、无噪音。(6)每位录音者必须签署授权协议,最终与结果一起提交。(7)单条语音只允许出现同一个人的声音,不可以出现多个人的声音。(四)注意事项在本任务中,下列语音结果被视为不合格。(1)语音中出现回音、干扰音、持续的底噪(背景噪音)。(2)语音底噪超过45dB。(3)语音中不可以出现突发噪音、严重喷麦、其他人说话等情况。(4)语音文件避免出现丢帧、截幅(截幅主要是因为声音过大并超过了采样值所能表示的最大值范围导致)等异常情况。(5)录音者声音过大或过小。(6)语音内容不完整,或者语音有快进、卡顿影响收听等情况。通常来说,语音采集任务在操作上是较为简单的,在这一任务中,最重要的就是要深刻掌握规范的要求,并且能够明确判断自己所采集的语音结果是否符合要求,这就是语音质检要达到的效果。对于语音采集任务而言,语音质检决定着语音的录制结果是否能够达到要求并为后续技术落地使用。可以说,语音质检人员是最能够理解语音采集任务需求的人。因此,为了使学习者更加深入地理解任务规范并对合格的语音采集结果形成深切的感受,从而能够胜任语音采集任务,本节特别将语音采集任务的实训形式转换成语音质检的形式。4.3语音质检(一)系统使用本实训任务通过数据标注实训平台完成。本规范仅对进入实训任务的步骤及具体的页面操作过程进行讲解。本实训任务从登录系统后到一条任务完成的操作流程如下。1.进入任务实施页面(1)进入实训练习页面。当前实训平台已将该页面设置为学员端默认首页,因此登录系统后即可自动进入实训练习页面。(2)进入任务列表页面。进入实训练习页面后,单击页面上语音采集模块下的“进入学习”链接,进入任务列表页面。(3)进入语音采集标注实施页面。在任务列表页面单击任意一个任务模块下的“进入学习”按钮,进入语音采集标注实施页面。语音采集标注实施页面大体可以分3个区域:蓝色框线的语音操作区主要包括语音的标题、“播放”按钮、“规范文件预览”按钮、“参考答案”按钮语音对应的文本素材等;红色框线的标签选择区主要用于选择语音采集标签及保存提交的结果;绿色框线的任务列表区主要用于呈现待完成的题目。下面介绍语音采集标注的具体操作。由于本次任务为语音采集,关于采集的操作步骤可以在系统外完成,系统内主要是针对采集后语音的审核,其目的是考验标注者对语音的审核能力。2.语音质检任务目标(1)判断系统所提供的语音是否存在问题,并打上对应的标签(本次任务标签可以支持多选)。(2)本次任务共有8个标签,包括正确、噪音、发音问题、背景音、多人声音、语速问题、格式问题和其他。3.标签释义(1)正确:录音者口齿清晰、发音标准,所录音的语音无格式问题。(2)噪音:在语音播放过程中,出现对听音造成干扰的声音,如明显的装修声、车辆的鸣笛声、动物叫声、来源不明的声音等。(3)发音问题:录音者出现大舌头、结巴、平翘舌错误、方言、声音过大或过小、吐字不清等问题。(4)背景音:在语音播放过程中出现的背景音乐、歌曲等。(5)多人声音:在单句语音中出现多人声音、重叠音、笑声等。(6)语速问题:录音者语速过快(≥4.5字/秒)或过慢(≤2字/秒)。(7)格式问题:在语音播放过程中出现丢帧(因设备问题导致声音卡顿)、语音时长不合格、变声、较大电流声、混响等。(8)其他:除以上情况外均属于其他,如喷麦、回音、自唱语音明显不完整(一句话明显没有读完就结束了)、语音多出一节文本未覆盖的问题等。(二)注意事项(1)微弱的白噪音不属于格式问题,单击鼠标的声音不属于噪音。(2)偶尔读错1-2个字可忽略,不包括平翘舌等发音错误,这里指句中漏字或读的字根本不同。(3)语速是指讲话时声音的快慢,单位时间内所吐音节的多少,计算时按照实际发出声音的文字计算,不要只按照题目展示的文字计算,不需要将标点计算为字数。(三)标注页面操作详解在本任务中,如果想要针对一个题完成标注操作,则需要用到如下按钮和步骤,按顺序说明如下。(1)标注任务领取。在本系统中,打开任务实施页面后,会默认加载第一条题目,因此不需要额外做任务领取操作,此时题目列表中第一条题目会默认呈现出选中状态。(2)播放或暂停语音。单击语音采集标注实施页面上的“播放”按钮或“暂停”按钮可以播放或暂停当前语音。(3)选择标签。收听完整段语音后,可以从页面下方的标签选择区中选择对应的标签,选择之后标签将变为橙色。在本次任务中,标签可以被进行多选,选中一个标签之后再次选择其他标签即可。选择标签后,如果想要重新选择或修改标签,则可以在提交之前进行修改。修改方法为再次单击已选中的标签进行取消,重新选中新标签即可。(4)保存当前标注结果。单击页面下方的“保存”按钮可以保存当前标注结果。“保存”按钮主要用于保存已标注的结果,以确保标注结果不会丢失。单击“保存”按钮后,该按钮会变成橙色,提示保存成功。(5)提交当前任务。单击“提交”按钮即可提交当前任务。单击“提交”按钮后,除了显示当前标注结果,还会呈现参考答案与作答结果对比页面,以供学习者对比参考。(6)切换到下一题。单击“提交”按钮后,可以单击参考答案与作答结果对比页面中的按钮手动换到下一题。对于已提交的题目,不能再次修改。(7)查看答案。单击标注页面上方的“参考答案”按钮可以查看参考答案。如果当前题目的结果尚未提交,则不允许查看参考答案。(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南宁天桃数学试卷
- 人才选拔与绩效管理协议
- 高校实验室安全规范与管理通知
- 基于java的超市商品管理系统的设计与实现
- 开发委托合同范本
- 模具交付合同范本
- 金属外表加工合同范本
- 美国小升初数学试卷
- 2025自学考试盆景与花卉装饰练习题及答案
- 六安汇文初中入学数学试卷
- GB/T 14153-1993硬质塑料落锤冲击试验方法通则
- (完整版)人教版八年级下册《道德与法治》期末测试卷及答案【新版】
- 并购贷款业务培训
- 北京大学人民医院-医疗知情同意书汇编
- 档案管理员述职报告9篇
- 建设集团有限公司安全生产管理制度汇编
- 牙体牙髓病最全课件
- 交通信号控制系统检验批质量验收记录表
- 疫苗运输温度记录表
- 各国钢材-合金牌号对照表
- 医院定岗定编要点
评论
0/150
提交评论