录音标注新手入门手册_第1页
录音标注新手入门手册_第2页
录音标注新手入门手册_第3页
录音标注新手入门手册_第4页
录音标注新手入门手册_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

LOGO 录音标注新手入门手册 培训流程 3 项目概况说明 项目名称 录音数据标注项目项目结果应用领域 语音识别技术应用目的 提高语音识别引擎的识别率 即提高语音识别结果的准确率 技术应用 1 呼叫中心自动质检 可以对通话记录进行自动质检 以减少人工质检 2 语音自动转文字 如微信对用户的语音进行了标注 则实现了语音转文字的功能 类似的应用有 百度语音助手 苹果siri等 3 其他的应用包括语音拨号 语音导航 室内设备控制 语音文档检索 简单的听写数据录入等 标注软件操作讲解 一 打开软件二 导入录音文件1 上传录音 标注软件操作讲解 2 生成textgrid文件进行标注 三 常用操作指令播放 暂停 Tab键放大 缩小 界面左下角 all全屏显示 in逐步放大 out逐步缩小 sel选中部分全屏显示选中音频 在语音波形上拖动鼠标拖动音频 拖动标注界面最下的滑动条生成切割线 在语音波形上用鼠标点击需切割处 即出现一条红色虚线 同时该红色虚线与每个标注层的相交处有一个空心圆圈 点击空心圆圈 即可生成切割线 快捷键 Enter 移动切割线 鼠标点住要移动的切割线 左右拖动 标注软件操作讲解 标注软件操作讲解 删除切割线 1 快捷键Alt Backspace2 点击界面左上顶部 Boundary 选项 选择Remove 即可删除 保存 Ctrl S查看秒数 在标注层下面 滑动条上面 有三个显示依次为 每个切割片切割秒数 屏显秒数 整条音频秒数做完之后删除记录 选中文件之后 点击左下角的Remove 标注规范讲解 一 语音文件分类按语音质量 把语音文件分为两大类 一类为训练语音 另一类为非训练语音 本项目只标注训练语音 非训练语音不标注 非训练语音识别条件文件大小方面 文件大小为200KB以下的语音 时长过短 未形成对话的语音 噪音方面 整段语音伴有严重的持续背景噪音的语音 背景音如严重电流声 风声和干扰声等 文本方面 不能听懂的方言类语音 如某些南方方言等 经常性听不清 不能准确写出文本的语音 无贡献文本的语音 如 文本只有 喂 你好 这几个字的语音 整段语音中50 以上文本为脏话的语音 其他方面 回声大的语音 听觉上出现双字的语音 过载严重的语音 音量过大导致截幅严重的语音 这里指全段语音的每字都严重截幅的语音 稍微截幅的要算作训练语音中标注 标注规范讲解 二 标注层级 图片案例 标注规范讲解 三 标注规范细则 图片案例 标注规范讲解 图片案例 标注规范讲解 图片案例 标注规范讲解 图片案例 标注规范讲解 图片案例 标注规范讲解 图片案例 标注规范讲解 图片案例 标注规范讲解 四 注意事项 质检验收标准讲解 1 正确率96 2 质检验收标准细则 文本有误 多字少字错字 主说话人的大段文本未标注 漏标 大段标成听不清 听不清的未单独切段 说话人角色 性别 身份有误噪音标识有误 错标 漏标 切割线位置不准 同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论