




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音转写规范1、 语音转写总体目标针对给定的语音片段,人工判断其是否为有效语音,对于有效语音,给出其中语音的起止时间段、标准的文本标注以及语音本身的相关属性,对于无效语音直接抛弃。操作说明1. 下载并安装chrome浏览器(必须条件);2. 用给定的账号和密码登陆网址46/index.php?c=login3. 登陆成功后,点击菜单栏“申请任务”,如果有任务的话,便可以点击“项目名称下”给定的项目进入,如下图:4. 同意保密协议开始工作后,工作界面如下所示:操作顺序分为五步: 首先判断声音的有效性,如果有效的话,再继续进行下面步骤;如果声音无效,则只需选择无效原因即可(选中“无效声音”后,自动下一句)。 在上图1所框波形中,通过鼠标拖拽的方式,标记出有效声音的起止时间点; 对有效声音进行“性别,底噪,口音、儿童音”四种属性的标记; 两条红色竖线内的音频即为需要转写的音频段(我们把这一段称为有效声音,转写校对时只需要转写校对有效声音段内的内容)转写内容写到下面文本框内。 需要加标签的地方加上标签,单击即可加入; 标记完毕后,点击“保存继续下一句” 点击1 of 150 处的箭头的话,本句的标注结果是不保存的,只是浏览 做到每个任务包的最后一句时,波形图的右上方会显示“提交“按钮,点击即可提交任务。注:账户中如果存在没有提交的任务,则无法领取新任务。先校对文字,再点生成拼音。2、 有效语音判断标准 单个发音人的清晰普通话语音是标注中需要处理的有效语音;对于带有一定口音,导致发音不标准的普通话以及由于发音习惯,导致个别发音改变的普通话,都属于有效语音;对于背景存在噪声,但不影响说话内容辨识的语音,也属于有效语音;其它情况的语音都属于无效语音,直接抛弃,无需进行任何标注,典型的无效语音有:1.音频中无人说话,只有背景噪声或音乐等。2.音频背景噪声过大,影响说话内容辨识。3.语音不是普通话发音,如广东话、唱歌、其它语言(普通话中夹杂少量英语情况除外)等。4.语音音量过小或发音模糊,无法确定语音内容。5.语音只有嗯啊呃的语气词,无意义的无效。例如,音频中只有1-2个字:对、是,这种无效。但是很明确的搜索的词语或者有意义的是有效。例如:新浪、你好。PS:一句中有一半以上听不懂算无效,不用截取听懂的部分。3、 时间标注规范 对每个有效的音频文件,都需要标注语音的起始和终止时间点,语音的文本标注内容需要与语音起止时间段内的数据完全对应。默认情况下,以整个音频文件的起止点作为有效语音的起止点,但遇到以下情况时,需要进行人工修改:1.有效语音的开头/结尾处出现了较长时间(超过0.5秒)的静音,则需要手工调整语音的起止时间,将时间标注点后移/前移,在有效语音开始前/结束后保留约500毫秒静音段即可。2.对于音频中有部分内容听不懂的情况,可以直接放弃,也可以人工选择一段可以听懂的部分,标记其起始和终止时间点,并在文本标注中给出对应的文本信息。(注:标注的时间段与标注的文本信息需要严格的一一对应,严禁文本中出现与标记时间段内语音信息不匹配的标注)3.对于音频中从始至终伴随有噪音的情况,需要人工确定有效语音的起止位置,并在音频属性中标注背景带噪,有效语音开始前和结束后的背景噪声需要被排除在语音起止时间之外。4、 文本转写规范1.文本转写结果以汉字表示,对于常用词语要保证汉字正确,对于不确定的字(如人名中的汉字)可以采用常见的同音字表示,如李山/李珊。2. 转写内容需要与实际发音内容完全一致,不允许出现修改与删减,即使发音中出现了重复或者明显的不通顺,也要根据发音内容给出准确的对应文本(如发音为:我我好饿;“我”出现了重复,转写为:我我好饿);但是对于因为口音或个人习惯造成的某些汉字发音改变,则需要按照原内容转写(如因为口音某些音发不清楚,音量读成了yin1 niang4,则仍然标注为音量,不能标注为音酿;对于某些汉字会有人习惯性的读错,如教室读成jiao4 shi3,则需要标注为教室,不能标注为教使)。3.遇到网络用语,如实际发音为“灰常”、“孩纸”、“童鞋”,则应该根据其发音标注为“灰常”、“孩纸”、“童鞋”,不能标注成“非常”、“孩子”、“同学”。4.转写时对于语音中正常的停顿可以标注常规的标点符号(如逗号),具体标注规则可以根据实际情况自行判断,不做强制要求。5.遇到数字,根据数字具体的读法标注为汉字形式,不能出现阿拉伯数字形式的标注(如123,允许的标注为一二三、幺二三、一百二十三等,禁止标注为123)。6.对于儿话音,根据音频中说话人实际的发音情况进行标注(如哪,读出了儿化音则标注为哪儿,没有读出儿化音则标注为哪)。7.对于说话人清楚讲出的语气词,如“哦,啊,嗯,呃,哎”等,需要根据其真实发音进行转写。8.对于语音中夹杂英文的情况,按照以下方式进行处理:a 如果英文的实际发音为每个字母的拼读形式,则以大写字母形式标注每一个拼出的字母,字母之间加空格,如Q Q,C S。b 如果出现的是英文单词或短语,对于常用的专有词汇,在能够准确确定英文内容的情况下,可以以小写字母的形式标注每个单词,单词与单词之间以空格分隔(如gmail dot com),其它情况下直接抛弃。(注:标注工作主要针对中文普通话,因此除了一些常见的专有词汇,如网址、品牌名称外,其它英文词汇直接抛弃即可)9. 拼音根据文本内容结合发音,校对拼音行。例如:办公室,发音是shi3,但是拼音需要字的正确发音,虽然发音人说的shi3,但拼音行仍然为ban4 gong1 shi4强调:一、七、八、不,33变调不用管。例如:发音人读qi2 ge4,那么“七”正确发音是qi1,所以正确的拼音应该是qi1 ge4英文在文本和拼音的标注都直接保留。系统可自动生成拼音,只需要校对多音字即可,多音字系统会有“_”提示,重点关注即可。需要注意的拼音有:1)乐,le4和yue42)谁,shui2和shei23)会,kuai4和hui4(后续补充)儿化音的拼音,例如“点儿”,dianr3 dian3 er2神马shen2 ma35、 噪音标注规范语音中某些特定位置出现短暂清晰的噪声,如环境噪声、非发音人说话,发音人咳嗽、呼吸声等,需要在标注文本中的对应位置加入相应的代表噪声的符号,具体的噪声分类及对应的标注方式如下:n 非人类产生的噪声,如:背景音乐、手机铃声、键盘敲击声、汽车鸣笛声、猫狗叫声等nps 非说话人本人产生的人类噪声,如其他人的说话、咳嗽、笑声等n:cough 说话人的咳嗽声n:throat-clear 说话人的清嗓音声n:sneeze 说话人的打喷嚏声n:laughter 说话人的笑声n:lipsmack 说话人的咂嘴声n:breath 说话人强烈的呼吸声 发音人因重复或说错导致的重复音,有吞音或半音情况时,如果能确定半音所对应的字,则尽量标出汉字,否则标记如:你今(只读出了j)今天去上班了么应该尽量标注为你今今天去上班了么,如果实在无法确定吞音现象对应的字,则标准为你今天去上班了么对于半音现象超过2次的音频文件,做放弃处理除了代表吞音意外,还表示1-2个字听不懂。就是个别字听不懂unk 代表句子中间有2个字以上听不懂的部分。比如:一句话,前面和后面能听懂,中间一部分听不懂,那么时间点是整句时间点,中间听不懂的语音用unk表示。mute 音频中有大于1秒的静音 sp 音频中大于1秒停顿不安静就标spsph 有效语音的起始点/结束点为非静音,即音频的起点或终点落在了说话人的声音上,则需要在对应位置进行额外标注(加入/sph符号)。主要用在标记切头、切尾。例如:爸爸去哪,前面切头,只有啊的音。那么标记“/sph 爸爸去哪“切尾例子补充说明:1. 如果成语中或其他情况,因为不认识而读错字的情况。例如:酗酒,读成凶酒,那么文本行:酗(xu4)酒拼音行:(xiong1) jiu3注意:拼音行,酗的拼音需要手动删掉,保留(xiong1)jiu3备注:将要括起来的拼音选中,点一下标签,自动加在选中部分的首尾。2. 数学符号:希腊字母,参考特殊符号.txt,直接粘贴即可。3. 时间点截取取消选择半句截取的方式,改成截取全部有效语音,如中间个别字词听不懂,可用或者【unk】标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 体育经纪在线平台企业制定与实施新质生产力项目商业计划书
- 药物胆汁排泄机制研究行业跨境出海项目商业计划书
- 仿真航模防冰除霜系统模拟创新创业项目商业计划书
- 代词的用法题目及答案
- 2025年动漫产业链协同创新与产业链延伸报告
- 2025年低碳城市绿色建筑与节能改造案例分析报告
- 辽宁安全员c考试考试试题及答案
- 【大同】2025年春季山西大同经济技术开发区管委会所属事业单位招聘博士研究生50人笔试历年典型考题及考点剖析附带答案详解
- 2025年海南州事业单位面向社会招聘工作人员笔试及现场笔试历年典型考题及考点剖析附带答案详解
- 2016年四川高考理综试题及答案
- 贵州贵安发展集团有限公司笔试
- 供应链管理在电网企业物资管理中的应用
- 《螺栓连接多层全装配式混凝土墙板结构技术规程》
- 【MOOC】《电工技术》(北京科技大学)中国大学MOOC慕课答案
- 输血科内部审核检查表
- 【MOOC】物联网工程专业综合实践-河海大学 中国大学慕课MOOC答案
- 八年级信息科技物联网专项试题
- 健康管理中心服务规范制度
- 检验检查结果审核管理制度
- 小学低年级识字教学策略研究三篇
- 降低住院患者压力性损伤发生率
评论
0/150
提交评论