浅谈语音识别技术对期刊编辑出版工作现代化的作用_第1页
浅谈语音识别技术对期刊编辑出版工作现代化的作用_第2页
浅谈语音识别技术对期刊编辑出版工作现代化的作用_第3页
浅谈语音识别技术对期刊编辑出版工作现代化的作用_第4页
浅谈语音识别技术对期刊编辑出版工作现代化的作用_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、浅谈语音识别技术对编辑出版工作现代化的作用浅谈语音识别技术对编辑出版工作现代化的作用在信息化社会里,采用先进的技术与手段进展信息的采集、处理、传播是出版业开展的必然,也是信息化社会对编辑工作者的要求1。随着现代科技的迅速开展,编辑出版工作的运行方式正在发生变化,表现为管理的现代化和手段的现代化。作为编辑必须适应这个变化,将科学的方法和先进的技术手段有机地结合起来,紧跟时代潮流,促进编辑工作现代化。语音识别技术是机器通过对语音信号的识别和理解过程将语音信号转变为相应的文本或命令的技术,是信息技术领域十大重要的新技术之一,其应用已经成为一个具有竞争性的新兴高技术产业2。科技的编辑出版对语音识别技术

2、的运用,主要是指采用先进的语音识别应用设备、软件和操作平台,对信息进展采集、处理、存储和传播,实现便捷、高效的编辑出版。语音识别技术的应用可使编辑甩掉键盘,通过语音命令对机器进展操作,让编辑记者从事务性劳动中解放出来,将更多的时间精力用于创造性劳动中,更好地从事编辑活动,到达编辑工作的目的3。一、语音识别技术在编辑检索中的应用在网络时代,作为一个编辑,需要随时理解行业动态,把关出版内容,审核信息真实性,根据编辑标准对文章进展加工制作,这一切都离不开对信息、资料、标准的查询检索。互联网搜索引擎,如百度、谷歌等,是目前人们最为常用的一种网络检索工具,编辑记者无时无刻不在使用。通过手写或键盘输入关键

3、字的检索方式,虽然比传统的纸质书报刊查阅有了质的飞跃,但也非尽善尽美:一是不能满足国际上通行的普遍效劳要求,例如文盲、肢体残障人和老年人无法使用。二是搜索效劳精准率不高,搜索引擎提供的结果众多,包含大量广告和无用信息,要找出所需要的知识还需要一条一条翻开链接再搜寻。三是音视频搜索存在许多盲点无法检索,例如在数字出版中要搜索电视剧某一片段仍很困难。通过语音识别技术,可以有效解决这些问题。例如,编辑需要查找某些内容,可以运用iPhne4S智能搭载的siri的来完成。其先在设置里把siri翻开,然后按he键唤出siri,再点一下界面上的话筒,siri开始聆听。语音输入完成,siri就开始识别并且作出

4、回应。因为跳过了谷歌、百度的所有步骤,从而免去了翻开链接再收寻的烦恼,而且答复以自然语言的形式呈现,准确度高,可帮助编辑大大进步搜索效率。又如,编辑需要一段乒乓球比赛的视频,利用中文电视播送新闻节目识别系统,编辑只要说出侧身抢拉、前三板等词,系统就可以找到准确到秒的视频片段。同样,假设想找一部电影的片段,只需记得其中的经典台词,对着系统说出即可精准搜索。编辑需要查找某首歌曲,可以利用哼唱搜索引擎idi,对着麦克风哼唱某段旋律,便可轻松找到想要的歌曲,它甚至可以自动纠正哼唱者曲调的错误。语音识别技术应用于搜索引擎中,可为编辑工作提供精准、方便、快捷的技术手段,并为所有能发音说话的人提供互联网效劳

5、。对下一代搜索引擎来说,语音搜索是将来开展方向。二、语音识别技术在采访中的应用采访是编辑记者同采访对象进展语言交流的动态过程。目前,媒体的采访工作受到两大问题困扰:一是访谈采用笔录、摄影及录音、录像等形式,采访完毕后,需要将上述素材整理成文字资料,这是一个费时费力的苦差事;二是许多采访活动会涉及与非母语的外国人士交谈,由于语言不通,不利于交流,影响采访的展开。为解除这两大困扰,科研人员经过长期的努力,提出了许多有效的解决方案,其研究成果也已应用于实际。利用谷歌的在线文本翻译器,编辑记者在采访过程中,可以使用母语对设备讲话,设备随后将编辑记者的声音转化成被采访者所希望的语言,并以人造合成声音的方

6、式输出;受访者也可以使用母语与编辑记者对话,该设备会将受访者的语言转化成编辑记者的母语,从而保证了编辑记者与外国人的畅通交流。iPhne4S智能应用Lingual后,会将用户的讲话显示在iPhne屏幕上,可供选择的语言达30种。由BBN公司开发的翻译设备TransTalk,也允许使用不同语言的人进展双向对话。我们可以设想一下这一语音控制时代的采访和写作,一旦采访者与被采访者的灵思闪现,只需要拿出自己的智能设备,对其发出指令,随意念出所思所想,便将成为媒体选用的作品。三、语音识别技术在文件输入中的应用电脑的诞生给传统的纸笔书写带本文由论文联盟.Ll.搜集整理来了新的技术革命,较之传统的手写方式,

7、电脑书写拥有不可比拟的优势。但是,要掌握一种输入法并纯熟操作不是一件容易的事,电脑打字也并非适宜所有人群;而且长时间坐在电脑面前操作,容易造成对眼睛的伤害,电磁辐射时刻威胁着人们的安康;工作的繁忙与灵感的转瞬即逝,也对文字输入效率提出了更高要求。语言是人类最简单、最快捷、最方便、最自然的思想表达方式,也是人类思维的工具4,人们一直都企盼着通过语音操控机器为人类效劳的时代到来,事实上,这个时代已经来到了我们身边。编辑可以运用inds7的语音识别系统,对着计算机朗读文本,由计算机自动生成常用格式的文字用以编辑写作;可以创立文本文档,也可在文档中进展修改或更正错误。假设计算机识别有误,可以说更正,接

8、着说出错误的字词,系统会及时作出修正。除了打字外,编辑还可以利用该语音识别程序中的16个常用命令、9项常用控件命令、31项文本处理命令、15项窗口命令、5个点击屏幕任意位置命令,以及另外的几组键盘命令,用语音对计算机进展操作。编辑更可以利用讯飞口讯这一基于云计算方式实现的听写软件,在实现语音文字输入的同时,将文字通过短信、邮件进展发送。这些信息甚至可以发送到新浪微博、腾讯微博和开心网供大家分享。该系统还能根据发音断句自动添加标点符号,极大提升了编辑的文字输入效率。假设编辑需要将某段播送电视节目中的语言变为文字加以利用,就可以使用中文电视播送新闻节目识别系统,让系统收听一段播送电视节目如新闻联播

9、节目,系统会自动将节目中的语音内容生成文字。还有一种翻译摘录笔也非常适宜编辑记者要求,它采用图像识别技术,可快速将书刊中的内容扫入笔中,供编辑随时查阅、修改。它能存储300万汉字,并可以快速传输到电脑、掌上电脑等设备中,比手写快几十倍。利用语音识别和图像识别技术,可以高效快捷地输入输出文字,可以进步电脑的使用效率,把编辑的双手从鼠标键盘上解放出来,让编辑将更多的时间放在筹划等有创造性的工作上,这是进步编辑质量的一个有效方法。四、语音识别技术在文字校对中的应用校对是编辑出版过程中的一个重要环节,其任务是根据原稿订正排印或缮写的错误。编辑加工除改错外还有补漏、删繁、润色、升华等,编辑质量的上下表达

10、在原稿上留错的多少,而校对工作的质量那么表达在出版物上留错的多少。编辑工作的疏漏,可由校对工作来弥补和完善,但校对工作的失检那么无可挽回地成为出版物中的过失5。文字的人工校对辛苦且枯燥,稍不注意就会出现漏校和错校,即使经过三校也难免遗漏。采用语音识别技术,可极大进步工作效率,减少错误率。例如,编辑可以使用即时语音校对软件InsTalk来开展校对工作。当编辑翻开一个rd文档输入汉字、数字和英文字母时,计算机附带的喇叭会跟随录入的字符即时发出相应的汉语普通话语音,通过语音的提示,编辑便可知道字符是否输错。这一功能对使用五笔或其他形码的编辑而言更显得意义重大,很多常犯的和稀奇古怪、莫名其妙的错误都可

11、以在输入过程中防止。文档输入完后,编辑还可以让电脑朗读全文帮助校对文字。需要编辑注意的是,虽然语音识别软件提供了快捷的校对手段,但其智能化程度目前还不是很高,对如语法、句子构造、词语搭配、专业术语、政治问题、指导人职务及排序、涉台问题以及目录、序号、科技计量、标点等错误,还不能有效检测校对,因此必须配合其他手段加以完善。黑马校对系统就是一个非常好的选择,黑马校对软件包含七十多个专业库,支持各种排版软件。目前国内已有95%以上的出版社、近万家的报刊、印刷企业、文化公司和机关办公等单位和个人正在使用黑马校对平台。将语音识别软件与黑马软件相配合,不仅可以大大进步工作效率,减少人工劳动强度,而且校对速

12、度快、质量高。五、语音识别技术在刊社管理中的应用1.过期收藏检索。过期记载着刊社开展历史,是刊社珍贵的内容资源,也是编辑经常查阅信息的数据库。使过期的收藏与管理逐步向标准化、现代化方向开展,是过期管理工作的根本要求和开展趋势。编辑运用微软的语音识别开发平台SAPI,只需说出想检索的内容,系统就会自动识别语音,返回检索结果,显示馆藏书刊、借阅情况等信息6。2.语言培训。编辑如需进展语音方面的训练如英语发音、普通话发音等,运用语音识别软件如思必驰公司开发的口语在线学习平台声动之芯,只需对着麦克风读出需要练习的字、词、句,系统就会自动打分并实时地把得分、发音纠正等评测信息反响出来。整个学习过程摆脱了

13、老师和课堂的限制,只要有电脑和网络,学习者就能随时进展口语练习评测。3.办公室管理。利用或其他手持电子终端,通过语音识别软件可以远程控制办公室的电器设备如电脑、空调、电视机、VD、电扇、窗帘。通过语音识别设备还可以取代人工接线员,实现 自动转接效劳,如中科信利智能总机系统TIDS即电脑接线员,用户只需说出所要找的人名,该系统就会用语音识别技术识别出用户想要找的人,将 转接到相应的 分机,它特别适宜于装有集团 的、图书出版社。运用语音识别技术还可以代替会议活动的速录,用于刊社车辆管理7,单位的防火防盗,以及员工考勤等诸多方面。语音识别技术开展到今天,其应用系统对中小词汇量以及非特定人语音识别精度

14、已经大于98%,对特定人语音识别精度那么更高。但是对连续、大词汇量和非特定人的语音识别要到达更高精度,还有较长的一段路要走;在任何环境下都能实现人机自由对话,其难度会更大,这不仅需要根底理论的打破,更需要大量真实用户数据积累后的系统自动学习和演进。目前语音识别技术已经可以满足编辑通常的应用要求,但也有缺乏:一是对不同的人,因为普通话程度有差异即口音的差异,其识别率上下会不同,因此需要对某些用户做一定的自适应训练后才能更准确识别8;二是识别系统的环境适应性尚不尽如人意,在噪音环境下语音识别性能还不够理想;三是由于知识表达等问题,听写系统还不能完全取代键盘的输入;四是语音识别系统在实验室演示效果很好,但转化为商品应用于实际,还

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论