智能基础医学 8_第1页
智能基础医学 8_第2页
智能基础医学 8_第3页
智能基础医学 8_第4页
智能基础医学 8_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章医疗智能语音导学内容与要求智能语音的基本知识:智能语音的概念、智能语音发展、我国智能语音的发展、智能语音技术在人工智能中的应用智能语音的相关技术:语音识别技术、语音合成技术、自然语言处理智能语音在医疗领域的应用:智能语音电子病历、智能问诊、导诊机器人、家庭AI医生10.1|智能语音概述10.1.1智能语音的概念智能语音即智能的语音交互,是让计算机、智能仪表、手机和家电等通过电子设备对语音进行分析、理解,让电子设备具有像人一样“能听会说、自然交互、有问必答”能力的综合技术,,是人机交互的一种重要方式。它涉及自然语言处理、语义分析和理解、知识构建和自学习能力、大数据处理和挖掘等前沿技术领域。10.1.2智能语音的发展10.1|智能语音概述智能语音技术的研究是以语音识别技术为开端并不断发展的,语音识别技术最早可追溯到1907年爱迪生发明的Ediphone,这是一个用于记录语音以供回放或打印出来的录音设备。10.1.2智能语音的发展10.1|智能语音概述时间事件1907年爱迪生发明Ediphone,其功能为听写会议记录的电子秘书1922年ElmwoodButton公司开发RadioRex玩具声控狗,利用声音振动原理进行语音辨识1938-1939年贝尔实验室Dudley及工程师RichardRiesz开发语音识别功能的电脑VODER,并于1938年获得美国2121142号专利1952年AT&T贝尔实验室发明Audrey语音识别系统,若读者为男性,则语音辨识度可达97-99%1956年美国普林斯顿大学RCA实验室的Olson和Belar等人研制出10个单音节词的系统1959年毕业于伦敦大学的Denes将语法概率置入语音识别技术中1960年语音识别编码技术:线性预测系数及动态时间校准的出现1970年语音识别编码技术:隐藏式马可夫模型出现10.1|智能语音概述1980年小词汇量、大词汇量语音识别系统产品出现1995年Apple首推出Apple单字音语音识别产品—中文听写工具2000年微软于1999年买下由英国剑桥大学工程系的机器智能实验室所开发的HTK软件(语音训练与识别软件),2000年开放民众免费使用2010年Apple公司收购了Siri,随后通过与全球最大的语音识别厂商Nuance合作,Siri实现了语音识别功能2012年Windows公司于Windows7系统中加入Mitini,提供简单的天气、数学语音查询与运算等2012年8月Google公司于最新一代Android4.1(JellyBean)系统加入GoogleNow语音搜寻功能2016年9月谷歌DeepMind表示他们最新的深度生成模型WaveNet将机器语音合成的表现与人类之间水平的差距至少缩减了50%2017年11月我国科技部宣布在自动驾驶、城市大脑、医疗影像、智能语音四大领域建设国家新一代人工智能开放创新平台10.1.3我国智能语音的发展10.1|智能语音概述我国智能语音研究起步于五十年代,长期得到国家自然科学基金项目、国家863项目、电子信息产业发展基金以及国家“十五”、“十一五”、“十二五”等重点攻关项目的支持。1958年中国科学院声学所利用电子管电路识别10个元音是我国智能语音技术的标志性开端。1986年3月“863”计划启动,智能语音的研究列入“863”计划,每2年滚动支持。从1991年开始,在全国范围内每隔一至两年举行了多次语音识别系统评测。目前,我国智能语音技术的研究水平已经与国外基本同步,在汉语语音识别技术上还具有一些特点和优势,达到了国际先进水平。10.1.4语音技术在人工智能中的应用10.1|智能语音概述行业应用智能家居可穿戴设备机器人智慧金融无人驾驶机智慧教育智能医疗机器人客服/呼叫中心虚拟助理可穿助理戴设备技术研究及服务计算机视觉语音技术/自然语言处理人机交互深度学习/机器学习传感器芯片操作系统数据服务平台云计算服务网络运行商基础设施10.2.1语音识别技术语音识别技术是让计算机能接受、识别和理解人类发出的语音信号,并将语音信息“翻译”成机器内部可判断识别的文本信息或命令的技术,实现人机交互的输入。10.2|智能语音相关技术12.2.1语音识别技术1.语音识别的原理12.2.1语音识别技术10.2|智能语音相关技术10.2.1语音识别技术10.2|智能语音相关技术2.1.2人工智能发展简史10.2.2语音合成技术语音合成的原理2.1.2人工智能发展简史12.2.2语音合成技术三个方法①拼接法。②参数法。③声道模拟法。10.2.2语音合成技术10.2|智能语音相关技术2.1.2人工智能发展简史10.2.3自然语言处理自然语言处理(NaturalLanguageProcessing,简称NLP):用计算机来处理人类的语言。由于语言是人类区别于动物的根本标志,没有语言,人类的思维也就无从谈起,所以自然语言处理体现了人工智能的最高任务与境界。10.2|智能语音相关技术2.1.2人工智能发展简史12.2.3自然语言处理1.自然语言处理与智能语音的关系“语音”和“自然语言处理”都是人工智能的研究领域,语音处理是自然语言处理众多应用中的一个方向,“语音”只负责声音与文字之间的相互转化,真正的语义理解和处理由自然语言处理技术实现。10.2|智能语音相关技术10.2.3自然语言处理2.1.2人工智能发展简史12.2.3自然语言处理2.自然语言处理技术(1)基础技术基础技术主要包括中文分词、词向量和词性标注,是自然语言处理的其他相关技术和应用都必须用到的技术。(2)研究内容从研究内容来看,自然语言处理包括语法分析、语义分析、篇章理解等。从应用角度来看,自然语言处理具有广泛的应用前景。(3)技术应用“NLP+”是仿照“人工智能+”或“互联网+”的概念,实际上就是把自然语言处理技术深入到各个应用系统和垂直领域中。10.2|智能语音相关技术10.2.3自然语言处理2.1.2人工智能发展简史10.2.4智能语音开发平台1.商用的语音开发平台(1)微软SpeechAPI微软的SpeechAPI(简称为SAPI)是微软推出的包含语音识别和语音合成引擎的应用编程接口(API),在Windows下广泛应用。(2)NuanceNuance通讯是一家跨国计算机软件技术公司,Nuance语音技术除了语音识别技术外,还包括语音合成、声纹识别等技术。世界语音技术市场,有超过80%的语音识别是采用Nuance识别引擎技术,其名下有超过1000个专利技术,公司研发的语音产品可以支持超过50种语言,在全球拥有超过20亿用户。(3)科大讯飞——讯飞语音科大讯飞是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的企业,在中国语音技术领域可谓独占鳌头,在世界范围内也具有相当的影响力。10.2|智能语音相关技术2.1.2人工智能发展简史12.2.4智能语音开发平台1.商用的语音开发平台(1)微软SpeechAPI微软的SpeechAPI(简称为SAPI)是微软推出的包含语音识别和语音合成引擎的应用编程接口(API),在Windows下广泛应用。(2)NuanceNuance通讯是一家跨国计算机软件技术公司,Nuance语音技术除了语音识别技术外,还包括语音合成、声纹识别等技术。世界语音技术市场,有超过80%的语音识别是采用Nuance识别引擎技术,其名下有超过1000个专利技术,公司研发的语音产品可以支持超过50种语言,在全球拥有超过20亿用户。(3)科大讯飞——讯飞语音科大讯飞是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的企业,在中国语音技术领域可谓独占鳌头,在世界范围内也具有相当的影响力。10.2|智能语音相关技术10.2.4智能语音开发平台2.1.2人工智能发展简史12.2.4智能语音开发平台10.2|智能语音相关技术平台编程语言支持的操作系统中文支持主要特点商用平台微软SpeechAPIVB/C/C++/C#Windows是深度封装,二次开发商快捷NuanceC/C++Windows/Linux是商业应用广泛,市场占有率较高科大讯飞JavaAndroid是主要用于Android的App开发开源平台CMU-SphinxC/JavaWindows/Linux/ios/Android是既有C版又有Java版,还有针对嵌入式的PocketSphinxHTK-CambridgeCWindows/Linux/iOS是做SR研究的很好工具10.2.4智能语音开发平台10.3|智能语音在医疗领域中的应用应用类型具体应用语音电子病历中科汇能“医语通”语音录入;云知声;科大讯飞“云医声”智能问诊百度医疗大脑-智能问诊模板、美乐医智能问诊平台;卓健科技的“掌握健康”与上海长虹医院联合开发“掌上上海”;搜狗明医;康夫子;科大讯飞智医助理;平安好医生;半个医生;小壹医疗客服;药师小乔;九大夫;医国医堂分诊与导诊机器人科大讯飞晓医/晓曼;小胖机器人;杭州百世伽;若水医生-康宝;小壹医疗客服导医服务机器人好人生;掌握健康掌上上海;搜狗明医;康夫子;平安好医生;Airdoc药物推荐三宝机器人;医国医堂;半个医生;九大夫;药师小乔;大白AI机器人;自测用药陪护机器人小壹家庭健康陪护机器人;华人医佳;照护士;HUSKY机器人本章小结智能语音技术是人工智能的研究领域之一,其技术原理涉及声学、语言学、数字信号处理、计算机科学等多个学科。从智能语音技术的发展历程来看,其应用的主要推动力之一是计算机芯片技术的不断进步,另一个主要动力是语音技术核心算法的不断进步。二十世纪九十年代,建立在统计建模和机器学习理念基础之上的语音技术核心算法逐步成熟,基于HMM(隐马尔可夫模型)的语音合成及识别技术在实用中逐渐占据了主导地位。如果未来核心算法能在自然语言理解上取得突破,则有望通过智能语音技术真正实现人机智能交互,从而使语音技术得到更加广泛的应用。参考文献[1]语音识别-维基百科:/wiki/语音识别[2]语音合成-百度百科:/view/549184.htm[3]MicrosoftSpeechAPI:/wiki/Speech_Application_Programming_Interface#SAPI_1[4]MSDN-SAPI:/zh-cn/library/ms723627.aspx[5]微软语音技术Windows语音编程初步:/yincheng01/article/details/3511525[6]IBMHumanLanguageTechnologiesHistory:/hlt/html/history.html[7]Nuance:/wiki/Nuance_Communications[8]科大讯飞:/view/362434.htm[9]CMU-Sphinx:/wiki/CMU_Sphinx[10]CMUSphinxhomepage:/wiki/[11]HTKToolkit:http://htk.eng.cam.ac.uk/[12]Julius:/wiki/Julius

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论