版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、科大讯飞语音云产品分析报告目 录1概述32系统架构32.1网络拓扑图32.2系统功能图43产品功能54产品优势54.1用户方54.2开发方65相关产品介绍65.1讯飞语点65.1.1概述65.1.2功能介绍65.2讯飞输入法85.2.1概述85.2.2功能介绍85.3讯飞口讯95.3.1概述95.3.2功能介绍96产品对我方的价值96.1运营模式106.2可行性分析106.2.1产品推广101 概述在传统通信计算模式下,语音的处理方式多是通过单个通信终端完成,例如我们熟悉的手机等通信终端;在云计算技术背景下,语音的格式转换、辨别等操作完全在“云”端执行。语音云,就是采用云计算的方式来执行语音操
2、作,利用云速度快,准确度高的特性,实现快速的语音应用。关注语音云的厂商主要有安徽 “科大讯飞”公司和北京“云知声”。科大讯飞的语音云MSP(iFLY Mobile Speech Platform)在10年十月举行发布会。通过MSP,移动互联网的终端用户可以随时随地的使用语音服务。产品介绍2 系统架构2.1 网络拓扑图MSP系统部署在互联网上,通过运营商的三网接入,无论是传统的互联网终端还是移动互联网终端都能够通过网络获得语音服务。MSP在互联网上建立多个云服务中心,每个服务中心能够独立提供稳定的互联网语音服务,云服务中心之间自动同步数据。通过这种机制,用户可以获得高度可用、流畅的语音功能支持。
3、2.2 系统功能图上图蓝色区域为MSP系统的实现范围,浅色区域是与MSP密切相关的组件或第三方角色。MSP系统主要包括语音应用接口(Speech Programming Interface,SPI)、客户端(Mobile Speech Client,MSC)、服务器(Mobile Speech Server,MSS)和基础支撑(MSP Infrastructure)四个层次,这四个逻辑层从用户到服务器操作系统底层,共同构成了完整的MSP 系统架构。应用接口是MSP系统提供的开发接口,集成开发人员应关注这些接口的定义、功能和使用方法。MSC负责实现这些接口,同时封装了网络通讯、音频编解码(Aud
4、io Codec)、语音检测(VAD)、协议解析(MSSP)等功能,同时为了便于开发和使用,系统在这一层提供了一系列高效、易用的工具。MSS提供语音服务的服务端实现,使用服务端的识别引擎提供语音功能,同时提供管理和维护功能;基础支撑层是MSP的服务基础,负责提供适合云计算架构的负载均衡、并行计算、数据存储等功能。3 产品功能实现可面向移动2G/3G网络及互联网提供语音服务的服务器,在语音服务平台ISP基础上为移动终端应用程序提供多路并发的语音合成、语音识别、语音听写功能,通过架设在互联网的语音应用服务器,用户可以随时随地获得高质量的语音服务。实现基于移动终端以及桌面平台的语音应用客户端,提供统
5、一的语音应用开发接口,通过该接口用户可以方便、快速地开发语音应用;同时,MSP也将开放一些基于移动以及桌面平台的语音应用,用于展示MSP语音服务平台的功能和使用方法,让用户直接体验到最新的语音技术。4 产品优势4.1 用户方1) 保持最新,为让用户体验最好的语音合成、最准确的语音识别技术,科大讯飞将以最快的速度推出最新的研究成果,; 2) 顺畅体验,为让用户可以随时随地享受顺畅的语音服务,语音云客户端对资源的开销极低,;3) 个性化,为更好服务每个用户,讯飞语音云保存每个用户的个性化数据。4.2 开发方1) 易用,提供可视化控件,覆盖Android、iPhone、Symbian、Windows
6、 Mobile等常见智能操作系统,并提供demo程序和源码,使得语音应用集成时间缩短到几个小时; 2) 全面,通过语音云开发网站您可以获得开发、调试、评估、调优等全方位的技术支持和点对点的技术服务; 3) 容量大,讯飞语音云支持超大规模的用户访问,不必担心由于用户规模的扩张而服务能力不足; 4) 费用低,语音应用开发接口现在可供任何组织和个人免费使用,在您的应用规模高于百万级之后,才需要支付非常低廉的费用。5 相关产品介绍5.1 讯飞语点5.1.1 概述讯飞语点是款 Android 应用,可以用语音控制打电话、发短信、搜索地图、查时刻表、查航班等,类 Siri 中文语音助手。5.1.2 功能介
7、绍1、 语音识别打电话讯飞语点绝非那些早期手机中的语音拨号功能所能相提并论的,讯飞语音其实已经将语音控制功能落实到了日常的实用功能中,形成了一个语音控制的平台。用户在讯飞语点主界面下,选择“点击说话”直接说出:“呼叫*电话”或者是“帮我给*打电话”,那么讯飞语点就开始运行,识别用户的语音输入,搜索联系人,最后将电话拨出。当然,讯飞语点对语音进行识别的过程很重要,如果用户在点击说话之后,没有进行语音录入,那么讯飞语点将会提示“没有听到声音”,录入语音之后,电话即可正常拨出电话。2、 语音控制发短信在讯飞语点主界面下的六个功能标签中,我们看到“发短信”按钮,点击发短信,系统将提示用户说话录音,用户
8、需要说出类似“给*发短信”,就可以进入信息编辑界面。这是用户使用讯飞语点来发送短信息的其中一个方式。在进入讯飞语点发短信功能之后,短信息内容的编辑,用户可以使用手机上的输入法来进行输入,当然讯飞语点这里提供了一个更加快捷、直接的输入方式,就是用户只需说话,语点即可将您的说话内容转换为文字信息输入信息编辑器中。3、 通过语音搜索APP讯飞语点在打开手机系统中各个应用时,都表现得比较轻松,并不需要用户等待多长时间。另外还有一种情况就是,当用户不具体说出需要寻找的是哪一款APP应用时,同样可以进入到讯飞语点为用户提供的APP搜索平台进行查找。4、 说一句话就能找到网页上网搜索功能项其实是属于讯飞语点
9、的聊天功能其中一部分。讯飞语点将百度为标准搜索平台,并内置入浏览器功能,用户无需做任何的手动跳转即可实现,从讯飞语点到浏览器界面的相互转换,这是通过讯飞语点来进行上网搜索的最大亮点。5、 歌曲精准搜索另外,喜欢听歌的朋友,还可以使用讯飞语点在线搜歌听歌,软件内置了音乐播放器,音乐来源为“联通沃音乐”。科大讯飞正在与联通合作布局人机交互,语音查询功能可以在生活中给我们提供很多帮助。搜索讯飞语点的音乐功能,只需用户发出“*的歌曲”的语音指令,讯飞语点即可在线搜索相关歌曲,歌曲是来源于“联通沃音乐”。选择点击喜欢的音乐即可播放。6、 其他功能简介打电话打电话给张三 / 给张三打电话 / 帮我接通张三
10、的电话 / 呼叫XXX发短信发短信给张三 / 发短信给老大我马上就到 / 发短信给XXX,查询余额 / 回复王五的短信联系人把张三的号码发给李四 / 新建联系人张三,号码是XXXX / 张三的号码是多少?提醒提醒我9点开会 / 8点半提醒我给爸爸打电话 / 半小时后提醒我去开会 / 周六早上8点提醒我买家具 / 每天早上八点提醒我起床音乐来一首飞得更高 / 我想听刘德华的歌 / 我想听甜蜜蜜 / 播放汪峰的飞得更高打开应用打开相机 / 启动愤怒的小鸟搜索应用下载讯飞输入法 / 搜索新浪微博 / 下载水果忍者餐饮美食附近有什么好吃的 / 北京西直门附近的川菜馆 / 附近有没有肯德基 / 附近有没
11、有火锅店火车航班从广州去北京的航班 / 查询明天从北京到上海的火车 / 有没有明天到广州的航班 / 6月15号成都回广州的飞机票查询天气北京的天气怎么样? / 查询上海的天气 / 广州明天会下雨吗?查询股票查一下科大讯飞的股票 / 查询中国移动的股票 / 查询002230的股票地图导航北京西直门怎么走 /北京西站的位置 / 广州天河广场在哪上网搜索打开新浪网 搜索科大讯飞 / 百度一下今年高考作文听新闻我想听新闻 / 最近有什么热门的新闻 / 播放最近的新闻翻译翻译很高兴认识你 /汉堡包多少钱一个英文怎么讲 /一会见的英文怎么说聊天给我讲个笑话吧 / 2乘以2加上3等于多少 / 鱼香肉丝怎么做
12、? / 介绍一下美国5.2 讯飞输入法5.2.1 概述讯飞语音输入法是由科大讯飞推出的一款手机输入法,是全球首款基于“云计算”方式实现的智能语音输入法。软件集语音、手写、键盘输入于一体,不仅具有强大的语音识别效果,而且可以在同一界面实现多种输入方式平滑切换,符合用户使用习惯,大大提升了手机输入速度,使用更加方便快捷。5.2.2 功能介绍1、 语音首款“云计算”智能语音输入法,采用全球领先的智能语音技术,语音流式识别,边说边识别。 2、 手写在键盘上直接手写,笔画顺序随意组合,竖屏叠写,长句手写也能一气呵成,横屏连写,写完左边写右边。3、 键盘拼音/英文/字母独立面板,通过底部滑动切换键盘,九宫
13、格式表情、标点、数字、网络符号面板,自动记忆自造词。5.3 讯飞口讯5.3.1 概述讯飞口讯是一款基于“云计算”方式实现的手机听写软件,可以将语音转换为文字后通过短信/邮件/微博进行发送。5.3.2 功能介绍1、 语音转换通过软件进行录音,后经云服务将语音转换成文字。2、 发短信将转换好的文字带到短信拟稿界面,选择联系人后即可发送。3、 发邮件将转换好的文字带到邮件拟稿界面,选择联系人后即可发送。4、 分享将转换好的文字通过选择的“新浪微博”、“腾讯微博”、“网易微博”、“开心网”进行发送。5、 复制将转换好的文字复制到剪切板,可以在其他应用程序中使用。6 产品对我方的价值通过语音是人传达信息
14、给系统的最简单途径,而且采用语音控制对操作人员专业水平、操作要求也大大降低。因此,将语音控制与现有业务进行结合具有实际意义和应用前景。6.1 运营模式将语音云与现有业务进行结合,通过语音将用户操作指令传达给业务系统,使应用更加智能化,更方便操作。6.2 可行性分析集团原来与科大讯飞信息科技股份有限公司有战略性合作关系,我们可以直接使用他们的语音云,并且往后他们会为我们搭建移动的语音云,可以免费使用。6.2.1 产品推广语音作为最直接的沟通、操作手段,在接下来生活、工作上必定会越来越被广泛使用,我们可以对其先进行研究,并且有集团与讯飞公司合作的契机,研发自有的语音产品。例如:家庭智能-通过语音控制家电,灯
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届河南省濮阳市台前一高数学高二上期末学业水平测试模拟试题含解析
- 内乡介绍教学课件
- 烘焙培训机构的管理制度(3篇)
- 美术功能室管理制度小学(3篇)
- 转运司机的闭环管理制度(3篇)
- 采样仪器维护和管理制度(3篇)
- 中学学生社团活动成果展示制度
- 养老院消毒隔离制度
- 企业企业文化与团队建设制度
- 2026湖南邵阳市邵东市人才引进62人参考题库附答案
- 2026年陕西省森林资源管理局局属企业公开招聘工作人员备考题库及参考答案详解1套
- 承包团建烧烤合同范本
- 电力线通信技术
- 人工流产手术知情同意书
- 2025秋人教版七年级全一册信息科技期末测试卷(三套)
- 教师三笔字培训课件
- 钢铁烧结机脱硫脱硝施工方案
- 中国医药行业中间体出口全景分析:破解政策难题深挖全球红利
- 抢工补偿协议书
- 山东省青岛市城阳区2024-2025学年九年级上学期语文期末试卷(含答案)
- 孕妇尿液捐献协议书
评论
0/150
提交评论