成都艾索语音技术有限公司.ppt_第1页
成都艾索语音技术有限公司.ppt_第2页
成都艾索语音技术有限公司.ppt_第3页
成都艾索语音技术有限公司.ppt_第4页
成都艾索语音技术有限公司.ppt_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、成都艾索语音技术有限公司,Chengdu iSonix Audio-Tech, LLC.,公 司 项 目 摘 要,语音是人类最自然最常用的交流方式,人们一直希望用语音通过说话的方式控制身边的设施且提供更为便捷的服务。 本公司将通过先进语音技术的开发和应用为基于自然语言的人机交互提供解决方案。,公司的竞争优势,技术优势,市场应用优势,人力资源优势,一、技术优势,音频指纹识别技术: 音频指纹和人的指纹类似,是反映音频的独一无二的特征。,目的: 通过分析信号本质来分辨音频是一种基于内容的分辨 识别率: 即使在信号变形的情况下也有很高的识别率 ( 95%) 鲁棒性: 对于信号的各种变形有很强的抵抗力:

2、 幅度变化,加噪,编码 (e.g. MP3), . 人为的变化 (e.g. D/A, A/D) 紧缩性: 指纹很小,2、先进的盲信源分离技术,麦克风采集的语音时,实际环境中存在的其它声音,如汽车声、电视声、空调声等也会同时被采集,这些无关声音会对识别结果产生很大影响,严重恶化识别性能。 采用麦克风阵列采集语音信号,并使用盲信源分离技术从中 分离出可能存在的各个信号源,可以自动识别信号源的数目。 使用该项技术可以有效的克服现在市场上很多语音相关产品 只能工作于安静环境中的缺陷。,3、独特的语音检测技术,4、基于语法模型的命令识别技术,采用基于机器学习的语音检测技术从分离出的各个信号中识别出 含有

3、语音的部分,去掉噪声等不含语音的部分。 该语音识别技术采用开发人员输入的语法来约束语音命令,只有满足语法模型的词才认为是有效命令。例如,“请开灯”,“把灯打开”就是两个语法,如果用户只说“开灯”则认为用户不是在下达命令,基于3、4两项技术的特点,我们就可以非常有效的解决目前市场上相关语音技术所谓领先水平(仅利用声音信息的孤立词识别技术)产品中存在的两项最大的缺点。 一是虚警率较高,会把不是命令的语音错误识别成命令。人类识别 语音时不仅使用语音信号本身,还使用了丰富的语法知识、语言知识以及背景知识以区分同意词(近音词),仅利用声音信息的孤立词识别技术会带来很多虚警。 二是使用之前要进行训练。孤立

4、词识别需要事先收集命令下达人的语音命令作为“模板”,这会给用户的使用带来一些麻烦,如客人没有经过训练就无法对电视下达命令。,5、语音控制衔接技术,该技术可以把以上技术进行有效衔接,从而有效解决目前使用语音相关技术产品中存在的缺陷,使产品有效升级。此外开发更多的便捷、实用、安全的相关语音控制产品,二、市场应用优势,目前在国内很多知识产权得不到最有效的保护,关键在于受害者不能提供切实的相关证据。 使用本公司的音频指纹技术就可以最有效的对相关音频方面的知识产权进行有效保护,打击非法盗版。比如音乐版权、电影电视剧版权、广告监测等等。 国外发达国家经常指责我们在保护知识产权方面的不力。同样我们使用该技术

5、也可以收集到足够的证据反击他们在保护知识产权方面并非象说的那样好。比如说日本每年都会盗播中国约9000集电视连续剧,在美国等其他国家同样也会发生这样的情况。 一旦该项技术被应用于市场,其市场前景将会无法估量。,1、基于知识产权的保护,比如说对电灯和电视的控制。我们都希望能够一进门不管是主人还是客人只要通过语音发出指令说开灯就能实现开灯的功能。躺在床上说“切换到中央一套”就能实现切换的功能。 第一步:将盲信源分离。使用盲信源分离技术从中分离出可能存在的各个信号源,可以自动识别信号源的数目。 第二步:通过语音检测技术从分离出的各个信号中识别出含有语音的部分,去掉噪声等不含语音的部分。 第三步:通过

6、基于语法模型的命令识别技术采用开发人员输入的语法来约束语音命令,只有满足语法模型的词才认为是有效命令。例如,“请开灯”,“把灯打开”就是两个语法,如果用户只说“开灯”则认为用户不是在下达命令。 以上三项技术都是基于音频指纹技术进行有效衔接的。综合之后就可以完全开发出符合我们要求的产品。,2、家用电子、电器产品(与说话人无关的技术),3、安全门警系统(与说话人相关的技术),随着社会的进步,人们更希望自己的家更安全,开门更便捷(甚至不带钥匙)。但是目前市场上的产品还只是很低端简单的相关语音控制产品 通过我们的语音控制技术就可以实现对现有产品对升级和更安全更便捷的功能。 比如说,我们的门警系统就仅仅

7、识别你或者你的家人的音频指纹,哪怕是声音变形(感冒、身体不适、噪音环境等)都能将门打开。其他任何人不管你采取何种形式,包括录音、窃听你的说话内容等都无法实现开门,且门警系统自动报警。,4、手机防盗功能,目前有很多手机也在使用语音功能,但是很低端的一些语音控制技术,完全不能避免前面所说的几项缺陷的硬伤。 通过使用我们的现有的语音技术,加上进一步开发,理论上就可以实现防盗功能。比如说,只有你的声音才能将手机打开,假如丢失,其他任何人都不能再使用。这样一方面使得偷盗手机就不会有任何意义;另一方面手机中的一些隐私内容也不会被盗甚至被讹传。对于手机今后的应用将是革命性的。,5、GPS应用,人们开车的过程

8、中,如果使用GPS系统,最不方便的地方就是既要把注意力放到开车上,又要随时用手去触摸GPS屏幕。那当然是一件非常危险的事。 如果能够完全通过我们的语音来控制将会即方便又安全。 通过使用我们的技术在理论上是完全可以实现这项功能的,邱克,董事长 西南财经大学教授;拥有多年国内外企业高管管理和投融资经验 美国波士顿大学MBA,瑞士管理研究学院DBA;成都市高层次海归人才 戴兵,执行董事,首席执行官-CEO 长期从事资本运作和企业投资上市,积累了大量相关经验 西南财经大学MBA 周后林,董事,首席营运官-COO 长期从事企业管理工作,在市场和管理方面又相当丰富的经验 西南财经大学MBA 韩疆:博士,首席技术官-CTO 在计算机软硬件和语音控制技

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论