安徽省语音产业技术发展指南.doc_第1页
安徽省语音产业技术发展指南.doc_第2页
安徽省语音产业技术发展指南.doc_第3页
全文预览已结束

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音技术涉及语言学、语音学、声学、数字信息处理、模式识别与人工智能等众多相关基础学科。语音产业是基于语音技术的新兴高新技术产业,为显著提升我省语音产业的核心竞争力,迅速抢占全球新一轮信息经济先机,促进我省语音技术产业快速发展,特编制安徽省语音产业技术发展指南(2010-2015年)。 一、发展现状及趋势 全球语音技术的竞争十分激烈,国际IT巨头纷纷投入巨资加大对语音技术市场的争夺,亚太地区已成为全球语音技术市场成长最好的区域。我国语音技术具有显着优势,产业化进程也较快,以科大讯飞公司、安徽出版集团等为代表的语音骨干企业,掌握语音合成、语音识别等核心技术,技术水平国际领先,在国际语音大赛上多次获得第一名的成绩,在全国中文语音主流市场占有率80以上。 语音产业属于技术拉动型产业,语音技术应用领域进一步拓展,在社会信息服务、语音出版物、语音交互软件与终端、语音教育产品、语音监控等领域有着广阔的应用市场和产业化前景,语音产业正处在起步向快速增长转变的阶段,表现出强劲的发展态势。 二、发展思路 1、总体思路。以提升我省语音产业的核心竞争力为目标,以语音技术的突破和拓展应用引领产业发展,坚持核心技术、共性技术及应用技术领域开发并举,突破核心技术,大力开发共性技术,建设语音技术平台,拓展新的应用领域,创造新的商务模式,做大语音产业规模,保持我省语音技术及产业的领先优势。到“十二五”末全省实现语音产业总产值50亿元。 2、技术路线。在语音合成、语音识别两大核心技术研究成果的基础上,开发语音评测、自然语言处理、少数民族语言及方言、智能人机语音交互及自主机器人、语音芯片和海量语音数据计算及服务等语音共性技术。逐步拓展语音技术应用领域,在语音教育、语音内容出版、语音交互软件及终端、语音社会信息服务、语音信息安全加大成果转化和产业化力度。重点建设语音863计划成果产业化基地、语音创新技术平台、语音工程中心、语音产业人才培训基地、语音产业公共集成服务平台、语音出版物平台等。 三、优先领域及发展重点 (一)突破两大核心技术 1语音合成技术。深入研究语音声码器、声学参数统计建模方法、参数生成与单元挑选算法、多语种合成、语音音色模拟等语音合成核心技术,建立覆盖全球范围的25个语种的语音合成系统、非特定人个性化语音合成系统、高表现力情感语音合成系统,实现多语种合成平均自然度达到3.5分,个性化语音合成对任意人的模拟相似度达到3.0分,情感语音合成表现力超过3.0分。 2语音识别技术。深入研究声学模型训练,语言模型训练,高效语音解码技术,环境鲁棒性算法,说话人口音自适应算法,语音搜索与检索算法等语音识别核心技术,完成新一代语音命令词识别系统,语音智能交互系统,语音内容转写系统,语音搜索系统,语音关键词监控系统,声纹识别系统,语种识别系统。实现通用环境语音识别总体正确率超过95%,进一步扩大语音识别技术的应用广度和深度,推动语音识别技术的产业化。 (二)开发六大共性技术 1语音评测共性技术。重点研究语音评测声学模型改进、识别解码网络优化、噪声干扰补偿以及专家评分检错映像技术,研究用于大规模口语水平考试的自动评分技术、用于学习辅导的发音练习自动评分技术、发音检错及自动修正技术、口语表达能力自动评测技术以、唱歌自动评分检错及修音技术。实现成年人普通话水平测试的完全自动化,测试结果超过人工评测的准确度;建立针对小学生的普通话水平评测标准,机器自动评测效果达到人工95%以上。 2自然语言处理共性技术。研究词典建设、命名实体自动识别、句法分析、语义分析等通用语言处理技术,研究面向语音合成的全自动多音字消除、主韵律短语预测及文本情感预测技术,研究面向语音识别中的针对受限领域的语言模型定制技术、长距离语言模型构建技术及区分性的语言模型训练算法等共性技术。建立面向公共安全领域等文本内容信息处理方面的实用化文本处理系统,系统综合性能达到国际最好水平95%以上。 3少数民族语言及方言共性技术。结合相关产业应用需求,研究中国几个主要少数民族语言以及方言信息处理中的语音、语言和语言资源等关键技术问题,建立面向少数民族语言及方言信息处理的大规模基础资源库,为语音技术、信息安全系统等提供支持。实现藏语、维语语音合成与识别可实用系统的突破和实际应用。 4智能人机语音交互及自主机器人共性技术。研究自然语言的语义分类技术、人机语音对话系统构建技术、自主机器人技术等,建立机器具备和人类一样的以语音为主要信息载体的交互界面,实现与人类最自然方式的交流和对话。实现面向家庭服务机器人和自动信息处理机器人实用化原型的突破,整体技术水平达到届时国际最好水平的90%以上。 5语音芯片共性技术。研究语音算法的硬件实现结构优化、低功耗、低面积芯片电路设计、语音SOC芯片设计与产品实现、基于语音语言算法特点的定制嵌入式DSP IP核和可重构芯片设计等共性技术,形成具有完全自主知识产权的语音和语言处理ASIC(专用集成电路)芯片和语音语言处理技术的便携式产品化解决方案。实现以语音合成与识别技术为主的智能语音芯片效果和效率方面的突破,25个语种的语音合成平均自然度超过3.0,中英文语音识别的识别正确率达到95%。 6海量语音数据计算及服务共性技术。研究互联网海量语音搜索技术、海量语音数据存储和访问技术、面向3G及互联网应用的分布式语音技术、海量语音数据云计算平台技术等,为海量语音数据处理系统和关键设备的研制及产业化奠定技术基础。实现可支持2000个以上CPU,4T以上运行空间,1000T以上存储容量的云计算语音服务平台,同时在线提供服务超过5万线。 (三)拓展五大应用领域 1语音教育领域。重点推广应用面向教育的高准确度语音朗读技术、普通话发音水平测试技术、英文语音应用水平测试技术等,开发面向大中小学中英文教学的语音教具系统设备、面向个人的读书笔、学习机、电子词典等语音教具、语音出版产品等。到“十二五”末实现产值10亿元。 2语音内容出版领域。开展语音交互技术在传统文字内容出版物方面的应用,选择、创作适合儿童学习、娱乐的读物制作纸质语音游戏读物和纸质语音学习读物,配合点读笔、学习机等语音产品的销售;开展数字出版的基础上,结合语音识别、语音合成等技术,突出听书功能,制作电子格式语音数字大众读物。实现电子格式的语音游戏读物、语音学习读物和语音大众读物在阅读器、手机等载体上绑定销售。到“十二五”末实现产值10亿元。 3语音交互软件及终端领域。开展精确语音命令控制技术、多语种高表现力高自然度的个性化语音合成技术、智能基于对话控制的语音交互技术应用研究,实现各种嵌入式终端和移动通信设备智能化、高性价比的语音交互功能,开发新一代嵌入式语音合成系统、嵌入式语音识别系统、语音芯片、语音板卡等产品,与嵌入式厂商合作推出车载语音导航产品、智能语音手机产品、智能语音玩具产品、智能语音家电产品等。到“十二五”末实现产值5亿元。 4语音社会信息服务领域。开展大容量高性能语音搜索技术、支持语音与文本内容高精度互相转换的合成与转写技术、电信通讯平台专用语音信息处理技术应用研究,开发新一代电信级语音交互平台、语音搜索增值业务平台等产品,与电信运营商加强合作,创新商业模式。到“十二五”末实现产值5亿元。 5语音信息安全领域。开展支持多方言多语言的声纹特征、语音特征检测鉴定和关键内容信息监控检索技术的应用研究,开发针对公安领域的信息情报获取与分析、通话自动监听,金融及公共服务领域的身份确认,军事领域的身份确认、语种识别、声音伪装等方向语音监控、身份自动识别产品。到“十二五”末实现产值5亿元。 四、创新公共平台建设 1建设语音及语言技术国家工程实验室。依托中科大讯飞公司和中国科技大学等单位,联合组建语音及语言技术国家工程实验室,通过需求牵引推动相关研究领域的交叉融合与延伸,根据语音在相关行业应用的特点和需要,围绕核心技术的产品化和工程化应用,开展核心技术、技术设计、应用集成与测试验证研究。强化语音技术基础理论研究,争取国家973计划支持,促进科研组织模式创新,聚合高层次人才实现学科方向的凝练与优化。 2建设国家语音信息处理工程技术研究中心。依托中科大讯飞公司,联合省内外高等学校和科研院所联合组建国家语音信息处理工程技术研究中心,在语音产业发展的重点领域和方向建立语音技术应用工程优化平台和语音重大技术应用示范平台,推进语音技术自主创新成果的工程化和配套化,研究制定语音技术国家级行业标准,为语音行业应用建立统一标准体系。建立语音产业技术创新战略联盟,促进产学研合作,推进语音核心技术与产业发展的有机融合,降低语音产业在新应用领域的风险。设立安徽省语音技术专项资金,支持语音关键技术研发及产业化,积极争取国家863计划、支撑计划项目支持,建设国家863计划成果产业化基地,通过招商引资,吸引语音应用相关企业入驻,形成以骨干企业为主的配套中小企业集群,扩大语音产业应用价值链。 3建设语音出版物创新服务平台。依托省出版集团公司,通过将语音核心技术与传统出版渠道的内容相结合,建立语音出版物创新服务平台。发掘内容与技术结合点、推动技术合作、创新商业服务模式等多种途径,将语音核心技术易于交互,形式灵活多样的特点与传统出版中的多样化内容相结合,推动采用语音互动形式、通过多种媒体传输手段、面向不同年龄

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论