版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
云创智能语音转录一体化解决方案3月目录TOC\o"1-4"\h\u1 项目概述 11.1 项目背景 11.2 市场分析 11.3 应用场景 12 方案介绍 22.1 产品目的 22.2 产品架构 22.3 产品特性 33 产品功效 33.1 笔录模版 33.2 审讯笔录 33.3 笔录校对 43.4 回放录像 43.5 光盘直刻操作 53.6 硬盘录像、回放操作 63.7硬盘数据导出 83.8光盘数据导入至硬盘 94 核心技术 94.1 技术介绍 94.2 工作原理 105 配备与布署 115.1 推荐配备 115.2 系统布署 11
项目概述项目背景随着信息化时代的到来,海量语音的获取和存储能力愈发强大,基于语音转写的实际场景,会存在需要大量的人力投入、工作效率不高、语音数据应用质量和效果不高的状况,并且结合各大单位机构的办公现状,现在会议统计、出稿的精确性和时效性规定高,人员工作压力大,传统的人工整顿方式已经很难满足规定。现在各类型会议,特别是重大、大型会议,介于信息安全等因素,需要指派内部专职人员全程统计,会后还要耗费大量的时间重复回听录音、编辑会议纪要。诸多重要会议含有时间长、信息量大、纪要输出严等特点,这对会议统计人员提出更高规定,会议统计和整顿的工作强度大,且仍可能存在信息遗漏或会议思想理解偏差等问题,亟需得到解决。基于以上背景,云创智能语音转录一体化解决方案应运而生,实现了以符合安全规定的方式将讲话语音内容实时转换成文字和将历史语音统计并转换成文字。该系统含有下列技术特点:一是语音转文字精确率高,中文原则普通话的转写精确率平均可达90%;二是数据安全和保密性强,采用私有云和终端一体机的方式布署,可有效避免会议内容和信息的外泄和灵活响应实际使用需求;三是可针对发音人口音和应用领域进行定制优化,持续提高转写效果;四是人工辅助产出语音成果,实现快速校稿并公布。云创智能语音转录一体化解决方案公布至今,已在多家企事业单位形成应用示范,基本覆盖了政府、公司、教育、公检法、医疗等行业,获得了良好的落地成效。市场分析政府、事业单位、教育和中大型公司由于信息流动范畴较大,诸多决策信息需要及时地向有关人员传达,如何更加好更快地对会议中讲话信息进行统计整顿,成为智能化办公建设道路中的一项挑战,同时也给我们带来了机会。在公检法领域,在做笔录或审讯时均需采集双方的录音,首先用于存证分析,另首先提高人工整顿的精确率和办案效率。在医疗领域,医生每天需要录入大量的电子病历信息,像口腔门诊和超声检查时往往不再方便去打字,急需用一种更加便捷的方式来即时快速的统计患者信息,语音录入替代传统键盘的解决方案应运而生。应用场景1.3.1办公会议云创智能语音转录一体化解决方案中的会议转写服务,能够选定不同类型会议的模板,在会议过程中将多人的讲话内容按角色实时转写成文字,最后保存会议,后来可追溯浏览录音及文字。上述同样可合用于法院庭审场景1.3.2审讯对话云创智能语音转录一体化解决方案中的审讯笔录服务,办案人能够在讯问过程中将双方的对话内容实时转写成文字,最后获取核心信息或快速成稿。方案介绍产品目的云创智能语音转录一体化解决方案是采用“端”的架构,为特定公司或机构提供多个语音转写有关的产品服务,并最后形成一整套“软+硬”的智能解决方案。产品架构云创智能语音转录一体化是基于云创的语音识别(ASR)技术、云创语音合成(TTS)技术开发的一种智能应用系统,该系统将顾客的语音转化为文本并精确理解顾客的业务需求,辅助信息的统计共享与决策。云创智能语音转录一体化的设计理念是:系统由多个模块构成,模块之间高内聚低耦合,易用性强。图1【云创智能语音转录一体化架构图】审讯人和被审讯人:分为审讯人和被审讯人两种角色麦克风:语音采集设备,根据距离可分为远讲或近讲,根据佩戴方式可分为鹅颈式、领夹式、手持式或盒子,建议根据实际使用需要选择。音频解决器:负责接入麦克风,对声音进行编解码,将音频传输到语音转写服务器中,部分状况也可由电脑独立完毕。语音精灵:负责语音转写和语音合成服务。终端设备:便携式语音识别音视频主机。客户端软件:安装在书记员电脑的软件产品,可根据实际场景分辨,如语音输入,单人转录,双人讯问,多人会议(涉及庭审),录音转写等。产品特性智能辅助:将语音转写成文字,辅助统计者完毕语音信息的即时统计与分享需求。场景适配:针对特定顾客特定使用场景进行模型和人机交互的全方位匹配。简易布署:产品集成化程度高,适应现场环境,简便快捷。定制模型:针对特定行业领域进行真实场景化的模型优化训练,提高识别精确率。软硬结合:语音前端与后端的软硬件结合,确保最后输出成果达成最佳效果。产品功效笔录模版可根据案件需要新增、修改、删除笔录模板,能够将一种模板设为默认模板,选其中一种模板单击“设为默认模板”后,审讯时自动以默认模板作为笔录模板。审讯笔录在未审讯界面双击排期进入审讯界面,如果存在默认模板,则自动打开默认模板,作为该次笔录的模板也能够点击打开模板,从本地选择一种文档作为该案件的笔录模板后开始审讯,审讯结束后,点击结束审讯结束本次审讯,途中也能够点击暂停审讯。笔录校对结束审讯后排期在笔录校对列表中,单击选中再点击修改,能够修改、完善案件信息。在笔录校对列表中选中该案件,双击进入笔录校对界面;校对的过程中发现统计错误的能够在里面进行修改。点击右侧的回放菜单能够查看案件信息、播放案件录像、查看重点标记。回放录像点击本地录像回放,笔录系统会根据现在所打开的笔录进行录像、案件信息关联回放,能够导出的案件或联动设备刻录时的光盘内的笔录。光盘直刻操作1、按直刻终端前面板上的“开/关”键将直刻终端启动;(需要等待硬盘加载能够看到硬盘容量再对设备进行操作)2、按直刻终端前面板上的“进/出仓”键将光驱仓门打开,放入两张DVD+R的空白光盘并关闭光驱仓门,等待直刻终端对放入的光盘检测、格式化;(如图2.10)3、按直刻终端前面板上的“刻录选时”键选择刻录时长;(每按一次时间增加1小时,1-24小时循环)4、按直刻终端前面板上的“光盘直刻”键开始光盘直刻并联动硬盘录像备份;(如图2.11)5、按两次直刻终端前面板上的“停止光盘”键停止光盘直刻,进行封盘并联动停止硬盘录像备份;硬盘录像、回放操作1、按直刻终端前面板上的“硬盘录像”键开始硬盘录像;2、再按直刻终端前面板上的“硬盘录像”键停止硬盘录像;3、用鼠标打开UI操作菜单“硬盘回放”弹出回放框选择需要回放的视频双击;
3.7硬盘数据导出1、用鼠标打开UI操作菜单“硬盘回放”;选择需要导出的视频文献在前面的勾选上;选择导出途径;点击备份,等待数据导出完毕;3.8光盘数据导入至硬盘将需要导入的光盘放入设备光驱;(左为光驱一、右为光驱二)用鼠标打开UI操作菜单“硬盘回放”;3、选择导入输入源(光驱一或光驱二)至硬盘;核心技术技术介绍4.1.1语音识别技术介绍语音识别是将一大段的语音转写成文字,让机器统计下来。4.1.2语音合成技术介绍语音合成是将文本转化成语音,让机器像人类同样能说会道。工作原理语音识别工作原理如图2所示:图2【语音识别工作原理】语音信号通过音频采集设备进入系统后,首先进入预解决阶段。预解决涉及端点检测和噪声消除等环节,端点检测环节对输入的音频流进行分析,自动删除音频中静音或非人声等无效部分,保存有效语音。噪声消除环节滤除背景噪声,满足顾客在不同环境下使用需求。通过预解决后的语音信号进入特性提取阶段,对语音信号进行分析解决,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息,同时对语音信号进行压缩。从说话人的语音信号中提取出说话人的声学特性。提取到的特性信号通过训练算法训练后,建立起声学模型和语言模型。为语音特性信号的匹配提供匹配根据。 声学模型的设计与语言发音特点亲密有关,识别时,将输入的语音特性同声学模型进行匹配,得到最佳的识别成果。声学模型单元(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大的影响。通过声学模型的优化,能够良好的识别出方言和地区口音。语言模型针对系统使用的语言进行设计,涉及语义构造、语法规则、语言的数学描述模型等方面,在大词汇量的语音识别系统中含有不可替代的作用,当识别时碰到多音字等容易造成歧义的成果时,语言模型能够根据语言学模型、语法构造、语义学进行判断纠正,输出对的的成果。进行语音识别时,特性信号通过声学模型进行发音解决,通过语言模型对语义、语法进行解决,经解码器找出最大概率符合该信号的字串,输出成果,传递给自然语言理解单元。自然语言理解单元通过意图理解,找出最大概率符合规则的答案,予以输出。配备与布署推荐配备4.1.1软件环境云创智能语音转录一体化需要配备恰当的软件运行环境,涉及但不限于:操作系统RedHatEnterpriseLinuxServerRelease6.2CentOS6.5Suse11sp1x86_64,kernel:2.6.32JDKJDKJDK1.7服务器Apache-Tomcat8.0.11数据库Oracle11.2.0XERedis3.2.1表1.软件基本规定列表4.1.2硬件环境云创智能语音转录一体化含有硬件占用资源低的特点,建议最低的硬件配备以下:服务器名硬件配备会议&询问笔录多功效一体机1.会议&询问笔录
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年电气传动系统中的反馈控制策略
- 2026年绿色建筑技术的国际经验
- 2026年智能监控在路基建设中的应用实例
- 贺家李课件教学课件
- 医院医疗废物焚烧设备维护规范培训
- 货物安全操作培训课件
- 个性化疫苗设计与制备
- 医院管理与运营优化
- 医疗信息安全管理与隐私保护策略
- 2026年衡水职业技术学院单招综合素质考试参考题库带答案解析
- 人教版(PEP)六年级英语上册复习知识点大全
- JJG 633-2024气体容积式流量计
- 咨询服务风险管理策略-洞察及研究
- 船舶阀件基础知识培训课件
- 立体停车设备质量控制管理文件范例
- 教学能力大赛备赛讲解
- 六年级语文阅读理解之托物言志(知识梳理技法点拨例文分析)(含答案)
- DB31∕T 1564-2025 企业实验室危险化学品安全管理规范
- 维修基金管理办法新疆
- 企业安全生产培训档案
- 工程机械安全操作规程
评论
0/150
提交评论