




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
智能庭审转写系统解决方案第2页r^TOC\o"1-5"\h\z\o"CurrentDocument"1背景概述 3\o"CurrentDocument"2系统架构 4\o"CurrentDocument"逻辑架构 4\o"CurrentDocument"物理架构 5\o"CurrentDocument"3功能描述 6\o"CurrentDocument"灵云智能庭审转写系统 6\o"CurrentDocument"创建庭审 6\o"CurrentDocument"关键词优化 7庭审实时转写 8\o"CurrentDocument"历史庭审记录回听 9庭审状态控制 10庭审信息自动播报 10\o"CurrentDocument"导出/打印/保存 11\o"CurrentDocument"灵云全智能能力平台介绍 12\o"CurrentDocument"语音合成 12\o"CurrentDocument"语音识别 13\o"CurrentDocument"4系统的益处与价值 16\o"CurrentDocument"5技术要求 17\o"CurrentDocument"软硬件配置清单 17\o"CurrentDocument"软硬件性能要求 17\o"CurrentDocument"软件参数 17\o"CurrentDocument"硬件参数 181背景概述当前,随着人工智能技术的不断发展和应用普及,针对多人连续语音的识别应用已经十分成熟。将人工智能应用到庭审实时识别转写场景下,改变当前的庭审纪要模式,实现在庭审过程中对审判长、原告、被告、犯罪嫌疑人、证人等各方陈述的内容自动实时识别成文字,能够成倍提升庭审的效率,并将大幅减轻书记员的工作强度和压力。而且部分庭审信息量大、讨论问题多、庭审时间长等要素,人工记录很难做到完全保存庭审信息,这时灵云智能庭审转写系统能够做到记录整个庭审过程全量信息,从而体现出巨大的实用价值。2系统架构2.1逻辑架构图1系统逻辑架构系统依托于灵云全智能能力平台提供的语音识别(ASR)和语音合成(TTS)能力,主要包括采音模块、业务系统和存储模块三部分:1)采音模块:主要通过麦克风及USB声卡等硬件采集庭审音频数据。2)业务系统:该系统为书记员等提供实时的语音识别文本展现、相关资料展现和庭审流程中各种基础处理功能,便于相关人员便捷实用系统,提高工作效率。3)存储模块:将业务相关数据存储于Redis数据库、Oracle数据库和文件服务器中,根据实际业务情况提供能力支撑和应用服务。2.2物理架构灵云智能庭审转写系统的物理框架如下图所示。一会议 会议1麦克, • 麦克I风1‘ 风N’/ ■ 一会议 会议1麦克, • 麦克I风1‘ 风N’/ ■ / I 卡侬线多通道USBUSB电缆」卡礴I音频流・服务器会议室 秘书电一—— 脑 ‘无线路由器会议室秘书电网线语音能力平台服务器无线
路由器会议室,秘书电图2系统部署架构系统物理框架首先需要在法院内网服务器上搭建语音平台,并且针对单个法庭需要新增一台专用采集设备和一台Windows电脑,Windows电脑要能够与语音能力平台服务器相连接。具体系统流程如下:1)法庭内的N个麦克风通过并线连接采音设备,采音设备实现将模拟信号音频转换为数字信号,通过USB连线与局域网内的Windows电脑相连接,将音频输出到台式机上。2)在书记员电脑上安装录音软件负责把采音设备采集到的数字信号通过法院内网发送给后台语音识别服务器。3)语音识别服务器负责将音频识别为文字,发送给书记员电脑上的网页端法庭系统。4)书记员通过网页端法庭系统可以实时查看、编辑、修改识别出的文字内容。
3功能描述灵云智能庭审转写系统产品结构图:折线图案彳樱星统计创建庭审功能描述:书记员创建庭审的时候,在网页上选择法庭,系统会自动关联到对应法庭的麦克风,书记员即可对麦克风的角色姓名进行编辑,从而在庭审转写的直播过程中来达到区分角色的效果。此外,在网页界面上支持对当前庭审的编号、名称、开庭时间、开庭地点等信息进行编辑设置,方便会后整理和查阅。
业务流程图:界面效果图:33用境■正第圉.±1!Hn-dtQM件修噌 业务流程图:界面效果图:33用境■正第圉.±1!Hn-dtQM件修噌 K事事等关键词优化功能描述:针对庭审转写过程中,某些个性化或者生僻的词语(例如人名、公司名、地名等)可能出现错误的情况,书记员可以提前输入一些关键词来优化语言识别模型,以便在后面的实时转写过程中,系统自动修正这些文字的转写结果,提高识别准确率,从而减少书记员修改识别结果的工作量,提高庭审效率。业务流程图:界面效果图:工・慎虚此*页JHW巳他母法庭才理壬・11伏牝 草闱优用心型旧1*M:界面效果图:工・慎虚此*页JHW巳他母法庭才理壬・11伏牝 草闱优用心型旧1*M:由N^LXtiK-ZEVEM.KillSEUAK. /便案开黑区WU"• 哂力⑪11A&.内设・小电3E丙肝开H=&IE工情工UMFiS.标■■11生小乐!7再MWmifl前量呻■显#S:!血总后甚#市Xffl冉JFH■忸MFny由恬号闱5虫, 阚*恸*五益8-检集一屋・』将胃!让星而■■疗阳1信111■泰是ii庄酒里府区互■校:»HEKIfl号£计划防・1■.由激*事事用句・分国■言翦*.=-ie«/»ww事设19・司*K电底用■加也中廿相串的BtrTEVi.(MttMK!iDViRrtZaE*2iJ17flLlOB31B.看51£・胃为三TKHfi:JHTPlfiE。。-Q股常■蠢HUII2D1F年英般汩X20仃3口;鼻).出/压尸机1QHH2玷哥1Mfl=.了■£学上而■而■屁.岸国国UNEH^i产H9H:度开情启出国事翱断苦前B万*.祀取事前好力灯肝苜增秋!H,脚升VI5E电段我常修工培训会直免展力风用4曲|T及各区意事脱串定部丽iM・峰MH艮花白♦也gWff■国曲・工际餐,Mzjrje.程用13工rvoi行曲升・松■।式1:叫上I日日宣az^T中।耀范|日)-4OE电mtw无谖■由岩干ma至r<叫qtstiMHwn■印3.电业*苔e自基曲・人国看坦里中星行七咫»41±■唱曲H的♦田,a^bEWHUH,出台区卫生■■住承*或1£也■对回rr民用西宜・■电也行&*对『8去中出鼻的鼻&性・^整科HJM而修时础.修慢・出宸.庭审实时转写功能描述:灵云智能庭审转写系统自动识别出来的文字内容虽然具有很高的识别率,但仍可能存在小部分的错误问题,书记员通过网页可以进行实时的修订、保存操作,并且支持复制粘贴、删除替换等操作,实现庭审记录的快速修正、生成。具体提供以下功能操作:1)普通修改:按照正常word操作习惯提供正常的增删改、复制、粘贴的功能、删除替换等。2)个性化词汇添加/快捷替换:书记员可以通过庭审记录页面快速添加个性化词汇,增强识别效果,同时可以通过双击个性化词汇列表,可将对应的个性化词汇快捷地替换掉转写输出的错误文本。业务流程图:界面效果图:施史云/审帖4藏堂 喇主任用B:m界面效果图:施史云/审帖4藏堂 喇主任用B:m㈱.正吁JU*中1次.Jfli&fttu 及为*4*/:・劭K开庭庭南中已闭庭遇阴(!搜口明用■01^3:46 日回&j*<ua■唯 -1UtfK■■1■*.-*-*-■-J1-吉区黑猿H不履.题U3E■民军♦.岫,生汨I本外星盟立Q・A:主修■隼节电砒开tl台台■丁仲:W盛胸.增■WlfrqM理仲朋眯加神B眼甲用足通SB电容fitHQMfl厚加口/白芭¥口1命牙0日・,—t抬■的tCEF式ttrTK.由E!■屐摹扈里「如梨EE-»>.压崛,&maWliE更看・呢%古卜冉H里,电'H2EU”■fiswa分向由开■致・.申第•瓦事■!博时啪国■点=,就・H皿例・动IR・内事阻硒时开羽■的富口乩用httfifflKftMl.'!Rfi230S2a1.'teiCfiaiB.守中曲密的力三十MIS.M—ks.落miHiiiH.q般—um4直斯/理3口23日年犯『日,一壬LWMflW衽系・mHs7*M«R^;f«IH.S!里用・融灯口话,尸格.让喀巾网吐朝“则旧通|三内,即■步棹古时戈灯・iiWiWl.期西fKU奇■及西憧HillSil客.*ls.SrflWA.fl*llMB.朝区域号DWf用高喜三期后副军・自播皆T件才看1tRZKB.雷=虚=35・金』忖动开II帖・1而;1=口9日■?□仃事白口阅日>一磨胴布口生工t主Q.♦五・注JL1;广才玉干婚》片明内修色”工WMD.—屿■・加I岫・人星♦EHiEIS产煤相2白“中两市!£・£&..45^?ENMllMM*青区上旺甘三二作,nfi/niNRMKBIt&jErK.意rm彳租限中出国爵帝an.・网件题.碱if黄同网却i*m量“M015IGOl»4fld£NSthlg 的历史庭审记录回听功能描述:书记员在庭审记录过程中,因记录不及时、陈述人语速过快的情况,通过转写过程中打点标记相应的位置,在闭庭时,可以通过回听庭审音频,再快速修正记录内容。业务流程图:例中.例中.第10页界面效果图:■,血断踞星云霄若事曲耳簟观B奥%E司第10页界面效果图:■,血断踞星云霄若事曲耳簟观B奥%E司.*1由3阻值日 ・也点:鼻打造庭«?«* 总"马际珈曲 。事名味:飒3n BCifians造JQWH!果境■理今随足■&事■.♦山堂1喊“\才由田源i东P皿拄f■.才儆本证犬行2觇t•工柞隼・»削3=,般iliH/心医仙闺[El牯❾帼It・M里码先就E在却巧切内升Hfli3仟m否:*fi格立璃二・I-eas&wMit双曲■隹F*基期E-UUF,£-a».丽石母皿椅・温mm:壬*段EH.W.区,3・9内据■培的工牙斑强Id,1TN霖充吊■后时航处区■安.—[二]收点用・E|I]本收近面搏出件的♦力墨的必胜?*隹REM・U朝司力匐仃*3月国日史印仃平阳澳1日-FIM■分为三例展:M-flIH,靠明■*JHR0氏常JNltia剧C刘1了年1内卫汩宣布”〜押了日1・田AM机智开IT取博■,!!SP.了假次刑行熊—品,凌丽■:■鸣11止图?/带出戛1■旭北行有E月为.和寒肿方由力■:讦惘相取静.电事肝mm强物Mf嬴皑巾附,叫T值的梅人典画I土现胤否定芟娥革集量则R*清Hi肾mms组占=闻⑼姐*日・rtr万m.第二前RL**母:括”Q同MTU将壹(201;•年4月813轨IV肛且2ffiJ,明阶注计生■.市物Ra*RWI&l(土干西螃M典F0舍”工不泊聊》.码1(当•要试383人属(«1碎西什51的雷w嗝斤蝌・ULKKMWBflm.配占尽口:计生口*曰言用■工不.他洋圾帔&iR■■础6好/1段昆罩哥美阳下年中出用的班性.峥性巨■,eHSfettSEPWWffliW*-调•・正围®国Ij蟀■刖3Ml❾王鼻!(■*型HMMIQ庭审状态控制功能描述:书记员通过网页端能够实现对整个庭审节奏的控制,当前系统提供三种庭审状态:“开庭”、“休庭”、“闭庭”。界面效果图:茂里麦等制口《关于加强医疗机相在含监言工作的蜘。,市£屐湮单委送靠的人反警迪布强.医疗机向等合监管专疝行副险电垢।西宴拉席属地驾理原则।配合区卫生计生委由好缘合监营工作.对医方填向IE刻实施餐况进行督导:发现政箝实标t14中出盟的苗头性、的同性.司时.及时报告并率奉行恻■胞髀决,fff庭庭审信息自动播报功能描述:对于开庭需要宣读的法庭纪律、功能描述:对于开庭需要宣读的法庭纪律、报,并且支持播报速度调整及音色自由选择。业务流程图:界面效果图:导出/打印/保存功能描述:书记员在整个庭审结束后,可以从系统的网页端将庭审生成的笔录导出为Word文档,支持在网页端中直接进行打印操作,并且可以将庭审笔录保存至庭审记录管理系统。业务流程图:第12页界面效果图:开始导出 打印 保存♦ 第12页界面效果图:开始导出 打印 保存♦ + +导出文本文件।卜印号洞*
打印预览皓束01:23:46日胃G街理式各区发将改茶去.德山发展旧变、」由经;并技术开发区空装改火高:为伤隆本市医药分开笳自&<1作平稳便和实法被蜜青导本市医疗独峋餐女管格次堆执行情况,婀究决定在全市范田内开展医罚分刑5吉改里像格方@检立■:一,擅支睚织方式此次检或由市地底由单至况一组绢,统一部署“提照口归市情悟行iff处时即办法》的眼症,市,区段腐奴革委根据曾情分工分别开展立查,市发通蚌委将用揶分百重点讨芭”二.皓面对建粕时间灵云全智能能力平台介绍全智能能力平台是基于服务器硬件和软件,提供捷通华声科技股份有限公司最新的语音合成、语音识别、声纹识别等多项核心技术能力,并在此基础上构建语音应用。语音合成语音合成(TexttoSpeech,TTS),是将文本信息转化为语音数据的技术。语音平台集成的语音合成第13页引擎是业界领先的文语转化引擎,采用最先进的中文文本、韵律分析算法和大语料库的合成方法,合成语音已经接近真人的自然效果。其主要功能有:1)高质量语音,将输入文本实时转换为流畅、清晰、自然和具有表现力的语音数据;2)多语种服务,整合了多语种语音合成引擎,可提供中文、英文、粤语、维语等语音合成服务;3)多音色服务,提供丰富、风格多样化的音色选择,如浑厚淳正的男声,温柔甜美的女声,天真烂漫的童声等等;多字符集支持,支持输入GB2312、GBK、Big5、Unicode和UTF-8等多种字符集,普通文本和带有CSSML标注等多种格式的文本信息;5)多种数据输出格式,支持输出多种采用率的线性WAV,A/U率WAV和VOX等格式的语音数据;6)语音调整功能,开发接口提供了音量、语速、音高(基频)等多种合成参数动态调整功能;7)配置和管理工具,合成引擎提供了统一进行配置和管理的工具,完成了全局参数配置、用户词典、用户规则管理等功能;8)效果优化,合成引擎提供了以定制资源包和CSSML为代表的多种针对实际应用环境进行合成效果优化的方法;9)一致的访问方式,能以方式访问远程的语音合成服务,并且提供与本地调用相同的开发接口,实现了完全透明的访问;10)背景音和预录音,提供了背景音和预录音的功能,大大提高了合成语音的自然度和表现力。3.2.2语音识别语音识别技术(AutoSpeechRecognize,简称ASR)所要解决的问题是让机器能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来,相当于给机器安装上“耳朵”,使其具备“能听”的功能。其主要功能有:A.前端语音处理前端语音处理指利用信号处理的方法对说话人语音进行检测、降噪等预处理,以便得到最适合识别引擎处理的语音。主要功能有:1)端点检测端点检测是对输入的音频流进行分析,确定用户说话的起始和终止的处理过程。一旦检测到用户开始说话,语音开始流向识别引擎,直到检测到用户说话结束。这种方式使识别引擎在用户在说话的同时即开始进行识别处理。2)噪音消除语音识别系统具备高效的噪音消除能力,以适应用户在千差万别的环境中应用的要求。第14页3)智能打断智能打断功能使用户可以在自助语音服务的提示语播放过程中随时说出自己的需求,而无需等待播放结束,系统能够自动进行判断,立即停止提示语的播放,对用户的语音指示做出响应。该功能使人机交互更加高效、快捷、自然,有助于增强客户体验。B.后端识别处理后端识别处理对说话人语音进行识别,得到最适合的结果,主要特性有:1)大词汇量、独立于说话人的健壮识别功能系统满足大词汇量、与说话人无关的识别要求,可以支持数万条语法规模的词汇量;并能适应不同年龄、不同地域、不同人群、不同信道、不同终端和不同噪声环境的应用环境。2)连续语音识别连续语音识别是指能够把用户说的任意语音转换成对应的文字信息,支持中文和中英文混读的常见语句听写,对于日常使用的常用对话有着很高的识别准确率,包含日常用语,如短信类、生活、交通、娱乐、科技、数字数值、名人、互联网热词、新闻、金融等领域的词库更新。3)智能标点添加连续语音识别支持中文标点智能预测,使用超大规模的语言模型,对识别结果语句智能预测其对话语境,提供智能断句和标点符号的预测。4)置信度输出置信度反映了识别结果的可信程度。语音识别引擎可以在返回识别结果时会携带该识别结果的置信度,应用程序可以通过置信度的值进行分析和后续处理。5)多识别结果又称多候选技术,在某些识别过程中,识别引擎可以通过置信度判决的结果向应用程序返回满足条件的多个识别结果,而不是唯一的结果。识别系统提供了可能的识别结果列表,并按置信度结果从高到低进行排列。在业务设计中,可以根据应用要求向用户提供这些结果,供用户进行二次选择。通过置信度判决和多识别结果输出技术可以开发更加灵活、更加人性化的业务流程。6)说话人自适应当用户与语音识别系统进行多次会话过程中,系统能够在线提取通话的语音特征,自动调整识别参数,使识别效果得到持续优化。7)多槽识别语音识别的槽(Slot)代表一个关键字,即在一次会话过程中可以识别说话人语音中包含的多个关键字,这可以提高语音识别应用的效率,增强用户体验。8)热词识别第15页热词识别使得语音识别应用程序能够在说话者说话的同时检测一个特定的词或短语,当说话者说到这个短语的时候,识别引擎会把控制权交还给应用程序。在应用程序使用该功能可以使识别器能够在后台监听输入的语音,直到用户说出特定的短语进行请求时才与用户交互。9)智能调整识别策略能够自动根据系统运行情况动态调整语音识别策略,在系统较忙时(CPU占用较高),采用计算量较小但具有足够精度的策略以保证系统的响应速度;在系统不忙时(CPU占用较低),采用精度更高的策略以达到更优的识别效果。10)语音录入允许用户通过语音方式动态增加识别语法。该功能使用户可以更加灵活的维护语法,扩展语音识别范围,并且能够提高识别系统对用户语音的适应能力,提高识别的准确率。11)识别日志语音识别的日志在系统中有着非常重要的作用,该日志记录输入的音频、加载的语法、识别过程的中间结果、识别模块识别过程、识别使用的各种参数、识别结果以及当时的系统环境信息。第16页4系统的益处与价值系统不但节省人力成本、减少人工出错率,而且给客户带来诸多益处或价值。1)超高的语音识别准确率灵云智能庭审转写系统识别准确率达到92%以上,庭审前的关键词优化,可以提升识别率到95%。2)能够大幅缩短庭审时长由人工录入120字/分钟上升至机器转录300字/分钟以上,普通庭审时间缩短20%,书记员熟练使用系统后将可以节约庭审时间将近50%。3)庭审纪录完整度庭审过程全程留痕,笔录完整度高达100%。第17页5技术要求软硬件配置清单系统建设所需的软硬件设备配置如下:类型配置或样式数量硬件设备专业级USB声卡8进8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高考生物426个易错点
- DB36-T1852-2023-茯苓规范化生产技术规程-江西省
- 财务成本管理中的绿色管理理念探讨试题及答案
- 2025年小学教师资格考试《综合素质》教育活动设计题历年真题汇编试卷
- 2025年小学教师资格《综合素质》文化素养全真试题解析及答案
- 2025年注册税务师税法(二)个人所得税专项实战演练卷
- 脾破裂的护理
- 福建省福州市二检2024-2025学年高三第二次质量检测 语文试题及答案
- 尿路结石护理措施
- 2025年国际化学奥林匹克竞赛试题及解析
- 2025年广州市番禺区九年级语文中考一模试卷附答案解析
- 留队申请书消防
- 2024审计常用法规定性表述及适用
- 作文写作(解析版)-2025年上海中考语文专项复习
- 2025-2030年中国电力勘察设计行业现状分析规划研究报告新版
- 2025年中国广东省内装配式建筑行业市场发展监测及投资战略咨询报告
- 2025福建省晋江水务集团限公司招聘17人高频重点提升(共500题)附带答案详解
- 亚文化认同与身份建构-洞察分析
- 深度学习完整版本
- AI培训课件教学课件
- 【培训课件】管理沟通
评论
0/150
提交评论