




免费预览已结束,剩余2页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【法宝引证码】 CLI.A.1236548 原文链接:/qikan/3754f7a0f1b886f095ca8da1390e2d16bdfb.html以“大数据+机器学习”为驱动构建刑事案件判案智能预测系统 期刊名称: 人民司法(应用) 期刊年份: 2018 摘要: 构建刑事案件判案智能预测系统,是将大数据、人工智能等现代科技融入到刑事司法领域应用的重要突破,对推进以审判为中心的刑事诉讼制度改革,促进类案适法统一,防范冤假错案具有重要意义。在构建刑事案件判案智能预测系统中,有两种代表性的思路:一种是以规则驱动的方法,该方法需要将每一种罪名的犯罪构成要件以及裁判方法嵌入到软件系统中,将耗费专家大量的时间精力。另一种是以数据驱动的方法,其优点在于以数据量和计算量换取研究的时间,随着数据量、计算能力以指数级增长以及机器学习的发展,数据驱动的方法可以预测的非常准确。本文倾向于数据驱动的方法,在对人工智能在法律领域应用进行实证考察的基础上,提出“大数据+机器学习”的思路构建刑事案件智能预测系统,对该系统进行整体规划,搭建大数据资源库、案件智能预测应用软件、大数据共享交换平台等三个基础架构,以命案定罪预测为例创建数据集,运用决策树算法建立数学模型,进行定罪预测,具有较高的可行性。 作者: 伍红梅 分类: 人工智能 期号: 10 页码: 34 随着近年来大数据、人工智能、云计算等现代科技的高速发展,国内外司法机关、律师事务所、公司纷纷将人工智能引入司法领域及法律服务领域,法律智能应用系统从基于规则的法律专家系统过渡到基于大数据的法律人工智能系统,在辅助法官办案、服务律师、社会公众方面正在不断取得新的成就。但是,因系统建设整体规划、顶层设计相对缺乏,功能上存在很大提升空间,尤其是对案件预判预测的功能存在缺失,数据收集共享应用上存在诸多薄弱环节,技术上面临诸多挑战。在此,笔者尝试以“大数据+机器学习”的思维方式,从方法论的视角,剖析当前法律人工智能应用系统存在的问题,探索构建刑事案件判案智能预测系统,尝试对刑事案件判案智能预测系统的整体规划、基础架构、预测模型进行设计。一、人工智能在法律领域应用的实证考察(一)人工智能应用于法律领域的发展历史1.第一次浪潮:基于规则的法律专家系统。上世纪70年代,由于受到专家系统成功研制的启发,人工智能技术开启了应用于法律领域的先河。人工智能在司法中的第一次实际应用,是D 沃特曼和M 皮特森1981开发的法律判决辅助系统,探索将其作为法律适用的实践工具,对美国民法制度的某个方面进行统计分析,运用严格责任、损害赔偿等模型,计算出责任案件的赔偿标准,并论证了如何模拟法律专家意见的方法论问题。我国法律人工智能的研制于20世纪80年代中期起步。1986年国家社科“七五”研究课题“量刑综合平衡与电脑辅助量刑专家系统研究”取得了盗窃罪量刑数据模型等成果,1993年武汉大学法学院开发的实用刑法专家系统,由咨询检索系统、辅助定性系统和辅助量刑系统组成,具有检索刑法知识和对刑法个案进行推理判断的功能。1该时期的系统主要是将法律专家的法律知识、经验等以规则的形式转变成为计算机语言。2.第二次浪潮:基于大数据的法律人工智能系统。即以大数据、机器学习、深度学习等为支撑的法律人工智能系统, AI基于大数据可以做出各种各样不同的预测,分析不同文档、相关数据。在合规调查中、诉讼中,帮助准备最准确的文档,分析在不同组织体系下法律诉讼的潜在危险因素。其典型代表有:由IBM研发的世界首位人工智能律师ROSS,英国首个“合同机器人” Berwin Leighton Paisner (BLP),致力于为商标和专利检索以及版权监测等知识产权法律工作自动化的TrademarkNow,提供智能合同服务的KMStandards、RAVN、 Seal Software、Beagle、LawGeex等公司,面向终端消费者的法律机器人DoNotPay,在线法律服务提供商LegalZoom,从事案件预测的LexMachina公司,涉及案例检索、律师推荐、案件预测的无讼、法狗狗、理脉智能、法驴等系统,上海、贵州的刑事案件智能辅助办案系统等。3.第三次浪潮:法律人工智能超越人类法律专家智能。未来10-20年左右,随着大数据、云计算、深度神经网络、算法融合、计算法律学等的发展,以及GPU、TPU等硬件的发展,人工智能将超越人类智能,法律人工智能将赶超人类法律专家智能,法官或律师的部分工作将被人工智能替代,人工智能设备成为法官或律师不可或缺的助手,甚至出现人机一体或人工智能代替法官直接作出裁判的现象。(二)人工智能应用于法律领域的国内外比较考察1.人工智能应用于法律领域的概况(1)主要功能。主要集中于法律信息检索、法律文本的自动生成、案件风险预测、量刑建议、案件胜诉率及撤诉率分析、证据指引、审查及证据链的判断、类案推送、法律咨询、智能案情分析、智能律师推荐等。例如,上海刑事案件智能辅助办案系统的功能包括证据标准指引、单一证据审查、逮捕条件审查、社会危险性评估、证据链和全案证据审查判断、办案程序合法性审查监督、庭审示证、类案推送、量刑参考、文书生成、电子卷宗移送、全程录音录像、知识索引等。法信平台的功能主要为法律人提供一站式专业知识解决方案、类案剖析同案智推服务,并向社会大众提供法律规范和裁判规则参考。ROSS通过使用机器学习解决判刑问题或预测罪犯,高效地进行案例检索,通过自然语言理解阅读法律文件然后找出相应段落并回答用户的问题。Lex Machina提供案件的法律分析,对法官判决进行预测,分析对方律师诉讼经验、绩效,分析可以采取的诉讼方式,涉及的诉讼程度,特定法官的经验,是否考虑转移管辖法院,以及诉讼案件可能的时间,提供诉讼评估报告等。无讼、法狗狗、理脉智能等通过大数据分析的方式,帮助客户预测胜诉概率、提供法律风险分析、为用户提供法律咨询,提供智能案例检索等。(2)涉及技术。既有运用传统的基于软件工程的BS、 CS软件架构的网络传输设计,数据包封装加密技术,数据发送接收技术等,如法院量刑规范化系统;又有运用现代人工智能技术,如上海刑事案件智能辅助办案系统图文识别(OCR)、自然语言理解(NLP)、智能语音识别、司法实体识别、实体关系分析、司法要素自动抽取等人工智能技术。ROSS基于法律的分类法和本体论,通过使用Watson的Q&A API,让Watson学习了数千页的法律文件,并基于谷歌的PageRank算法,建立了用于法律搜索的机器学习层LegalRanko使用深度神经网络、依存解析、命名实体识别、 language model等进行智能检索、回答用户提问、预测判决,以百万计的法律案例训练word embedding。DoNotPay在线智能对话、人机对话,处理了37.5万张违章停车罚单纠纷,能够自由处理涉及消费者权利和劳动争议的1000多种法律问题,帮助难民填写移民申请。法狗狗运用大数据、云计算、语音识别、人机交互等技术,通过模拟对话场景,对用户进行引导咨询,得到相应回答;将法律知识点做成神经细胞一样的点状结构,再通过技术手段实现点与点之间的匹配和联络,最终构建出一个神经网络式的知识图谱体系,并根据用户的反馈不断调试优化,通过大数据挖掘技术短时间内高效制作某类案件大数据分析报告。理脉智能运用语义分析和机器学习技术,将海量的法律数据清洗、分类、结构化,最终提供可视化的咨询服务;将数据进行高度整合、关联,提供结构化、可视化、智能化的搜索结果;按照特定的语义规则,将文书自动分段、贴标签,实现信息自动分类并建立索引,使用户能够进行跨库检索、关联搜索。(3)数据范围。主要包括中国裁判文书网上公开的裁判文书、案例库、法律法规司法解释库、法律文件库、法律图书期刊库、用户咨询库、公开的诉讼数据、庭审录音录像等数据库,涉及的形式有文本、图片、语音、视频等,包括结构化数据、半结构数据及非结构化数据等,处理数据的步骤涉及数据的清洗、集成、规约、关联、分析、计算、挖掘等。例如,上海刑事案件大数据资源库已汇集1695万条数据,包括案例库、裁判文书库、法律法规司法解释库、办案业务文件库、证据标准库、电子卷宗库等。法信平台包括案例要旨、法律观点、法律图书、法律文件、司法裁判、法律期刊六大资源库和55个子库,总文献数达2000万篇,总字数达100亿字,是目前中国容量最大的法律应用知识资源库。(4)研发思路。当前的人工智能法律系统,既有基于规则的法律专家系统,例如法院量刑规范化系统,其根据最高法院制定的量刑规范化实施细则确定的量刑方法,构建软件框架,法官输入案情要素,得出量刑结果;也有基于大数据的法律人工智能系统,大部分服务于律师、社会公众的系统即为该类系统,例如ROSS、Lex Machina、DoNotPay、无讼、法狗狗、理脉智能等,其对量刑的预测,基于社会公众输入要咨询的案情,通过软件系统分析海量同类案件的量刑范围,最后对咨询者作出量刑建议;还有基于专家与大数据分析二者的融合,例如上海刑事案件智能辅助办案系统,其对证据链的构建,首先由法律专家制定刑事案件证据标准和证据规则指引,在此基础上,由专家根据每一类案件的犯罪构成要件、侦办审理案件过程,构建该类案件的证据链模型总体框架,然后对历史案件进行大数据统计分析,得出该构成要件项下所需的关键证据,从而构建完整的证据链。2.当前人工智能法律系统存在的问题(1)系统建设整体规划和顶层设计相对缺乏。构建思路上是以规则为主还是大数据为主,各家系统均不一样。总体而言,法院的智能法律系统主要以专家系统为主,辅之以大数据,但对大数据的分析、挖掘不够;市场化的智能法律系统以大数据为主,但是运用专家规则较少,限于数据的种类掌握不多,对数据的深度挖掘、关联应用不够。同时系统存在重复建设与部分项目缺失并存的现象,例如,最高法院和各省市法院的系统功能都有裁判文书的检索、庭审数据的检索、法律法规的智能检索等功能,但是运用大数据对定罪量刑、民商事案件预测、类案精准推送存在缺失,研发深度较浅或范围较窄的现象,上海刑事案件证据链的构建还仅限于3类犯罪7个罪名。(2)功能上仍存在很大提升空间。功能深度较浅、功能范围较窄、应用与需求的结合不够、案件预测较少。基于服务对象及需求点的不同,司法机关和律师事务所、公司研发侧重点不一样,二者除了均具有法律信息智能检索、案例检索、法律法规的检索、量刑建议、类案推送之外,在涉及案件的判案预测、法律风险预测分析、胜诉率预测分析方面,往往过于简单、模糊预测,不能根据具体案情,形成精准的预测,刑事案件的预测仅限于量刑。类案的推送也比较模糊,往往是同类案由的推送,缺乏对类似关键案情的类案进行精准推送。(3)数据收集共享应用上存在诸多薄弱环节。虽然目前数据积累的体量比较大,但数据的多样性、标准化、关联度、深度挖掘不够,例如公开的裁判文书目前有3000多万篇,但是其他数据如案例、法律法规司法解释、法律文献、庭审录音录像等公开的体量不大。对裁判文书的深度挖掘不够,例如目前对案件的预测,主要集中于刑事案件量刑的预测,缺乏通过大数据、机器学习对定罪的预测。而对民商事案件的预测,也仅限于通过对当事人、案由、判决结果、管辖法院等简单要素分析,预测法律风险、案件胜诉率和撤诉率。行业的知识图谱构建缺失,上下级法院之间、法院和其他单位之间、不同网络之间的数据共享交换体系尚未全面建立,导致数据之间割裂,不能进行关联应用。数据的标准化方面,没有建立标准化规范,非结构化数据较多,结构化数据积累不够,对数据的标注还处于起步阶段。(4)技术上面临诸多挑战。智能系统建设仍需有针对性的核心技术和关键技术预先研究支撑。机器学习主要算法之间的集成与融合不够;基于神经网络、深度学习等前沿人工智能技术在功能开发中应用程度不高,尚不能为群众诉讼、公众普法、司法资源调配、社会管理和公共服务提供全方位、高水平的智能分析服务,司法大数据资源的效用远未发挥充分。机器学习偏重于对标注数据的有监督学习,对无监督学习探索不深,数据标注的标准、社会化众包尚处在探索阶段。二、以“大数据+机器学习”建立刑事案件判案智能预测系统的整体规划开发刑事案件判案智能预测系统,把统一适用的案件预测模型嵌入数据化的办案程序中,是一项把现代科技与司法改革融为一体,把大数据、人工智能融入到刑事办案中的一项全新的科技创新任务。该软件系统对推进以审判为中心的刑事诉讼制度改革、提高审判质效、法官定罪量刑、统一法律适用具有重要意义。(一)构建思路建立以“大数据+机器学习”驱动为主的刑事案件智能预测系统的思路。在构建智能预测系统中,有两种代表性的思路:一种是以规则驱动的方法,以构建刑事案件判案智能预测系统为例,将案情输人系统,然后结合法律专家知识,运用三段论演绎推理、类比推理等裁判方法,对案件作出预判。在研发软件时,需要将每一种罪名的犯罪构成要件以及裁判方法嵌入到软件系统中,将耗费专家大量的时间精力。另一种是以数据驱动的方法,在积累海量数据的基础上,提取、选择特征,通过传统机器学习、深度学习或机器学习的集成应用,通过多轮训练迭代,提炼审判规则,评估并完善模型,然后对新的案件事实进行分类预测。“大数据+机器学习”方法的优点在于以数据量和计算量换取研究的时间,随着数据量、计算能力以指数级增长以及机器学习的发
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 零星维修协议书范文
- 云南省畹町市2025年上半年事业单位公开遴选试题含答案分析
- 河北省宽城满族自治县2025年上半年公开招聘村务工作者试题含答案分析
- 2025版汽车维修企业安全教育培训合同
- 2025爆破工程爆破设计与施工合同
- 2025年新春商铺转租合同范本及注意事项
- 2025年度电力施工环境保护合同范本
- 2025版智能投影仪采购与教育培训服务合同
- 2025版商铺认筹协议书(城市更新)
- 2025版水电设施维修保养劳务合同服务标准
- 2025至2030中国PE微粉蜡市场需求量预测及前景动态研究报告
- 近视推拿培训课件
- 2025年国企运维岗笔试题目及答案
- 中华人民共和国治安管理处罚法2025修订版测试题及答案
- 新学期教学工作会议上校长讲话:把功夫下在课堂里把心思放在学生上把质量落到细节中
- DB42T 1655-2021 湖北省建设项目文物影响评估报告编制规范
- 2021年安徽省初中学业水平考试语文试卷及答案
- 目标管理与执行力培训课件
- 《抽象函数》 教学课件
- 西藏民主改革60周年模板课件
- 住院病历书写质量评估标准
评论
0/150
提交评论