(计算机应用技术专业论文)贝叶斯网络在刑事审讯辅助决策支持中的应用.pdf_第1页
(计算机应用技术专业论文)贝叶斯网络在刑事审讯辅助决策支持中的应用.pdf_第2页
(计算机应用技术专业论文)贝叶斯网络在刑事审讯辅助决策支持中的应用.pdf_第3页
(计算机应用技术专业论文)贝叶斯网络在刑事审讯辅助决策支持中的应用.pdf_第4页
(计算机应用技术专业论文)贝叶斯网络在刑事审讯辅助决策支持中的应用.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(计算机应用技术专业论文)贝叶斯网络在刑事审讯辅助决策支持中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕士学位论文 摘要 刑事审讯是公安系统串最重要、最复杂、涉及范围最广的任务之一。审讯工作的基 本研究对象是受审查入的心理活动和能们在不霹审讯阶段酶行为表现。经过数十年的发 展历史和国内外对犯罪行为的研究,现在已经形成了个科学的系统结构犯罪心理 学。这一系统化的知识隐藏在公安系统中大量的犯罪案件信息之中。现有的审讯过程浪 费大量的人力和物力,存在误判、漏捌的现象,并且存在因为处理时闯缓慢两导致贻误 破案时机的情况。另外目前在该领域,还存在许多零散的、具有提当规模的业务数据分 布在各个不同的郝门;各个部门的数据独立处理,需要人工建立联系,效率低下;并且 对信息的处理还基本停留在增、删、改、查询等传统功能上,缺乏智能化的统计与分析 功能。 本文是以大连市公安局项舀刑事审讯辅助决策支持系统作为研究背景。刑事审讯辅 助决策支持系统是个大型综合系统,旨在综合分布的业务数据:对数据进行复杂处理 并生成标准报表;挖掘隐藏在刑事审讯数据之中的知识和规则;提供信息分析、推理和 预测等功能,辅助办案人员处理案件。其中包括刑事审讯信息管理和刑事审讯辅助决策 支持两大部分: 本文对贝叶斯网络的知识发现与决策支持理论进行了研究,并以贝叶斯网络为工 具,针对刑事审讯中的审讯置标、审讯方式、审讯策略和方法、审讯语言和审讯环境等 闯题进行研究,给出了部分刑事审讯相关的贝叶斯网:络模型,包括犯罪嫌疑人心理特征 分类的贝叶斯网络模型,审讯目标模型和审讯对策模型。审讯目标的意义十分重大,是 审讯饪务的指导纲领。将审讯目标模型推理出的审讯目标信息与心理特征分类模型推理 如的分类信息相结合,能够力审讯王作提供一系列的辅助决策方案,如提问随题类型、 心理对策和审讯方法等。最后对刑事审讯系统进行了分析和总结。 另外,本文细化和枣b 充了刑事审讯信息的部分属性,建立了知识库,并将系统框架 与具体的数据挖掘算法相结合,完成了刑事审讯辅助决策支持系统的原型。经过试验测 试,得到公安专业人士的认可。 关键词:刑事审讯;知识发现;数据挖掘;贝叶斯网络 贝叶斯网络在刑事审讯辅助决策支持中的应用 b a y e s i a 珏n e t w o r ba p p l 主c a 妓。娃洫 c “m i n a li n t e l l r o g a t i o na s s i s t a n td e c i s i o ns u p p o r t 抽m 洳a li 珏如星两。狂i st bm o s t 妞l p o 吨燃a n d 伽旺【p 耗x 纽s ko fp o l i 掣s 搬执t k 允耐| a i 如啜1 协1 他卸出删嗽0 f 协ei 1 1 j 嘲拍g 撕o nw o 出i s 翮s p e c 心p s y c h o l o 或g a la c 脚戤l d b e 蛔瓶o fp 薯畦臻绷c ei n 妇d i :瞳鹳睡纽妇鲥8 l 姆。擞d a 鹳越o f 髑簦c h 遮 谢m i n a la 蒯啊锣鲫砌w o r l d ,as c i 酬丘cs y s t i e ms 臼m 艄h a s 慨a 1 吨如棚小倪瞰1 i 1 1 a l p 咖l o 彰羽随姆珀朗蠲侧k 轮w 姆毯撼遮髓弧咎镤斑臻c 缴函如删强蛐洲 i l l 曲p o l i c c $ 慨( h 觳t i n 咖g 甜o n 班0 c 鹪sc o s t s 蝴i v e m 锄p ( m 惯觚d r e s 0 艄,h a s 司猿稿潮爨翎艟西w 阐呜j 潞斑岛砌s o 嫩翻如懿c a 璐铺协蜘& 遮辨娟彩函陵罐耧蛾呻 s j n 妇b e c 勰o fm e 鲫黜妇i sk m g 蜘a l p 黼s e n ti n 她d o n l a i n ,慨 跚ys c 农恻辩触碱穗b s 坟魉莲照泊落醴泌攫蘧勰瞪玉翔内鼬;d e p 毅赶麟热 d a t ai s 雠s s e d 触i q 嫩蛐锄d 也er e j 面伽sn e e dt 0b em 锄】a u y 洲s h e d 恤 翻谢随昭遗b 潞崦极睡涮囊幽蹒f e 豁髓避陵饿碰傩辩馥弱稍幽晦幽 e d 堍嗍锄d s o o 玛蛐t k i n :烈l e c t l l 删s t l l t i s t i c s a n d 鲫融y s i s 霹凼粥强期瞧e 越瞄醅喀印谢幽删贸卜q 删洳 a s s i ! 妇n td e c i s i o ns 唧邺眦s y s t e 黻ni 8ah 铲s c a :l e 姗峨驴舶l n $ 鼬e mf 1 0 r 也ep 哪p 0 0 f 霹n t 酏s i :堍t kd i s 缸话啦融鼹丽d a a 弘渊i n gd a 瓿a 碡黼她赡激如耐嘲p o 坞m 嘲 雠妣撇a n d t h e 州eb i d i n gi n 恤删姗鲥0 n 峨舯v i d 堍础眦 a n a :惝,耐觫嘲a n d 蛐删幻妇l m e 雠渊m 嗍胁 i n c 觚喇o r 刚卜删删o n 抵触麟嘲删a n d 删 i n 刍e 糟蹭砸。髓销s 鼬矗妇虹o ns u 啊地 髓迅粥蕊脚殛斌峙d i s o 鲫哪勰dd l 畦妇s 嘲幔b 鑫刚强b 姆商嫩 删詈嗽的r l 笛戤l c li m p l 暇n i 朗临t b ea l 签) 矗也m a j i 】a e da tt h er e a r 6 h 出u tc i 面删q 僦伽1 s ,e 舀 避锹鸿越溅g o 瓣删鳇嘲妣鲥i 镰啦啦豁a 砖涨魅媳妇删睨泌孵 a n d 妇倒- 0 n 绷:、,i 枷m 毗抵脚e r 脚s e s 此删a 1 删觚哪啦i nm o 耐s , 通融她幽泌蹭e 畦拶婢的姆曲雒裁她谶ec l 鑫s 蚓泌随强髓硝吐泌融蛳斑跚燃 喇a i l d 抵咖蛐留删i f lt h e 砒l h i s 科椰位删汹a n d 曲 冬蓼嫩s 鑫l 毫o 妞茁遁盘越姻耄e 鞠曜撇g 蜘。 帆恤p 彬捌d e 8 肌d 嘲) l i e s 咖a 缸o f 涮娥咖 谜弧碰峨暾麟洳惋妇嘶融蝴融辨燃妞翻删o f 缸驴觚戚龇 d a t a 蛐i n ga l 鲥峨砌b a s i c 曲c o m p l 懈恤蝴砌舭o f 删 h - 大连理工大学硕士学位论文 h l g a 舶na s s i 蛐td e c i s i o ns w 】p l o ns y s 锄n 硼删t so fe ) 【p 懿妇e n t1 1 a :v eo b t a i 】瞒n l e p o 珏c ep 硒凳s s i 铡融sa p 弘戚 1 畸w o r d s :c r i m 洫a lh t e n o g a t i o n ;l 证o w l e d g ed i s c o v e 眄;d a t am 铀i i i 麟b a y 岱i j m 撕。噍 一i i i - 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究 工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得 大连理工大学或其他单位的学位或证书所使用过的材料。与我一同工作 的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢 意。 作者签名:多霆。 日期: 2 0 d tj 。 s 大连理工大学硕士学位论文 本学位论文作者及指导教师完全了解h 大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保黧并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名: 导师签名: _ 5 5 _ 大连瑗工大学矮圭学馒论文 引言 l 。选题背景 随着世界上信息总量的不断增加,迫切需要有效的信息分析工具,它们麓发现大量 数据间隐藏的依赖关系,它们能从大量数据中抽取有用的信息或知识。尽管很早就出现 了简单的数据统计技术,但先进的智能数据分析工具尚未成熟。因此,在数据生成和数 据理解之闻存在很大静差距。数据挖掘就是为解决这一矛盾丽出现静一种新型数据分析 技术。数据挖掘旨在能从大型数据库中提取隐藏的预测性信息,是构建高效数据仓库的 基本操作。知识发现是从数据集中抽取和精炼新的模式,找出企业经营者可能忽视的信 息,以便于理解和观察的形式反映给用户,并为企业做出前瞻的、基子知识的决策参考 意见。知识发现是一融变叉性学科,通常人们将“知识发现捞等嗣于“数据挖掘 。墨 前国际上在该领域的研究相当活跃,无论在理论上,还是实用技术上都取得了喜人的成 果,同时也开发出了各种专用或通用的商业数据挖掘软件 1 - 3 】。 测事审讯是一门涉及面很广的学科,渗透了心理学、犯罪心理学、逻辑学、信息 论、行力学等多门学科,需要相当广泛的专业知识,从个体心理活动特征出发,专门研 究受审人员、办案人员和其他有关人员的心理活动发展规律,探索在审查活动中如何正 确处理办案人员与受审人员以及其他有关人员的关系【4 ,5 】。囡前在该领域,相关部门已 经建设了一些信息数据库,许多业务信息系统逐步从小型微机数据库移植到大型数据库 ( 如a 慨氐等 ,但对信息的处理还基本停留在增、测、改、查询、统计等传统功能 上,缺乏智能化的分析功能。可以说其事务性功能已经基本完善,但分析功能还相当欠 缺,具备关联性的规律趋势等潜藏在大量业务数据后面,尚有待挖掘和提取。 隔前可以利用数据仓库和数据挖掇技术,在拟定的算法下对大量的犯罪信息记录进 行分橱,从而发现犯罪的规律、趋势,了解不同犯罪行为之间的关联,以及何种状态会 诱发何种犯罪行为,该行为又可能会导致哪些结果,以及公安部门应该采取何种防范措 施等等。这是司法领域所迫切需要的,具有相当重要的现实意义。 2 本文的主要工作 , 本文的主要工作是将贝叶斯网络用予刑事审讯的数据挖掘过程之中,建立审讯辕助 决策支持的案例库,开发出具有实验性的辅助决策支持系统的原型,并推出可被接受的 部分刑事审讯决策模型。 ( 差) 本文研究了刑事审讯过程随业务流程以及涉及的相关属性,细化并李 充了审讯 决策相关属性,绘出了模型库结构; 更器 额网络在涮事审讯辅助次策支持孛的应用 ( 2 ) 实现了证据审校功能,定义了审校相关的表结构,对审校部分的数据进行处理 并给出报表; 移) 现了贝叶斯网络算法中的贝叶斯信息标准测度算法、期望最大化算法和n 砸v e 推理算法,对刑事审讯的数据库进行数据挖掘,为其辅助决策提供支持【量】; ( 4 ) 实现了开放式问题处理功能,使用户可以自由选择问题属性进行挖掘,并且实 现了结果对比功能,可以对不同的算法结果进行横向比较,为用户提供高精度的决策方 案。 轰本文结构 本文首先概述了贝叶斯网络、数据挖掘、知识发现和决策支持系统的相关知识和发 展状况;其次描述了在贝叶斯网络研究方面的工作,对贝叶斯网络的几种常见的结构学 习、参数学习和推理算法进行了分析;最后几个部分是对刑事审讯辅助决策支持系统的 需求和贝叶斯网络算法在该系统中的应用方法。在这两章中,首先分析了烈事审讯辅助 决策支持系统的需求,其次叙述刑事审讯辅助决策支持系统的实现以及贝叶斯网络算法 的数据挖掘过程的具体实现。其中编程实现的贝叶斯网络结构学习算法是贝叶斯信息标 准澳l 度算法,参数学习翰算法是期望最大化算法,推理算法实现的是奎眺i v e 捌潞溅黜算 法。最后一章对该原型系统进行实验数据测试,给逝了部分刑事审讯相关的贝叶斯网络 模型,包括犯罪嫌疑人心理特征分类的贝叶斯网络模型,审讯目标模型和审讯对镱模 型。并对刑事审讯系统进行了分析和总结。 2 大连理王大学硕士学位论文 1 基础知识综述 1 1 数据挖掘 数据挖掘( d a t am 娃n g ,d m ) 是一种从大型数据库或数据仓库中提取隐藏的预测 性信息的技术,它能挖掘出数据间潜在的模式( p 戤e m ) 和关系( r e 戡i m ) ,找出潜在 的、有价值的信息和知识( 您1 0 w le d | g e ) ,指导商业行为或辅助科学研究。其中,模式 是利用挖掘算法缛到盼结果,是对一种可能性分布的简单撼述;知识或信息是通过对模 式进行处理丽得到的易于理解的结果。数据挖掘又可以被称为“知识发现 大处理过程 中的一部分,由于知识发现过程包括了获得有意义结果所必须采取的步骤,所以它是成 功实现数据挖掘的基础。 由于借助了效的分析方法和工具,数据挖掘指能够从传统的事务型数据库功能( 增 加、删除、修改、查询、统计等) 脱离也来,获 ! 导更深层次的信息。所以数据挖掘可以 称为是一种决策支持过程,它基于人工智能、机器学习、统计学和逻辑学等技术,高度 自动化地分析原有数据,做出归纳性的推理,从中挖掘出潜在的模式,预测分析对象的 行为趋势,从面帮助决策或调整策略。 数据挖掘的墨的在予提高市场决策能力,检测异常模式和在过去的经验基础上预言 未来趋势等等。 数据挖掘涉及的学科领域相当多,利用人工智能中一些已经成熟的算法和技术,大 致可分势:机器学习、统计、入工神经网络和数据库方法等。搬据挖播任务,通常可将 数据挖掘分为5 种:关联、序列、分类、聚类和数据总结。数据挖掘的一般的步骤是: 采样;特征探索、分析和预处理;问题明确化、数据调整和技术选择;模鍪 的研发、知 识的发现;模型和知识的综合解释、评价。数据挖掘的整个流程是反复进行的,需要不 断优化和逼近真实、正确的情况。 当前数据挖掘的研究热点在于提高挖掘所得知识的准确性和可理解性、提高挖掘搡 作的可伸缩性、集成数据挖掘操作和现有的数据存储和分析工具等。此外i 作为数据挖 掘准备工作的数据离散化、数据变换、数据清洗和数据挖掘结果的可视化显示以及挖掘 结果的评估等技术也属于数据挖掘研究的范畴【1 捌。 1 2 知识发现 数据库中的知识发现( 妇删g ed i s c o v e 搿:i n 执l 耋a b a ,k d d ) 是从大量原始数据 中识别和提取出可信的、有效的并表示为能被入理解的新的知识模式的高级处理过程, - 3 _ 贝时额网络在刑事审讯辅助决策支持中的应用 以满足用户对数据高层次而不仅仅是查询这样的低层次的要求,从而给人们提供问题的 答案,提高信息的利用率。) d 是一个可与数据挖掘互换的、使用频率很高的术语, 搿) d 是数据挖掘科学方法的使用。除了执行数据挖掘之外,典型的磁) d 处理模型包括 一个方法论,它用来提取和准备数据,以及数据挖掘执行后,对所要采取的行动做出的 决策【1 ,3 】。 知识信息处理是实现信息共享和智能化的重要技术。知识发现是知识信息处理的关 键润题之一。 l 。3 知识发现的处理过程 为了从大量信息中发现有用的知识,需要利用知识发现和数据挖掘技术。知识发现 技术是人工智能、机器学习、统计学技术与数据库技术等相结合的基础上发展起来的从 数据中发现知识的技术和方法,图1 1 为一个具有一般意义上的磁) d 处理模型【1 】。 图1 1 数据库中的知识发现处理过程模型 脚量。重p 蝴邋榭域醴鼬蝌艇g e d 运v 衅汛d 耆眩b 黼 如图1 1 所示,通常知识发现的处理过程包括以下三个主要步骤: :( 1 ) 数据准备,包括以下兰个子步骤【1 3 】: 数据选取( d a t a 烈。曲) :从数据源中选取感兴趣的目标数据; 数据预处理( d a t a 皿翟0 0 嘲i n g ) ;消除噪音、估算缺损数据、删除重复数 据等; 数据变换( 妇蚋懿删潍) :连续数据的离散化、数字化等。 ( 2 ) 知识提取:根据知识发现的目的和要求,选用适当的数据挖掘算法,从数据中 提取有用的知识。 4 大连理工大学硬圭学位论文 ( 3 ) 对所提取的知识进行解释和评价,并根据评价结果对数据准备、知识提取过程 进行反馈校正,如重选目标数据,采用其他的数据挖掘算法等。 从上面的知识发现的过程可以看出,知识提取阶段在知识发现过程中占据关键遗 位,主要是应用数据挖掘技术并直接影响知识发现的缝聚。燃过程作为要固d 酶关键 环节注重于处理过程及处理过程中算法的选取,烈) d 则注重目的与结果。然瓶二者的 本质是一致的,都是对原始数据进行分析处理,并提取出隐含在大量数据背后豹反映数 据蠹在特性的关系模式的过程。所以,人钌邀就常常把d 嵫和) d 等两起来。 兰4 数据挖掘技术 l 。分类( 漱耋) 分类是按照分析对象的属性、特征,建立不i 司的组类来描述事物。分类的目的是构 造个分类函数或分类模型( 也常常称作分类器) ,该模型能把数据库中的数据项映射 到菜个给定类别。 定义:给定数据库d = 毽,乞”, ,元组毯d ,类的集合c = q ,岛妒。,g , 分类问题定义为从数据库到类集合的映射厂:d 专c ,即数据库中的元组 分配到某个 类c ,中,有c ,燃 f ll ,诉) 拳c ,1 嚣f ,l ,且 d ) 。 分类技术】实现算法通常可以使用以下方法:( 1 ) 机器学习方法:决策树法知识表 示是决策树或判另g 拷,规测魉纳知识表示是产生式觏翼| | | ;国统计方法:知蓼 表示是判嬲 函数和原型事例,贝叶斯法,非参数法( 近邻学习或基于事例的学习) ;( 3 ) 神经网络方 法:b p 算法,模型表示是前向反馈神经网络模型;( 4 ) 粗糙集( r i o u g hs e t ) :知识袭示 是产生式规爱l j 。 。 2 聚类( a 黼t e l 如0 聚类是识另4 并分析对象的内在规则,并按照这些规则对其进行分类的方法。弱镑警算 法即是先定义一个合适的度蛩,然后计算任意两个样本之间的距离。当两个样本之间的 欧凡里德距离小于菜个溺值西时,这两个样本就属于霹类甘距离阂值南影响簇的数 量和大小,岛越小,每个簇就越小,簇的数疆就越多。如果磊太大,奚| j 所有样本将会 被分为同一簇;如果画太小,每个样本又会单成一类。 定义:给定某一数据样本集z 五,托,以) ,根据数据点间的相似程度将数据集 含分成忌簇: c l ,c 2 ,q ) 的过程称为聚类,魄q = 办qu q = 办f j f - 相似样 本在同一簇中,相异祥本在不同簇中。 蝉5 一 贝叶斯网络在刑事审讯辅助决策支持中的应用 聚类的方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。实 现聚类的算法有k m e a n s 聚类算法 1 】。 3 关联规则( a 鼹o c i a t i o nr u l e s ) 和序列模式( s e q u e n t i a _ lp a t t 明陷) 的发现 关联是某种事物发生时其他事物会发生的这样一种联系。序列是不同项集的有序排 列。序列模式挖掘的任务就是找出数据库中所有的序列模式,即那些在序列集合中出现 频率超过最小支持度( 用户指定最小支持度阈值) 的子序列。 序列定义:,= 瓴,如, 是项集,( 1 七册) 是一个项,序列s 记为 s = ,其中葶,( 1s 歹刀) 为项集( 也称序列s 的元素) ,即s ,每个 元素由不同项组成。序列的元素可表示为( f 。,如,f 拊) ,若个序列只有一个项,则括号 可以省略。序列关联规则的定义:对于给定的项集,= “,乞,) 以及序列s 和序列 乃形如sjr 的表达式称为序列关联规则。 实现关联规则的算法【1 】有j 蜘耐算法、f r s p 距、p r e 缸s p 姐算法等等。 4 预测 预测是把握分析对象发展的规律,对未来的趋势做出预见。其目的是从历史数据记 录中自动推导出对给定数据的推广描述。分类和回归都可以用于预测【l 】。 5 偏差分析 偏差分析是指对分析对象的少数的、极端的特例的描述,揭示内在的原因。其基本 思想是寻找观察结果与参照量之间的有意义的差别,通过发现异常可以引起人们对特殊 情况加倍注意。偏差分析的个重要特征是它可以有效的过滤大量不感兴趣的模式【1 】。 6 建模 建模就是通过数据挖掘,构造描述一种活动或状态的数学模型。机器学习中的知识 发现实际上就是对一些自然现象进行建模,重新发现科学定律【1 】。 1 5 贝叶斯网络与知识发现 贝叶斯网络以概率论和图论为基础,结点表示了随机变量,结点间的有向边表示了 变量之间的因果关系,变量间影响的程度由网络中依附在父、子结点对上的条件概率来 表示。在数据库之中,变量可以对应表的字段,变量的取值就是表中的值。所以利用先 验知识及大量数据获得贝叶斯网络模型的过程,实际上是一个知识获取过程,因此贝叶 斯网络已经成为知识发现的有利工具。 6 大连理工大学硕士学位论文 1 6 决策支持系统 决策支持系统d s s ( d e c i s i ( ms u p p o r ts y s t e m ) 是在管理信息系统s ( m 锄萨 h l f o 肋撕0 ns y s t i m ) 的基础上发展起来的。对d s s 的定义也有不同说法,本国学者胡 金柱认为“d s s 是以管理学、运筹学、控制论和行为科学为基础,以信息、仿真和计算 机等技术为手段综合利用现有的数据、信息和模型,辅助决策者解决半结构化或非结构 化决策问题的人机交互系统”。d s s 具有的三个基本要素:决策信息、决策模型和决策 者,d s s 的目的是辅助决策者作决策,提高决策者的决策技能和组织的决策水平,从而 使组织能获得好的经济效益。d s s 的一个重要特点是模型驱动( 即以模型库管理为核 心,着重体现决策要求) ,以建模解模为主,数据库随模型改变而改变,利用模型进行 泱策。 d s s 的基本结构也即它的逻辑结构,包括对话子系统d s ( d i a l o g 嘴s y s 胁) ,对 话子系统的主要成分是对话生成管理系统d g m s ( d i a l o g q 黜m 觚a g e s 姗) ;模型库子系统s ( 删b a s y s t e m ) 。它由模型管理系统m b m s ( m o d e lb a m 粗a g es y s t e m ) 和模型库m b ( m 0 d e lb a ) 组成;数据库子系统d b s ( d a 埝b a s 咖) ,它由数据库管理系统d 劭鹏( d a 土a b a s cm 姆s y s t e m ) 和d s s 数据库d s s d b ( d s s 的d a l ab a ) 组成。d s s 的生命期是指d s s 从开始研制,经 过使用,直到其废弃或被其他系统替代为止的整个生存期,d s s 是一个不断完善的过 程,开发贯穿于它的整个生命期。 1 7 研究髋冠财蝴蝴 1 贝叶斯网络现状 贝叶斯网络算法包括结构学习、参数学习和推理解释1 。个方面,目前对算法本身的 研究情况有:宫秀军,史忠植研究了基于贝叶斯潜在语义模型的半监督w 曲页面的分 类与检索网;史会峰等研究了在贝叶斯网络学习之中使用蒙特卡罗方法阴;田风占等 研究了多模块贝叶斯网络推理简化方法 8 】;林士敏,田凤占等讨论了贝叶斯网络的建造 及其在数据挖掘中的应用【9 】。 目前贝叶斯网络的应用范围已经十分广泛,例如: ( 1 ) 用户智能交互 微软的办公处理系统o 伍c e 系列( 9 7 后续版本) 中的帮助精灵,它可以对用户的 模糊性操作进行提示【1 0 】;还有o m c e 办公套件中的智能菜单隐藏功能也是由贝叶斯理 论的成功应用。 - 7 贝时斯网络在刑事审讯辅助决策支持中的应用 ( 2 ) 医疗诊断与故障诊断 国外使用贝叶斯网络已经十分成熟。例如r d 鞭m 研究开发的多代理系统妯旧l i a 用于处理诊断领域中的复杂的未知的知识【1 1 】,p r 加等开发的c p c s ( c 鲫p 1 】t 默- b 丛e dp 撕e n tc a s es t u d y ) 模型是大型的多连接多层网络,具有四百多个结点,覆盖了相 关医疗领域的大多数内容【1 2 】。目前贝叶斯网络已经广泛应用于脑科学研究、神经科学 研究和细胞网络研究之中【1 3 ,1 4 】。国内学者李俭川使用贝叶斯网络解决大型机电设备的 故障诊断问题【1 5 】。 ( 3 ) 图像识别 1 9 9 3 年美犀海军实验室使用贝叶斯网络开发了船只识别系统 1 6 】。 ( 4 ) 预测决策支持 国内学者张少中将贝叶斯网络引入防洪系统,取得初步成果【1 7 - 1 9 】。 ( 5 ) 智能系统 2 0 0 1 年,欧海涛和张卫东等人对贝叶艇学习的城市交通多智能系统进行了研究; 2 0 0 2 年李俭川、陶俊勇研究了智能故障诊断方法;2 0 0 1 年胡玉胜、涂序彦开发了交通 事故处理智能决策支持系统。 分类一直是机器学习、模式识别秘数据挖掘等研究的核心河题,它在图像识别、语 音理解、自然语言处理、医疗诊断及w 曲页面的分类冒录组织等领域具有广泛的应 用。近年来,涌现出了大量的适合予不同盛用的分类算法,如基于归纳学习的决策树分 类、基于向量空润模型的k 2 近邻分类、基于统计学习理论的支持向量机( 轴删 v i 嘲饼m a 如酶,瓢理涯) 分类和源于概率统计的贝叶斯网络分类等。最近的研究表明, 贝叶斯鼹络在知识盼表示、学习和推理方面的研究与应用正在成为当前机器学习和数据 挖掘的研究热点之一。 贝叶斯网络以其丰富鲍概率表达能力、综合先验知识的增量学习特性及其稳固的数 学基础正在引起研究人员的关注,涌现出大量的从数据中学习分类模型的方法,被尝试 应用到各类实际问题之中 2 犯罪信息数据挖掘研究现状 目前在国内外,将计算机处理应用到犯罪相关领域的实例非常少。美国政府与其国 内大学合作,对犯罪相关数据等进行研究,成功开发了c i o 】p l 烈k 系统,该系统使用代 理技术和数据挖掘技术对分散在国内各个部门的相关数据进行分析处理【2 0 】。国内对该 领域的研究刚刚起步,目前宁波大学与公安部门进行合作研究【2 1 】方法是:使用关联 分析和序列分析进行尝试性数据挖掘,使用决策树对犯罪信息进行分类研究。 - 8 - 大连理工大学硕士学位论文 2 需求分析 2 1 需求描述 1 审讯的定义 审讯有多种定义,例如“审讯是侦查人员为揭露案件真相,证实犯罪和查明犯罪 人,依法就案件事实和其他案件有关的问题以言词的方式对犯罪嫌疑人进行提问,以获 取真实供述或辩解的一项侦查行为;“审讯是指侦查人员为了进一步查明和证实犯罪 事实,依照刑事诉讼法的有关规定,对犯罪嫌疑人进行讯问的一静侦查行为 等等。总 体匕来说,审讯定义应该主要从审讯的形式( 言语形式) 、内容( 案件事实或与案件有 关的问题) 、县的( 揭露和查明案件真相) 对审讯的内涵作了界定。刑事案件中,人的 主体行为是案件的主导队5 】。 本系统设计的本质依据:辅助决策支持系统决定了本系统需要和人进行密切的交 互,所以设计的时候要充分考虑人的作用。 信息收集依据:人类行为的基本模式是:嚣= ,妒国。其中器代表入的行为;p 代表个人;露代表环境( 包括社会环境,各种环境) ;厂代表函数。所以库表结构盼搀 建要从个人与环境两个都分入手盹5 】。 随着信息他的发展,有关部门已经建立了褶当规模的犯罪信息系统,但对这些信息 系统的使用仅仅停留在查询、更新、统计等初级应用上, 爵且审讯人员在处理犯罪信息 的时候局# 琵在个人经验或者是交流经验之中,丽对于数据库中蕴涵的知识的应用还基本 上处于空白。以下将讨论用贝叶斯网络算法构造刑事审讯辅助决策支持系统中的一个分 析预测模块。 2 原系统处理流程 案件主要包括三大部分,分别是犯罪事实、证据材料和犯罪嫌疑人。证据的划分标 准有很多,根据证据对案件的影响程度可以分为直接证据和间接证据两种。直接证据是 直接与案件发生关系的证据,它是能够直接作为认定事实的根据;间接证据是不与案件 发生直接关系的证据,它凭借本身的价值并不能直接作为认定事实根据。但是间接证据 可以与直接证据发生关系,从而间接影响刑事案件。通常司法中将两种证据的关系划分 为v 字状锁链型结构和梅花型锁链型结构。 刑事审讯的最终目的就是为对犯罪嫌疑人进行合理合法的定罪。定罪的过程为通过 犯罪嫌疑人与相关证据的结合,认定其犯罪事实,做到有法可依,然后根据相关法律 ( 刑事案件的主要依据为刑法) 规定对其进行定罪。犯罪嫌疑人与证据的关系可以参见 - 9 贝叶斯网络在刑事审讯辅助决策支持中的应用 图2 ,l 。刑事审讯过程结束之后必须将案件相关资料以及相关人与物提交给法庭进行审 判和定案。在整个案件进行过程之中犯罪嫌疑人是主导因素,证据是辅助性因素。证据 与犯罪嫌疑人之间会发生直接或间接的关系,所以刑事审讯必须要排除切矛盾,达到 证据和犯罪要件的统一,证据和证明对象的统一,并与客观的事实相一致,才能够证明 犯罪嫌疑人的犯罪事实。简单的可以认为刑事审讯就是对上述过程的重复性工作,并以 定罪为主要目的的过程。 证明对象 犯罪嫌疑人 犯罪事实 证据材料 犯罪要件 工 犯罪主体 犯罪要素证 据组合 工 何人 证据事实 单 个 证 据 图2 1 犯罪事实与犯罪嫌疑人的关系 矾舀2 1d e l i n q u ta o u n ta n dc r i m es 懈p e 甜s 他i a 咖璐 3 证据审校 证据审校是刑事审讯的重要环节。证据审校的简要过程为:在某一案件中,对此案 件中的每个犯罪嫌疑人寻找他的犯罪要件,对他的每一个要件寻找可以与之相结合的 证据,以此构成他的证据事实与犯罪事实。在犯罪要件中,可以分为以下几方面考虑: 犯罪主体,与之相关的证据有年龄、能力等等;犯罪客体,与之相关的有何种犯罪行 为;犯罪主观方面,与之相关的有动机和目的等等;犯罪客观方面,与之相关的有时 间、地点、手段和危害结果等等。对于每种犯罪要件的审校,都有相关的法律法规进行 指导。 目前公安局中对证据审校处理包括三个步骤:首先对犯罪嫌疑人初步进行罪名评 定。然后,根据证据审校规定找到该罪名需要审校的构件。最后,对每一个构件进行审 校,以确定该罪名是否成立。 1 0 - 大连理工大学顼士学位论文 证据审校模块是个人正决策的模块,其目的是为案件中所有的犯罪嫌疑人进行罪 名评定,其中必须评定的怒一级罪名。值得注意的是,每对犯罪嫌疑入定一个罪名都要 重复进行证据审校过程。每个犯罪嫌疑人至少要定一个一级罪名。如果无法对犯罪嫌疑 人定罪,则谈为其无罪。 4 剩事审讯 通常包括三部分:审讯准备、审镶过程与审讯总结。定罪过程与审讯过程是相辅棚 成的,定罪作为审讯的指导,审讯必定罪提供证据依摄。其中数据挖掘以及辅助决策可 以参与其中很多地方。例如,相似性案件的定罪一般准则,相似性犯罪嫌疑人的遴常使 用的手段等等。 ( 1 ) 审讯准备 审讯活动的薮要素:人、事、时间、场所、原因跣及方式。审讯前需要对这五方面 进行准备f 4 ,5 】。人郢审讯对象,包括犯罪人和犯罪嫌疑人两种,需要准备审讯对象的相 关倍惠。事是指审讯其体过程戳及审讯达到麴霉标。时闻是指审讯活动安排的时间,例 如犯罪现场立郎视讯、惹期审讯等。场新是窜讯的场所。审讯的群原因”就避要取得犯 罪嫌疑人的供词;审讯的“方式 指如镪运耀具体的审讯行为秘言语对犯罪嫌疑入实施 审讯,与他谈话,向他提出问题,在这个过程中,运用目前所掌握的所有讯问技术促使 犯罪嫌疑人做出有罪供述。从广义上说,证人是指了解案情而随时被通知到法庭就其所 了勰的情况作证盼人。但一般情况下都不对证人使用审讯手段。 ( 2 ) 审讯过:程 应用审讯技巧和相关资料进行审讯以获取口供。审讯过程是由审讯人员主导的,审 讯人员研究犯罪嫌疑人盼相关资料,了解犯罪嫌疑人的性格特点等等。针对案 孛信息串 所有霹疑之处进行询润,综会使瘸各静审讯技巧。审谖过程实际上是审讯太员所徽决策 的应用阶段,决策的歪确与再会在此时褥到验证。在审讯的过程之中会镶要审讯人员随 机应变,以对付各种可能出现的情况,随时做出耨的决策,以推动审讯的正确执行,取 得正确的结果。 ( 3 ) 窜讯总结 结案学习,归档,报告,定罪等。根据从犯罪嫌疑人那里得知的新的资料,结合已 经存在的资料和历史资料进行重新审校,重新寻找确定的证据、需要核实的证据和可疑 之处等等。审讯总结实际上是下一次审讯过程的开始,审讯总结和审讯准备常常不具备 清晰盼分界线。遗常此步骤会出现数据的积累,形成报表等等。 5 测事案件中的几耪关系 烫时瓶网络在烈搴事讯鞴髓决策支持中的应用 人与入的关系:( 1 ) 犯罪嫌疑人与同案犯的关系,缝缓者与被组织者、领导者与一 般成员等;( 2 ) 犯罪嫌疑人与被害人的关系。 入与事的关系:犯罪嫌疑入与发生巍案佟整个过程之率的一些事 串的关系,该犯罪 嫌疑人对事彳譬的影响等。注意应该分清组织责任与个入责任垂 人与物的关系:犯罪嫌疑入与涉案相关物证的关系,需罄弄清楚物属关系,物品在 案件中所起劐的 謦用等等。 事与物的关系;案件事实与物证的关系。 本原型系统参照了以上凡静常见关系,确定了数据瘁中部分的表结构。 2 2 功能需求 用 户 管 理 刑事审讯辅助莰策支持系统 系 统 管 理 综 合 查 询 数 据 维 护 鍪ll 攀ll | | l 鋈ll 萋耀ll 复|l 雯| l 鬻ll 囊 芷 据 枣 校 辕 助 决 燕 系 统 蓁ll 囊ll 篱参ll|誊|囊 样ll 数掇 本ll 挖撼 抽ll 算法 墩li 学习 图勉系统结构鬻 磁勉娃o f 刚l e m s 栅嘲鹣 用 户 行 为 日 恚 数据ll 决 挖掘ll 繁 算法ll 管 推理li 理 根据上述对剃事审谓禳篙! 的分析以及辐关的审讯原理知识,可以设计以图2 2 靛系 统。系统中需要提供数据挖掘的功能,对于整个刑事审讯过程的证据审校、审讯目标、 审讯对策、审讯方法、审讯问题等进行辅助决策支持。 。1 2 多爨体 大连理工大学硬士学位论文 因为公安局目前存有刑事相关的字典数据和部分历史数据,并且以o m c l e 数据库 为载体,所以本系统以q 嘲e 数据库为数据平台,以c - 卜 语言实现算法处理部分,以 饼编写应焉程序框架,进行开发。 2 3 系统说明 董。系统管理 包括用户管理,权限管理和数据的备份与恢复。鉴于刑事审讯数据库的使用对蒙, 划分沟系统管理员角色、一般甩户角色,在不同的部门范围上划分数据库管理员角色、 底层甩户角色、嫒时用户角色。各角色说睨翅下: ( 1 ) 数据库管理员( d b a ) :d l 弧角色具有整个数据库系统的管理和维护的权利。 包括修改表结构、创建存储过程、管理各级备区域的用户,部门级d b a 角色对所在部 门豹数据进行建表、录入、查询、更新和删除。 高级用户( s u ) :s u 角色可以:对整个工程数据库的表进行录入、查询、更新和 删除。 ( 3 ) 一般用户( b u ) :b u 角色只能有范围限制地查询可公开的数据及访问视图, 健不允许访问基本表,不能修改、删除系统数据库中豹任何数据。 ,鳓l 盔时怨户( 聪) ;l u 是色只能在给定熬时限蠹有范圈限露雉查询某些数据,但 不允许访闯基本表,不能修改、删除系统数据库中的任何数据。 案件基本信惠表包括单位部门编码、职员编码等字段,当不同的用户以不同的身份 进入系统瑟,系统会根据箕投限对所有数据进行初次过滤,徽婺l 职员与职员之闻权责分 明,单位与单位之阆权责分鞠。 , 数据备份与恢复,充分利用c 瞻c l e 数据库的优点,实现数据的导入导出,并且实 现整个数据库的冷备份、热备份和整个数据库的恢复功挠,保证数据的安全性。 2 数据维护 对a 唿c l e 数据库中所有的表和数据进纾操作。可以实现表的管理( 增删改) ,实 体完整性,基本的用户定义完整性;实现所有o r a c l e 支持的常用类型的数据格式的维 护,例如整型、实型、日期、大字段等等。 3 涯摆窜技 证据审校程序的功能为,制定罪名功能,包括一级罪名、二级罪名、犯罪构成;审 查证据功能。其中用户的职责为:定义罪名( 可以定义某个案件中某个罪犯的多级罪 名) ,对于已定义的罪名结合该罪犯酶相关证据进行审查。系统韵职责为:基础项强维 护功缝,即维护猁法条曩、审查项霞条匿、允许用户定义罪犯罪名,对毁三耱顼露可 _ 1 3 _ 贝叶斯随络在刑事审讯辅助决策支持中的应用 以实现增、删、改的功能;查询功能,即对需要进行的审查项目进行查找和显示、保存 审查结采;以及对任何关联数据的查询和显示。 正常情况下,每个犯罪嫌疑人都需要定出一级罪名,如果无法对某个犯罪嫌疑人进 行定罪,则只能认为他无罪。无论凡级罪名,均出皇相关法律法规。罪名不能擅自增加 减少和修改。所以罪名是个相对不变的字典数据。工作人员根据该案件所归属的案件 类别对其中所有的涉案犯罪嫌疑人进行一级罪名判定,判定的依据就是上文的刑事审讯 过程分析中的犯罪要素与证据的结合情况。案件类别是指对案件的定性描述,是对所有 案件的性质的总体划分,例如杀人、抢劫、盗窃等等。它是对相关法律法规条文的分 类,由此可见案件类别与罪名是多对多的关系。所以每个案件类别都需要一些标准来判 别,这就是构件。构件是审校的最小单位。即如果某个案件能够满足某类案件类别的所 有构件,则可以称为该案件属于这个案件类别。构件是由语言描述的要求,构件有很多 种。案件类别只是对构件的种覆盖,所以案件类别与构件之闻是多对多的关系。 当审校人员得到犯罪嫌疑人的罪名之后,便会查找确定该罪名需要的新有构件最 后,按照每个构件的要求,结合该嫌疑人的相关证据以及犯罪事实,确定该嫌疑人是不 可以被定为此罪名。对于重大犯罪嫌疑人,通常会定出多个罪名。无论定出多少个罪 名,都需要按照匕述步骤对每个罪名进行审校。 4 辅助决策支持 本原型系统的辅助决策支持实现方式如图2 3 所示。可以分为两个大部分,分别是 建立模型部分与评价部分。其中建立模型由数据挖掘部分与模型管理两部分组成。评价 部分是对决策结果的显示。由于系统的应用与入息息相关,所以对于决策准确性的要求 很高。本原型系统设计的宗旨是使用多种数据挖掘方法,综合得出结果,为决策人员提 供具有较高精度的决策结果。评价部分的作用就是定义不同算法结果的描述形式,找出 具有可比性的结果属性进行对比并输出【3 l ,3 2 】。 s 数据挖掘 使用多种数据挖掘技术对刑事信息进行挖掘,对信息进行分类、聚类、寻找关联规 则或者推理等工作。本文主要研究和实现贝叶斯网络技术,使用贝叶斯网络算法实现信 息的分类,并实现原型系统的数据挖掘功能。 6 样本抽取 以实现辅助决策支持为目的的数据抽取。可以对数据库中任何表中的任何列的数据 进行选择和组合,并进行数据离散化处理。所以需要此功能能够读取数据库系统表信 息,实现对库中所有表和表中盼数据进行操作。样本抽取需要提供用户操作接口,对表 1 4 大连理工大学硕士学位论文 中数据进行筛选;可以选取表中任意列,并与其他表的任意列按照一定规则组合成新 表;可以对表中数据进行基本的离散化操作;还可以对表进行数据填充。所有对数据库 的操作应该独立于数据库之外,所以本应用程序使用了m i e 粕s o f 的剐) o n 班编写访 问数据库的功能模块,利用a d o n l 玎的特性可以很容易的将数据调入内存之中并进行 复杂的操作。 图2 3 辅助决策支持的构成 2 3 加磷蛐糟o f a 晦妇n ld 雠i s i l 难s p p o n 洳激 a d o n e t ( a 甜、,e x 魏l 诅州黜n e t ) 提供对m 毓f ts ( 戳s 铋惯等数据源以 及通过o l e 潞和飙等公开的数据源的一致访阀。数据共享使用者可以使用 a d o n e t 来连接到这些数据源,并检索、操作和更薪数据。图2 鼻为a d 0 0 岍的高 层结构。 a d o n 矸具有以下特点: ( 1 ) 协作性,通用性:具有在异构环境下的相互通信的能力,a n 翻r 本身就支持 多种数据库访问接口,通过简单的编程就可以实现数据库平台无关性。 ( 2 ) 伸缩性:具有在不降低系统性能的前提下,服务动态增加的客户端的能力。 ( 3 ) 高生产率:具有逶过a d o n e t 提供的丰富的可扩展的c o m ( 姗i b 薹e m j x 溉魅。场鳅删) d c l ) 模型快速开发安全可靠的数据存储应用程廖。 ( 4 ) 性能:具有断开式数据结构,可以在不占用数据库资源的情况下提供高性能的 数据访问方式。 ( 5 ) 成江支持:) q 儿支持内置在a d o 闷盯中非常基本的级别上。舢盯 乳雕l e 嘲o r k 和a d o n 嚣t 中的难。类是羼一结构的一部分,它嚣】在许多不同酶级别集 _ 1 5 贝叶斯网络在刑事审讯辅助决策支持中的应用 成。用户不必在数据访问服务集和它们的叫匝相应服务之间进行选择:它们的设计本 来就具有从其中一个跨越到另一个的功能。 图2 4a d o 舰的高层结构 f i 辱2 4h i 咖k ,e ia r c h i 搬加聆o fa d o n l 强 7 模型学习 模型学习是利用数据挖掘算法从数据库中提取知识和规则。根据算法的不同,算法 的学习过程需要的数据的类型、格式也会有所不同。所以算法的数据必须由算法模块自 身包含,并做处理,以实现接口的统一。 8 模型推理 算法推理是指使用已经得到的模型进行辅助决策的过程,即使用数据挖掘算法进行 推理的过程。数据挖掘算法的推理是指使用数据挖掘算法的学习成果知识和规则, 对未知数据进行预测、判定等操作。系统采用多个算法进行挖掘,可以对不同的算法的 推理结果进行横向比较,以提供给决策者具有较高的精度的结果。 9 模型管理 模型管理是一个存取模型库的过程,其中包括模型的解释、持久化和编辑功能等 等。 1 0 决策结果评价 决策结果评价是对模型推理得到的决策结果的横向比较与输出。 1 6 _ 大连理工大学硕士学位论文 2 4 系统流程 1 证据审校 证据审校是一个不可缺少的功能模块。整个处理流程要求人工确定处理的结果,给 出结果评价,并且产生的结果将在多处决策部分使用。该功就的主要目的是为每个案件 中的每个犯罪嫌疑人确定罪名,其中必须确定的是一级罪名。此部分采用的是向导式晃 面。 大概的处理流程如下:首先需要确定处理的案件,列出每个与该案有关的犯罪嫌疑 入。然后需要对每个犯罪嫌疑天进行证据审校过程,选择某个嫌疑入,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论