电子围栏系统应用--涉车案件研判分析平台设计方案201308_第1页
电子围栏系统应用--涉车案件研判分析平台设计方案201308_第2页
电子围栏系统应用--涉车案件研判分析平台设计方案201308_第3页
电子围栏系统应用--涉车案件研判分析平台设计方案201308_第4页
电子围栏系统应用--涉车案件研判分析平台设计方案201308_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、经纬视通 涉车案件研判分析平台方案涉车案件研判分析平台方案目录1.背景及建设构想32.现阶段目标及后续规划32.1.卡口数据与电子围栏数据的关联32.2.海量数据查询与比对42.3.平台后续规划43.分析研判平台总体设计原则54.分析研判平台整体应用架构55.平台持续规划设计思路76.建设目标87.软件功能清单88.系统性能和主要参数指标99.核心功能模块109.1.海量数据分析引擎109.2.轨迹查询119.3.同行分析模型129.4.人车关联分析129.5.假设轨迹分析模型139.6.频繁通行分析模型139.7.涉车案件嫌疑对象频度分析模块139.8.假牌研判分析模块139.9.主题库分析

2、比对模块149.10.搜索(信息核查)功能模块149.11.辅助分析工具159.12.系统平台性功能1510.平台硬件配置建议1511.部署实施1610.1.实施步骤1610.2.时间进度安排1710.3.运行环境配置建议1712.服务支持18201. 背景及建设构想在“金盾工程”一期建设取得巨大成果的基础上,各级各地公安机关正在深入推进“金盾工程”二期工程的建设。二期“金盾工程”建设更加强调科技强警战略,其中一个重要方面就是大力推进公安信息化建设和应用,以信息化推动警务机制创新、提升警务工作效能,全面提高公安机关的实战能力。研判分析平台在此背景下产生,依托于目前业内最快的查询引擎基础上,基于

3、公安数据库的特点建立了全字段全文索引结构,实现了不同来源、不同业务数据之间的内在关联关系分析,支持公安干警进行“发现式”情报信息查询,帮助公安干警梳理各类分散的、独立的情报线索,进而组织为清晰、有序的情报分析链,为实现“打、防、管、控”一体化的警务目标提供有力支持。2. 现阶段目标及后续规划近年来,随着社会经济的快速发展,机动车保有量的迅速增长,与此同时,与交通相关的刑事和治安案件也逐年上升。在此情况下,如何利用研判分析平台,提高卡口交通管理水平,抑制交通事故、高效的破获机动车盗窃等刑事案件,是平台亟待开发的分析应用之一。机动车卡口系统可以通过前端监控的高清相机抓拍软件,拍摄过往车辆的图片,图

4、片中可以清晰分辨车辆的车型、车身颜色、车牌颜色、车牌号码等信息,并自动进行号码识别。然后将图片和信息传至指挥中心等部门,入库保存。热点系统则可以通过对手机信号的监控,及时发现过往卡口车辆中人员的手机信息,如手机串码、机器码、手机号码等。如何有效的结合两套系统进行数据分析,如:通过车辆多次经过卡口信息来分析手机号码(持有人);通过人员经过卡口来分析车辆;通过单个车辆分析人员群体;通过单个人员分析多辆车。并将其中相关的运算模型固话,形成快速分析工具,是本项目需解决的核心问题。2.1. 卡口数据与电子围栏数据的关联卡口数据和电子围栏数据在时间上、地点上存在天然的关联关系。机动车卡口数据是机动车卡口系

5、统前端监控点的监控设备采集的机动车过卡口时的各种数据信息,包括车辆的车牌号码、车牌颜色、过卡时间、过卡车道、过卡相片等;当车辆过卡时,电子围栏设备采集到了各种手机信息,包括手机信号抓取时间、抓取卡口、IMEI、IMSI等,通过分析车辆过卡的轨迹数据与同时电子围栏抓取到的手机信号数据在时间上、地点上的藉合度分析,让从车找到人成或从人找到车成为可能,那么对卡口数据和电子围栏数据建立高效的关联分析研判模型,就具有了很强的实战性、很高的分析价值了。2.2. 海量数据查询与比对目前,卡口数据和电子围栏数据按月统计已经达到亿级了,随着机动车保有量的不断增加和电子围栏建设的加快,卡口数据和电子围栏数据的数据

6、量会不断增加。如果采取传统的关联查询方式,响应时间就更难有保障了,多并发情景下甚至于产生系统宕机现象。公司长期以来一直致力于海量数据的分布式并行运算及分布式文件系统存储技术,对海量数据查询、比对和拓展分析有着特有的应用经验和实现模式,其主要核心技术有三点:l 采用分布式文件存储系统,即数据抽取后存放于文件系统中,独立于平台。不依赖于任何类型的关系型数据库或其他软件,这样可充分保证对数据的使用效率和稳定性。l 采用文件索引技术,即对可能需要查询的信息预先进行索引,将对信息的查询转化为对索引的查询。这种索引利用了业内最前沿的NoSQL技术,较传统关系型数据库中的主键和索引字段中的B树索引有了较大的

7、性能提高。l 采用内存数据库及内存缓存等先进技术,实现高速的结果集比对运算。2.3. 平台后续规划建立在高速查询比对平台的基础上的分析应用,后续建设主要有三个应用方向,可根据各地用户的数据情况和实战中的案例进行平台的二期扩容建设:关系人分析模型。利用各数据资源中的潜在关联关系,对人员的关系人进行挖掘,如:人员亲属(同户、配偶、父母、子女、房产共有人,人员家庭成员等)、同学、同事、同乡、同案等各类关系,通过综合分析比对,快速发现该人的关系网络。人员群体分析。建立分析模型,利用涉事群体人员在旅店、航班、卡口、网吧及相关特种行业海量历史信息与实时数据进行比对分析,自动地描绘出被关注人(或关注车辆)在

8、重大事件发生前后一段时间内的行为轨迹,找出事件与人、人与人群之间的关系。案事件串并分析。在多发性、连续性、跨区域流窜性案件及职业惯犯作案中,犯罪嫌疑人由于受心理定势的影响,其犯罪行为所呈现的征象往往具有很多共同点,这些共同点就为公安机关串并案件提供了条件,串并案件的条件有多种,如案件性质相同或相似、发案时间具有某种规律性、发案地点及其周围环境相同、作案方法手段过程相同或相似等可根据上述特点,根据案件进行多角度的细分,从中找出相同或相似案件。3. 分析研判平台总体设计原则l 系统应采用先进、成熟的软硬件技术,遵循国家的相关标准和规范。l 系统设计应遵循实用性、可靠性、安全性、灵活性、稳定性和可扩

9、展性原则。l 以成熟产品集成为主,应用开发为辅。l 系统可满足目前和今后一段时期内业务发展的需要,至少三年。4. 分析研判平台整体应用架构平台以业界流行的分层软件架构(N-Tier)为基础,结合面向服务(SOA)的架构设计原则和设计思想对应用进行合理的组织。将基础设施层、数据服务层和引擎核心的访问层、逻辑层、模块功能应用层、界面展示层进行了清晰的划分和应用功能的独立封装。该应用架构充分体现了“以全文检索引擎为基础,构建各种查询和分析应用为目标”的平台建设思想,理解和融合了软件领域先进的软件架构理论,并为平台后期的扩容和新功能、新应用的扩展提供了良好的架构基础。 展示层通过portal等技术建立

10、展现平台,方便用户在这个界面上提出服务请求。 应用层实现了建立在全文检索基础平台之上的各种专项业务应用,目前项目中的应用以模型驱动设计的开发模式构建,并通过添加敏捷方法(AM)来应对需求的不断变更。 逻辑层的设计类似于SOA架构中的服务(Services),它封装了核心引擎的基础业务逻辑组件,起到承上启下的作用。对上响应业务应用需求模型,对下以调用相关引擎核心组件服务来完成需求,形成“业务驱动服务、服务驱动技术”的SAO事务处理格局。项目核心层采用这种设计的优势在于其灵活性,通过增加和重构这些服务,改变服务的细粒度,以应对项目后期因不断深入而使交互模式变得更为复杂的局面。 访问层封装了对分布式

11、索引存储和结构化索引信息的数据访问。索引程序通过(数据)访问层建立索引,而检索程序通过(数据)访问层检索索引。 数据层这里泛指数据源信息服务层,目前项目主要利用全文索引库完成查询、比对、关联等各种应用,随着项目后期的深入,各种类型的内存数据库、图形数据库、NoSQL库等先进技术都有可能被项目采纳,所以数据层的独立还能有助于项目根据需求,灵活的对先进技术进行选用。 基础层相当于SOA架构中的系统软件层,包括了操作系统,原始的业务数据库系统等,是一个集成的平台。 除此之外,QOS(服务质量)、安全性、权限控制等也是架构的组成部分。5. 平台持续规划设计思路本平台的定位是一个分析及研判平台,从目前公

12、安应用趋势出发,平台将由数据资源、索引服务群集、应用群集三大部分组成。数据资源部分主要包括来自公安内、外部各类业务库、资源库、社会数据、全国请求服务数据、基层采集数据等。随着公安信息化的不断深入,业务数据资源也将越来越多,通过数据采集机制和数据采集系统的不断完善,社会信息也将越来越丰富。另外,通过各类分析平台,挖掘工具的深入建设,将产生各类专题应用库,这些应用库也会成为(可利用的)数据来源的重要组成部分之一。索引服务群集部分主要是利用平台的搜索引擎机制,将数据源信息建立全文索引,并为各类查询、分析、比对、关联应用提供统一的数据服务。索引服务群集采用SOA架构设计原则,即可根据业务需求进行多阶段

13、的逐步建设,每次建设仅需满足现阶段业务应用的数据要求,同时兼容后期多个应用对此类业务数据的运算和分析。应用服务群集是构建在平台最上层的各类系统。随着业务需求的不断挖掘,应用服务群集中将包含大量的分析模型和挖掘工具,这些模型的组合完成了特定的业务逻辑,实现了信息化的破案流程和方法,并可通过自身的关联、挖掘能力形成各类主题库、应用库、专题库。丰富了数据资源的建设,也为其他的专业性模型应用提供了数据基础。平台通过资源的整合抽取、索引、模型的建立、专题库的形成构建了一个未来可持续发展的应用架构。通过不断丰富完善的数据源,扩展平台的应用价值,产生更多的业务需求和分析模型;通过实战分析模型的不断增加带来了

14、更丰富的破案手段、预警及监控方式、产生更有价值的专题应用数据,进一步完善数据资源。6. 建设目标根据平台总体设计架构,建设重点为以下三个方面的内容:一、 建立数据抽取及全文索引机制,整合各类数据源,供现有及后期分析模型应用提供数据基础。二、 围绕涉车研判专题,建立卡口、热点分析模型及人车关联分析模型,为各类涉车犯罪案件的侦破提供有效的打击手段。三、 开发卡口轨迹相关的挖掘模型,形成以车辆为基础的一系列车辆专题应用库。7. 软件功能清单一、平台数据整合1卡口数据2热点数据3卡口信息数据4全国请求服务接口5本地机动车库6sis嫌疑人号码数据7出租车库数据8公交车辆库数据二、涉车研判功能1轨迹分析1

15、.1车辆轨迹分析1.2车辆图片浏览1.3热点轨迹分析1.4车辆轨迹筛选1.5热点轨迹筛选1.6结果导出1.7图片打包下载2关联分析模型2.1车人关联模型2.2人车关联模型2.3同行人的关联模型2.4同行车的关联模型2.5IMEI与IMSI互换关联模型2.6车辆单点数据碰撞模型2.7热点单点数据碰撞模型2.8车辆关联数据碰撞模型2.9热点关联数据碰撞模型3普通排查模型3.1车辆假设轨迹3.2热点假设轨迹3.3车辆频繁通行3.4车辆频繁同行3.5工具车排查3.6热点普通查询3.7车辆轨迹查询4辅助性分析功能4.1归属地筛选4.2阅读标记4.3垃圾数据排查4.4结果聚合分析4.5统计和排序(过卡数、

16、天数、次数)4.6数据比对识别4.7人员数据标重(SIS)4.8车辆数据标重(公交车、出租车、黄牌车)4.9车辆单点轨迹收集4.10热点单点轨迹收集4.11车辆关联结果收集4.12热点关联结果收集4.13信息核查8. 系统性能和主要参数指标运行环境:PC服务器 志强两路六核CPU E5-2620 2.8G*2 内存16G文本内容总量 100G 索引总量40G数据库表扫描抽取速度500-1000万行/小时/线程单CPU最大线程数4(推荐值)索引速度500万记录/小时单并发各类检索性能检索类型平均完成时间轨迹查询3s20轨迹单车模型运算15s100轨迹单车模型运算50s 20轨迹多车模型运算20s

17、100轨迹多车模型运算70s单模型并发运算性能(20轨迹模型运算)并发数平均响应时间115s530s1045s支持同时在线用户数50以上9. 核心功能模块9.1. 海量数据分析引擎数据分析引擎基于全文检索技术、内存数据库技术构建,采用专利的全字段全文索引技术实现高速查询、快速比对、关联分析等基础功能,为平台上开发的各类研判分析应用提供了高吞吐、高并发处理的数据底层。引擎由数据配置、抽取整合、清洗加工、数据索引、数据监控五个主要模块组成:数据配置模块负责完成原始数据源(数据库)信息到索引信息的映射功能。可基于多种不同数据源混合配置,数据的来源可以是各种不同的业务数据库、生产库、资源库、社会资源库

18、等,结构上也能同时兼容ORACLE、SQLSERVER、SYBASE、MYSQL、POSTGRESQL等多种数据库类型。抽取整合模块主要完成对各种同构信息的整理合并,对原始库各类分表存储信息,分类存储信息进行整合,实现对同一类信息的统一抽取。另外该模块和实现跨数据源的映射功能,如:卡口与其对应热点的关系映射等,为关联分析提供配置基础。数据质量是分析应用的重要基础。清洗加工模块可根据用户定义的规则,对数据进行去重、转换、合并、分解等操作,保证分析使用的元数据的一致定义。数据索引模块采用分布式文件系统存储,可对用户数据库中的各类数据建立索引,这种索引以独立文件形式保存数据文件,以提供高速比对碰撞,

19、关联分析。数据监控模块将各种不同类型的监控对象(数据源、数据量、每日更新情况等),按照分析应用的模型要求进行分类,提供用户清晰、简洁直观的整体图形化展现。用户通过在监控系统界面上,点击某一监控对象,则该对象的相关信息即可以图形化的方式进行展现。通过图形化的方式展现监控信息便于用户掌控监控对象的整体信息和处于异常状态的监控对象信息。分析引擎数据抽取模块架构图9.2. 轨迹查询 卡口轨迹查询能够查询满足检索条件的车辆历史轨迹信息,包括:过卡时间、卡口名称、通行车道、车牌号码、车身颜色、车牌颜色、通行速度、超速状态、行驶方向、行车状态。同时关联全国机动车库、车辆违章违法库、全文搜索引擎等,实时获取当

20、前车辆的各类登记基本信息,进行信息校对和人工比对。 热点轨迹查询能够查询满足检索条件的手机号历史轨迹信息,包括:热点名称、过卡时间、手机号、IMSI、IMEI等。同时关联全文搜索引擎,实时获取当前手机号在各库的关联信息,进行信息校对和人工比对。9.3. 同行分析模型 车辆同行分析模型针对嫌疑车辆或工具车辆可能的结队出行特点,根据某嫌疑车牌的过卡轨迹,通过数据挖掘的方式分析其通过多个卡口前后相邻时段的轨迹,利用多个卡口轨迹点与其他车辆过卡轨迹的时间关系进行反复碰撞,找出与嫌疑车辆有关联的车辆,从而获取破案线索。 人员同行分析模型针对嫌疑人员结队出行的特点,根据某手机号码的过卡轨迹,通过数据挖据的

21、方式分析其通过多个热点前后相邻时段的轨迹,利用人员轨迹(多个电子轨迹点)与其他人员电子轨迹的时间关系进行反复碰撞,找出与人员同行的其他人员。9.4. 人车关联分析 车辆到人员关联分析模型利用卡口轨迹点与人员电子轨迹点的时间、空间关系进行反复碰撞,关联挖掘与某嫌疑车辆相关的嫌疑人员。 人员到车辆关联分析模型利用人员电子轨迹与卡口车辆轨迹的时间关系进行反复碰撞,关联挖掘与某嫌疑人相关的作案车辆。 在实战过程中,研判人员往往利用同行分析与人车关联分析相结合的方式,以嫌疑车辆为切入点,分析出同行车辆,再通过车辆到人员的关联分析方式找出嫌疑人员,再通过嫌疑人员同行关系挖掘出更多的嫌疑人员,再利用人员到车

22、辆的关联方式确定最准确的嫌疑车辆等。这种可循环扩展的迭代分析方式成为挖掘犯罪团伙、打击团伙系列案件的有力工具。9.5. 假设轨迹分析模型根据案件提供的线索,将过卡时间范围,过卡地点(或区域)等进行多次设定,模拟出一条可能的轨迹线路,利用多点碰撞分析原理进行排查,找到符合条件的车辆,并按照假设条件的符合度进行排序,提供调阅其卡口记录和图片功能。这种模型广泛适用于各类案件,只需要有几个明确的时间和区域范围条件,就能在海量数据中找出最匹配的嫌疑车辆和嫌疑人员。9.6. 频繁通行分析模型对卡口轨迹多的车辆(类型是小型车、以及号牌所属区域为敏感区域、时段为敏感时段(符合进出城逻辑规律的(备选条件)进行排

23、查,并默认按通行次数与天数等综合判断标准进行排序排查。这种模型非常适合对车辆长期固定行驶车辆和长期违法行驶车辆的研判分析。车辆长期固定行驶轨迹的研判:一段时间内,哪些车辆在指定范围内(多个卡口)具有频繁固定的活动规律,为研判人员判断相似路径的车辆数量及线路,提供科学的决策依据。车辆长期违法行驶的研判:一段时间内,哪些车辆经常在指定范围内(多个卡口)违法行驶,显示其违法行为、违法地点和违法频次。同时,为进一步的宏观分析提供依据。9.7. 涉车案件嫌疑对象频度分析模块此功能可通过后台进行配置,将系统与涉车案件(如:被盗抢车辆)信息库进行关联。建立自动任务,对案件中的被盗车辆、被盗时间等进行自动提取

24、,利用同行分析和人车关联分析模型,批量化实现对每宗案件嫌疑对象的逐个排查,并统计出与多宗案件有关的嫌疑对象,该模型实现了对多个案件的线索批量关联运算,解决了因单一案件线索不足,无法进行有效确认的问题,利用历史案件中的轨迹信息、关联信息进行综合比对碰撞,对破获系列案件、团伙案件有非常重要的帮助。9.8. 假牌研判分析模块在抽取过程中,系统可实时将卡口通行车辆自动(逐级)与本地车辆登记库、全省车辆登记库、全国车辆登记库进行比对,自动判断出已报废、报失、无登记信息的假牌,并生成假牌主题库。9.9. 主题库分析比对模块从实际业务需求出发,定义特定流程,对特殊性质、特殊行为的车辆进行分析,并将有价值的分

25、析结果或临时信息进行统一存储,形成专题业务库。现阶段平台根据涉车业务规划设计六类专题应用库。分别为:假牌库、套牌库、本省车辆库、外地车辆库、本地遗漏车辆数据库、未识别号牌车辆库。以假牌车辆库为例,平台通过定义假牌车判定流程,实时(准实时)对卡口过往车辆进行分析,将疑似假牌车辆信息统一归入假牌车专题库,并可提供其他业务系统或分析模型使用。外部调用接口暂定为WEBSERVICE方式。具体识别流程图举例如下:9.10. 搜索(信息核查)功能模块将各类分析结果中的车牌号、手机号码、车主身份证号等各类信息关联到智能检索系统进行信息核对,可进一步发现更多线索,如人员信息,各类背景资料、涉及的其他案事件信息

26、等。9.11. 辅助分析工具l 全国请求服务的调用和查询转发l 比对命中的标重l 模糊车牌的分析l 号码归属地分析l 阅读信息的标记9.12. 系统平台性功能l 用户管理l PKI认证l 系统日志l 用户使用日志l 数据质量监控10. 平台硬件配置建议序号硬件设备数量主机配置操作系统单价(万元)1卡口研判平台应用服务器1台HP DL580G7 E7-4820 2P SP1047CPU: Intel 8核Xeon E7 4820内存:= 16GB硬盘:4 * HP 450GB 10K SAS 6G双端口热插拔硬盘 RAID5Windows 2003 server 64bit52卡口研判数据索引服

27、务器1台HP DL388p Gen8 E5-2620 Base CNCPU:两路 Intel 6核E5-2620内存:=16GB硬盘:4 * HP 450GB 10K SAS 6G双端口热插拔硬盘 RAID5Windows 2003 server 64bit3(以当天供货价为准)11. 部署实施对于本项目,我公司将从公司内部外部抽调具有项目管理能力、熟悉数据库检索和搜索引擎原理及架构、掌握先进软件技术、具有多年质量控制经验的人员组成项目组。在整个工程项目的实施过程中,我公司实行项目经理负责制。实行集中开发、统一管理,严格认真执行我公司行之有效的质量保证体系。项目组内设立“项目监控”专职岗位,严

28、把项目质量关。在公司,计算机应用软件系统工程项目可划分为七个阶段,即项目立项、规划、需求分析、系统设计(总体设计、概要设计、详细设计)、系统实现(编码、测试、新需求定制)、安装运行、验收七个阶段。10.1. 实施步骤1、 数据源收集整理,包括数据库联系信息,数据表结构信息(字段中文说明、字典项说明、字典表说明等)。2、 网络、硬件、操作系统环境准备、安装、调试;3、 运行环境搭建-包括协调服务器,调试网络环境(远程操作等);安装涉车案件研判分析系统;配置系统,配置1-2个数据源,测试性能。4、 测试索引数据。测试系统和支撑数据库。测试待部署数据源。5、 整理待部署数据表文档,部署数据。需根据数据源数量预估时间,每日整理数据源5-10个。6、 扫描数据,可在此过程中测试已部署数据。需根据数据量大小预估时间,每小时扫描数据量在500-1000万左右。7、 配置任务调度和索引自动更新,协调配置PKI登录。8、 配置照片信息,用户及权限信息,导入用户数据,做全面测试。备注:步骤5和6可同时进行,在系统扫描过程中每日动态添加数据源。如有调整性二次开发改造要求,需根据需求双方协商再定。10.2. 时间进度安排项目项目实施点时长(天)实施方1数据源收集整理,包括数据库联系信息,数据表结构信息1客户公司配合2网络、硬件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论