



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘技术在金融反洗钱中的应用标准化文件发布号:(9456EUATWK-MWUBWUNNINNULDDQTY-KII一、洗钱的概念及我国反洗钱I:作中的不足目前关于洗钱的定义有很多种,国际上并没有一个统一的定义。中华人民共和国反洗钱法中第二 条中关于的洗钱定义是:通过各种方式掩饰、隐瞒帝品犯罪、黑社会性质的组织犯罪、恐怖活动犯罪、走 私犯罪、贪污贿赂犯罪、破坏金融管理秩序犯罪、金融诈骗犯罪等犯罪所得及其收益的來源和性质的洗钱 活动.依照木法规定采取相关措施的行为。我国反洗钱匸作主要是通过可麺交易报告制度完成的.而金融机构的反洗钱的情报收集和分析匸作中 目前存在主要问题为:(1)工作址大,误报
2、率商;(2)预设标准易于为洗钱分子所规避;(3)无法自动适应洗钱形式 的变化等。这就使得洗钱可融交易行为的识别存在巨大的困难。二、数据挖掘技术在反洗钱中的应用数据挖掘是指从大虽数据中提取或”挖掘有趣的知识。目前,发达国家的反洗钱系统都充分利用r数 据挖掘匸具。在反洗钱领域中,人匸智能、聚类分析、归纳算法、神经网络等都具有较强的适应性,具有广 阔的应用前景。1人匸智能在反洗钱调査中得到了快速发展。芙国的FAIS系统综合使用了人丄智能技术和基于案例 的推埋、照板(blackboard)等人匸智能技术.其独特的分析能力主要得益于其数据视角的转变:从交易导 向转为对象(如人或者组织)导向。每一笔交易、
3、对線.账户都要用336条规则去测试每条规则都给出是 否为非法或合法的判定证据.展后用贝叶思推理对每一个项目的可麺性进行评定2聚类分析是一种非监督的数据挖掘技术。在反洗钱领域.聚类分析技术特别适用于从大址的交易数 据中产生及时、准确的线索。由于洗钱方式笫种藝样.数据对歛表现出來的分布也就各式各样,并不是所 有的可疑账户都可以聚成一类。因此.在洗钱行为识别中簇的数虽是未知的因洗钱方式的不同而不 同。聚类分析中”簇的数址未知这个特点刚好满足洗钱行为识别的这个要求。而且,由干其聚类分析的自 动处理、非监替学习等特性使得其可以动态地适应洗钱于 段的变化.也可以在一定程度上规避洗钱犯罪活 动的自适应问题。
4、lx反洗钱基本程序定义目前关于洗钱的定义有很多种.国际上并没有一个统一的定义。但洗钱的本质就是利用资产、资金转换(转移)过程中 所造成的信息缺失、信息隐蔽、信息不完整、信息不真实、信息复杂而使犯罪所得收益的原始来源和性质无法识别或追循.从 而掩盖和隐瞒其真实信息。1.2基本程序我国的反洗钱基本程序分为采築、监测分析和移交三个步骤:第一步.大额和可疑交易报吿的收采第二步.大额和可 疑交易报吿的分析和甄别。第三步.可疑交易线索移送。2、数据挖掘技术2.1数据挖掘的任务数据总结、分类、关联分析、聚类。2.2数据挖掘流程将数据挖堀应用于反洗钱技术中.在建立攻击检測系统过程中消除人为因素和特定因素.为其
5、开发一个更加系统化的方 法.即开发一套能从各种审计数据中产生攻击检测検型的自动工具。中国人民银行南吕中心支行苏辉责应用关联分析和序列樓 式分析等算法.发现特征之间的关联和与时序有关的联系.从而完成对用户数据的收築与特征选择过程反洗钱中的数据挖堀 过程如图1所示C5包八貝件图1及汪饯屮敛据挖握过程2.3数据挖堀中常用的数据挖拥算法1)关联分析算法。关联规则是表示数据库中一组对象之间某种关联关系的规则。在数据库的知识发现中.关联規则就是描述这种在一个事 务中物品之间同时出现的规律的知识模式。更确切地说.关联规刘是通过星化的数字描述物品A的出现对物吊B的出规有多大 的影响。2)序列分析算法关联分析是
6、发掘数据记求中不同数据项之间的横向关联性.而序列分析则是发现不同数据记录之间的纵向相关性。序列 分析的目标是在事务数据库中发堀出序列檢式(large sequences).即满足用户指定的最小支持度(minimum support)要求 的大序列.并且该序列模式必须是最髙序列(maximal sequence)。3)分类算法。数据分类实际上就是从数据库对象中发现共性.并将数据对象分成不同几类的一个过程。分类的目标是对训练数据进行 分析.使用数据的某些特征属性.给出每个类的准确描述(即分类规则)据此对数据库中的其它数据进行分类4)聚类算法。将物理或抽象对象的築合分组成为由类似的对象组成的多个类的
7、过程称为聚类。对象根据最大化类内的相似性和最小化 类间的相似性的原则进行聚类或分组。所形成的每个簇可以作为一个对象类.由它可以导出规则.在许多应用中.可以将一个 簇中的数据对象作为一个整体来对待。聚类与分类不同.聚类分析的输入数据第是一组未标记的对象.也就是说此时输入的对 象还没有进行任何分类.聚类的目的是根据一定的規则.合理地进行分组或聚类.并用显式或隐式的方法描述不同的类別。由 于分析可以采用不同的算法.所以对相同的数据集合可能有不同的划分。3、数据挖掘技术在反洗钱中的应用3.1系统的整体设计反洗钱系统本身应用的特殊性.要求它具有准确性、全局性、可扩展性、可伸缩性以及环境适应性。到目前为止
8、.研究 人员已经提出实現了许多方法.但没有一种模型能够满足完全検測的要求c由于系统的设计和实現都取决于设计人员自身的知 识储备和其对已知反洗钱形式的了解程度.因而系统的效率和环境性都受到了限制。基于数据挖掘技术的智能反洗钱系统的核心就是从事件序列数据(训练数据)中挖掘正常和异常行为规则.构建规则 库.在此基础上.再根据发现的证据进行反洗钱识别。采用数据挖掘方法实现整个过程.并将它划分为三个过程c1)特征提取。在系统中.数据的来源主要有:系统审计曰志、已知的洗钱行为、国家和政府的相关的法律法规。不同性 质的数据要求采用不同的数据挖堀算法.因此.采用不同的方法来自动抽取不同数据源数摒中的关键特征.
9、为规则发現莫定基 础n2)规则发现.对不同类型的数据.采用不同的数据挖堀算法发现其中的规则c对己知反洗钱方法的数摒.由于决策树方 法具有较髙的精度和效率.采用该算法进行处理.以发现其中的分类規则;对于审计数据采用分类和关联分析相结合的方法. 以发现关键层性间的协同作用;对系统调用序列数据.则采用序列漠式挖掘算法。3)建立好规则库后.对每一次发现的证据.就可以根据规则釆判断是否廊于反洗钱行为3.2基于数据挖据的智能反洗钱模埜的设计系统结构包括如下组件:数据处理、审计数据库、数据挖掘引孚、待征提取器、数据挖掘引挈、规则库、数据检測引挈 和决策响应中心.如图2所示。ffl 2自适应数据挖据反洗钱系统结构釆自多个地方的数据.主要通过如下方式进行处理和转换:1)数据处理。客户交易数摇往往有几十甚至上百个属性.而机构代码.银行柜员编号等属性对反洗钱没有意义.因此要 垂新进行格式化。一些组织的公吿.一般都是一些非机构化的文本文件.需要对此进行结构化处理.使之能分辨数据库的存取
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电梯维保公司服务质量管理方案
- 高考英语阅卷经验总结报告
- 法律服务价值评估模型-洞察与解读
- PEP小学六年级英语期末试卷解析
- 房地产销售人员培训教材与技巧
- 低速车排放控制技术-洞察与解读
- 新能源汽车行业智能化财务管理发展趋势
- 小学一年级德育期末考试题库
- 2025-2030数字化手术室设备检测规范及行业分析
- 中小企业采购流程优化方案与控制措施
- 甜水园吉野家餐厅合同7篇
- 2024年蚌埠五河县事业单位选调工作人员考试真题
- 2025年医院领导竞聘面试题与参考答案
- 黑龙江省高等教育教学成果奖申请书
- 2025中矿金石实业有限公司社会招聘备考考试题库附答案解析
- 2025年屠检考务试卷及答案
- 亨利八世课件
- (正式版)DB65∕T 4260-2019 《薰衣草优 质种苗组培快繁生产技术规程》
- 足球绕杆射门课件
- 五金材料知识培训课件
- 2025年农险初级核保考试题库
评论
0/150
提交评论