大数据挖掘风险评估_第1页
大数据挖掘风险评估_第2页
大数据挖掘风险评估_第3页
大数据挖掘风险评估_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据挖掘风险评估随着网络数据体量的增加,AI图景中隐含的风险因素增多,加重了AI图景的使用风险,威胁各个行业与工作领域。而传统方法由于获取风险因素的静态关联规则,当数据体量不断上涨时,其风险等级评估结果严重脱离实际,因此研究AI图景下,基于大数据挖掘的风险评估方法。此次评估基于大数据挖掘,获取风险因素动态关联规则;利用云模型,粒化AI图景;根据评估矩阵,评估AI图景的使用风险。实验证实数据体量不断增长条件下,此次研究方法的风险评估结果,与给定结果一致。可见此次研究的风险评估方法,可用来测量AI图景的使用风险。关键词:AI图景;大数据挖掘;风险评估;动态关联规则现阶段我国提出新一代人工智能发展

2、规划;,并在第十三届全国人大一次会议政府工作报告中指出,做大做强新兴产业集群,实施大数据发展行动,加强新一代人工智能研发应用;。可见在网络科技创新发展背景下,人工智能技术的发展越来越受到国家的关注。人工智能技术全称为ArtificialIntelligence,是根据人脑思维模式创建的一项机器智能技术,但随着人工智能技术的不断优化升级,AI图景下,各行各业都将该技术应用到企业发展中,通过提升高工作效率、降低决策成本等,进一步调整企业生产与项目管理。但AI图景发挥强大功能的同时,也带来了巨大的风险,例如人工智能技术构建AI图景时,需要智能采集基本数据,侵害了企业的数据产权;黑盒疏漏打破了大数据平

3、衡等等1。因此针对现阶段的问题,传统方法根据文献2中的部分内容,将风险程度分为无风险、一般风险、中度风险以及重度风险,结合贝叶斯网络,建立了基于多状态贝叶斯决策树的风险评估模型,用来评估AI图景下的风险因素2。但随着网络信息体量的不断增加,该评估方法出现了不适用的问题,因此在AI图景下,研究基于大数据挖掘的风险评估方法。大数据挖掘就是从大规模异构或多源数据中,找出其中隐藏的风险因素,或识别风险因素之间的关联特征,再通过计算评估风险程度,为目前海量的网络数据,提供更加可靠的评价结果。1AI图景下基于大数据挖掘的风险评估方法1.1基于大数据挖掘获取风险因素动态关联规则一般意义上来说,风险因素关联规

4、则是静态的和永恒有效的,但是当前社会的大环境在变化,人们的需求也在不断改变,风险因素的静态关联规则,已经是过去的风险评估基本条件,此次研究根据目前的变化特征,引入支持度向量和置信度向量,通过大数据挖掘结果,描述规则在时间变化下的动态特性。大数据挖掘算法,将动态关联规则进行定义:现阶段的风险因素动态关联规则,是描述AI图景数据自身特性随时间变化而改变特性的关联规则。因此假设在t时间段内,AI图景下基于大数据挖掘的风险评估研究王伟(河南工业贸易职业学院信息工程系,河南郑州,451191)1.2粒化AI图景云模型是大数据挖掘中一个计算型模型,可以揭示风险因素的模糊性与随机性之间的关联,因此通过云模型

5、粒化AI图景。假设定量论域用D表示,G是定量论域的定性概念,若定量值α∈D,且α是定性概念的一次随机实现,那么α对G的确定度为λ(α)∈0,1,表示有稳定倾向的随机数,即λ:D→0,1,∀α∈D,α→λ(α),此时在论域D上的分布,就是云模型,每一个α为一个云滴。利用期望Eα、熵En以及超熵Ge的特征,反映定性概念G整体上的定量特征。使用云模型粒化AI图景,就是使用逆向云发生器,从数

6、据集中得到反映定性概念的数字特征集,该集合可表示为(Eα,En,Ge),利用该集合将图景划分为n个粒。利用云模型分割具有不同风险AI图景,得到每个图景对应的一个粒,根据该粒以推广的方式,评估风险指数。1.3风险评估根据粒化后的AI图景,建立判断矩阵,进行AI图景使用稳定性风险评估。该判断矩阵的部分参数,K表示图景使用稳定性风险;U1、U2、U3、U4分别表示机制风险、社会用户风险、图景生成风险、环境影响风险;uij表示指标Ui比指标Uj重要的程度量化值。该判断矩阵中,uii=1;uji=1/uij,且uij0。根据上表1中的数据,制定所有影响AI图景的风险因素的判断矩阵,并计算所有

7、判断矩阵的最大特征值和对应的特征向量,通过归一化得到判断矩阵的权重向量,该权重用ijω表示。假设最大特征值为max,则一致性指标的计算结果为:由于风险因素具有多样性、复杂性等特征,因此只依靠上述指标,判断图景使用稳定性风险K时,还具有一定的片面性,因此利用平均随机一致性指标RI,来弥补一致性指标的不足。用一致性指标CI比上平均随机一致性指标RI,得到的一致性比率用CR表示。当CR2对比实验设置此次研究的风险评估方法,为实验组;传统方法为对照组。搭建仿真实验平台,利用仿真测试软件,模拟海量信息生成的AI图景存在的风险程度。分别利用上述两个测试组,测试数据体量动态变化下,AI图景中隐含

8、的风险指数,结果如图1所示。根据图中的风险评估结果可知,当数据体量在100GB时,两种方法的风险评估结果极为相近。当数据体量分别为5000GB、10000GB以及100000GB时,实验组的风险评估结果,与表3中给定的数据近似;而对照组对含有3组海量信息的图景,其风险评估结果均在0.30.4之间,当数据体量增加到10000GB、100000GB时,风险评估结果的变化非常微弱。表1为两个测试组的风险等级评估结果。根据表中的数据可知,虽然实验组的风险指数评估结果,没能与给定结果完全一致,但高度近似的评估结果,可以认为实验组方法评估可靠,其得到的风险等级,也与给定数据一致。而对照组的风险指数评估结果,只有前两组与给定结果近似,后两组评估结果完全失真,因此最终得到的风险等级,也完全错误。可见实验组评估结果更加贴合实际。3结束语此次研究的风险评估方法,经过实验论证后,得到了较高的评价,但受个人能力以及研究经验限制,还存在一些不足之处,今后的风险研究工作中,可以对大数据挖掘算法进行改进,进一步优化关联规则获取方式,使得到的评估数据,更能体现AI图景基本现状,为国家AI技术的发展与应用,提供性能更好的评估方法。参考文献1蒋洁.AI图景下大数据挖掘的风险评估与应对策略J.现代情报,2018,38(05

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论