CN113961881B 一种识别挖矿用户的方法、装置、设备及存储介质 (国网浙江省电力有限公司杭州供电公司)_第1页
CN113961881B 一种识别挖矿用户的方法、装置、设备及存储介质 (国网浙江省电力有限公司杭州供电公司)_第2页
CN113961881B 一种识别挖矿用户的方法、装置、设备及存储介质 (国网浙江省电力有限公司杭州供电公司)_第3页
CN113961881B 一种识别挖矿用户的方法、装置、设备及存储介质 (国网浙江省电力有限公司杭州供电公司)_第4页
CN113961881B 一种识别挖矿用户的方法、装置、设备及存储介质 (国网浙江省电力有限公司杭州供电公司)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(19)国家知识产权局(12)发明专利电公司地址310016浙江省杭州市上城区建国中(72)发明人杨翱徐祥海商佳宜侯炳旭许中平谢可高璐李榛陈致远陆海波张志鹏赵天煜方响王岗陈琳李飞龚莺飞公司11283曹荣虎赵潇潇郑子洵储介质述若干高耗电用户中每两个高耗电用户用电量线和绿电出力曲线的Pearson相关系数;根据2根据每两个高耗电用户用电量序列间的电量距离通过社区发现算法,建立用户电量社计算每两个高耗电用户与j间的电量距离dij:dc为0.8~0.9;用电数据采集模块,获取指定区域若干高耗电用户用电数据,获取指定区域所有高耗3电用户用电数据时,数据时间跨度大于或等于1年,并根据行业标签,去除常规高耗电用户用电数据,获得所述若干高耗电用户用电数据;绿电出力采集模块,获取向所述指定区域供电的绿电出力数据;数据预处理模块,对绿电出力数据和高耗电用户用电数据进行预处理;电量距离计算模块,计算每两个待测用户用电量序列间的电量距离;用户电量社区建立模块,根据每两个待测用户用电量序列间的电量距离通过社区发现相关系数计算模块,计算各社区中典型电量曲线和绿电出力出现的Pearson相关系数;挖矿用户确定模块,确定挖矿用户,并输出所确定的挖矿用户信息。8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-6任一项所述的一种识别挖矿用户的方法。9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述权利要求1-6任一项所述的一种识别挖矿用户的方法。4技术领域[0001]本发明属于电子信息技术领域,具体涉及一种识别挖矿用户的方法、装置、设备及存储介质。背景技术[0002]比特币等虚拟货币未经过官方发行,在相关的投机活动中存在巨大风险。同时,挖矿行为本身消耗大量电力却并未对社会经济发展起到实际的推动作用,因此也不符合我国绿色发展的理念。然而,尽管较大的较为知名的矿场已关闭,一些中小规模的矿场仍可能在云计算中心及数据中心的伪装下从事挖矿活动。因此有必要发明一种方法,根据高耗电用户的用电特征,对高疑似度挖矿用户进行识别。[0003]现有技术的缺陷和不足具体体现在以下方面:[0004](1)传统的挖矿用户识别主要依靠人力对电量曲线的观测分析,效率较低,漏查[0005](2)依赖一般机器学习及聚类算法,需要大量样本数据进行训练,实际中往往较难获取。[0006]经研究发现,挖矿用户电量曲线季节特征明显。经分析,挖矿行为强度与所在网省主要绿电出力呈现强烈正相关。由于在特定季节,绿电出力高,消纳困难,导致绿电价格低,吸引挖矿行为。因此,可利用上述特性,可实现基于较小数据样本的高疑似度挖矿用户电量识别。发明内容[0007]本发明提供了一种识别挖矿用户的方法、装置、设备及存储介质,以解决传统的挖矿用户识别效率低、漏查错查严重的技术问题。[0008]本发明采取下述技术方案予以实现:[0009]本发明的进一步改进在于:包括以下步骤:[0010]获取指定区域若干高耗电用户用电数据;[0011]获取向所述指定区域供电的绿电出力数据;[0012]对获取的绿电出力数据进行预处理;[0013]计算所述若干高耗电用户中每两个高耗电用户用电量序列间的电量距离;[0014]根据每两个高耗电用户用电量序列间的电量距离通过社区发现算法,建立用户电量社区;[0015]计算各用户电量社区中典型电量曲线和绿电出力曲线的Pearson相关系数;[0016]根据Pearson相关系数大小,确定挖矿用户,并输出所确定的挖矿用户信息。[0017]本发明的进一步改进在于:所述获取指定区域若干高耗电用户用电数据的步骤具体包括:[0018]获取指定区域所有高耗电用户用电数据时,数据时间跨度大于或等于1年,并根据5[0022]计算每两个高耗电用户i与间的电量距离dij:[0026]根据每两个高耗电用户i与间的电量距离dij与预设阈值dc进行比较;关系数pi,并根据Pearson相关系数大小分若干组输出各用户电量社区。[0038]相关系数计算模块,计算各社区中典型电量曲线和用户的方法。6[0042]与现有技术相比,本发明至少包括以下有益效果:[0043]1、本发明通过对自动社区中典型电量曲线进行分析,排查效率高,漏查率低,准确性高。[0044]2、本发明将挖矿行为与所在省的绿电出力结合,提高对挖矿用户的识别准确性。[0045]3、本发明通过各社区中典型电量曲线和绿电出力出现的Pearson相关系数判断用户是否挖矿,避免了漏查与错查。附图说明[0046]构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:[0047]图1为本发明一种识别挖矿用户的方法流程图;[0048]图2为本发明一种识别挖矿用户的装置框图。具体实施方式[0049]下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。[0050]以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本发明所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。[0051]实施例1:[0052]如图1所示,一种识别挖矿用户的方法,包括以下步骤:[0053]获取指定区域若干高耗电用户用电数据;[0054]获取向所述指定区域供电的绿电出力数据;[0055]对获取的绿电出力数据进行预处理;[0056]计算所述若干高耗电用户中每两个高耗电用户用电量序列间的电量距离;[0057]根据每两个高耗电用户用电量序列间的电量距离通过社区发现算法,建立用户电量社区;[0058]计算各用户电量社区中典型电量曲线和绿电出力曲线的Pearson相关系数;[0059]根据Pearson相关系数大小,确定挖矿用户,并输出所确定的挖矿用户信息。[0060]根据向指定区域供电的电力公司的供电规模和用户的耐受能力,在相同研究时间内对各用户用电量进行从大到小的排名,选择前40-100名作为高耗电用户作为研究对象。[0061]对于指定区域,收集高电耗用户电表的日用电量数据,数据时间跨度不低于一年,并根据电力营销系统中的行业标签,排除基站等常规高电耗用户,剩余待检测用户数据;[0062]收集所在网省主导性、季节性绿电出力数据,包括但不限于水电、风电、光伏电站等发电形式,数据颗粒度应至少为月平均功率;[0063]对绿电出力数据按时间进行插值或平滑处理,使在相同的时间跨度内,绿电出力数据序列长度与各高耗电用户用电量数据序列长度相等。7 [0064]两两计算待检测用户i与j间的电量距离(,其中pij为[Qi,dc时,认为高耗电用户间无显著相关性。[0065]根据每两个高耗电用户i与j间的电量距离dij与预设阈值dc进行比较;[0067]若dij小于dc时,i和j处于同一用户电量社区;[0068]dc为0.8~0.9。[0069]计算各社区中典型电量曲线和绿电出力曲线的Pearson相关系数,根据Pearson相关系数大小,确定挖矿用户的步骤,并输出所确定的挖矿用户信息具体包括:计算各社区中典型电量曲线i与插值后的绿电出力曲线间的Pearson相关系数pie,并根据Pearson相关系数大小分4组输出各用户电量社区。[0070]其中,将根据pie判断该社区内所有高耗电用户是否为挖矿用户;若pie≥0.8的用户电量社区分为一组输出;将,则为高度疑似;若0.8>pie≥0.6的用户电量社区分为一组输Pie<0的用户电量社区分为一组输出,则排除用户。[0071]实施例2:[0073]用电数据采集模块,获取指定区域若干高耗电用户用电数据;[0074]绿电出力采集模块,获取向所述指定区域供电的绿电出力数据;[0075]数据预处理模块,对绿电出力数据和高耗电用户用电数据进行预处理;[0076]电量距离计算模块,计算每两个待测用户用电量序列间的电量距离;[0077]用户电量社区建立模块,根据每两个待测用户用电量序列间的电量距离通过社区[0078]相关系数计算模块,计算各社区中典型电量曲线和绿电出力出现的Pearson相关[0079]挖矿用户确定模块,确定挖矿用户,并输出所确定的挖[0080]用电数据采集模块获取指定区域所有高耗电用户用电数据时,数据时间跨度大于或等于1年,并根据行业标签,去除常规高耗电用户用电数据,获得所述若干高耗电用户用电数据。[0081]绿电出力采集模块,采集的绿电数据的数据颗粒度大于等于月平均功率。[0082]数据预处理模块,对绿电出力数据按时间进行插值处理,使绿电出力数据序列长度与各高耗电用户用电量数据序列长度相等。[0083]电量距离计算模块,计算若干高耗电用户中每两个高耗电用户用电量序列间的电[0084]计算每两个高耗电用户i与j间的电量距离dij:8 [0087]用户电量社区建立模块,根据每两个高耗电用户i与j间的电量距离dij与预设阈值dc进行比较;[0088]若dij大于等于dc时,i和j不处于同一用户电量社区;[0090]dc为0.8~0.9;[0091]通过社区发现算法遍历所有高耗电用户,建立若干用户电量社区。[0092]挖矿用户确定模块,计算各社区中典型电量曲线和绿电出力曲线的Pearson相关系数,根据Pearson相关系数大小,确定挖矿用户的步骤,并输出所确定的挖矿用户信息具体包括:计算各社区中典型电量曲线i与插值后的绿电出力曲线间的Pearson相关系数pie,并根据Pearson相关系数大小分4组输出各用户电量社区。[0093]其中,将根据pie判断该社区内所有高耗电用户是否为挖矿用户;若pie≥0.8的用户电量社区分为一组输出;将,则为高度疑似;若0.8>pie≥0.6的用户电量社区分为一组输Pie<0的用户电量社区分为一组输出,则排除用户。[0094]实施例3:[0095]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例1所述的一种识别挖矿用户的方法。[0096]实施例4:[0097]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现实施例1所述的一种识别挖矿用户的方法。[0098]由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。[0099]本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。[0100]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实9现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。[0101]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论