版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(12)发明专利自由贸易试验区临港新片区东征路133号1453室专利权人公安部第三研究所张艳事务所(普通合伙)31230本申请的目的是提供一种用于标记敏感数据进行识别,确定所述抽样数据对应的敏感分申请可以通过预设的分类分级规则对数据库的对数据库的日志数据进行抽样采集,获得一个或多个抽对数据库的日志数据进行抽样采集,获得一个或多个抽根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级2对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括每个抽样数据对应的敏感分类及敏感级别信息;其中,所述分类分级规则包括分类策略和敏感级别策略;所述根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感根据所述分类策略对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类;根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。2.根据权利要求1所述的方法,其中,所述对数据库的日志数据进行抽样采集,获得一通过已部署在数据库上的插件对所述数据库的日志数据进行抽样采集,获得一个或多个抽样数据。确定所述数据库对应的分类分级规则。4.根据权利要求3所述的方法,其中,所述确定所述数据库对获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则。5.根据权利要求3所述的方法,其中,所述确定所述数据库对通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则。6.根据权利要求5所述的方法,其中,所述根据所述存储数据特征,确定与所述存储数根据所述存储数据特征,确定所述数据库对应的涉及敏感场景信息;根据所述涉及敏感场景信息,确定与所述涉及敏感场景信息相匹配的分类分级规则。7.根据权利要求1所述的方法,其中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的第一敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感根据所述敏感级别策略,获得所述敏感分类对应的第一敏感级别信息;根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信8.根据权利要求7所述的方法,其中,所述敏感级别策略还包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第二敏感级别信息;其中,所述根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;3根据所述第一敏感级别信息及所述子敏感分类对应的第二敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。9.根据权利要求1所述的方法,其中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第三敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述子敏感分类对应的第三敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。获取用户对已存储的目标抽样数据的复核结果;若所述目标抽样数据对应的敏感分类及敏感级别信息中的至少一项与所述复核结果不一致,根据所述复核结果调整所述目标抽样数据的敏感标记。11.根据权利要求10所述的方法,其中,所述调整所述目标抽样数据的敏感标记包括以下至少一项:修改所述敏感标记中的敏感分类;修改所述敏感标记中的敏感级别信息;针对所述目标抽样数据去除所述敏感标记,并取消存储所述目标抽样数据。根据所述敏感级别信息,调整所述数据库的抽样率,使得后续使用调整后的抽样率对所述数据库的新日志数据进行抽样采集。13.一种用于标记敏感数据的计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1至12中任一项所述方法的步骤。14.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至12中任一项所述方法的步骤。15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至12中任一项所述方法的步骤。4一种用于标记敏感数据的方法、设备、介质及程序产品技术领域[0001]本申请涉及通信领域,尤其涉及一种用于标记敏感数据的技术。背景技术[0002]敏感数据是指泄漏后可能会给社会或个人带来严重危害的数据。包括个人隐私数技术中,业界对敏感数据的解决方案是手动标记形式,并未有智能流程化的形式。发明内容[0003]本申请的一个目的是提供一种用于标记敏感数据的方法、设备、介质及程序产品。[0004]根据本申请的一个方面,提供了一种用于标记敏[0005]对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;[0006]根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;[0007]根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信[0008]根据本申请的一个方面,提供了一种用于标记敏感数据的计算机设备,该设备包[0009]一一模块,用于对数据库的日志数[0010]一二模块,用于根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;[0011]一三模块,用于根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。[0012]根据本申请的一个方面,提供了一种用于标记敏感数据的计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其中,所述处理器执行所述计算机程序以实现如上所述任一方法的操作。[0013]根据本申请的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上所述任一方法的操作。[0014]根据本申请的一个方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述任一方法的步骤。[0015]与现有技术相比,本申请通过对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记5包括所述每个抽样数据对应的敏感分类及敏感级别信息,从而可以通过预设的分类分级规则对数据库的日志数据进行智能分类分级,并自动打上对应的敏感标记,且可以灵活选择所使用的分类分级规则,从而实现智能流程化的形式。附图说明[0016]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:[0017]图1示出根据本申请一个实施例的一种用于标记敏感数据的方法流程图;[0018]图2示出根据本申请一个实施例的一种用于数据安全的智能数据分类分级系统[0019]图3示出根据本申请一个实施例的一种用于标记敏感数据的计算机设备结构图;[0020]图4示出可被用于实施本申请中所述的各个实施例的示例性系统。[0021]附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式[0022]下面结合附图对本申请作进一步详细描述。[0023]在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个[0024]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccessMemory,RAM)和/或非易失性内存等形式,如只读存储器(ReadOnlyMemory,ROM)或闪存(FlashMemory)。内存是计算机可读介质的示例。[0025]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-ChangeMemory,PCM)、可编程随机存取存储器(ProgrammableRandomAccessMemory,PRAM)、静态随机存取存储器存储器(Electrically-ErasableProgrammableR或其他内存技术、只读光盘只读存储器(CompactDiscRead-OnlyM多功能光盘(DigitalVersatileDisc,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。[0026]本申请所指设备包括但不限于终端、网络设备、或终端与网络设备通过网络相集成所构成的设备。所述终端包括但不限于任何一种可与用户进行人机交互(例如通过触摸板进行人机交互)的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如Android操作系统按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不程逻辑器件(ProgrammableLogicDevice,PLD)、现场可编程门阵列(FieldProgrammable6述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(CloudComputing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局 (AdHoc网络)等。优选地,所述设备还可以是运行于所述终端、网络设备、或终端与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。[0027]当然,本领域技术人员应能理解上述设备仅为举例,其他现有的或今后可能出现的设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。[0029]图1示出根据本申请一个实施例的一种用于标记敏感数据的方法流程图,该方法包括步骤S11、步骤S12和步骤S13。在步骤S11中,计算机设备对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;在步骤S12中,计算机设备根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;在步骤S13中,计算机设备根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。[0030]在步骤S11中,计算机设备对数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在一些实施例中,日志数据是指数据库的操作行为日志数据,日志数据中包括但不限于针对数据库的某个操作行为的行为时间、行为内容(例如,在数据库中读取、插入、修改、删除的存储数据)、行为结果(例如,是否成功)、行为对象(即数据库中的至少一个存储数据)等。在一些实施例中,可以按照预定的采样率来对数据库的日志数据进行抽样采集,采样方式可以是按照行为时间的先后顺序来进行间隔采样,例如,若采样率为10%,则在该数据库中的每10次已发生的操作行为中采集1次操作行为的日志数据,即若已采集操作行为1的日志数据,则下一次采集的是按照行为时间的先后顺序在该操作行为1之后第十次发生的操作行为2的日志数据。在一些实施例中,采样方式还可以是采集针对该数据库的所有操作行为的多个日志数据,若采样率为10%,则根据该多个日志数据的数量Num,在该多个日志数据中随机抽取Num*10%数量的日志数据作为抽样数据。[0031]在步骤S12中,计算机设备根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,分类分级规则中包括多个预定的敏感分类(例如,个人身份信息类、个人财产信息类)及每个敏感分类的识别策略,识别策略用于识别数据中是否包括该敏感分类所对应的敏感分类,具体的识别方式包括但不限于正则表达式识别、关键词识别、模型特征识别等,该分类分级规则还包括分级策略,分级策略用于在若识别到数据中包括该识别策略所对应的敏感分类的时候确定该数据在该敏感分类下对应的敏感级别,敏感级别可以是用则识别到数据中包括某个识别策略所对应的敏感分类,则将其作为该数据对应的敏感分类,然后继续根据分类分级规则确定该数据在该敏感分类下对应的敏感级别。在一些实施7例中,可以是一个敏感分类仅对应一个敏感级别,若识别到数据中包括某个分类策略所对应的敏感分类,则直接将该敏感分类对应的敏感级别作为该数据在该敏感分类下对应的敏感级别,或者,还可以是一个敏感分类对应多个不同的敏感级别,则此时需要根据分级策略来确定该数据在该敏感分类下对应的敏感级别,具体的确定方式包括但不限于语义分析方式、关键词提取方式,模型特征方式等,例如,通过语义分析的方式来确定该数据在该敏感分类下对应的敏感级别,或者,该敏感分类预定设定了若干个关键词与敏感级别之间的映射关系,根据该数据中所包括的关键词所映射的敏感级别,确定该数据在该敏感分类下对应的敏感级别,或者,将该数据输入已训练的该敏感分类对应的敏感级别模型,得到该敏感级别模型输出的该数据在该敏感分类下对应的敏感级别。[0032]在步骤S13中,计算机设备根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。在一些实施例中,可以是根据抽样数据对应的敏感级别,将敏感级别满足预定的级别阈值的抽样数据确定为敏感数据,例如,将对应的敏感级别大于或等于预定的级别数值阈值的抽样数据确定为敏感数据,或者,还可以将所有识别到包括分类分级规则中的至少一个敏感分类的抽样数据确定为敏感数据。在一些实施例中,针对敏感数据(即至少一个抽样数据)打上对应的敏感标记,该敏感标记包括该敏感数据所对应的敏感分类及敏感级别,并对该敏感数据进行存储。在一些实施例中,用户可以对存储的敏感数据进行检索得到需求数据,或者,还可以对存储的敏感数据进行资产可视化分析并通过报表导出。在一些实施例中,还支持外部调用存储的敏感数据和/或支持将存储的敏感数据外送。本申请可以通过预设的分类分级规则对数据库的日志数据进行智能分类分级,并自动打上对应的敏感标记,且可以灵活选择所使用的分类分级规则,从而实现智能流程化的形[0033]在一些实施例中,所述步骤S11包括:计算机设备通过已部署在数据库上的插件对所述数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在一些实施例中,可以通过在数据库上部署(或者安装)插件来对数据库的日志数据进行自动抽样采集,该插件属于半侵入式的软件应用,成本低,便捷性好,同时可扩展性强,通过该插件直接进行数据库日[0034]在一些实施例中,所述方法还包括:计算机设备确定所述数据库对应的分类分级规则。在一些实施例中,需要先确定针对该数据库所使用的分类分级规则,具体的确定方式可以是获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则,或者,还可以是通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特征,根据所述存储数据特征,自动确定与所述存储数据特征相匹配的分类分级规则。[0035]在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则。在一些实施例中,预置了多个默认分类分级规则,用户可以在该多个默认分类分级规则中自由灵活选择一个作为该数据库对应的分类分级规则。例如,分类分级规则可以是按照个人信息保护进行分类的规则,其包括个人身份信息、个人财产信息等多个敏感分类,又例如,分类分级规则还可以是按照电信运营商行业进行分类的规则,其包括用户基本资料、位置数据、消费信息等多个敏感分类。8[0036]在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特征;根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则。在一些实施例中,可以先通过对数据库中的存储数据进行语义分析,分析得到数据库中的存储数据特征,该存储数据特征用于表征该数据库中主要存储了何种类型何种特点的数据,然后根据该存储数据特征,在多个默认分类分级规则中自动确定适合这种类型这种特点的存储数据的分类分级规则,并将其作为该数据库对应的分类分级规则,例如,若该存储数据特征表征该数据库中主要存储了对话类型的消息文本数据,则适合这种对话类型的消息文本数据的分类分级规则可以是按照社交信息包含进行分类的规则,其包括个人聊天信息、个人空间发布信息、个人资料信息等多个敏感分类。[0037]在一些实施例中,所述根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则,包括:根据所述存储数据特征,确定所述数据库对应的涉及敏感场景信息;根据所述涉及敏感场景信息,确定与所述涉及敏感信息相匹配的分类分级规则。在一些实施例中,可以先根据该存储数据特征,确定该数据库所涉及的敏感场景信息,然后根据该敏感场景信息,在多个默认分类分级规则中自动确定适合该敏感场景信息的分类分级规则,例如,若该存储数据特征表征该数据库中主要存储了商品链接、商品价格、收货地址等类型的数据,则可以确定该数据库所涉及的敏感场景为购物场景,并在多个默认分类分级规则中自动确定适合该购物场景的分类分级规则,其包括个人消费信息、个人支付信息、个人联系方式信息、个人地址信息等多个敏感分类。[0038]在一些实施例中,所述分类分级规则包括分类策略和敏感级别策略;其中,所述步骤S12包括:计算机设备根据所述分类策略对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类;根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,分类策略中通常包括预先设定的多个敏感分类,分类策略用于识别抽样数据中是否包括该分类策略中的某个或某几个敏感分类,具体的识别方式包括但不限于正则表达式识别、关键词识别、模型特征识别等。在一些实施例中,一个抽样数据可以对应多个敏感分类,即若根据分类策略识别到抽样数据中包括某个敏感分类,则可以直接将其作为该抽样数据对应的其中一个敏感分类。在一些实施例中,一个抽样数据仅可以对应一个敏感分类,则若根据分类分级规则识别到抽样数据中包括多个不同的敏感分类,需要在该多个不同的敏感分类确定其中的一个敏感分类作为该抽样数据对应的敏感分类,例如,每个敏感分类对应不同的识别可信度或匹配度,可以在该多个不同的敏感分类中对应的识别可信度或匹配度最高的敏感分类作为该抽样数据对应的敏感分类。在一些实施例中,在确定出抽样数据对应的敏感分类之后,进一步根据敏感级别策略,确定该抽样数据在该敏感分类下对应的敏感级别,敏感级别可以是用数值形式来表征,例如,数值越大,则说分别对应的敏感级别,可以直接将抽样数据所对应的敏感分类对应的敏感级别作为该抽样数据在该敏感分类下对应的敏感级别。在一些实施例中,敏感级别策略中可以包括每个敏感分类对应的敏感级别的具体确定方式,该具体确定方式包括但不限于语义分析方式、关键词提取方式,模型特征方式等,在确定出抽样数据对应的敏感分类之后,需要根据该敏感9分类对应的敏感级别确定方式,来具体确定该抽样数据在该敏感分类下对应的敏感级别,例如,通过语义分析的方式来确定该数据在该敏感分类下对应的敏感级别,或者,该敏感分类预定设定了若干个关键词与敏感级别之间的映射关系,根据该数据中所包括的关键词所映射的敏感级别,确定该数据在该敏感分类下对应的敏感级别,或者,将该数据输入已训练的该敏感分类对应的敏感级别模型,得到该敏感级别模型输出的该数据在该敏感分类下对应的敏感级别。在一些实施例中,若抽样数据对应多个敏感分类,则需要先分别确定该抽样数据在每个敏感分类下对应的敏感级别,然后再根据该多个敏感级别来确定该抽样数据在该多个敏感分类下所对应的敏感级别,例如,若敏感级别是数值形式,则可以将多个敏感级别数值所对应的平均值作为该抽样数据在该多个敏感分类下所对应的敏感级别。[0039]在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的第一敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,获得所述敏感分类对应的第一敏感级别信息;根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,每个敏感分类对应一个敏感级别,敏感级别策略中包括分类策略下的每个敏感分类对应的第一敏感级别。在一些实施例中,在确定出抽样数据对应的敏感分类之后,可以直接将该敏感分类对应的第一敏感级别作为该抽样数据在该敏感分类下对应的敏感级别,或者,可以将该敏感分类对应的第一敏感级别输入预定的函数关系式,将该函数关系式的输出作该抽样数据在该敏感分类下对应的敏感级别。[0040]在一些实施例中,所述敏感级别策略还包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第二敏感级别信息;其中,所述根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述第一敏感级别信息及所述子敏感分类对应的第二敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,每个敏感分类还会对应多个子敏感分类,每个子敏感分类对应一个敏感级别,敏感级别策略还包括分类策略下的每个敏感分类所对应的多个子敏感分类及每个子敏感分类对应的第二敏感级别。在一些实施例中,在确定出抽样数据对应的敏感分类之后,需要根据敏感级别策略来确定该抽样数据在该敏感分类下对应的子敏感分类,具体的确定方式包括但不限于正则表达式识别、关键词识别、语义分析、模型特征识别等,通过敏感级别策略可以识别出该抽样数据属于该敏感分类下的哪个具体的子敏感分类,然后根据该敏感分类对应的第一敏感级别和该抽样数据所属的子敏感分类对应的第二敏感级别,来确定该抽样数据在该敏感分类下对应的敏感级别,例如,若敏感级别是数值形式,则可以将该第一敏感级别与该第二敏感级别的平均值或最大值或最小值作为该抽样数据在该敏感分类下对应的敏感级别,或者,还可以将该第一敏感级别和该第二敏感级别输入一个预定的函数关系式,然后将该函数关系式的输出作为该抽样数据在该敏感分类下对应的敏感级别。[0041]在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第三敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述子敏感分类对应的第三敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,第三敏感级别与前文所述的第二敏感级别相同或相似,在此不再赘述。在一些实施例中,在确定出抽样数据对应的敏感分类之后,再根据敏感级别策略来确定该抽样数据在该敏感分类下对应的子敏感分类,然后可以仅根据该子敏感分类对应的第三敏感级别,来确定该抽样数据在该敏感分类下对应的敏感级别,例如,将该子敏感分类对应的第三敏感级别作为该抽样数据在该敏感分类下对应的敏感级别。[0042]在一些实施例中,所述方法还包括:获取用户对已存储的目标抽样数据的复核结果;若所述目标抽样数据对应的敏感分类及敏感级别信息中的至少一项与所述复核结果不一致,根据所述复核结果调整所述目标抽样数据的敏感标记。在一些实施例中,可以向用户呈现所有敏感数据(即至少一个抽样数据)供该用户复核,或者,还可以仅向用户呈现识别可信度或匹配度低于或等于预定阈值的敏感数据供该用户复核,其中,复核是指用户手动核查该敏感数据所被打上的敏感标记是否准确。在一些实施例中,若该用户针对目标敏感数据(即目标抽样数据)的复核结果指示该目标敏感数据所被打上的敏感标记不准确,即若该目标敏感数据所对应的敏感分类及敏感级别中的至少一项与该复核结果不一致,则需要根据该复核结果来调整该目标敏感数据的敏感标记,其中,具体的调整方式包括但不限于修改该敏感标记中的敏感分类、修改该敏感标记中的敏感级别信息、针对该目标敏感数据去除该敏感标记,并取消存储该目标敏感数据。[0043]在一些实施例中,所述调整所述目标抽样数据的敏感标记包括以下至少一项:修改所述敏感标记中的敏感分类;修改所述敏感标记中的敏感级别信息;针对所述目标抽样数据去除所述敏感标记,并取消存储所述目标抽样数据。在一些实施例中,若目标敏感数据对应的复核后的敏感级别不满足预定的级别阈值,例如,复核后的敏感级别小于预定的级别数值阈值,则针对该目标敏感数据删除其所被打上的敏感标记,并取消对该目标敏感数据进行存储。在一些实施例中,若复核结果指示目标敏感数据中不包括该分类分级规则中的任何一个预定的敏感分类,则针对该目标敏感数据删除其所被打上的敏感标记,并取消对该目标敏感数据进行存储。[0044]在一些实施例中,所述方法还包括:计算机设备根据所述敏感级别信息,调整所述数据库的抽样率,使得后续使用调整后的抽样率对所述数据库的新日志数据进行抽样采集。在一些实施例中,可以根据抽样数据对应的敏感级别,计算得到敏感级别满足预定的级别阈值的目标抽样数据(例如,该目标抽样数据可以是该至少一个被打上敏感标记的抽样数据即敏感数据)的数量与抽样采集到的一个或多个抽样数据的总数的比例,例如,计算得到敏感级别大于或等于预定的级别数值阈值的抽样数据的数量与抽样采集到的一个或多个抽样数据的总数的比例,若该比例数值大于或等于预定的第一比值阈值,则可以提高该数据库的原有抽样率,可以按照默认的幅度增加原有抽样率,或者,还可以根据该比例数值的大小动态确定原有抽样率的提高幅度,若该比例数值小或等于预定的第二比值阈值,则可以降低该数据库的原有抽样率,可以按照默认的幅度降低原有抽样率,或者,还可以根据该比例数值的大小动态确定原有抽样率的降低幅度,然后后续在需要对该数据库再次进行抽样采集的时候,会使用该调整后的抽样率来对该数据库新产生的新日志数据再次进行抽样采集。[0045]图2示出根据本申请一个实施例的一种用于标记敏感数据的方法流程图。11[0046]如图2所示,该智能数据分类分级系统包括审计日志及数据库资产采集模块、数据志及数据库资产采集模块用于通过插件化形式对数据库的日志数据进行抽样采集,智能策略配置模块用于智能配置数据分类分级引擎所使用的分类分级规则,数据分类分级引擎用于利用分类分级规则对日志数据进行敏感数据识别,手动复核模块用于对日志数据的识别结果进行手动复核,存储模块用于对识别数据进行存储,资产检索及分析模块用于调用存储资产对识别数据进行检索以及对识别数据进行可视化分析。[0047]图3示出根据本申请一个实施例的一种用于标记敏感数据的计算机设备结构图,该设备包括一一模块11、一二模块12和一三模块13。一一模块11,用于对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;一二模块12,用于根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;一三模块13,用于根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。[0048]一一模块11,用于对数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在一些实施例中,日志数据是指数据库的操作行为日志数据,日志数据中包括但不限于针对数据库的某个操作行为的行为时间、行为内容(例如,在数据库中读的存储数据)、行为结果(例如,是否成功)、行为对象(即数据库中的至少一个存储数据)等。在一些实施例中,可以按照预定的采样率来对数据库的日志数据进行抽样采集,采样方式可以是按照行为时间的先后顺序来进行间隔采样,例如,若采样率为10%,则在该数据库中的每10次已发生的操作行为中采集1次操作行为的日志数据,即若已采集操作行为1的日志数据,则下一次采集的是按照行为时间的先后顺序在该操作行为1之后第十次发生的操作行为2的日志数据。在一些实施例中,采样方式还可以是无顺该数据库的所有操作行为的多个日志数据,若采样率为10%,则根据该多个日志数据的数量Num,在该多个日志数据中随机抽取Num*10%数量的日志数据作为抽样数据。[0049]一二模块12,用于根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,分类分级规则中包括多个预定的敏感分类(例如,个人身份信息类、个人财产信息类)及每个敏感分类的识别策略,识别策略用于识别数据中是否包括该敏感分类所对应的敏感分类,具体的识别方式包括但不限于正则表达式识别、关键词识别、模型特征识别等,该分类分级规则还包括分级策略,分级策略用于在若识别到数据中包括该识别策略所对应的敏感分类的时候确定该数据在该敏感分类下对应的敏感级别,敏感级别可以是用数值形到数据中包括某个识别策略所对应的敏感分类,则将其作为该数据对应的敏感分类,然后继续根据分类分级规则确定该数据在该敏感分类下对应的敏感级别。在一些实施例中,可以是一个敏感分类仅对应一个敏感级别,若识别到数据中包括某个分类策略所对应的敏感分类,则直接将该敏感分类对应的敏感级别作为该数据在该敏感分类下对应的敏感级别,或者,还可以是一个敏感分类对应多个不同的敏感级别,则此时需要根据分级策略来确定该数据在该敏感分类下对应的敏感级别,具体的确定方式包括但不限于语义分析方式、关键词提取方式,模型特征方式等,例如,通过语义分析的方式来确定该数据在该敏感分类下对应的敏感级别,或者,该敏感分类预定设定了若干个关键词与敏感级别之间的映射关系,根据该数据中所包括的关键词所映射的敏感级别,确定该数据在该敏感分类下对应的敏感级别,或者,将该数据输入已训练的该敏感分类对应的敏感级别模型,得到该敏感级别模型输出的该数据在该敏感分类下对应的敏感级别。[0050]一三模块13,用于根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。在一些实施例中,可以是根据抽样数据对应的敏感级别,将敏感级别满足预定的级别阈值的抽样数据确定为敏感数据,例如,将对应的敏感级别大于或等于预定的级别数值阈值的抽样数据确定为敏感数据,或者,还可以将所有识别到包括分类分级规则中的至少一个敏感分类的抽样数据确定为敏感数据。在一些实施例中,针对敏感数据(即至少一个抽样数据)打上对应的敏感标记,该敏感标记包括该敏感数据所对应的敏感分类及敏感级别,并对该敏感数据进行存储。在一些实施例中,用户可以对存储的敏感数据进行检索得到需求数据,或者,还可以对存储的敏感数据进行资产可视化分析并通过报表导出。在一些实施例中,还支持外部调用存储的敏感数据和/或支持将存储的敏感数据外送。本申请可以通过预设的分类分级规则对数据库的日志数据进行智能分类分级,并自动打上对应的敏感标记,且可以灵活选择所使用的分类分级规则,从而实现智能流程化的形式。[0051]在一些实施例中,所述一—模块11用于:通过已部署在数据库上的插件对所述数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方[0052]在一些实施例中,所述设备还用于:确定所述数据库对应的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。[0053]在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。[0054]在一些实施例中,所述确定所述数据库对应的分类分级规则,包括:通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特征;根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方[0055]在一些实施例中,所述根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则,包括:根据所述存储数据特征,确定所述数据库对应的涉及敏感场景信息;根据所述涉及敏感场景信息,确定与所述涉及敏感信息相匹配的分类分级规则。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。[0056]在一些实施例中,所述分类分级规则包括分类策略和敏感级别策略;其中,所述一二模块12用于:根据所述分类策略对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类;根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信[0057]在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的第一敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,获得所述敏感分类对应的第一敏感级别信息;根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在此,相关操作与图1所示实施例相同或相近,故[0058]在一些实施例中,所述敏感级别策略还包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第二敏感级别信息;其中,所述根据所述第一敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述第一敏感级别信息及所述子敏感分类对应的第二敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在此,相关操作与图1所示实施例相同或相以引用方式包含于此。[0059]在一些实施例中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的多个子敏感分类及每个子敏感分类对应的第三敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的子敏感分类;根据所述子敏感分类对应的第三敏感级别信息,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。[0060]在一些实施例中,所述设备还用于:获取用户对已存储的目标抽样数据的复核结果;若所述目标抽样数据对应的敏感分类及敏感级别信息中的至少一项与所述复核结果不一致,根据所述复核结果调整所述目标抽样数据的敏感标记。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方[0061]在一些实施例中,所述调整所述目标抽样数据的敏感标记包括以下至少一项:修改所述敏感标记中的敏感分类;修改所述敏感标记中的敏感级别信息;针对所述目标抽样数据去除所述敏感标记,并取消存储所述目标抽样数据。在此,相关操作与图1所示实施例[0062]在一些实施例中,所述设备还用于:根据所述敏感级别信息,调整所述数据库的抽样率,使得后续使用调整后的抽样率对所述数据库的新日志数据进行抽样采集。在此,相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。[0063]除上述各实施例介绍的方法和设备外,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。[0064]本申请还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。[0065]本申请还提供了一种计算机设备,所述计算机设备包括:[0067]存储器,用于存储一个或多个计算机程序;[0068]当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。[0069]图4示出了可被用于实施本申请中所述的各个实施例的示例性系统;[0070]如图4所示在一些实施例中,系统300能够作为各所述实施例中的任意一个设备。在一些实施例中,系统300可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或NVM/存储设备320)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如,(一个或多个)处理器[0071]对于一个实施例,系统控制模块310可包括任意适当的接口控制器,以向(一个或多个)处理器305中的至少一个和/或与系统控制模块310通信的任意适当的设备或组件提供任意适当的接口。[0072]系统控制模块310可包括存储器控制器模块330,以向系统存储器315提供接口。存储器控制器模块330可以是硬件模块、软件模块和/或固件模块。[0073]系统存储器315可被用于例如为系统300加载和存储数据和/或指令。对于一个实施例,系统存储器315可包括任意适当的易失性存储器,例如,适当的DRA中,系统存储器315可包括双倍数据速率类型四同步动态随机存取存储器(DD[0074]对于一个实施例,系统控制模块310可包括一个或多个输入/输出(I/O)控制器,以向NVM/存储设备320及(一个或多个)通信接口325提供接口。意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。[0076]NVM/存储设备320可包括在物理上作为系统300被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备320可通过网络经由(一个或多个)通信接口325进行访问。[0077](一个或多个)通信接口325可为系统300提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统300可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。[0078]对于一个实施例,(一个或多个)处理器305中的至少一个可与系统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 畹町烧烤活动方案策划(3篇)
- 打井建房施工方案(3篇)
- 大堂换灯施工方案(3篇)
- 天津专业活动策划方案(3篇)
- 社团冬至活动策划方案(3篇)
- 物流行业运输与配送规范
- 2025年老龄服务行业护理操作规范
- 医院开业广告投放方案
- 给排水技术培训
- 2025年大学大二(管理学)专业核心能力测试题及解析
- DL∕T 5106-2017 跨越电力线路架线施工规程
- 床-轮椅转移操作质量及评分标准
- DL-T976-2017带电作业工具、装置和设备预防性试验规程
- DB32T3916-2020建筑地基基础检测规程
- 2024年青海海南州消防救援支队消防文员招聘笔试参考题库附带答案详解
- 2022版《义务教育教学新课程标准》解读课件
- 期末水平综合练习(试题)新思维小学英语一年级上册
- 人教A版高中数学选择性必修第二册全册各章节课时练习题含答案解析(第四章数列、第五章一元函数的导数及其应用)
- 六年级下册小升初全复习-第12讲 工程问题-北师大 (含答案)
- 烹饪原料知识 水产品虾蟹类
- 考勤抽查记录表
评论
0/150
提交评论