




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
量子科技产学研创新联盟2024年12月1本报告围绕基于量子安全的分布式容错云存储的应用场景展开研究。本报告首先介绍了存储技术、容错技术及量子安全相关概念,并列举了分布式容错云存储技术在多个行业领域的应用场景,分析总结了当前分布式云存储系统主流架构,接着本报告提出了基于量子安全的分布式容错云存储技术方案,包括需求分析、方案设计、技术路线实现、技术特点总结等内容。最后本报告对研究内容进行了总结,并给出发展建议。2 1 21前言 12缩略语 13相关技术介绍 2 23.1.1集中式存储 33.1.2分布式存储 33.2容错技术 43.2.1数据镜像 43.2.2纠删码 43.2.3秘密共享 53.3量子安全 5 5 6 64.1应用场景介绍 7 7 8 9 4.1.7车联网 4.1.8气象数据 4.1.9高校数据中心 4.1.10医疗大数据 4.2.2Ceph框架 4.2.3Swift框架 21 35基于量子安全的分布式容错云存储 5.1需求分析 5.2方案设计 5.2.1量子安全保证数据的机密性 5.2.2纠删技术实现数据的完整性与容错性 5.2.3秘密共享增强用户对密钥的分散存储及数据的管控 255.3技术路线实现 5.3.1三种存储方案的比较 5.3.2基于量子安全的分布式容错云存储架构 5.3.3应用层密钥秘密共享及数据预处理 5.3.4系统层的数据存储容错处理 5.4技术特点总结 5.4.1存储技术与量子安全相结合 5.4.2密钥的秘密共享及分散存储 5.4.3密钥密文同存保护 7参考文献 1数据存储已成为现代信息技术和数字化社会的基石,深刻影响着各行各业的发展以及人们日常生活的方方面面,其发展与研究的意义非常重大。通过存储技术使得数据信息可以得到保存与传承;企业和组织中,数据存储已经成为业务运营的核心部分;随着大数据时代的到来,数据存储也成为数据分析与决策的基础;数据存储技术的进步也不断推动着科技创新的发展。比如在人工智能、机器学习等前沿技术方面需要大量的数据进行训练和验证,而高效的数据存储解决方案为这些技术发展提供了坚实基础。随着云计算技术的发展,数据存储也已进入云存储时代,分布式云存储成为数据云存储的研究热点之一。然而,随着越来越多的个人和企业将敏感信息委托给云服务,数据安全和隐私变得至关重要。数据泄露或未经授权访问的潜在后果是严重的,从经济损失到声誉损害。面对众多的网络威胁和复杂的攻击技术,需要强有力的安全措施来应对防范这些风险。如何更高效更安全地存储数据已经成为云存储最为关注的问题。QKD(量子密钥分发,QuantumKeyDistribution)是一种利用量子态实现安全密钥分发的方案,常用于保障传输数据的安全性。本研究报告探索QKD在传输安全之外更丰富的量子安全服务应用场景,比如数据存储、数据处理等方面,也提供量子安全的能力。本研究报告首先介绍了分布式云存储及量子安全技术相关概念,总结了分布式云存储当前现状及相关背景研究。接着介绍了当前云存储系统在政务、金融、电力、广电、航空、交通、教育、医疗等多方面领域的应用场景,并对主流云存储系统架构进行了分析总结,并提出了改进思考。本研究报告对三种当前主流的容错存储方案的优缺点对比分析、分布式云存储系统如何融入量子安全、如何高效容错存储、在单用户和多用户场景下的密钥安全保护及分散存储、数据拥有者对共享数据的管控等关于量子安全的分布式容错云存储系统的多个研究方向进行了重点分析,并提供了解决和改进方案。研究报告在基于量子安全的分布式容错云存储系统的需求分析、技术路线实现、技术方案设计、技术特点总结等多个方面进行了详细阐述。最后,报告对基于量子安全的分布式容错存储在未来各个领域发挥的作用及研究方向进行了展望。CIFS:通用互联网文件系统(CommonInternetFileSystem)CRUSH:可扩展哈希下的受控复制(ControlledReplicatedUnderScalable2DAS:直接附加存储(DirectAttachedStorage)EBS:弹性块存储(ElasticBlockStorage)EC:纠删码技术(Erasurecoding)HDFS:Hadoop分布式文件系统(HadoopDistributedFileSystem)iSCSI:互联网小型计算机系统接口(internetSmallComputerSystemMDS:元数据服务(MetaDataServer)MS:镜像存储(MirroringStorage)NAS:网络附加存储(NetworkAttachedStorage)NFS:网络文件系统(NetworkFileSystem)P2P:对等网络(Peer-to-Peer)QKD:量子密钥分发(QuantumKeyDistribution)RSA:RSA公钥加密算法(RonRivest,AdiShamir,LeonardAdlemanSAN:存储区域网络(StorageAreaNetwork)SCSI:小型计算机系统接口(SmallComputerSystemInterface)SS:秘密共享(SecretSharing)3相关技术介绍本研究课题涉及存储技术、容错技术以及量子安全等方面内容,下面就这几个方面的相关技术做个简要介绍。3.1存储技术存储技术主要分为集中式存储和分布式存储两大类。集中式存储属于传统的存储方式,其特点是数据集中存放在一个物理位置。分布式存储通过连接多台独量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究3立的存储设备的磁盘空间起来,构成一个虚拟的、逻辑上统一的存储设备,实现数据的分散存储和管理。集中式存储包括DAS(直接附加存储)、NAS(网络附加存储)、SAN(存储区域网络)等。DAS是指将存储设备通过SCSI线缆或光纤通道直接连接到服务器上,这种连接方式可扩展性差,而且在应用系统大量读取文件时,SCSI通道成为I/O最大瓶颈,因此DAS法满足大规模存储的要求。NAS是一种文件共享服务。NAS拥有自己的文件系统,通过NFS协议或CIFS协议对外提供文件访问服务,因此能实现不同的操作系统进行文件共享。NAS依赖于业务网络,其应用访问存储和存储内部的数据备份、恢复管理等共用网络,容易给网络形成双重负担,特别是当网络拥塞时,应用访问存储以及存储的数据备份恢复等操作都会受到影响,容易形成单点故障。NAS主要用于非结构化数据存储。SAN是一种通过网络方式连接存储设备和应用服务器的存储架构,这个网络专用于主机和存储设备之间的访问。当有数据的存取需求时,数据可以通过存储区域网络在服务器和后台存储设备之间高速传输。目前常用的SAN结构根据协议和连接器的不同,主要分为两种:一种是FCSAN;另一种是IPSAN。主流的存储阵列由于同时提供光纤通道接口和普通网络接口,因此能够利用FCSAN和IPSAN结构与主机连接。SAN存储主要用于结构化数据的场景。SAN,特别是IPSAN,组网灵活,不受地域限制,存储也相对高效,但其后端安装复杂,价格比较昂贵。大数据时代,在数据急剧膨胀的情况下,集中式存储存在容量扩展不易、性能瓶颈、运维成本高等诸多问题。3.1.2分布式存储相较于传统存储方式,分布式云存储带来了全新的高性能、高扩展、高稳定、高性价比等优势,特别是对于非结构化的数据,分布式云存储具备传统存储不可比拟的优势。分布式存储能够有效地解决传统集中式存储在处理大规模数据时面临的性能瓶颈、可靠性和安全性问题。分布式存储通过将数据分布在多个节点上,实现了数据的冗余备份,提高了数据的可用性和可靠性。即使某个节点发生故障,其他节点仍然可以提供数据访问服务,从而保证了数据的持续可用性。分布式存储具备高扩展性,可以灵活地增加或减少存储节点,以适应数据量基于量子安全的分布式容错云存储应用场景研究4的增长或减少。这种动态扩展的能力使得系统能够轻松应对大规模数据存储的需求,降低了因数据量增长而带来的存储压力。分布式存储通过并行处理和负载均衡等技术,提高了数据的访问速度和系统的响应能力。多个节点同时处理数据请求,可以显著提高数据访问的吞吐量和效分布式存储技术广泛应用于大数据处理、云存储服务、物联网和人工智能等各种需要大规模数据存储和处理的应用场景。云存储是一种基于云计算技术的存储技术,它将数据存储在云服务器上,并通过互联网进行访问和管理。云存储也属于分布式存储技术的一种,它采用分布式存储架构,具备分布式存储的所有特点,同时云存储还提供了按需付费、数据安全和灵活性等额外优势,是一种灵活、可靠、安全且成本效益高的数据存储解决方案。3.2容错技术对于任何一类存储,采用容错技术以保证数据不因节点失效而丢失都至关重要的。实现容错有很多种方式,比如数据镜像技术、纠删码技术,以及秘密共享技术等。数据镜像(也称副本拷贝)技术是一种重要的数据管理和备份方法,它通过创建原始数据的完整副本,并将这些副本存储在不同的位置,以此来保障数据的完整性、可靠性和可用性。这种复制通常是实时的或近实时的,旨在确保在源位置发生故障或需要恢复时,能够迅速地从目标位置获取准确的数据。通过使用专门的软件或硬件工具,数据镜像在源位置和目标位置之间建立一个同步机制,监控和比较源数据的更新。3.2.2纠删码纠删码技术是一种数据保护方法,它将数据分割成片段,并通过编码将冗余数据块扩展、编码后存储在不同的位置,如磁盘、存储节点或其他地理位置。纠删码技术通过创建一个数学函数来描述一组数字,从而可以检查数据的准确性,并且在数据丢失时能够恢复。这种技术最早应用于通信行业,解决数据在传输中的损耗问题,后来被引入到存储系统中,以提高存储可靠性并降低存储成本。纠删码的实现算法有很多种,其中较为常见的是Reed-Solomon算法,它通过计算原始数据的冗余部分,并将这些数据和冗余部分存储起来,以达到容错的目的。当原始数据或冗余数据丢失时,可以通过剩余的数据和冗余部分恢复丢失的数据,量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究5从而保证数据的可靠性。纠删码技术提供了与传统的副本机制相同的容错能力,但能大幅度降低存储成本,因为它的存储开销通常不超过50%,而传统的副本机制通常会有200%的额外开销。秘密共享(SecretSharing)是通过利用密码技术将秘密信息分拆成n个份额,并分发给多个成员,只有阈值数量k(k≤n)个合法成员的份额共同参与才能恢复出原秘密信息。在这个过程中,任何单个参与者或少于k个的参与者组合都无法获得关于秘密的任何有用信息。秘密共享的主要目的是阻止秘密过于集中,以达到分散风险和容忍入侵的目的,是信息安全和数据保密的重要手段,秘密共享可以实现秘密的分散保存和容错存储。秘密共享在容错上的应用具有显著的优势和广泛的应用前景。它不仅能够提高系统的容错能力和安全性,还能够为分布式存储系统、安全协议等领域提供有力的支持。3.3量子安全量子安全(QuantumSafe)是一种能够抵御量子计算等超强算力威胁的信息安全技术。随着量子科技的快速发展,传统的信息安全技术面临着前所未有的挑战,量子安全技术的出现正是为了应对这一挑战。在数据存储领域中,量子安全不仅能够保障数据的机密性和完整性,提高数据存储安全,还能够在节省存储空间、增强数据容错上发挥重大作用。未来随着量子技术的不断进步和应用的不断拓展,量子安全在存储领域的作用将会更加凸显。实现量子安全方式主要分为基于数学方法和基于物理方法两类。随着量子计算的发展,其强大的计算能力给当前许多经典安全协议和密码算法带来巨大威胁和挑战,如RSA、ECC等都很容易受到量子计算的攻击。因此,量子安全技术需要寻找新的加密方法和协议,以确保在量子计算时代的信息安全。基于数学难题的后量子密码(PQC)是指这类密码算法可以抵御已知量子计算攻击,其安全性同样依赖于计算复杂度,但与传统加密算法不同的是,它们在设计时就考虑到了量子计算的威胁。这类算法或协议通过采用新的数学难题或计算模型,使得量子计算无法在短时间内破解。量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究63.3.2基于物理方法基于物理方法的量子安全是指基于量子物理原理实现的经典密码学目标的Distribution)技术,它能够在通信双方之间安全地生成和分发密钥,而无需担心密钥被窃取或破解。本文涉及的量子安全内容主要是指的就是量子密钥分发技术。量子密钥分发(QKD)是一种利用量子力学原理保证通信安全的技术。在经典密码学中,密钥的安全性通常依赖于算法的复杂性和计算的难度,但在量子计算出现后,这种安全性可能受到威胁。而QKD利用量子力学中的不确定性原理和量子不可克隆定理等特性,提供了一种理论上无条件安全的密钥分发方式。目前,QKD已经在一些特定的场景和实验中得到了应用,如金融、政府、军事等领域的高安全通信需求。随着量子信息技术的不断发展,QKD有望在更广泛的领域中得到应用,成为未来保障信息安全的重要手段之一。4分布式云存储应用场景分布式云存储作为一种灵活、可扩展且成本效益高的数据存储解决方案,已经广泛应用于各个领域的多方面的应用场景:比如企业的数据备份与恢复以及资源共享与协作,企业可以利用云存储进行关键数据的定期备份,以防数据丢失或损坏。云备份服务提供了快速恢复数据的能力,减少了因数据丢失导致的业务中断。比如电商平台的商品资料存储与客户数据与订单管理,电商平台需要存储大量的商品图片、视频和描述信息,云存储提供了经济高效的解决方案,支持商品信息的快速检索和展示;云存储用于存储客户的个人信息、购买历史和订单数据,便于企业进行客户关系管理和订单处理。比如医疗行业的患者数据管理和远程医疗服务,医院和诊所将患者的电子病历、影像资料等敏感数据存储在云端,可以实现数据的集中管理和安全共享。医生也可以通过云存储平台访问患者的历史病历和检查结果,进行远程诊断和给出治疗建议。比如教育机构可以通过云存储方式建议教育资源库,可以将教学资料、课件、视频等教育资源存储在云端,供师生随时访问和学习。科研机构可以利用云存储平台存储实验数据、分析结果和研究成果,促进科研数据的共享和交流。比如政府的公民信息管理,政府部门可以将公民的身份信息、社保记录等敏感数据存储在云端,实现数据的集中管理和安全共享。以及智慧城市应用,利用云存储为智慧城市项目提供数据存储支持,如智能交通、环境监测等系统产生的海量数据可以通过云存储进行高效管理和分析。下面就政务、金融、电力、广电、航空、交通、教育、医疗等领域的几个应用场景做个简单介绍。量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究74.1应用场景介绍随着人们生活水平的提高以及公共云建设的推动作用,人们对政府信息资源的获取也越来越重要。国家也制定相应的政策减少行政审批事项,简化相应的审批流程,为了使得居民获得更好的服务,加快政务资源的共享成为政府重点关注的问题。在社会信息化进程不断深入的情况下,云计算技术也在社会的相关领域中得到了较为广泛的应用,也可以说云计算技术是现代化信息技术发展到一定阶段的产物。面对当前数据信息资源不断增加的情况,云计算技术能够有效提高相关资源的利用率,同时也会降低对用户终端性能的要求,在政府应用领域中,以云计算技术为基础的政务云能够更好的帮助政府发挥相关服务的功能,并且应用也越来越广泛。政务云是一种基于云计算技术的平台技术框架,对于政府部门的管理和服务职能,其能够进行有效的优化,并且还能够有效提升政务办理的效率和政府部门的服务水平。政务云能够有效整合和配置政府部门的IT资源,对居民、企业和相关部门而言,可以将这些资源进行共享,这在一定程度上,能够有效提高政府部门相关资源的利用率。从政务云应用的方面来看,其就像处于政府部门底层的一个基础架构平台,能够将传统的政务应用进行迁移,在政务云平台上实现相关业务的办理,并且实现各个部门资源的共享,提高政府的服务效率和服务能力。电子政务云模型如图1所示。数据池数据池节点集群控制中心云端(服务器)用户接口上传/下传数据入客户端客户端客户端客户端客户端图1电子政务云模型[5]电子政务云平台采用分层框架设计,结合了传统的应用系统设计框架和云计算数据存储平台,从整体上看,政务云系统的服务应用架构可以分为服务层、管基于量子安全的分布式容错云存储应用场景研究8理逻辑层以及数据处理层。服务层是一种功能界面,最终呈现在用户面前,主要包含政务公开、信息共享和网络审批的功能;数据处理层是完成政务云中数据的存储,并根据用户的相关请求来处理数据;管理逻辑层主要负责用户登录、管理、任务管理,能够将提前设计好的功能界面呈现给用户,用户通过应用这个功能界面,就能够顺利的完成相关政务业务的办理。政务云平台的总体设计框架如图2所示。服务层—政务公开、信息共享、网络审批服务层—政务公开、信息共享、网络审批数据处理层—数据存储、数据处理管理逻辑层—用户管理、任务调度电子政务云平台中应用HDFS分布式文件系统,对于政务云平台中数据的存储而言,该分布式文件系统能够很好地实现,Web服务器与分布式文件系统集群中的相关结点进行交互,进而能够很好地实现数据的相关管理功能,对于客户端而言,这还能够开放一些应用程序接口,用户在使用客户端的时候,就可以直接通过Web服务器来实现数据的相关操作。政务云平台的建设依靠于数据中心的服务器、存储等资源,采用大数据、云存储、云计算等前沿科技,努力实现电子政务从低效能分散的粗放式建设向高绩效协同的集约化发展模式转变,降低了政务服务的建设成本,全面推进了跨部门、跨层级的业务协同和政务资源信息共享,有效解决了政府间的“信息孤岛”问题,推动了云计算、大数据在政府管理、公共服务、决策等领域的广泛应用,形成了具有特色的智慧政务的良好局面。4.1.2金融科技²随着时代和科技的飞速发展,金融科技企业在日常的业务运营中,会产生大量信息,TB级数据已经很常见,PB、EB级的数据已成为趋势。通过搭建Hadoop大数据平台,对金融科技企业海量数据实施分布式存储,可以提高数据存储性能和数据安全性,为企业节省数据存放成本。海量的业务数据,再加上许多非结构化的数据,传统的关系型数据库已经不能满足存储需求。数据的安全性也非常重要,如果数据仅存在于某个数据库或者某台机器,安全性达不到要求,那么数据的共享程度也不高。为解决这些问题,可以通过在多台大容量Linux服务器上部署Hadoop大数据平台,搭建HDFS分量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究9布式集群环境,对数据文件进行分布式处理,能提高数据的存储效率、安全性、可靠性。在Hadoop大数据平台上,构建Hive数据仓库,在Hive数据仓库中对海量结构化数据进行分析,能满足大数据分析的需求。金融科技企业的大数据Hadoop平台可以为企业发展的提供技术保障,通过大数据平台,也可以对大数据进行分析,挖掘数据潜在的商业价值,进一步推动金融科技企业良好有序发展,为社会创造更大的价值。金融科技企业分布式存储架构如图3所示。其中包括三大核心组件:HDFS、MapReduce和Yarn,分别发挥着各自的功能和作用。Ambari(安装、部署、配置和管理工具)(分布式计算框架)(分布式文件系统)其中,HDFS是分布式文件系统,主要将文件分布式存储在多台服务器上;MapReduce是并行计算编程框架,其作用主要是在多台服务器上实现并行运算;Yarn是分布式资源调度平台,主要是帮助用户调度大量的MapReduce程序,并能够合理地分配分布式运算资源。在Hadoop系统架构中,HDFS是Hadoop生态系统的分布式文件系统,主要负责数据的切片与分布式存储。HDFS可以提供高吞吐率的数据访问服务,在超大数据存储上的应用最为广泛。注2:本小结内容参考文献[6]《大数据分布式存储技术在中小型金融科技企业的应用与推广》[J].中国管理信息化.2021,Vol.24,No.11。4.1.3电力行业3在电力行业中传统存储方式应用范围最广的是SAN和NAS。SAN主要用于存储结构化数据的场景,如数据库部署。NAS相对应用较少,主要用于非结构化数据归档等。随着当前电力数据急剧膨胀的情况下,集中式存储存在扩充容量困难、存取性能低下、运行维护成本过高等问题,目前大多转型分布式存储。分布式存储的实现方式是通过网络整合多个节点的存储资源,构成一个统一整体的数据存储方式、技术和系统。参照分布式架构的CAP理论,系统无法同基于量子安全的分布式容错云存储应用场景研究三个特性。向较于互联网公司主要存储的是类似图片、视频、文件等非结构化数据,其分布式架构更关注于可用性和分区容忍,少量文件的不一致或丢失不会影响系统整体可用的应用需求,电力行业是数据一致性要求极高的关系型数据库应用场景。一方面需要存储节点故障时必须保证不影响系统的继续使用,另一方面要求整个存储系统必须具备高可用性。如图4所示,电力存储系统框架采用目前流行的开源分布式存储CEPH,底层使用RADOS对象存储,客户端块存储IO请求时,I/O路径包括:Librbd—Networking—OSD—FileSystem—Disk,分布式存储系统的性能表现基本能满足需求。客户端客户端RBD服务磁盘磁盘图4电力分布式存储CEPH框架[7]电力分布式存储系统主要采用副本方式来避免节点异常产生的数据丢失,厂商建议和默认副本数为3,虽然支持精简配置,用户也可自行设定副本数量或数据一致性强度,但事实是副本数越多磁盘利用率越低。从信息技术发展来看,分布式架构存储系统较传统存储系统具备先进性。随着硬件技术的不断发展和系统解耦的不断深化,分布式架构和硬件重构在未来存储系统中存在更多发展可能。电力行业信息技术也在不断发展,未来的电力存储系统也需要能深入契合行业应用特点,开拓创新。广电CDN,即广电系统的内容分发网络(ContentDeliveryNetwork),是广电行业为了提升用户体验、解决网络拥塞问题而采用的一种关键技术。它是在Internet上建立的一张面向业务内容的分发网络,该网络能够实时地根据网络流量、网络负载状况、服务器与用户的距离,以及服务请求的响应时间等一系列信量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究息,调整用户的服务中心,将用户的请求引向离用户最近的服务中心,从而使用户可以就近取得所需的内容。当前,分布式云存储的主要技术方案包括Ceph和Swift。Ceph支持块存储、文件存储和对象存储;Swift仅支持对象存储,不支持块存储和文件存储,如要支持对象存储相关应用,需要进行接口对接,部分应用需要重新开发。为满足不同应用的存储要求,贵广网络选择Ceph作为云存储的主要技术方案。基于Ceph的分布式云存储通过在通用服务器上部署分布式存储软件,构建一个开放、可扩展的对象存储系统,其主要由硬件集群层、核心存储系统层、接口层以及应用层组成,系统架构如图5所示。虚拟机创建虚拟机创建文件存储接口x86服务器×8固态硬盘硬件图片、视频等x86服务器×8x86服务器×8对象存储接口块存储接口数据池广电分布式云存储系统采用3副本机制来保证数据的可靠性,即将存储数据切分成固定大小的数据对象,每一个数据对象被复制为3个副本(1个主用副本和2个备用副本),然后按照一定的分布式存储算法将这些副本保存在集群中的3个不同节点。分布式云存储除了适用于CDN存储以外,也适用于广电行业媒资系统存储、BOSS用户影像数据存储、配置备份文件以及日志存储等应用场景。注4:本小结内容参考文献[8]《分布式云存储在广电CDN中的应用》[J].广播电视网络.2023,No.6。当今的航空电子系统已发展为分布式综合化航空电子系统,由专用的大容量存储模块负责数据的存储,其他模块通过机载总线从大容量存储模块中获取或记录数据。因此,对于航空电子系统的分布式存储技术的研究是十分有必要的。综合化模块化航空电子系统由可更换的LRM模块组成,其中包括网络交量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究换模块、图形图像模块、输入输出模块、数据处理模块、电源模块和大容量存储模块,模块之间通过高速的机载总线相连。大容量存储模块提供数据存储服务,其他模块通过机载总线访问存储在大容量存储模块上的数据,如图6所示。大容量存储模块大容量存储模块大容量存储模块电源模块数据处理模块数据处理模块输入输出模块图形图像模块网络交换模块大容量存储模块作为服务器,数据是完全相同的。由主服务器提供数据的访问服务,其他服务器作为备份。航空电子系统的云存储模型是将客户端访问大数据的任务分解成多个较小的子程序,各个子程序通过网络向远程的服务器请求数据的读写;每个服务器为任务提供部分数据;客户端的读写任务最终将子程序读写结果综合,向用户提供最终的读写结果。通过云存储技术,能为航空电子系统提供高速的数据存取服务。航空电子系统的云存储工作原理如图7所示。大数据大数据读写任务子程序…分布式文件系统服务器2服务器n分布式文件系统数据同步——读写请求—---读写结果在云存储系统中,数据在服务器上的存储不再以完整的形式存在,而是被划分成许多的区块,并使用链条的形式串联起来。每个数据块在两个或者多个服务器上都有存储,避免单服务器故障导致数据丢失,可以由多台服务器同时为用户提供数据访问服务,提高了数据访问的速度。云存储系统的数据存储原理如图8量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究数据块N+1N+2数据块N+2数据块NN+1N服务器为了避免单服务器故障造成数据丢失和提高数据的访问速度,同一个数据块必须在两台或两台以上的服务器上同时部署,避免单台服务器故障造成服务器的数据块丢失。航空电子系统的云存储架构是将访问数据的任务进行多机分解,由多台远程服务器协同工作,为系统提供快速的数据访问服务。注5:本小结内容参考文献[9]《航空电子系统的云存储技术研究》[J].电光与控制.2022,Vol29,No.3。随着大数据、云计算、物联网等技术的快速发展,铁路综合视频监控系统规模迅速扩大,现有视频图像系统的规模、架构、系统应用已不能满足新形势的要求,铁路综合视频云存储系统的搭建势在必行。云存储则是一种云状结构的存储系统,通过集群应用、分布式文件等技术,将网络中不同类型的存储设备集合进行协同工作,并通过协议接口对外提供业务访问和数据存储备份等工作。云存储技术能够很好地处理数据冗余和复制,具有良好的可扩展性,可以有效节约成本,提高部署效率。相比于仅含有硬件资源的传统存储,铁路综合视频监控云存储系统架构见图9。云存储系统集合了网络设备、存储设备、服务器、公网访问接口和用户客户端程序等多个部分,其功能结构可分为三层:第1层为存储层,可以由多种不同类型的存储设备构成,由一个统一的管理平台进行管理,用于实现设备虚拟化、多链路冗余优化和设备状态监控及维护;第2层为基础管理层,是最核心的部分,通过集群、网格计算和分布式文件系统,实现存储设备的协同工作,提供良好的设备访问性能,并通过内容分发系统、数据加密技术和多种备份容灾措施,保证数据的安全性、完整性和稳定性;第3层为应用接口层,对外提供各种应用服务。系统采用的是分布式存储Ceph框架,Ceph是一个高度集成的框架,将云存储需要的各个层级进行整合,主要由基础管理层的监视器设备、元数据存储设备和存储层的对象存储设备构成。其中,对象存储设备负责对数据进行存储、复量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究制、转发和恢复,并定时上报给监视器设备;监视器设备负责对集群进行检测维护,对集群中的成员进行管理,并对成员属性相关的信息进行分发,当有新的数据需要进行存储时,会根据对象身份信息和当前存储状态分配存储地址;元数据存储设备主要针对于文件存储,一般情况下不使用。块存储接口块存储接口(物理主机、虚拟机)元数据服务器基础管理层监视器设备元数据存储设备存储层对象存储设备(可靠的、自组织的、可自动修复、自我管理的分布式对象存储系统)文件系统存储接口(直接访问Rados)对象存储接口应用接口层图9铁路综合视频监控云存储系统架构[10]除了直接访问外,Ceph还提供了Radosgw(对象存储接口)、Rbd(Rados块存储)、CephFS(文件系统)等存储接口。Ceph存储容错通常采用多副本备份或纠删码技术方式。随着日益升级的智慧铁路建设,综合视频监控网络化、高清化、智能化开始普及,视频数据的深度应用成为系统发展的未来导向,如何有效存储和高效使用大量视频监控数据,成为了新的研究对象。为此,将云存储、云计算技术引入到铁路综合视频监控系统中来,适应铁路发展的潮流。云存储的推广和应用,可从容量、成本、空间可扩展性、服务可用性、接口通用性、数据可靠性等多个角度,提升综合视频监控存储及应用的质量和效率。注6:本小结内容参考文献[10]《铁路综合视频监控系统云存储技术应用研究》[J].铁道通信信号.2021,Vol.随着车联网体系逐渐成熟,信息存储量也呈指数增长并且信息类型复杂程度增大。因此,在车联网系统中,可靠的数据存储和高效的数据处理是必不可少的。结合车联网数据在实际应用中的特点与需求,为实现海量车联网数据存储和处理目标,同时满足系统对稳定性、实时性和高效性的要求,构建的以分布式存储和处理为主的车联网数据分布式系统总体架构如图10所示,系统划分为数据存储层,数据处理层和应用层。量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究实时查询实时查询交通流热点预测用户行为分析拥堵预测基于内存的并行化计算框架分布式文件系统(HDFS)列存储数据库(HBase)GPS传感器车载传感器摄像头采集其他传感器其中基于HDFS架构实现的高度容错的分布式文件系统,能够提供极高吞吐量的数据访问,适合用于海量车联网离线数据的存储,基于HDFS的车联网数据分布式存储架构如图11所示。注7:本小结内容参考文献[11]《海量车联网数据分布式存储处理系统的设计与实现》[C].福建省电机工程学会论文集.2020.6。4.1.8气象数据近年来,随着气象业务的不断发展,各类气象探测数据和气象产品数据的规基于量子安全的分布式容错云存储应用场景研究模都呈现出快速增长的态势,这不仅体现在数据种类上,也体现在数据的覆盖范围、数据的传输频次以及数据应用与分析规模上。气象数据具有以下几个显著特点:1)观测数据实时存储和长序列大数据集的历史存储需求并存;2)观测数据和产品数据具有并发特性,即数据的存储和数据的访问都会按照固定时次出现峰值;3)数据种类多,内容复杂,结构化(如自动气象站数据)与非结构化数据(如雷达、卫星等)共存;现有的气象信息系统多采用关系型数据库和文件系统相结合的数据管理构架,在有限数据规模情况下可正常运行,但当数据总量始终处于不断扩大的状态时,这种传统的集中式存储架构对于系统的高冗余性、高可扩展性、高并发性和高可用性等方面的需求就会越来越力不从心。与集中式存储相对的是分布式存储,它并不是将数据存储在某个固定的节点上,而是将数据分散存储于多台独立的设备上,使这些设备共同分担存储负荷,它不但解决了传统集中式存储系统中单存储服务器的瓶颈问题,还提高了系统的可靠性、可用性和扩展性。基于HDFS的气象数据分布式云存储存储系统架构如图12基于HDFS的气象数据分布式云存储架构[12]基于Hadoop的HDFS架构分布式存储系统具备高吞吐量、高并发、高容错性、高可靠性、低成本等优点,可满足实现气象数据分布式存储的技术要求,适用于气象数据中典型的非结构化数据,对于解决气象数据目前所面临海量扩张、高并发读写、长序列大数据集数据检索效率等问题有着重要的意义。4.1.9高校数据中心9随着高校信息化的发展,高校各种业务数据越来越多,原有的传统的专用存储虽然能满足数据存储的要求,但随着学校各种业务数据的急剧上升,如教学网络平台生成的课件和学生的作业,校园云平台上快速增加的虚拟机等这些都需要以学校数据中心为例,由于学校部署了校园云自助服务平台和网络教学平台,每年的业务数据增量很大因此每年都要采购专用的存储来满足需求,然而这些专用存储不仅价格昂贵,而且不便于扩展。由于采购的因素限制,学校每次采购的专用存储可能型号不一,导致现有的存储系统之间管理方式不兼容,存储I/O带宽也无法线性扩展,同时配置也很繁琐。专用存储系统可用性和数据持久性不能满足学校教学网络平台和校园云平台的需求,一旦存储控制器故障和硬盘灾难性损坏,数据将不无法保证可用性。基于OpenStackSwift架构的云存储技术具备高可用性,扩展性强,成本低等优势,通过Swift架构组建的校园分布式云存储平台,可解决上述学校数据中心所面对的问题。基于Swift存储技术的校园云存储体系架构如图13所示。RestRest-fullAPI读写数据客户端Swift面向对象的高可用分布式存储最初由Rackspace公司开发,后来作为核心子项目被贡献给OpenStack开源社区。部署Swift分布式面向对象存储只需要廉价的标准服务器和硬盘,并且硬盘无需组建Raid也可以保证高可用性。Swift通过在软件层面引入一致性环形Hash散列技术和数据冗余备份机制来提供强大的扩展性、冗余和高可用性。传统存储的单点故障一直是困扰数据中心管理人员的难题,而Swift架构不存在单点故障,可用性高。Swift架构中并没有单独的元数据节点,所有元数据信息都均匀分布在所有节点上,并且存有副本,这样任何一个节点故障都不会影基于量子安全的分布式容错云存储应用场景研究响到整个存储系统的正常运行。该体系结构在线扩展性强,数据存储容量和性能扩展不受限制,无单点故障,可用性高,无需采购专用存储系统设备,采购成本低,能解决高校数据中心使用专用存储所面对的难题。近年来,随着信息技术飞速发展,医疗与医学研究领域正步入大数据时代,医疗数据的日增长量达到了TB级别。海量的医疗数据蕴含着巨大的价值,构建医疗数据存储平台,实现数据的统一存储与检索,有利于不同医疗机构之间共享数据。医疗数据属于大数据,具有数据来源复杂、结构多样、规模巨大、增长迅速、多模态性等特点。其中,多模态性包括二维数据、图像、视频、文本文档等。然而,在当前医疗服务业务中,获取数据的实时性、存储设备的可靠性及数据分析的准确性仍是亟待解决的三大问题。传统关系型数据库无法存储非结构化数据且受到单机性能限制,无法满足数据存储的需求。而分布式技术以其低成本、高可靠、大容量等优点在存储领域得到广泛应用,为存储海量医疗数据提供了新思路。系统数据存储和管理中心,具有高容错性、高效写入等特点。其集群包括NameNode和DataNode两大组成部分,NameNode负责点,负责存储和检索数据,并定期将存储的块信息发送给NameNode。基于HDFSNameNodeNameNode读元数据块操作量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究分布式技术可实现医疗数据的统一存储与查询,但目前研究仍然存在一些问题。例如,医疗数据中包含大量患者隐私信息,而目前的存储方案均未很好地考虑数据隐私保护问题。注10:本小结内容参考文献[14]《分布式医疗大数据存储方案研究综述》[J].软件导刊.2022,Vol.21,No.4。4.2应用场景总结综合以上介绍的各领域的多个应用场景可以看出,当前实现分布式云存储的架构技术主要包括DHFS、Ceph和Swift。我们分别介绍如下:4.2.1DHFS架构11HDFS(HadoopDistributedFileSystem)是Hadoop项目的核心子项目,是专为大数据环境设计的分布式文件系统,HDFS分布式云存储架构如图15所示。HDFS架构采用Master/Slave方式,主要包括客户端(Client)、NameNode(NN)、DataNode(DN)和SecondaryNameNode(SNN)四个核心组件。客户端是用户与HDFS交互的接口。它负责将文件切分成多个数据块(Block),与NameNode交互获取文件的位置信息,以及与DataNode交互进行数据的读写操作。客户端还提供了一些命令来管理HDFS,如启动或关闭HDFS,以及通过命令访问HDFS。NameNode是HDFS的管理者,也被称为元数据节点。它维护着整个HDFS的命名空间(文件目录树)和数据块映射信息。NameNode管理HDFS的名称空间,包括文件名、目录结构,管理数据块映射信息及副本信息,即文件被分割成的数据块及其存储位置以及处理客户端的读写请求,指导客户端如何与DataNode交互。NameNode是整个Hadoop集群中至关重要的组件。DataNode是实际存储数据块的节点,是HDFS中的从节点(Slave),负责存储实际的数据块,并根据NameNode的命令执行数据块的读写操作。周期性地基于量子安全的分布式容错云存储应用场景研究向NameNode发送心跳信息和块信息,报告自身的状态和数据块信息。与其他DataNode同步数据块,以达到数据副本数的要求。SecondaryNameNode主要是辅助NameNode进行元数据的合并操作。通过数据块多副存储方式,DHFS架构具备高备高扩展性(可动态扩展集群节点)、适合大数据处理、低成本运行等优点。DHFS架构不适合低延时数据访问、小文件存取、并发写入和文件随机修改等场景。作为主流架构之一,HDFS架构可以为大数据环境提供高效、可靠的数据存储解决方案。4.2.2Ceph框架12Ceph是一种性能优越、可靠性高的分布式云存储系统,也是当前热门的开源云存储架构之一,具有良好的可扩展性,可轻松扩展至PBCeph作为开源项目,从最初发布到逐渐流行,已经发展了近十年。当前在Openstack社区,Ceph是最受欢迎的开源存储项目,且国内外知名厂商如Intel、Cisco、Dell、华为等,均采用Ceph作为存储方案。与HDFS的间接通信不同,Ceph不存在中心节点,Ceph是典型的完全无中心架构,不同于传统的存储架构,没有主控制器,因此扩展性较高,并且整体集群性能会随着节点数量的增加而线性增长。Ceph使用CRUSH算法是一种基于随机分布、复制的选择算法,可以很好地实现集群容灾域隔离、数据的副本规则,以及跨机架、机房的感知等。Ceph集群中可以自定义数据的副本数量,并支持指定副本数据存储在不同物理节点及故障域上,在单节点或单机架发生故障时,Ceph通过CRUSH算法对损坏的数据在其他正常运行的节点进行自动重建,从而保持数据的高可用。Ceph作为主流的分布式统一存储技术,支持块存储、文件存储、对象存储基于Ceph分布式云存储架构如图16所示。底层为RADOS(ReliableAutonomousDistributedObjectStorage)集群,由大量的存储节点组成对象存储系统。当Ceph集群数据读写时,CRUSH算法先确定存储位置,RADOS再以对层RADOS的逻辑,在Ceph上直接调用LIBRADOS层API进行开发即可。LIBRADOS层之上为应用接口层,提供RBD、CephFS和RadosGW,分别对应块设备、文件系统、对象存储的应用,使Ceph集群可以同时满足不同业务需求的对象存储访问,基于RBD的云主机访问和基于CephFS的文件存储等。随着分布式存储技术的日益成熟,传统存储业务应用部署已经向分布式存储上迁移。从项目实际建设总结,基于Ceph的分布式存储架构具备高可靠性和高可用性,以及丰富的数据访问方式,可提高了集群存储效率,节约了项目建设成本,是分布式数据存储较好方案。注12:本小结内容参考文献[16]《基于Ceph的云存储系统的设计与实现》[D].电子科技大学.2023.06。4.2.3Swift框架13作为云存储系统之一的对象存储系统Swift框架具有扩展性强、无单点故障、简单可靠等特性,因其能够较好的满足海量数据存储的需求而被广泛应用。Swift分布式存储系统最初是由Rackspace公司开发的项目,该公司在2010年将其贡献给OpenStack开源社区作为子项目之一,十余年间,基于Swift框架的技术研究也在不断发展进步。Swift存储系统是云环境下的分布式对象存储系统,它向用户提供整个对象的访问,不提供对原始数据块的访问服务或基于文件的访问。在Swift存储系统中,用户可以通过类似基于HTTP协议的URL的SwiftURL对系统进行操作,类似于使用浏览器访问web服务器。对象存储不直接提供数据的存储位置,而是将其抽象成URL,在扩展系统规模时,不影响数据的存储位置,使得对象存储能够在较低成本下实现大规模和高并发。随着系统规模的和扩大,对象存储系统仍然能够提供单一的命名空间,且不需要将数据分块存储到不同位置,用户不需要关心底层存储系统的情况,极大的减少了运维成本。Swift存储系统的总体结构可以分为两层:访问层和存储层。量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究访问层主要包括代理服务、认证服务和缓存服务。代理服务对外提供对象服务API,作为客户端与后端存储服务的桥梁,并转发客户端请求至相应的账户、容器或对象服务;认证服务提供用户身份信息的认证和授权;缓存服务缓存令牌、账户和容器信息,可以提高数据访问速度,减少后端存储服务的压力。存储层由存储服务器组成,负责存放实际数据。容器服务提供容器元数据和统计信息;对象服务提供对象元数据和内容服务,每个对象以文件形式存储在文件系统中。复制服务负责检测本地副本和远程副本是否一致。基于Swift分布式云存储架构如图17所示。访问层访问层验证服务存储层Auditor缓存服务AuditorAuditorSwift的架构设计充分考虑了分布式系统的复杂性和挑战,通过合理的组件划分和高效的数据管理机制,实现了高可用、可扩展和容错的云存储服务。无论是从逻辑架构还是物理部署架构来看,Swift都展现出了其作为云存储解决方案的强大实力和灵活性。注13:本小结内容参考文献[17]《基于Swift的存储技术优化与研究》[D].四川大学.2021.04。4.2.4总结及改进思考当前主流的几种存储架构技术有着各自的特点:HDFS架构适合存储大文件,如G级、T级文件。HDFS通过元数据进行文量子科技产学研创新联盟基于量子安全的分布式容错云件管理,元数据包括目录信息和存储块信息,是占用管理节点NameNode内存的,如果应用于小文件的存储,会产生大量的元数据,耗费内存,导致系统性能下降。HDFS适合低频写入,并行读取。HDFS一次只允许写入单个文件,不支持动态修改文件,要求让文件一次写入就不再变化,要变化只能在文件末尾添加内容。HDFS适用廉价PC设备。多副本的存在提高了存储的容错和恢复机制,使得HDFS可以应用于普通的PC设备上,相较于传统的中心式存储,降低了对单机设备的硬件要求。存储的文件类型上,文件存储适用HDFS。元),完成数据的写入,一份数据写多个副本。保持数据的强一致性。设读操作需要读取的节点数为R,写操作需要更新的节点数为W,数据复制的份数为N。论)。统一存储(块/对象/文件统一体)适用Ceph。支持无单点故障。Swift的元数据的存储地址每个节点的地位是平等的,处理存储的方式是一致的,保证了其具有强大的容错性。相较于HDFS中的单一故障点NameNode,Swift具有更好的容错能力。扩展性。Swift的架构是完全对称的,可以通过新增设备来实现线性提升,系统会自动处理数据迁移,使各服务节点达到新的平衡。数据强一致性。Swift默认配置是N=3,W=2,R=2。这里R=2,代表同时读取两个节点的元数据,然后比较时间戳以确定新旧版本。如果两个节点的数据出现差异,后台进程会进行数据同步,确保数据的强一致性。对象存储综合上述,可根据应用场景和具体的存储需求选择部署适合的存储架构。几个主流的分布式云存储系统框架也都存在共性,比如分层设计,并且分层结构基本一致,各层都提供对外接口,各层中功能模块化等通用特性,这就使得对基于这些分布式云存储系统框架而实现的应用系统进行二次开发和优化提供了可能。5基于量子安全的分布式容错云存储随着云计算技术的发展,数据存储也已进入云存储时代,分布式云存储是数据存储的研究热点之一。然而,随着越来越多的个人和企业将敏感信息委托给云服务,数据安全和隐私变得至关重要。数据泄露或未经授权访问的潜在后果是严重的,从经济损失到声誉损害。面对众多的网络威胁和复杂的攻击技术,需要强有力的安全措施来应对防范这些风险。量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究我们一直从事量子安全方面的研究,在量子技术尤其是QKD具有深厚的积累。我们希望探索除了将QKD应用于传输安全之外,是否能够5.2方案设计加强数据云存储安全的一个十分有前景的研究方向就是利用了量子通信技术的潜力。量子通信特别是量子密钥分发(QKD),提供了以量子力学基本原理量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究5.2.2纠删技术实现数据的完整性与容错性为保证数据可用性,数据容错机制对于保证云存储可靠性十分关键。目前最广泛使用的是副本冗余策略,如GPFS,HDFS,GlusterFS,Ceph等都提供这种副本冗余容错策略。另一种容错机制是纠删码技术。相较于副本镜像备份存储方式纠删码技术可以大大减少了存储成本。纠删技术是一种实现数据冗余存储的技术,从而实现数据的完整性和容错性。纠删技术的原理基于信息冗余和容错编码思想。具体来说,就是把原始数据分割成多个数据块,然后通过编码矩阵计算得到冗余块,这些数据块和冗余块分散存储在不同的位置,比如不同磁盘、存储节点或者其它地理位置,以实现更安全的冗余存储。纠删技术具备高容错、可扩展、高效率等特点。通过较小的冗余块实现高可靠的数据恢复。调整冗余度,可以适用不同备份存储要求。纠删码之前在通信中应用广泛,这些年被高度关注在分布式云存储应用中,纠删码技术在分布式云存储中的应用会越来越广泛。5.2.3秘密共享增强用户对密钥的分散存储及数据的管控密钥尺寸相较与加密数据是非常小的,这非常适合采用Shamir秘密共享机制对密钥实施保护和分散存储。密钥分为认证密钥和数据加密密钥,我们用认证密钥保护数据加密密钥,然后对认证密钥实施Shamir秘密共享,并对生成的份额进行分散存储。只要保证外部分散存储的份额总额不足于阈值,密钥就是绝对安全的。用户保留的既不是数据加密密钥,也不是认证密钥,而是认证密钥的部分份额,这样大大降低了用户保存密钥的安全等级和风险,也大大增强了密钥的安全性。秘密共享技术不属于云存储方式,它本质上是一种将秘密分割存储和安全共享的方法,具备信息论安全性特点。通过秘密共享,也可以实现用户(单用户和多用户应用场景)通过对密钥份额的分发而实现数据共享,从而实现数据拥有者对加密数据的管控。本方案考虑融合当前可用的技术,如采用公认的信息论安全的密钥分发技术 (QKD)和公认的量子安全的加密算法(对称密码算法),信源和信道加密密钥来源于量子密钥分发网络和本地量子随机数,实现高安全的数据机密性和传输信道间的隔离性,确保信源及传输安全。方案整体上实现基于量子安全的一体化分布式云存储安全。2021年,日本团队曾发布过一篇关于采用Shamir秘密共享的量子安全分布式数据云存储方案,并在东京QKD网络上运行演示验证[2],包括这个日本团队在其他研究文献里的一些工作[1][3],方案均采用Shamir秘密共享方法处理保护数据。这种处理方式需占用大量的云存储空间资源,极大地限制了方案的实用性。我们对于采用QKD、Shamir秘密共享、纠删处理等多方面技术如何与分布式云存储如何有效融合利用进行了研究。Shamir秘密共享机制更适用于密钥的分散存储,而对于加密数据采用纠删方案或镜像备份方式实现冗余存储更合适。5.3.1三种存储方案的比较14秘密共享、镜像备份和纠删码技术三种存储方案有各自特点,从数据机密性、数据可用性和存储效率三个角度分析如下:首先,从数据机密的角度来看:假设源数据是加密的,加密算法是安全的,不能通过量子计算等方法破解,那么三种方案的安全性是相同的。如果数据源未加密,则三种方案的保密性存在差异。设单个存储节点的数据泄漏概率为p(p《1)。在镜像方案中,完全数据泄露的风险是p乘以副本数量,以复制3个副本为例,这意味着风险将至少增加到3*p。在基于秘密共享和基于纠删码方案中,设k是阈值,n是数据块的总数。数据完全泄漏的风险是,在p较小的情况下,秘密共享和纠删方案都具有优势,秘密共享方案中的每个数据块都具有不泄露部分信息的信息论安全性,而没有源加密的纠删方案会泄露每个数据块的部分信息。因此,从数据机密性的角度来看:秘密共享方案>纠删码方案>镜像备份方案。从数据可用性的角度来看:设单个存储点损坏的概率为q(q《1)。在镜像备份方案中,数据不可用的概率是q*备份数。在秘密共享和纠删码方案中,数据不可用的概率为,这意味着超过n-k个存储点损坏的所有可能情况的总和。因此,镜像备份方案的鲁棒性强于秘密共享和纠删码方案。因此,从数据可用性的角度来看:镜像备份方案>纠删码方案=秘密共享方案。从存储效率的角度来看:镜像备份是数据的完全拷贝复制,秘密共享并不会减少秘密份额的尺寸,而纠删码方案只会增加一些冗余块尺寸,存储空间利用率高。因此,从存储效率的角度来看:纠删码方案>镜像备份方案>秘密共享方案。三种存储方案比较见表1所示。★★纠删码方案注14:本小结内容参考文献[4]《Quantum-securefault-tolerantDistributedCloudStorageSystem》[J].AIPAdvances量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究5.3.2基于量子安全的分布式容错云存储架构方案在现有的分布式数据云存储系统(诸如DHFS/Ceph/Swift等)基础上,主要关注三个方面的改进和增强:在上层应用的密钥管理上加入秘密共享机制以实现密钥的保护、分散存储及权限分配;在系统层数据存储上选择以纠删技术为主或以纠删码和镜像备份相混合策略的容错存储策略,实现数据容错机制。系统整体上支持基于量子的安全保障,QKD网络通过系统各层接口为分布式数据云存储系统提供安全密钥,在系统的各个层间传输实现QKD安全通道,实现应用数据安全、数据传输安全和数据传输通道间的隔离。基于量子安全的分布式容错云存储架构如图18所示。客户端APP秘密共享应用层低速处理硬件层分布式云存储系统各类接口库系统层5.3.3应用层密钥秘密共享及数据预处理单用户应用场景秘密共享可以实现秘密的安全拆分和安全存储。考虑到秘密份额的存储空间的利用效率,秘密共享更适合用于小尺寸数据比如密钥的秘密共享。在单用户场景下,通过在存储系统的应用层中增加密钥秘密共享机制,可实现对用户密钥的分散存储和安全备份。数据的预处理包括了由秘密共享生成的子量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究密钥份额插入密文,与密文同存保护的过程。a)用户数据上云处理流程描述如下:1、用户获取量子安全密钥K和R(由QRNG生成的量子随机数),其中K加密用,R认证用,同时R也作为K的密钥加密密钥。2、用户准备待加密的明文数据D。3、用户使用密钥K加密数据D形成密文数据E。4、用户使用K与R异或生成数据KR。5、用户使用R生成随机数n1,nl∈[0,maxlen(E)],maxlen(E)为密文E的最大长度。6、用户采用Shamir秘密共享(3,4)方案,设k=3,n=4,构造密钥R的秘密份额R1、R2、R3、R4(秘密份额4份中取3份即可重构出密钥R)。用户自己保留2份,例如R1、R2(保证用户手里保留秘密份额的大部分),R3、R4分散到外部保存。7、用户使用秘密份额R1与R2异或生成R12,由R12生成随机数n2,n2∈[0,maxlen(E)],maxlen(E)为密文E的最大长度。8、按值n1位置将KR插入密文E中,形成数据E’。9、按值n2位置将R3插入数据E'中,形成数据E"。10、用户用密钥R对数据E"进行完整性校验,计算所得值M,接入数据E"尾部,形成数据N,N=(E"|M)。11、R4与n2合并形成数据R'4,R'4=(R4|/n2)。用R1对R'4做完整性校验生成M14,用R2对R'4做完整性校验生成M24。M14和M24与R'4合并,形成数据B,B=(R'4||M14||M24)。12、用户将数据N与数据B发送给云存储系统,数据N由云存储系统纠删处理后上云分散存储,数据B作为备份数据由云存储系统本地保存。数据通信采用加密传输,由QKD网络保证,实现网络数据的量子安全。比如可采用QKD+OTP方式可实现ITS安全。13、用户将K、R、KR、R3、R4、R12、n1、n2等所有过程数据只保留R1、R2,用户需保证秘密份额R1和R2的安全,至少要保证R1和R2不能同时丢失。数据上云的密钥秘密共享及数据处理操作流程如图19所示。量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究1、1、QRNG生成加密用密钥K和认证用密钥RRK10、用R对数据E"进行完整性校验,计算得M值,接入E"尾部,形成数据N5、用R生成随机数n1N(数据B作备份用,平时不需取回秘密份额R1、R2、R3、R412、数据N和数据B发送给纠刑服务器,数据N经服务品纠删处理后上多云存储,数据B由纠删服务器本地保存11、R4与n2合并形成数据R4,用R1对R4做完整性校验生成13、用户删除K、R、R3、R4、nt、n2,只保留R1、R2,且用户只要保证R1和R2不同时丢失即可BM14,用R2对R'4做完整性校验生成M24,与R4合并,形成数据BKR=(KOR)KRKR8、按n1位置将KR9、按n2位置将R3插入密文E,形成数插入数据E',形成成随机数n26、将R按Shamir(3,4)秘密共享方案(k=3,n=4),生成2、用户提供数据D3、用K对数据D加密得密文ER云存储系统4、K与R异或生成KR(用户保留)DBEE图19单用户场景的数据上云处理过程b)数据下云(数据恢复)普通情况处理流程描述如下:N。Shamir秘密共享SS(3,4)方案(t=3,n=4)重构出原秘密,即认证密钥R。相等执行下一步操作,不相等则操作终止。数据下云(数据恢复)普通情况的密钥秘密共享及数据处理操作流程如图20所量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究云存储系统REE图20单用户场景的数据下云处理过程(普通情况)c)数据下云(数据恢复)特殊情况处理流程描述如下:下,用户向云存储系统中的服务器请求数据N,同时也请求服务器本地保存的备得值M'24,M'24与数据M24比对,相等执行下一步操作,不相等则操作终止。R3、R4与用户手里的R2按Shamir秘密,即认证密钥R。对,相等执行下一步操作,不相等则操作终止。形成新的密文E'。10、用户使用K对密文数据E'解密,恢复明文数据D。数据下云(数据恢复)特殊情况的密钥秘密共享及数据处理操作流程如图21所示。量子科技产学研创新联盟基于量子安全的分布式容错云存储应用场景研究用户E存储系统2EE图21单用户场景中数据下云处理过程(特殊情况)在多用户场景下,存储系统的应用层中增加密钥秘密共享机制不但可以实现用户密钥的分散存储和安全备份,而且通过系统层中服务器端的配合,还能够实现数据拥有者对数据共享用户的授权和共享数据的管控。代理重加密是当前数据共享的一种通用方法,在多用户场景下,可以使用基于秘密共享机制的代
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 造雪机租赁合同协议
- 韩式餐饮采购合同协议
- 管理经验入股协议书
- 食品测试委托协议书范本
- 矿产手续转让协议书
- 装修违约赔偿协议书
- 项目合作免责协议书
- 剧团展演安全协议书
- 运输货车租聘合同协议
- 律师案源合作分成协议书
- 会计师事务所考勤和日常工作管理制度
- 置景合同模板
- 2024年医学高级职称-心血管内科(医学高级)考试近5年真题集锦(频考类试题)带答案
- 2024年山东省青岛市中考语文试卷(附答案)
- 医院培训课件:《肛肠科无痛病房建设》
- 食品公司品控部工作管理手册
- 人教新目标八年级上册英语Unit 10 If you go to the party,youll have a great time!Section B-说课稿2
- 2024新高考I卷全国统一考试高考生物试题(真题+答案)
- 河北省石家庄市新华区2023-2024学年七年级下学期期末数学试题
- 湖南省邵阳市2024年八年级下学期英语期末质量检测卷附答案
- QBT 3888-1999 铝合金窗不锈钢滑撑
评论
0/150
提交评论