版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据上链的原则与方式由于区块链技术众所周知的不可篡改的特性,很多人就将区 块链作为一个数据库来使用,在传统项目进行区块链改造的过程 中,将所有本来存入传统RDBMS (关系数据库)的数据,全部改 成存入区块链中,以为这就是区块链项目了。实际上,在对传统 项目进行链改的过程中,由于区块链的特殊特性,并不能作为传 统数据库使用,而是要将关系数据库、区块链结合,进行业务分 析,将能上链的,有必要上链的数据进行区块链上链改造。那么到底哪些数据适合上链,哪些数据不适合上链,到底用 什么方式上链?一、哪些数据不适合直接上链1、大文件不直接上链比如视频、图片等。主要是因为区块链作为一种分布式账本 技术,在多
2、个节点(甚至所有节点)都在本地存储了区块链完整 的历史数据。如果将1GB的视频直接上链,那么这个视频将会在 每个节点都占用1GB的磁盘空间,而且一旦上链是无法删除该交 易的,所以还不能去删除该数据,强行删除将会导致区块链数据 不完整,新节点加入同步并检查历史账本数据时将会因为数据丢 失而校验失败。所以一般来说区块链都会限制交易的大小和区块 的大小,比如要求每个交易不能超过1 MB,每个区块不能超过 8MB,从而杜绝大文件直接上链导致的磁盘急剧膨胀的问题。如 果的大文件有上链的需求,可以采用哈希上链的方式,要么直接 计算哈希值,然后将哈希上链,要么结合IPFS去中心化存储技 术,将大文件存储到I
3、PFS网络中,然后IPFS会给出一个特殊的 哈希值,将该哈希值上链。2、机密、敏感数据不直接上链比如合同内容、订单内容。因为的区块链账本是分布式存储 在各个节点的,所以如果将机密敏感的数据直接上链了,那么所 有节点都会同步到上链的数据,在他们本地节点就可以查看上链 后的敏感机密信息。如果有上链的需求,可以将数据存储在私有 的数据库或者IPFS中,然后哈希上链,也可以通过密码学的方 法进行加密,然后密文上链。3、大量、冗余重复的数据不直接上链比如系统日志。一般系统日志如果开到DEBUG级别,每秒几 千几万笔日志记录是很正常的,而且这些日志的价值信息很低, 基本都是很细节的,冗余重复的日志。而区块
4、链本身是一个性能 有限的网络,一般TPS都是在千级别,能做到上万TPS的都已经 是很厉害的了。而如果将大量冗余重复的数据上链,那么将会占 用大量带宽,导致真正有价值的数据淹没在日志交易中,排队等 待打包,从而影响正常业务的运行。而且大量日志上链也会导致 区块链磁盘占用快速膨胀,对所有节点的存储也是挑战。如果有 日志上链的需求,一般可以按批次,将日志进行IPFS存储、计 算哈希,或者通过一种叫KSI (无密钥签名基础设施)的方式, 对批量日志建立哈希树,将哈希根上链。二、哪些数据适合上链1、有价值含义的数据上链比如积分、票据、礼品卡、游戏金币、游戏道具等。区块链 天然可用于构建价值网络,在区块链
5、中可以很容易的支持通证 (Token)的创建、流转、销毁等操作。一般通证分为两种:同 质化通证(fungible Token)和非同质化通证(NFT全称是non- fungible Token)o通证并不是公有链独有的技术,在联盟链 中,也可以通过合约实现这两种通证。同质化通证用于表示同一种类型的,彼此没有区分的价值符 号,比如你有1000个国航里程积分和我有1000个国航里程积分 是没有区别的,都可以去兑换相同的礼品,其价值是一样的。所 以某商家的积分、某游戏金币都可以用同质化通证在区块链上实 现。非同质化通证用于表示彼此之间有区别,具有唯一性的符 号。比如游戏道具,不同的道具可能具有不同的
6、属性,从而在游 戏中具有不同的表现。对于这些有价值,而且可以看得出来是有流通需求的数据, 就可以用通证来表示。2、有共享需求的数据上链比如黑名单共享。行业中经常有数据共享的需求,比如在银 行之间希望能够共享信用黑名单,如果在一个人在某个银行失 信,进入了银行的黑名单,那么其他银行肯定也不愿意贷款给这 个人。于是银行之间可以建立区块链,每个银行将黑名单共享到 区块链中,利用区块链共享账本的特点,所有上链数据同步到每 个银行的区块链节点中。当然出于隐私保护和法律法规的要求, 不会直接明文上链,可以通过一些密码学的方法,将黑名单数据 在各个银行之间共享,同时也保证不泄露更多隐私信息。3、有协同处理需
7、求的数据上链比如商品溯源。一件商品从生成出厂到后面经过总经销商、 分销商、各个物流公司、零售商才会到达消费者手中,如果是跨 境贸易,那么中间还会经过海运、海关等环节,中间经手的环节 多,参与方又是独立的不同的公司和政府部门,所以想要知道每 件商品到底经过了哪些环节,每个环节花费了多久的时间,从而 进一步的优化流程;消费者想要知道购买的商品是否是仿冒品, 中间经过哪些环节,那么就需要将物品的溯源做好。商品溯源的 一大难点就在于中间经手的环节太多,而且是不同的公司,所以 一个中心化的系统很难处理。而区块链分布式账本的特点,可以 为每个环节的公司和政府部门建立节点,他们只需要将自己的系 统对接本地的
8、区块链节点,在业务流转过程中,通过区块链实现 各个环节公司的协同。4、有审计要求的数据上链比如核心数据操作日志。在传统中心化系统中,将商家评 分、消费者评价、企业信用评估分等存储到数据库中,平台系统 根据数据库中的数据决定是否优先展示,是否给予批贷款等,所 以这些数据是非常核心,非常重要的。真是由于这些数据的重要 性,所以也带来了一种黑产:修改信用评分、删除差评等。究其 原因是因为中心化数据库系统中的数据是可以被修改,可以通过 系统漏洞或者行贿数据库管理员,由管理员修改了核心数据。而 采用区块链技术,将核心数据上链,基于区块链不可篡改的特 点,即使是IT管理员也无法篡改这些上链数据。所有修改都
9、会 留痕,并被审计,所有黑客攻击篡改行为和内部人员的数据修改 行为都无所遁形。三、数据上链的方式1、原文上链这种主要适用于只上链一个字段的情况,比如做了一个许愿 的DAPP,就是用户将自己的心愿写到区块链上,而这个心愿可能 就是几个字,也可能是长篇大论,但不管怎么样,他可以认为就 是一个文本字符串,而的上链操作就是将整个字符串直接上链存 储。2、格式化后上链这种主要适用于业务数据上链的场景,比如企业要将自己生 成的所有产品上链,而产品本身具有很多属性,比如:材质、总 量、类型等等。企业可以将产品的所有要上链的属性构建成XML 对象或者JSON对象(个人更推荐使用JSON对象),然后将格式 化(
10、序列化)后的产品对象上链。不推荐使用protobuf、rlp等 数据库不支持的序列化方法,一般很多NoSQL数据库是支持JSON 对象的索引的,所以如果存入的是JSON对象,那么还可以直接 对存入的对象进行各种条件的检索。3、哈希摘要上链这种主要用于文件上链的场景。前面说到,区块链不适合将 大文件直接上链,而哈希算法可以将大文件计算出一个固定长度 的摘要。(比如SHA256算法,算出来32字节的摘要)使用哈希 摘要可以保证原始数据不会被篡改,因为文件一旦被篡改,那么 算出来的哈希值和链上的哈希值不匹配。而为了预防文件存储在 某个服务器硬盘上,万一服务器硬盘坏了,那么数据就永远丢失 了这种情况,
11、可以采用IPFS这种分布式存储技术IPFS负责将 大文件切割成很多个小块,然后将小块分散存储在多台服务器 中,从而避免了单机故障造成文件丢失的可能。同时IPFS在文 件分割和存储的同时,也会计算出一个哈希摘要,可以将该哈希 摘要上链(可能还需要对哈希进行加密),在获得文件准确的哈 希值,就可以通过IPFS获得原始文件。4、加密后上链这种上链方式好主要适用于不希望其他方看到的机密敏感数 据。加密一般采用对称加密,而加密的密钥每个文件都不一样, 可以将密钥用上链方的公钥进行加密,这样只有私钥持有方才能 解密出对称密钥,然后再用对称密钥解密链上数据。为什么不直 接用数据持有者的公钥加密呢?因为一方面
12、对称加密的性能远远 高于非对称加密,另一方面,如果希望将某个链上数据共享给另 一方,那么他只需要解密对称密钥,然后将该密钥用对方的公钥 加密上链,这样对方就可以使用自己的私钥解密出对称密钥,然 后用对称密钥解密出文件。四、数据上链为带来什么安全优势1、所有上链数据基于密码学数字签名,上链数据不可被第三 方篡改,不可抵赖这是基于区块链交易的基本特性,数据要上链就得通过交 易,而交易要被广播和打包到区块中,就必须要有数字签名。而 数字签名保证了交易数据无法被第三方篡改,也保证了上链数据 必然是私钥持有者签名的,不可伪造,不可抵赖。2、基于多参与方的共识算法,防止单方面作恶,修改自己链 上历史数据区
13、块链作为分布式账本,在记账时,需要多方进行共识,只 有共识通过才会被记账,而无论采用哪种共识算法,都需要保证 单方或者少数节点的作恶行为不会影响整个链的数据。而基于区 块链的链式数据和区块头中包含区块所有交易的默克尔根的特 点,保证了历史数据无法被篡改。这里的无法篡改和基于签名的 无法篡改是两种情况。数字签名保证的是原始数据不会被第三方 篡改,但是如果一个文件只是由我用自己的私钥签名了,那么我 是可以修改文件的内容,然后再用我自己的私钥重新签名,生成 一个新的合法的签名文件的。而区块链的共识算法就是如果我已 经把A文件签名并上链了,那么我自己都不能把A文件改成A1后重新签名,神不知鬼不觉的把A替换成新的A1。3、基于分布式技术,每个节点具有完整全账本,防止单机故 障和数据丢失因为上链的数据具有多个副本,每个全账本节点都保留了完 整的区块链数据,所以不存在单机故障导致整个区块链网络无法 正常运行或者因为硬盘故障导致链上数据丢失的可能性。4、基于联盟链的节点准入、TLS加密通讯、通道隔离等技术,保证了数据的传播范围可控,防止数据被窃取这里主要说的是联盟链技术,联盟链属于许可链,和开发的 任何人都可以访问的公有链相比,联盟链是受限访问的,即使联 盟链节点部署在互联网中,但是由于节点准入的限制,并不是任 何人下载了节点运行的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海旅游高等专科学校《Android 程序设计》2025-2026学年第一学期期末试卷(B卷)
- 上海政法学院《安全生产与环境保护》2025-2026学年第一学期期末试卷(B卷)
- 上海戏剧学院《阿拉伯国情》2025-2026学年第一学期期末试卷(B卷)
- 上海电力大学《安全人机工程》2025-2026学年第一学期期末试卷(A卷)
- 儿童慢性咳嗽题库及答案
- 护理管理中的协调管理
- 上海现代化工职业学院《安全科学与工程导论》2025-2026学年第一学期期末试卷(A卷)
- 上海现代化工职业学院《AutoCAD 绘图》2025-2026学年第一学期期末试卷(A卷)
- 上海海洋大学《安装工程计价》2025-2026学年第一学期期末试卷(B卷)
- 上海海洋大学《AutoCAD》2025-2026学年第一学期期末试卷(B卷)
- 企业微信报销审批制度
- 放疗治疗知情同意书
- 2026年两会政府工作报告精神宣讲《聚焦两会关注民生》
- 社区日常巡查监督制度
- 《2026年》医院行政岗位高频面试题包含详细解答
- KDIGO慢性肾脏病贫血管理临床实践指南(2026年)解读课件
- 慢走丝合伙合同范本
- TCECS 1418-2023 锚固螺栓现场检测技术规程
- TCECS 1417-2023 预埋件现场检测技术规程
- 事业单位护理学知识题库及答案解析
- 《中西医协同老年健康状态评估指导》
评论
0/150
提交评论