“数据可得性”和“数据可得性问题”指的是一些区块链扩容方案所面临一个问题。具体来说,就是当新的区块创建时,节点如何确保该区块中的所有数据都已发布到网络上?困难之处在于,如果区块生产者没有公布区块中的所有数据,就没人能发现该区块中是否隐藏了恶意交易。
在本文中,我将深入探讨数据可得性问题的重要性,以及相关解决方案。
区块链节点是如何运行的?
区块链上的每个区块都由两部分组成:
区块头,即,区块的元数据,由一些关于区块内容的基本信息组成,包括交易的默克尔根。
交易数据,即,区块的主要组成部分,由实际的交易数据组成。
区块链网络中主要有两类节点:
全节点。这类节点会下载区块链中的每笔交易并验证其有效性。这需要消耗大量资源和数百GB的磁盘空间,但是这些节点的安全性最高,因为它们不会接受包含无效交易的区块。
轻客户端。如果你的计算机没有足够的资源来运行全节点,你可以运行轻客户端。轻客户端不需要下载或验证任何交易。它们只下载区块头,并认定区块中包含的交易都是有效的。因此,轻客户端的安全性低于全节点。
区块链赋能自媒体/多媒体数据可信管理相关国际标准在ITU-T成功立项:2月18日消息,2022年1月17-28日,国际电信联盟第十六研究组(简称ITU-T SG16)召开全体会议,来自中国、美国、英国、韩国、日本等国家和世界卫生组织等国际组织的百余名代表参加了在线会议。由中国信息通信研究院指导,由北京邮电大学牵头,共同提出的《基于区块链的多媒体数据分发系统参考架构》国际标准项目立项建议获得通过,这也是国际上首个区块链技术在自媒体/多媒体数据资产共享与管理领域应用的标准。[2022/2/18 10:00:19]
幸运的是,有一种方法可以让轻客户端间接检查区块中的所有交易是否有效。轻客户端可以依赖全节点向其发送关于无效交易的?欺诈证明,无需自己检查交易的有效性。欺诈证明是一个很小的证明,可以证明区块中的某个交易是无效的。关于欺诈证明的运作原理,本文不做具体介绍,请阅读这篇文章。
这里只有一个问题:全节点如果要为某个区块生成欺诈证明,需要知道该区块的交易数据。如果区块生产者只公布区块头,没有公布交易数据的话,全节点就无法验证交易的有效性,并针对无效交易生成欺诈证明了。这就要求区块生产者公布区块的所有数据,但是我们需要找到一种方法来强制实行。
隐私及数据保护平台HOPR利用Ceramic提供数据可验证性:9月10日消息,隐私及数据保护平台HOPR宣布,已经开始使用去中心化网络存储协议Ceramic向节点运行者提供链下日志信息,同时保持其数据的隐私性。HOPR协议是新一代去中心化应用程序的第0层隐私基础。HOPR激励混合网允许任何应用程序发送数据,而不会泄露数据或元数据。HOPR节点将依靠Ceramic来追踪节点支付,而不会牺牲用户隐私。[2021/9/10 23:16:21]
为了解决这个问题,轻客户端需要找到某种方法来检查区块的交易数据是否真的发布到了网络上,以便全节点进行验证。然而,我们又要避免让轻客户端下载整个区块,因为这会使得轻客户端丧失存在的意义。
我们该如何解决这一问题?首先,我们先来讨论数据可得性问题的相关性,以及如何采取解决措施。
数据可得性问题与哪些方案有关
在上一节中,我们介绍了数据可得性问题。让我们来讨论一下它对可扩展性解决方案的重要性。
增加区块大小
在比特币等区块链中,绝大部分一般的手提电脑都能运行全节点并验证整条链,因为存在人为规定的区块大小上限,来防止区块链变得过大。
CyberVein全球大使Jack:PoC共识助力DAVE实现数据可信:据官方消息,12月22号上午11点,CyberVein全球大使Jack在《瞰见未来—国际区块链技术创新峰会暨Cointelegraph中文一周年》的首秀现场发表了《DAVE:从代码可信到数据可信》的演讲。
Jack表示:“CyberVein自主研发的PoC贡献量证明机制已从理论落地到实际运用,通过DAVE利用PoC评估数据及数据库对CyberVein生态的贡献,建设大数据互联互通解决方案。主要案例为PoC运用在PISR数据库中,每个数据处理动作都会记为数据贡献。如,AI训练模型、元数据、大数据集等资源,均由大数据提供者上传至PISR数据库并经验资源质量的评估,从而获得相应奖励。
在这样一个生态下,PoC共识机制助力DAVE实现数据可信,所有大数据都被转化成可被深度共享的知识和模型,既能保护数据产生者和数据贡献者的知识产权,也能为全球大数据需求者提供有效的辅助决策,惠及更多行业。”[2020/12/22 16:05:30]
但是,如果我们想要增加区块大小上限该怎么办?那就只有更人才能负担得起运行全节点并独立验证区块链的成本,大多数人都会运行安全性更低的轻客户端。这并不利于去中心化,因为这会让区块生产者更容易更改协议规则,插入无效交易来轻客户端。因此,为轻客户端提供欺诈证明支持很重要,但是正如我们已经讨论过的,轻客户端需要一种方法来验证区块中的所有数据是否都已发布至网络。
火币公链汪毅江:区块链企业面临数据库防篡改和确保数据可信的挑战:7月8日消息,金色财经主办“全球应用安全加速—区块链发展的护城河与加速器”主题沙龙活动在线上举办。本次活动邀请了阿里云新金融事业部解决方案架构师元佑、阿里云网络产品解决方案架构师骐迹、阿里云安全高级解决方案架构师福威、HBTC霍比特创始人巨建华、火币公链技术专家汪毅江、库币首席安全官CSO Angelia Tian、Bybit首席安全官 Benjamin等技术领域专家作为嘉宾出席。
火币公链技术专家汪毅江在论坛对话中,对安全技术主要守护哪些方面的问题表示,“区块链安全需注意的要点包括私钥管理安全、业务流程安全、智能合约与开源代码安全、随机数安全等等。区块链本质上决解的问题是数据库防篡改以及数据可信,但区块链领域的企业却对此面临着严重挑战。一些成熟或者创新的安全技术,可以比较容易的解决这样的问题。比如加密芯片,HSM,凡篡改数据库等。这些技术在传统互联网应用并不广泛,但却是值得思考和尝试的。”[2020/7/8]
分片
提高区块链吞吐量的一种方法是,将区块链分成多条链,即,分片。这些分片都有自己的区块生产者,而且可以相互通信,以便在分片之间转移代币。分片的意义在于,将网络中的区块生产者分组,这样就不需要每个区块生产者处理每个交易,只需将他们分散到不同的分片上即可。每个分片只需处理部分交易。
中科聚信CTO贺光忠:区块链可提升AI数据可信度:中科聚信公司首席技术官贺光忠先生在最近的一次媒体访谈中谈道:“区块链技术与人工智能技术已经在各行业中逐步应用,而两者的结合将会是下一个非常重要的创新点。我们认为一个很重要的应用就是通过区块链技术解决AI应用中数据可信度的挑战,有了区块链可信数据的保障,AI应用可以聚焦于算法。”[2018/4/9]
通常来说,在分片式区块链上,验证者只需要为一个或少数几个分片运行全节点,并为其它分片运行轻客户端。毕竟,如果每个验证者都要为每个分片运行一个全节点,就无法实现分片的目的——将网络的开销分割给不同节点。
然而,这种方法本身存在缺陷。如果分片上的区块生产者作恶,开始接受无效交易怎么办?相比非分片式系统,分片式系统更有可能发生这种情况,因为后者的每个分片上只有少量区块生产者,攻击起来更容易。请记住,区块生产者会被不断分配到不同的分片上。
为便于察觉是否存在分片接受无效交易的情况,我们必须确保分片中的所有数据都是公开可得的,以便使用欺诈证明来证明所有无效交易。
Rollup
Optimisticrollup是一种基于rollup侧链的新型可扩展性策略。这些侧链有自己专属的区块生产者,可与其它侧链互相转移资产。
但是,如果有恶意的区块生产者将无效交易打包进区块,将侧链上所有用户的资金盗走怎么办?为解决这一问题,我们可以使用欺诈证明来发现这种情况。但是,还是那个老问题,侧链用户需要找到某种方法来确保侧链上所有区块的数据都公开可见,以便发现无效交易。为了解决这一问题,以太坊上的Rollup将所有rollup区块都发布到以太坊区块链上,依赖以太坊来实现数据可得性。也就是说,将以太坊作为数据可得性层。
ZK-rollup与optimisticrollup类似。区别在于,前者并非使用欺诈证明来发现无效区块,而是使用有效性证明来证明区块的有效性。有效性证明本身不需要数据可得性。然而,总的来说,ZK-rollup需要数据可得性,因为如果区块生产者创建了一个有效区块,并为其生成有效性证明,却没有公布区块数据,用户就无法知道区块链的状态以及他们的余额,也就无法与区块链进行交互。
进一步探索
rollup的设计旨在将区块链作为数据可得性层来存储交易,但是实际的交易处理和计算都发生在rollup上。这是一种很有趣的思路:区块链实际上不需要进行任何计算,但是至少需要将交易分装到区块中,并确保交易的数据可得性。
这也是LazyLedger的设计思路,即,一种“懒惰的”区块链,只需要完成区块链的两个核心任务——通过可扩展方式对交易进行排序,并实现交易的数据可得性。这使得LazyLedger成为rollup等系统中的最小“可拔插”组件。
数据可得性问题的解决方案
下载所有数据
正如上文所讨论的那样,解决数据可得性问题的最直接方法就是,要求所有人下载所有数据。显然,这种方法不具备良好的可扩展性。比特币和以太坊等大多数区块链均采用这种方法。
数据可得性证明
数据可得性证明是一种新技术:客户端只需下载区块中的一小部分数据,即可检查该区块中所有数据是否均已发布。
数据可得性证明采用了一种被称为纠删码的数学元件。纠删码被广泛应用到了从CD-ROM到卫星通信再到二维码等信息技术中。纠删码可以将原本1MB的区块数据扩充成2MB,其中多出的1MB就是叫做纠删码的特殊数据。如果区块中的任何字节丢失,纠删码都可以帮你找回它们。即使整个区块的数据丢失,纠删码也可以帮你找回所有数据。同样地,有了纠删码,即使CD-ROM中的数据都被擦除,你的计算机也可以读取到。
这就意味着,要实现100%的数据可得性,区块生产者只需将区块中50%的数据发布到网络上。如果恶意区块生产者想要成功隐瞒1%的数据,就必须隐瞒超过50%的数据,否则这1%的数据可以通过剩下50%的数据找回。
有了这个知识,客户端就能采取措施来确保区块中的数据不会被隐藏。客户端可以尝试随机下载区块切分而成的数据块,如果他们未能成功下载数据块,它们就会拒绝承认该区块的数据可得性。如果下载一个随机数据块,客户端就有50%的概率发现无效区块。如果下载两个数据块,就有75%的概率。如果下载三个数据块,就有87.5%的概率。以此类推,直到下载七个数据块之后,就有99%的概率。通过这种方式,客户端只需下载区块中的一小部分数据,即可有效检查整个区块的数据可得性。
数据可得性证明的全部细节会更复杂一些,而且依赖于其它假设,例如,网络中的轻客户端数量不能低于某个下限,这样就有足够多的轻客户端请求数据块,以便恢复整个区块的数据。如果你想了解更多信息,可以查看关于数据可用性证明的论文。
结论
在本文中,我们介绍了数据可用性问题,讨论了数据可用性对区块链可扩展性的重要性,并提出了解决方案。
如果你想了解更多信息,请查看以下资料:
JohnAdler’swhiteboardsessionaboutfraudanddataavailabilityproofs
Originalfraudanddataavailabilityproofspaper
CodedMerkleTreespaperonanalternativedataavailabilityscheme
EthereumResearchwikipostonthedataavailabilityproblem
原文链接:
https://coinmarketcap.com/alexandria/article/what-is-data-availability
作者:?MustafaAl-Bassam
翻译&校对:?闵敏&阿剑
大多数用户并不知道,所有重治理的协议,如yearn.finance、Compound或Aave,都有或多或少的托管.
1900/1/1 0:00:00当前的Filecoin全网算力达到较高水平,标志着区块链分布式存储将从规模扩张,进入到价值落地阶段。区块链分布式存储的价值并非在于存储海量数据和信息,而是成为资产化数据的“保险柜”.
1900/1/1 0:00:00链闻消息,链上数据显示,算法稳定币FraxFinance启动3小时,链上锁仓已突破2600万USDC。今天早上8点,算法稳定币FraxFinance正式启动.
1900/1/1 0:00:00高盛的商品研究主管称比特币是“零售通胀对冲”,并将加密货币比作铜。他说,黄金和比特币可以共存,并且“不认为比特币的日益普及对黄金作为最后一种货币的地位构成生存威胁.
1900/1/1 0:00:00BancorV2引入Chainlink预言机与单一代币流动性机制,试图减少流动性提供者的无常损失.
1900/1/1 0:00:00DOT重定面额都展示了链上治理的潜力,可以实现在其他区块链上几乎不可能的更改。原文标题:《Polkadot重定面额:链上治理的一个实用视角》撰文:SuZhu,ThreeArrowsCapital.
1900/1/1 0:00:00