摘要
线下生活的线上化及如火如荼的所有者经济催生了巨大的数据存储需求,具备巨大的商业和应用前景;
中心化存储由于高昂的成本、预置的存储格式等因素难以跟上数据指数型增长所带来的存储容量、数据读写速度、安全性和数据关系的变化,由此去中心化存储应运而生;
去中心化存储基于区块链技术,具有可扩展性强、安全、效率高、自动容错、可靠性高、成本更低的特性;
Web3.0的世界里,用户海量的线上足迹和创作的线上作品创造了一个难以置信的巨大的数据王国,而这数据王国的维持依赖一个可靠稳定安全的数据存储网络;
元宇宙辉宏的世界里,货币化的虚拟物品若失去可信任的区块链链上存储的保护,一旦其对应的元数据和媒体数据失效或被篡改,则将会变成一张没有承兑方的无价值支票;
现时主要的去中心化存储方案为IPFS/Filecoin和Arweave项目,IPFS开创性地引入了激励层Filecoin以确保数据在约定期限内的可靠存储,而Arweave通过技术创新以期实现数据在链上的永久保存。
导语
2021年的夏天,一组由一万个不规则像素组成但看起来很奇怪的小人忽然兴起,让人惊讶的是其单个头像却能以等价于几千万美金的以太坊成交;此后BoredApeYachtClub、Loot等成为加密市场的新宠。从加密艺术、游戏到头像、文字,NFT的兴起引燃了人们对元宇宙、对Web3.0的无尽想象。
然而当我们在谈论作为身份象征的CryptoPunk、兴致勃勃地边玩边赚游戏AxieInfinity、酣畅淋漓地构想在元宇宙里星辰大海的征途时,我们是否想过这些数据会被存储在哪?是否担心这些数据可能会被篡改?没有人会希望花了几千万美金的头像因为底层数据的篡改而一文不值,没有人会希望在元宇宙里与朋友对话的珍贵回忆因为系统宕机而永远消失。站在元宇宙和Web3.0纪元的起点,在数据爆发式增长的今天,我们急需一个安全、开放、自由、可靠的存储网络。
本文将通过介绍存储之于Web3.0及元宇宙的深刻意义,尝试向读者描绘去中心化存储在Web3.0及元宇宙中激动人心的应用。同时,本文还将立足于去中心化存储的发展现状,对不同的去中心化存储方案进行研究和比对。
存储的产业生态
新冠疫情的肆虐加速了真实世界与虚拟世界边界的模糊,人们在真实世界中的工作、社交、娱乐、餐饮、购物、出行等活动几乎都可以在互联网世界中来执行;同时,从Web1.0到Web3.0,从被动的数据读取到热火朝天的内容创作,数据生产量发生了爆炸式的增长,并且还将以指数形式继续增长。据360研究报告,全球数字内容创作市场预计将在2025年达到169亿美金市值。如火如荼的所有者经济模式和指数型增长的数据创造了巨大的数据存储需求,芯片技术、算法、硬件等的发展促进了存储技术的进步,而数据价值的释放和数据安全的刚需又倒逼存储技术的创新和基础设施建设。在软件及算法的迭代与融合中,存储行业从传统的磁盘存储突破硬件的物理限制而逐渐演进到云存储。作为区块链技术的三大支柱之一,存储对于Web3.0与元宇宙的发展都具有重大意义——从应用角度来看,数据安全与数据主权的最终归属关系着虚拟世界的稳定运行;而从经济角度来看,元宇宙与Web3.0世界产生的海量数据存储需求也有着巨大的商业前景。
去中心化投资基金Hydra Ventures完成1000万美元募资:金色财经报道,去中心化投资基金Hydra Ventures完成1000万美元募资,用于投资其他以投资为重点的DAO,1kx、ConsenSys、Collab+Currency、Wicklow Capital 和 Seed Club 等参投。[2023/3/29 13:33:31]
全球数据产生量走势图,来源:www.slideshare.net/PerryLea/the-20-rule-how-the-seismic-growth-of-data-has-always-and-will-always-outgrow-telcom
碍于各种因素我们现时无法整体评估存储市场的规模,但以云存储为例,预计到2027年,全球云存储市场规模将达到2,222亿美元,在预测期内年复合增长率达21.9%(SnehaKoradRachitaRake&VineetKumar,2021)。
全球云存储行业市场规模预测,来源https://www.alliedmarketresearch.com/cloud-storage-market
存储的商业模式分为中心化和去中心化存储,中心化存储是将数据完整地存储在中心化的服务器上,去中心化存储则是采用分布式存储技术将数据切片分散存储在多个独立的存储供应商上。中心化存储方案以高稳定性的性能、低廉的费用,满足了企业级存储的需求;去中心化存储以其定制化存储方案、经济激励模型、隐私性强等特点满足了长尾企业市场的特殊场景要求。站在Web3.0与元宇宙的交汇处,对数据安全性和用户数据所有权的重视,去中心化存储的重要性将愈发凸显。
2.1中心化存储
中心化存储,即将整个存储集中在一个系统中的多套设备上,是过去大型主机时代的产物,采用有限的固定的节点数,数据访问仅需经过一个控制器,因而具有低延迟的优点但相对费用较高、数据安全性、服务提供商的运营可扩展性低等问题。
中心化存储系统顺利运行的关键之一是存储服务器稳定运转,存储服务器成为系统性能的瓶颈以及可靠性的焦点,对于存储环境、硬件设备等提出了极高的要求,因而巨大的中心化存储市场却是巨人的蛋糕,亚马逊、微软、谷歌、阿里云四大巨头合计占据了云存储市场份额的67%。
掌柜调查署 | bloXmove CTO:去中心化网络可用于实现电力网和电动汽车之间的平衡:在今日举行的《掌柜调查署 | 呼吁出行巨头停止聚合开始协作》直播中,针对“bloXmove希望打造以实现净零碳排放为目标的通用基础设施,请问bloXmove为何如此看重碳排放指标?bloXmove又将如何实现净零碳排的目标?”的问题,德国柏林bloXmove CTO Harry表示,可持续发展在欧洲是一个非常重要的话题,去中心化网络可用于实现电力网和电动汽车之间的平衡。在这里,bloXmove 连接了两个新部门,可以建立全新合作关系并带来新机会。在电网的电气化过程中,汽车或其他电动设备(如电动助力车、公共汽车)等起着储电装置的作用。bloXmove 在德国的能源合作伙伴 50Hertz是一家电网电气运营商,其网络中 60 %以上的为可再生能源。bloXmove会连接越来越多的智能设备,私人终端用户可以为耦合能源网作出贡献,并且当用户选择使用绿色和智能移动出行服务时,就能够得到奖励。[2021/8/31 22:47:43]
2021Q1全球云存储提供商的市场份额
随着微博、Facebook等的传播以及自我内容创作的流行,我们进入了数据以指数倍增长的时代,爆炸式的数据增长对存储容量大小、扩充速度和数据备份等方面提出了更高的要求;用户间实时的信息互动需要更快的数据读写速度和更高的安全性;同时,由于用户自我创作产生的数据种类、数据间的关系变得更加复杂多样化,存储系统需要从过去单一的文件类型扩展至各种半结构化、非结构化的数据关系。而中心化存储由于其高昂的建设成本以及行业进入壁垒,数据存储容量、数据类型等的扩张都难以跟上数据生产的脚步,去中心化存储由此应运而生。
2.2?去中心化存储
就如IPFS(InterPlanetaryFileSystem)早期布道者胡飞瞳所说:“在中心化数据存储的世界里,用户不仅为数据存储付费,而且还得不到很好的数据保护,这一现象必须改变。通过去中心化,用户可以自己管理自己的数据、加密存储、授权访问、安全备份等等特性的实现将极大地加强用户的隐私,也能增强数据的长期保存,同时,有望通过共享的模式大大降低费用。这是数据存储发展的必然方向。”
去中心化存储基于区块链技术,采用开源的应用程序和算法,把数据切片分散存储在多个独立的网络节点上,主张隐私保护、数据冗余备份等,并且通过对种子节点或文件上传方提供经济激励使数据价值化。其中,经济激励模式使得用户数据得以安全长久地保存正是去中心化存储的点睛之笔。
当去中心化存储遇上区块链技术,便具有了可扩展性强、安全、效率高、自动容错、可靠性高、成本更低的特性:
可扩展性:存储节点的数量可无限扩展,每个节点的存储容量亦可灵活调整;
安全性:无需了解合作对方或寻求第三方的信任,存储信息拆分成碎片分散存储在多个节点,存储数据的加密不仅局限于用户和软件终端,而且在存储网络的所有环节中、在信息传输过程中通过私有网络访问密钥、零知识证明等方法进行加密处理;
高效率:同一网络上的节点可直接共享文件;
自动容错:由于存储内容已分散到网络中的许多节点上,可在数据传输或存储出错时存储额外的副本;
开源矿池合伙人伯言:去中心化存储的重点在于节点的对等性:据官方消息,2020世界区块链领袖峰会暨2020年度矿业风向标颁奖典礼在科兴ECO国际会议中心盛大落幕,在本次大会中特别邀请到开源矿池合伙人伯言在会上发表了《分布式存储的价值与机遇》主题演讲,伯言在演讲中表示:“去中心化存储的重点在于节点的对等性,因为所有去中心化的节点在比特币的矿机里做节点认证,在分布式存储里面相对来说会有一个落差,在不同的节点上面,应用证明是不对等的。
分布式存储真正的价值在于整个数据的隐私性和不可删改,在分布式存储里面所有数据,无论是目前使用的微信、阿里的支付宝之类的数据,真正的数据不止是在我们自己的手中,也在各个运营商手中,包括给我们服务的APP里面,这对于我们个人数据产生的价值并没有得到等应的回报。数据隐私更无从谈起。未来在分布式存储里面,隐私性会有非常大的提高。”[2020/12/25 16:31:38]
高可靠性:存储系统内含的验证机制能确保文件被完整真实地存储,且能7*24小时供用户随时取用;
低成本:据悉,存储一期《中国有嘻哈》视频文件,按0.001美元/GB带宽成本计算,则爱奇艺需支付给传统存储商一百万美元,若采用IPFS分布式传输则可节省60%的带宽成本。
去中心化存储:Web3.0与元宇宙的交汇之处
3.1去中心化存储与Web3.0
互联网的起源可以追溯至1989年万维网的诞生,如果说门户网站开启了Web1.0时代,那么2003年博客的兴起标志了Web2.0的开端。从Web1.0到Web2.0,从被动的信息接收到自主创造内容与在线交互,互联网用户呼唤更注重用户内容创作、易用性和互操作性的应用体验,Web3.0呼之欲出。正如蒂姆·伯纳斯·李所说,“人们一直在问什么是Web3.0。我想也许当你在Web2.0上有一个可扩展的矢量图形覆盖层——所有的东西都在荡漾、折叠、看起来模糊不清——并且可以访问一个集成在巨大数据空间中的语义网络时,你就可以访问一个难以置信的数据资源”。虽然现在我们还未对Web3.0达成一致的定义,但Web3.0应该具有以下特征:
开放性:由开放和可访问的开发人员社区构建开源软件,并且链上进行的操作能被所有人查看。
去信任化(Trustless):网络本身允许参与者在没有可信第三方的情况下公开或私下互动。Web3.0通过去中心化的激励机制保证参与者遵守规则,在交易中利用区块链协议的共识机制验证账户的真实性和转账的有效性,达成去中介化的价值转移。
去许可化:任何人,包括用户和供应商,都可以在没有管理机构授权的情况下参与。
互联网的演化
Web3.0的星辰大海里,数字世界与物理世界的边界正在模糊。用户海量的线上足迹和创作的线上作品,如果没有一个稳定可靠的数据存储网络在背后默默地记录下,当我们兴致勃勃地回望Web3.0世界里所发生的一切,那时可能只剩下一片模糊的碎片。
韦氏评级:没有去中心化金融就没有加密革命:8月19日,加密货币评级机构韦氏评级(Weiss Ratings)发推称,没有去中心化金融就没有加密革命。而且看起来已越来越像没有LINK就没有DeFi。[2020/8/19]
3.?2去中心化存储与元宇宙
2021年随着Roblox上市“元宇宙/Metaverse”概念忽然席卷了互联网、VR/AR和金融投资界等各大行业,借着微型计算机、VR设备和以5G为代表的高速网络技术的兴起,人们来到了元宇宙纪元的门口。正如我们上一篇爆款研究报告《Metaverse全景透视:从过去看向未来》所说:元宇宙世界的点睛之笔正是其经济系统。其一,基于区块链的开放式支付和清算系统,可以满足用户在元宇宙世界的实时、公平、透明、快速的P2P支付需求;将元宇宙中用户的虚拟物品或创新成果货币化,不仅赋予了用户与真实物理世界近似的权益保障,更能极大地促进元宇宙资产的流通、交易并鼓励用户通过持续创新来获得财富积累。而这背后,在元宇宙辉宏的世界里,庞大的用户信息交互及创作的虚拟物品信息如若失去可信任的区块链链上存储的保护,一旦其对应的元数据和媒体数据失效或被篡改,那么用户手上的NFT所有权凭证将会变成一张没有承兑方的无价值支票。
TheSandbox游戏内虚拟资产,数据源:TheSandbox
3.?3主要的去中心化存储解决方案
3.3.1Bittorren
最早期的去中心化传输方案为Bittorrent,即BT下载,由软件工程师BramCohen于2003年提出,通过P2P下载的方式克服了传统下载方式的局限性——不需要资源发布者拥有高性能服务器来传输资源,且下载同一文件的人越多下载该文件的速度越快,加上其免费使用这一收费模式,吸引了众多的网民使用。然而Bittorrent下载必须使用种子文件,即下载内容的所有地址放到这个种子文件中才能下载,且客户端只能下载种子文件内的内容。但种子文件可能随着时间推移而减少甚至消失,这也意味着存储的内容可能会在传播中消失。Bittorrent的另一个明显的问题是缺乏激励机制,缺失激励用户无偿共享文件的动力。在适当的经济激励缺席下,只有那些广受流行且不断有人下载的内容才能幸存下来,而某些未能引起大众注意的精华则可能消失在历史的长河中,只留下一抹模糊的剪影。
3.3.2IPFS/Filecoin
IFPS是2015年提出的另一去中心化存储方案,克服了bittorrent的不足——可存储内容的多个版本、可预下载内容,进而实现去中心化、快速、高效率、可靠性、安全的内容存储。值得注意的是,IPFS又开创性地引入了激励层Filecoin,通过通证激励机制以确保文件在约定期限内的可靠存储。
Filecoin允许任何个体利用空闲的硬盘空间和带宽在公开市场上提供数据存储和检索服务,将未用硬盘容量货币化,并通过PoRep和Post来保证矿工真实存储文件的情况,防止女巫、生成、外包等虚假存储数据的攻击。简单来说RoRep是证明矿工真实存储了数据,而Post则是证明矿工一直将该数据存储在自己的硬盘中。运作原理如下图:用户通过发布订单寻找合适的存储矿工,数据加密并分割后发送至矿工,矿工将该信息添加至存储区块进行存储并持续证明其工作以获得奖励。
声音 | BB:降低主网通胀率提议一夜之间通过证明了去中心化治理的力量:Block.one CEO BB在推特上表示:“我今天醒来后发现有人提议将EOS主网的从5%降低到1%,并在一夜之间被社区通过了。这说明了去中心化治理的力量,以及证明了是为持币者最大利益而设计的网络。如果 EOS不是去中心化的,那就没有任何是。如果任何网络都不是去中心化,EOS仍然是一致的。这些类型的操作突出了工作证明网络升级的脆弱性。工作证明网络如何降低通胀率或者在无需分割的情况下升级为权益证明?”[2020/2/26]
IPFS工作原理图,图片来源:https://www.8btc.com/article/613165
当然,filecoin的这种模式并不意味着它就是完美无缺的。IPFS挖矿需要专业设备—GPU矿机而使挖矿成本较高,行业进入壁垒的提高导致普通个体可能无法直接参与存储挖矿,进而全网总存储将向少数存储供应商或大规模矿池集中。这从某种程度上来说,IPFS所构想的完全去中心化在执行过程中又变成了少数供应商垄断的“中心化”存储。
Filecoin主网于2020年10月上线,目前已有3,175个活跃节点,主要遍布于北美、欧洲、中国、韩国等。截止21年10月14日,Filecoin全网提供了12.393EiB有效算力,当前基础费率为0.1052nanoFIL,封装32G存储花费4.958Fil/TiB。
Filecoin节点分布图,图片来源:filscan.io/statistics/map
Filecoin基线与算力走势图,图片来源:filscan.io/statistics/map
伴随着filecoin底层网络和基础设施的完善,其网络效应发展的前期红利吸引了更多的应用来布局。截至目前,filecoin已建立起一个涵盖“消费者存储应用、数据市场、数检索、NFT、Defi、可验证存储和隐私”等领域的生态环境,如Fileswan、NFTStororage、Opera、Livepeer等项目。
Filecoin生态图,图片来源:https://github.com/filecoin-project/community/discussions/194
3.3.3Arweave
与Filecoin将数据存储在链下不同,另一存储方案Arweave将数据内容直接存储在区块网中,是主打永久存储+链上存储的去中心化存储方案。如下图所示,Arweave方案分为两层架构:底层的区块网络Blockweave和上层基于HTTP构建的Permaweb。Arweave项目的技术亮点正是其底层Blockweave网络:
Blockweave:
项目采用了全新的区块链网Blockweave——基于共识机制和特定的出块模式,即将之前所有区块的哈希值做成一个哈希列表并将系统中所有活跃钱包做成一个列表,矿工通过检索哈希列表和钱包列表来完成验证工作,而无需像BTC、ETH等节点一样去验证整个节点,这种方式减少了能源消耗并提高了节点工作效率。
激励算法Wildfire:
与Filecoin需要持续性地收取存储费用不同,Arweave只在数据写入时收取一次性的永久存储费用,之后用户读取数据都是免费的,为了鼓励节点对数据读取请求作出响应,Arweave引入了激励算法widfire。简单来说,Wildfire就是一个节点评分系统,根据节点发送新交易和区块的次数以及响应请求的速度来让每个节点对其他节点排名。从相邻节点得到的可靠数据越多则给对方的评分就越高,相应地出块概率就越大。
智能网SmartWeave:
SmartWeave将智能合约执行的计算负担从节点转移到了用户,即Arweave网络中只存储了应用程序的所有数据,这些数据将以代码的形式提供给浏览器或其他客户端应用程序,因而使得Arweave能支持需要大量计算的Dapp。
Arweave架构
虽然Arweave存储方案将数据保存在链上,能保证数据的不可篡改、“永久存储”和所有人公开访问;然而这种模式也具有一定的弊端。其一,数据的不可篡改导致任何改动都只能通过上传新数据,这将造成一定的迭代成本。其二,为了保证数据的永久存储,Arweave需要不断吸引新的节点加入同时确保节点的边际收益大于边际成本,然而Arweave节点数一直在减少,目前仅有146个节点,较2020年5月的490个节点减少了70%。
Arweave节点分布图,来源:https://viewblock.io/arweave/stats
Arweave主网于2019年1月29日上线,并于2020年5月推出具有捆绑交易存储功能的Arweave2.0版本,链上交易量在2021年开始发力并于今年9月达到顶峰(9月日均交易量超8万笔)。Solana上MetaplexCandyMachine的推出以及ipfs2arweave跨链桥的推出等造就了Arweave的亮丽表现。
Arweave交易量统计,来源:https://viewblock.io/arweave/stat/txCountHistory
纵观Arweave生态项目,目前较为活跃的是NFT、DeFi及基础设施赛道,如Koii、Limestone等项目,目前生态还处于建设的早期阶段。
Arweave生态一览???????
展望
站在Web3.0与元宇宙的交汇处,对数据安全性和用户数据所有权的重视,去中心化存储的重要性将愈发凸显。去中心化存储与中心化存储在存储空间来源、带宽来源、安全性、使用方式等多个维度的差异,导致现时去中心化存储的规模和性能远远不如中心化存储系统。虽然IPFS、Arweave等项目通过不同的“非中心化”设计方式弥补了其不同的缺陷,并引入通证激励使全网存储总规模扩大,但是项目方与用户的利益不一致、费用结构的等因素阻碍了项目的快速拓展,其生态构建尚处于早期阶段,未来需要在费用、节点量、用户量之间找到平衡,实现规模与性能的兼顾。
去中心化存储方案的对比
我们期待随着元宇宙和Web3.0纪元的开启,网络的“飞轮效应”使去中心化存储能迎来应用爆发的浪潮,期待存储技术的改进和经济激励模式的优化,去中心化存储这一赛道能有长足稳定的发展。
参考文献
CloudStorageMarket(2021),SnehaKoradRachitaRake,VineetKumar,https://www.alliedmarketresearch.com/cloud-storage-market
分布式存储——千亿存储市场的蓝海大战,https://www.8btc.com/article/613165
2020分布式存储产业链研究报告,焦仕可https://www.jinse.com/news/blockchain/835473.html
A'morerevolutionary'Web(2006),VictoriaShannon,https://www.nytimes.com/2006/05/23/technology/23iht-web.html
WhatIsWeb3.0&WhyItMatters,FabricVenture,https://medium.com/fabric-ventures/what-is-web-3-0-why-it-matters-934eb07f3d2b
IPFSandFriends:AQualitativeComparisonofNextGenerationPeer-to-PeerDataNetworks(2021),ErikDanielandFlorianTshorsch
出品:LDCapitalResearch
作者:Betty、YY
研究员:JamesKuo、NoiseZhou、Lightmanben
北京时间10月28日晚,Facebook宣布更名了,此次更名,并不是Facebook社交软件更名,而是Facebook公司更名,这代表着Facebook原有的计划都会归集到新品牌Meta上.
1900/1/1 0:00:00随着昨天特斯拉股票再度暴涨,已经是世界首富的elonmusk的身家达到了惊人的3351亿美元,不但把贝佐斯远远甩在了身后,更是等于中国前八大富豪的财富之和.
1900/1/1 0:00:0010月27日,链必安-区块链安全态势感知平台舆情监测显示,DeFi借贷协议CreamFinance再次遭受攻击,损失达1.3亿美元。被盗的资金主要是CreamLP代币和其他ERC-20代币.
1900/1/1 0:00:00本篇报告跟踪盘点了加密资产的中美监管与美国产业发展近况,描绘了两国对产业各环节的监管概况,比较了多份中国加密资产监管史上的重要文件、比特币期货ETF与现货ETF的不同以及多个美股上市公司加密资产.
1900/1/1 0:00:00头条▌NFT行业首个自律公约发布10月31日,国家版权交易中心联盟牵头,中国美术学院、浙江省杭州互联网公证处、央视动漫集团、湖南省博物馆、蚂蚁集团、京东科技、腾讯云等共同发布《数字文创行业自律公.
1900/1/1 0:00:00原文标题:《Facebook更名落定:MVRS取代FB“Meta”代表应用、V/AR业务》就喜欢这种真刀真的公司终于落定了.
1900/1/1 0:00:00