以太坊协议所面临的一个最为长久且尚未解决的挑战,就是由于状态数据规模不断增长而带来的问题。以太坊区块链上的许多操作(创建账户、写入一个合约存储槽、发送 ETH 到一个新的账户……)都会给以太坊添加状态内容(也即是给状态数据增加数据对象),而所有全节点都必须存储全量的状态数据,这样才能验证新区块以及制造新区块。这些操作只需事务的发送者一次性缴交按 gas 用量来计量的手续费,但会给整个网络造成永久的持续性成本,因为节点需要存储这些新数据(而未来加入的节点也需要在同步过程中下载这些数据)。
这是系统设计中的一个显著的失衡,可能会让以太坊系统变得越来越难用,因为状态中充斥着不再有用处的 “垃圾数据”。本文的目的是详细解释问题产生的根源,以及一些解决该问题的方法。如果我们能实现某个解决方案,这将为安全地大幅提高区块 Gas 上限 铺平道路。
本文所论述的研究领域仍在推进中,随时有可能出现更新、更好的想法和更优雅的权衡。
“状态” 指的是节点若想处理新产生的区块和事务就必须存有的信息。状态与 “历史” 完全不同,后者是关于过去时间的信息,节点可以保存这些信息以便日后重新广播或归档,但并不是处理区块链所必需的。
观点:Ordinals促进了比特币交易的增长:金色财经报道,分析师Spencer Hughes称,由于Ordinals和BRC-20活动激增,过去一个月比特币网络非常活跃。Ordinals是1月份在比特币主网上推出的NFT协议,促进了比特币交易的增长。投机者一直热衷于铸造比特币上出现的任何项目,并设定高额交易费用以优先考虑他们在铸造过程中的位置,随着Binance和OKX等中心化的交易所增加对Ordinals的支持,这种趋势可能会上升。[2023/6/6 21:18:03]
在以太坊协议中,状态信息包括:
账户的 ETH 余额 和 nonce(流水号)
智能合约的代码
智能合约的存储项(storage)
与共识机制相关的数据(近期的区块哈希值,叔块;权益证明的共识数据还包括验证者的公钥以及及其记录在信标链上的活动,等等)
历史信息则由旧的区块和收据组成。EVM 中没有操作码可以让你访问旧区块、旧事务和内容和收据输出,所以节点丢弃这些数据也仍然能验证新区块,所以这些是历史信息。
观点:美联储加息的冲击可能会引发“债券市场闪崩”:金色财经报道,美国经济一直在与通胀猖獗作斗争,投资者热切等待美联储宣布下个月的下一次联邦基金利率上调。对冲基金Praetorian Capital的创始人Harris Kupperman认为,美联储加息的冲击可能会引发“债券市场闪崩”或“炸毁财政部”。Kupperman称“雪崩正在发生”,因为他认为美联储目前陷入困境,尽管言辞强硬,但他认为美联储需要转向提高FFR。
此外,在悲观的宏观趋势中,Fluid Finance的首席营销官Jessica Walker表示,经济不景气和法定货币陷入困境揭示了加密货币的真正好处。[2022/10/24 16:36:39]
上述状态信息列表中的最后一项 —— 共识机制相关数据 —— 在设计上已经精心限制了其规模,因此我们不太需要为此困扰。但前面三项,就令人头大了。这三类状态信息的规模会随着时间推移而不断增大,因为不断会有新用户加入网络,他们会创建新的账户、新的合约,还会加入合约、收到 token 什么的。
观点:ETH改变世界的潜力只有通过创建可持续的项目和真正的去中心化解决方案才能实现:Cointelegraph今日在推特上表示,Ethereum的金融影响令人振奋,但其改变世界的潜力只有通过创建可持续的项目和真正的去中心化解决方案才能实现[2021/1/3 16:17:57]
难办的是,许多状态用过之后就会静静地躺在那里(不会再被触及);一旦某个用户停用某个应用之后,就会产生一些 “垃圾状态” —— 不会再派上用场,但会永远存在那里。
理论上,用户可以做到 “垃圾不落地”。用户可以仅发布带有 SELFDESTRUCT 条件的合约,等他们再也用不上这个合约的时候,就调用这个操作码移除这个合约、清空其 token 余额;他们还可以使用智能合约钱包,通过一个已有的外部持有账户(EOA)来发送交易,而无需生成一个新的 EOA(EOA 状态是没法删除的)。
但是在实践中,这样的激励非常少,而适当的状态清理的技术复杂性又太大了。在许多合约中,给任何人赋予这样调用 SELFDESTRUCT 的权限都是不合适的(人们想要的就是 “无法终止” 的应用!),而且,也会给用户体验和代码上也会增加很多复杂性。实际上,由于 SELFDESTRUCT 用处极其有限而副作用极大,我更倾向于永远移除这个操作码。如果我们真想控制状态数据的规模,我需要的是一个网络中的节点可以 默认 丢弃不再被使用的 “垃圾状态” 的方法。
观点:未来区块链去中心化趋势将随用户基础扩张逐步减弱:10月15日消息,世界经济论坛学术撰稿人Stephanie Hurde撰文称,从表面上看,区块链技术支持者认为,区块链是现代经济的反垄断趋势的解药。但实际上,区块链应用当前不像大型科技公司那样大肆行使经济和权力,那是因为它们还没有实现任何可与之媲美的用户基础。大规模的采用以及随之而来的关注和资金,是积累权力的先决条件。万维网从Tim Berners-Lee的去中心化发明发展到,成为像Facebook和Twitter这样利润丰厚、功能强大的社交媒体应用,花了几十年的时间。关键问题在于,如果区块链拥有了自己的杀手级应用,这些服务是否会比目前的选择更加去中心化,而答案是不会。他称,很有可能,再过一二十年,我们就会像今天抱怨大型科技公司一样,抱怨区块链大公司的邪恶本质。(CoinDesk)[2020/10/15]
这个问题的一类解决方案基于 “无状态客户端” 的观念(此文是论述这个观念的出处 ,此处是演讲视频)。基本原理是,让区块验证不再以持有全局状态为前提。相反,区块会自带证据(或者叫 “见证数据(witness)”),证明其所访问状态的值。就跟现在的设计一样,区块内会包含一个 “状态根(state root)”,所访问的值可以对应着状态根得到证明(译者注:默克尔证明即是一种常见的证明技术)。以太坊现在的状态树方案(默克尔帕特里夏树)支持这样的证明技术,像二进制树或者 Verkle Trie 这样更高效的方案也可以。见证数据也会证明处理完该块后新状态根的正确性。
观点:比特币仍是机构投资者的首选资产:在最新一期Unchained播客中,ARK Invest首席执行官兼首席信息官Cathie Wood和ARK主题分析师Yassine Elmandjra重点介绍比特币如何继续成为机构投资者的首选资产,同时还讨论比特币和以太坊网络之间的复杂细节,以及它们在推动投资者信心和认可度方面的作用。Wood指出投资组合配置背后的关键原因,“这些生态系统的价值将由货币主导,而比特币作为储备货币,将是我在这一领域分配大部分资产的选择。尽管我可以看到随着时间的推移,还有其他货币在演变。”与BTC相比,ETH选择了不同的发展路线,因此在此类用例中并不总是受到关注。Elmandjra强调该差异,将其归类为“创新最大化主义者和货币最大化主义者”之间的分歧。“当你从金钱至上的心态来看待它时,你会从比特币开始,然后以它结束。在这种情况下,投资者关注的焦点实际上是关于货币的保证理论,并从货币的角度来看待这个问题。”他还指出,对于比特币来说,即使它确实具有传输和验证数据交易的可靠机制,投资者的首要任务也应该围绕网络可扩展性和“使用这些大型功能集创建可表达、可升级的基础层协议”。(AMBCrypto[2020/4/23]
无状态性有两种形式:
弱无状态性:出块者仍然需要完整的状态,以为(自己制造的)区块生成见证数据;但验证区块的阶段可以是无状态的;
强无状态性:没有任何节点需要完整的转台。反过来,是交易发送者需要提供见证数据,而出块者可以聚合这些数据。交易发送者自己负责存储为所关切的账户生成见证数据所需的部分状态树。
强无状态性是一个非常 “优雅” 的解决方案,因为它把责任完全转移给了用户,虽然为了保证实践中的良好用户体验,我们需要创造某些类型的协议来帮助不运行个人节点的用户维护状态、并处理用户需要与意料之外的账户交互的情形。打造这样的协议非常难。
此外,所有类型的无状态性都提高了网络所需的数据带宽;而强无状态性还需要交易声明其所交互的账户及存储项的键(概念上这个叫做 “访问列表”)。
更温和的解决方案可以归结为不同形式的 “状态过期” 方案。必须持续得到访问的状态才能保持 “激活状态”;而长期无人问津的状态会变成 “失活”(或者叫 “过期的”)。具体用什么机制来更新状态,有很多选择(例如预付 “租金”,或者只需访问那个状态),但一般原则是,除非某个状态对象被显式地更新,否则就以某种形式处于失活状态。因此,任何创建新状态对象(以及更新已有状态对象)的活动,都只能成为节点在一段时间内的负担,而不像现在这样变成永久负担。
失活状态,故名思义,就不是 “状态” 的一部分;想要处理区块或创建区块的节点无需存储失活状态。不过,失活状态不是被完全删除了!在所有类型的状态过期提案中,都预设了某种方法可以 “复活” 已经失活的状态。
一般原则是,激活状态的使用与当前相同,而失活状态则需通过上述无状态客户端的机制来使用。复活一个过期状态对象的事务需要提供一个证据(见证数据),来证明该对象是失活状态的一部分。为了能够生成这样的证据,用户自己需要存储和维护至少一部分失活状态(对应于其所关切的失活状态对象的那部分)。
决定过期条件的设计也有很多种。最常见的几种是:
直接租金:逐块逐块收取 “租金”,直接以每个账户(或其他状态对象)的余额来支付;状态对象的余额降到了零,该账户就过期了。
剩余存活时间值:每个状态对象都存储一个 ”剩余存活时间“ 值,这个值可以通过支付费用来增加
触达即刷新:每个状态对象都存储一个 ”剩余存活时间“ 值,并且每逢读取或写入该账户都会增加该值
所有状态对象定期过期(例如每 6 个月一次):也就是 ReGenesis 提案(中文译本)
我自己越来越喜欢 ”触达即刷新“ 方案,因为(1)它避免了应用需要创造复杂的经济模型来让用户承担状态租金;以及(2)它保证了激活状态的规模有一个清晰的上限(区块 Gas 上限 / 触达状态对象的 Gas 消耗量 × 状态存活的时长)。让大量状态按照规律的时间间隔过期的方案(也就是 ReGenesis)也有同样的好处,但也有一些有趣的权衡:关键好处是,过期方案更简单(无需遍历整棵状态树而逐个逐个地灭活状态对象),但关键不足是,跨过一个过期时点后,你再激活自己的状态对象时,需要多少见证数据会跟你触达状态对象的时间点有关。
状态过期的逻辑既可以运营到账户层面,也可以运用到单个存储槽层面。当前,我强烈偏向于在存储槽层面实现状态过期方案。因为很多合约账户的存储槽数量是不受限制的,任意用户都能加入合约并增加合约名下的存储槽的数量(例如,空投就是一个已经出现过的案例)。不管使用什么样的账户层过期方案,想要实际限制状态的规模,租金的数量都必须与合约内存储槽的数量成比例(或者存活时间与之成反比)。结果是,用户还是能够仅支付一次性的费用就给合约及其用户施加 永久的持续性成本。
要解决这个问题,合约要么加入复杂的内部逻辑,将存储操的租金 “转嫁” 给用户,要么重新设计自己合约的模式,转向使用 CREATE2 操作码创建新的合约并使用这些合约来充当存储槽。不管是哪种办法,最后都会变成等价于存储槽层面的过期方案。因此,我个人认为,我们应该仅在合约存储槽层面实现状态过期方案。
但是,存储槽层面的过期方案也有自己的缺点:每个存储槽都要增加一个元数据,指明它何时过期(或者说是否已经失活),这也意味着 “复活冲突问题”(详见下文)不仅会影响账户,也会影响存储槽。
伴随去年某资金盘线下开会被一锅端以及疫情的到来,线上销售虚拟货币的场景愈发常见。概括性的代币发行融资涉嫌违法犯罪已是老生常谈,飒姐团队希望通过本文对代币发行融资的几种常见运营模式进行刑事法律分析.
1900/1/1 0:00:00以太坊联合创始人 Vitalik Buterin 「强调 Optimism 和 Offchain Labs 即将在 3 月上线」引发了中国社区对「Rollup 早鸟应用」的关注.
1900/1/1 0:00:002021年2月9日早八点,据欧易OKEx行情显示,比特币再次向上突破,最高报价47480.8美金,冲击50000美金关口。比特币破新高,与新晋世界首富、特斯拉总裁马斯克密近期的言论不可分.
1900/1/1 0:00:00创新型区块链资产服务商、加密货币合约交易平台Anbbit于2021年2月22日19:00正式开通DODO USDT本位的永续合约.
1900/1/1 0:00:00项目预计大年初一(2021年2月12日)20点正式开始流动性挖矿。DeFi流动性挖矿火爆一时,吸引了大量投资者参与.
1900/1/1 0:00:00超过53个区块链项目已经成为市值数十亿美元的加密独角兽,这标志着2021年牛市才刚刚开始。在传统的投资世界中,“独角兽”一词被风险投资家用来描述一家估值超过10亿美元的私人创业公司.
1900/1/1 0:00:00