火星链 火星链
Ctrl+D收藏火星链

BIT:想做好区块链数据分析?先来看看如何解决“去匿名化”这个大难题

作者:

时间:1900/1/1 0:00:00

编者按:本文来自区块链大本营,作者:新缸中之脑,Odaily星球日报经授权转载。在最近的会议演讲中我经常会被问到:区块链数据分析的最大挑战是什么?我的回答就一个词:去匿名化。我坚定地认为,识别不同类型的参与者并理解其行为是解锁区块链分析潜力的核心挑战。我们花费了相当多的时间来考虑这个问题以识别出与数字货币运动的伦理不发生冲突的正确边界。在这篇文章里,我想进一步探讨这个思路。市场上大多数区块链的架构依赖于匿名或伪匿名机制来保护其节点的隐私并实现去中心化。数据混淆机制可以将加密资产交易数据记录在公开的账本上让每个人都能访问,但是也让分析这些数据变得异常困难。如果不能识别参与者的身份,就很难理解区块链数据集并分析出有意义的结果,而且区块链分析只能徘徊在初级阶段。然而,重要的一点是要理解,去匿名化区块链数据集并不是要知道账本中每个地址的真实身份,这个方向基本上是不具备可扩展性的可能。相反的,我们可以识别并理解区块链中已知参与者的行为,例如交易所、OTC柜台、矿工以及其他构成区块链生态系统的核心成员。地址数量会不知不觉误导你

Bybit平台USDC-USDT永续合约交易对资金费率升至0.3567%:3月11日消息,据 Coinglass 数据显示,Bybit 平台 USDC-USDT 永续合约交易对资金费率已升至 0.3567%。

注:当市场趋势看涨时,资金费率为正,此时多头将向空头支付资金费率。当资金费率大于 0.01% 时,已代表市场普遍看多。[2023/3/11 12:57:05]

网络的量度是区块链分析中无所不在的一个指标,也是一个可以清晰地展示去匿名化威力的指标。地址数量是最常见的一个具有误导性的指标,因为并非所有的地址都同等重要。交易创建的一个用于临时性转账的地址,显然不能和另一个长期持有资产的钱包地址相提并论。类似的,像币安这样的交易所的热钱包,肯定也不同和我的个人钱包采用同样的方法和指标去分析。同等对待所有地址的匿名性,注定会导致解读的有限性并且经常会得出误导性的结论。

Deribit发布新的客户端资产验证功能:金色财经报道,加密货币衍生品交易所Deribit宣布,它为使用交易平台的客户推出了一款新的“储备证明”工具。现在,客户可以验证他们的资产是否包含在Deribit的总储备中。客户获得一个密钥,允许他们在整个文件中找到他们的余额,并可以确定他们的资产被Deribit的链上余额覆盖。用于创建Deribit修改后的默克尔树的所有代码都是可用的,因此客户端可以验证前端数据的准确性。[2022/12/25 22:05:43]

匿名性vs.可解读性

匿名或伪匿名身份是可伸缩的去中心化架构的关键因素之一,但是这也让从区块链数据集中获取有价值的信息变得极端困难。理解这一观点的一个办法,就是把匿名性视为区块链分析的可解读性的一个反因子。在区块链数据集中匿名性与可解读性之间的摩擦相对来说还比较小。一个区块链数据集的匿名性越高,从中获取有意义的信息的难度就越大。参与者的身份提供了其行为的上下文环境,而上下文环境则是可解读性的关键构建模块。

FTX已恢复提款服务:11月11日消息,据0xScope创始人Oar推文,FTX重新开放提币。另据链上数据显示,FTX 相关热钱包地址已重新开始活动,社群反馈 FTX 已恢复提款服务。[2022/11/11 12:46:46]

去匿名化vs.打标签

「你是什么」远比「你是谁」要重要。去匿名化区块链数据集并不涉及了解每个参与者的真实身份。试图了解每个用户的真实身份不仅是一个意义重大的任务,而且也会让分析工作难以突破一定的规模。相反,我们可以试着理解一个参与者的关键特征来让我们的分析达到一定程度的可解读性。因此,不需要清楚地识别每个地址的真实身份,我们可以给地址打标签或者附加一些描述性的元数据,来让其行为具备一定的上下文环境。在大规模数据中,打标签常常要比个体识别更有效果。理解区块链生态系统中特定个体的行为当然会让分析达到更个性化的程度,但是对于在宏观层面理解行为的趋势就显得相对受限了。

今日恐慌与贪婪指数为30,恐慌程度大幅上升:金色财经报道,今日恐慌与贪婪指数为30(昨日为41),恐慌程度较昨日大幅上升,等级仍为恐慌。注:恐慌指数阈值为0-100,包含指标:波动性(25%)+市场交易量(25%)+社交媒体热度(15%)+市场调查(15%)+比特币在整个市场中的比例(10%)+谷歌热词分析(10%)。[2022/8/18 12:32:53]

因此,相对与对区块链地址的个体真实身份的识别,去匿名性的挑战与地址的关键性属性的标注的关系更大。我们如何实现这一点?机器学习会是一个优秀的解决方案

标注或者去匿名化区块链的思路可以让区块链分析更好地生态中已知参与者的行为模式和特征。直觉上我们可以考虑创建一些规则来分析区块链生态系统中的不同成员,例如:“如果一个地址持有大量比特币地址并且一次执行100个交易,那么这是一个交易所地址……”虽然很有吸引力,但是基于规则的方法将很快失效,无法再提供有用的信息。下面列出了部分原因:预置知识的完整性:基于规则的分类会假定我们对于如何识别区块链生态中的不同参与者有足够的知识。这显然是不正确的假设。持续的变化:区块链解决方案的架构一直都在演变,这对任何嵌入的规则而言都是挑战。特征属性的数量:创建一条有两三个参数的规则很简单,但是试图创建一条有几十个甚至上百个参数的规则就没那么简单了。要识别出像交易所或OTC柜台这样的地址需要大量的特征。因此我们不能使用预置的规则,我们需要一种可以从区块链数据集中学习模式的机制来自动推断出有意义的规则让我们可以标注相关的参与方。从概念上来说,这是一个经典的机器学习问题。从机器学习的观点,我们应该从两个主要途径来考虑应对去匿名化的挑战:无监督学习:无监督学习聚焦于学习指定数据集中存在的模式并识别相关分组。在区块链数据集的上下文中,可以使用无监督学习模型基于地址的特征将其匹配到不同的分组中并对这些分组进行标注。监督学习:监督学习方法可以利用已有的知识来学习指定数据集中的新的特性。在区块链上下文中,可以使用监督学习方法基于已有的交易所地址数据集训练一个模型来识别出新的交易所地址。

去匿名化或者给区块链数据集打标签很少是只用监督学习或者只用非监督学习,更多的情况下需要两种方法的结合。机器学习模型可以有效地学习区块链生态系统中特定参与者的特征,并利用这些特征来理解其行为。在使用区块链ETL工具将区块链原始数据加载到数据库或大数据分析平台后,将标注层引入区块链数据集是进行更有价值的区块链数据分析的一个关键挑战。这些标签提供了更好的上下文环境,也让区块链分析模型具有更好的可解读性。不过尽管我们有机器学习这样强大的工具,去匿名性依然是分析理解区块链生态系统的道路上一个不可忽视的重大路障。

标签:区块链BITDERIFTX区块链的未来发展前景数字化研究bitbull币有投资价值吗Deri ProtocolSBLAND Vault (NFTX)

比特币价格热门资讯
区块链:肖磊:为什么全球两大央行都提出要争取数字货币领导权

编者按:本文来自肖磊看市,作者:肖磊,Odaily星球日报经授权转载。现在我们经常会看到金融科技,以及金融创新等宣传字眼,那么在数百年的金融历史上,到底什么才是颠覆性的金融创新呢?什么样的金融科.

1900/1/1 0:00:00
LIBRA:中国DCEP试点在即,Libra监管放松

DCEP自Libra白皮书发布后,推行进程频频加速,近来落地场景应用的试点消息更是频频,相比于深陷重重监管泥潭的Libra,似乎顺风顺水,但其实对于Libra,美国监管层态度已有所转变.

1900/1/1 0:00:00
APP:新华网:互联网行业越守“网规”,越能释放红利

编者按:本文来自新华网,作者:何冬昕,Odaily星球日报经授权转载。时光荏苒,岁月如白驹过隙,在互联网的世界里,季节交替和时代更迭的速度似乎更让人难以捉摸.

1900/1/1 0:00:00
区块链:律师肖飒:矿机圈关心的“职务侵占”,到底是个啥?

编者按:本文来自肖飒lawyer,作者肖飒,Odaily星球日报经授权转载。某矿机创始人涉嫌职务侵占被批准逮捕,一时间圈里不少朋友私信飒姐询问:啥是职务侵占,能判几年呀?入罪门槛是什么?等等.

1900/1/1 0:00:00
EFI:海外周报 | Polkadot实验性网络Kusama已开启转账功能;Beam发布新版桌面钱包,增加原子交换功能(12.2—12.8)

Odaily星球日报出品作者|王也编辑|郝方舟上周,英属维尔京群岛称,将推出自己的央行数字货币.

1900/1/1 0:00:00
ETH:伊斯坦布尔硬分叉要来了,但以太坊2.0还要十万八千里

本文来自:哈希派,作者:LucyCheng,星球日报经授权转发。据以太坊基金会消息,伊斯坦布尔硬分叉升级预计将于2019年12月7日前后发生,和前几次的君士坦丁堡、拜占庭等硬分叉升级一样,这次的.

1900/1/1 0:00:00