火星链 火星链
Ctrl+D收藏火星链
首页 > 币安币 > 正文

BERT:如何利用机器学习识别加密项目风险?

作者:

时间:1900/1/1 0:00:00

加密货币和监管的必要性

加密货币是一种存在于数字世界的交易媒介(另一种支付形式),依靠加密技术使交易安全。加密货币背后的技术允许用户直接向他人发送货币,而不需要通过第三方,如银行。为了进行这些交易,用户需要设置一个数字钱包,而不需要提供身份证号码或信用评分等个人细节,因此可以让用户伪匿名。

对于普通的加密货币用户来说,这种匿名性可以让他们放心,因为他们的个人信息或交易数据不会被黑客窃取。然而,这种交易匿名性的提高,也容易被犯罪分子滥用,进行、恐怖融资等非法活动。这种非法活动给区块链钱包用户以及加密货币实体都造成了巨大的损失。虽然金融行动特别工作组(FATF)等监管机构已经在这些实体的监管中引入了标准化的指导方针,但由于每天都有大量的加密货币实体和交易发生,监控加密货币空间是一项具有挑战性的任务。

因此,人们有兴趣利用开源信息,例如新闻网站或社交媒体平台,来识别可能的安全漏洞或非法活动。在与Lynx Analytics的合作中,我们(来自新加坡国立大学的一个学生团队)已经致力于开发一个自动工具,以刮取开源信息,预测每篇新闻文章的风险分数,并标记出风险文章。这个工具将被整合到Cylynx平台(https://www.cylynx.io/)中,这是Lynx Analytics开发的一个工具,用于帮助监管机构通过使用各种信息源监控区块链活动。

Uniswap基金会:将在未来几周讨论如何部署超437万枚ARB:金色财经报道,Uniswap 基金会表示将把 Arbitrum 分配的 4,378,188 枚 ARB 发送到 Arbitrum 上 Uniswap 基金会拥有的多重签名地址(90xF4E08 开头),接下来几周将启动关于如何部署这些资金的社区讨论。[2023/4/18 14:11:14]

我们确定了3类开源数据,这些数据可以提供有价值的信息,帮助检测加密货币领域的可疑活动。这些类别是:

传统的新闻网站,如谷歌新闻,它将报告重大的黑客事件。

加密货币专用新闻网站,如Cryptonews和Cointelegraph,它们更有可能报道小型实体和小型安全事件的新闻。

社交媒体网站,如Twitter和Reddit,在官方发布黑客新闻之前,加密货币所有者可能会在那里发布有关黑客的消息。

马斯克回应查理芒格关于加密货币言论的推文:我们可能会死,但无论如何都值得一试:2月17日消息,马斯克回应一条关于芒格最新的批评加密货币言论的推文,加密货币应该被禁止,并称加密货币就像“性病”一样令人不齿。马斯克评论称,“2009年,我曾和芒格共进午餐,他向整个餐桌的人说特斯拉将如何失败。这让我很难过,但我告诉他,我同意所有这些理由,我们可能会死,但无论如何都值得一试。[2022/2/17 9:57:26]

检索文章和社交媒体帖子的内容,然后建立情绪分析模型。该模型为文章中提到的实体分配了一个风险活动的概率。

我们尝试了四种不同的自然语言处理工具进行情绪分析,即VADER、Word2Vec、fastText和BERT模型。在通过选定的关键指标(召回率、精度和F1)对这些模型进行评估后,RoBERTa模型(BERT的一个变种)表现最佳,被选为最终模型。

维珍银河董事长:PayPal消息传出后各大银行讨论如何支持比特币:维珍银河董事长Chamath Palihapitiya今晨发推表示,PayPal消息传出后,各大银行都在开会讨论如何支持比特币。它不再仅作为一个选项。[2020/10/22]

RoBERTa模型对新闻文章(标题和摘录)或社交媒体帖子的文本进行处理,并为特定文本分配一个风险分数。由于该文本在数据收集过程中已经被标记为实体,我们现在已经有了加密实体的相关风险指标。在后期,我们将多个文本的风险分数结合起来,给出一个实体的整体风险分数。

RoBERTa原本是一个使用神经网络结构建立的情感分析模型,我们将最后一层与我们标注的风险分数进行映射,以适应风险评分的环境。为了提高模型在未来文本数据上的通用性,我们进行了几种文本处理方法,即替换实体、删除url和替换hash。然后我们使用这个表现最好的模型进行风险评分。

分析 | BTC暴跌该如何操作?合约关注8300压力位:据Huobi数据显示,BTC现报8078美元,日内涨幅1.87%。针对当前走势,金色盘面特邀分析师保罗大帝表示:昨晚大饼再次下探了7700支撑,受到支撑反弹8000上方,白天基本维持了震荡局面。日线布林线呈开口向下扩散,各指标也是空头排列。

?技术上看,1小时看,比特币RSI运行在50附近,KDJ经过刚才的反弹后,底部有金叉趋势。但是可以看到,反弹的上方受到了MA30的压制,MA30成反弹的阻力位。合约15分钟看,这个位置与前高8300位置大约重合,BTC要想走稳向上这个点位要突破,是最基本的要求。

今日操作:上方压力位8200,上方强压力位9300美元,下方支撑位7700美元。合约方面,空单关注8300能否突破,不能突破站稳、空单可跟进。(若趋势反转向上,回踩平仓。)严格带好止盈止损。现货方面,关注下方7700支撑,跌破减仓。?注1:以上合约操作价格为火币季度合约价格,现货为火币现货价格。[2019/9/27]

现在,每篇文章都有一个相关的来源(news/reddit/twitter),一个风险概率和一个计数,指的是文章被转发、分享或转发的次数。为了将这些风险概率转换为加密货币实体的单一风险得分,我们首先将文章的概率值缩放到0到100的范围内,并获得每个来源的加权平均值,结合文章的风险得分和计数。加权平均数用于对计数较高的文章给予更大的重视,因为份额数量很可能表明文章的相关性或重要性。

声音 | 中远海运董事长许立荣:如何将区块链等技术与航运业结合 是挑战也是机遇:据第一财经消息,7月11日,在“2019年中国航海日论坛”主论坛上,中国远洋海运集团有限公司董事长许立荣表示,“当前各种新技术更是层出不穷,大数据、云计算、区块链、无人驾驶、人工智能等。如何把这些新技术与古老的航运业相结合,创新商业模式,既是新的挑战,也是创新的难得机遇。”论坛上,新加坡海事与港口局局长柯丽芬介绍,以新加坡为营运基地的太平船务已成功试行了一套以区块链为基础的电子提单系统。转让销售证明书的行政程序时间大幅减少,从以往的7天,减少到只要1秒钟。[2019/7/11]

在计算出各来源的风险得分后,我们对各来源的风险得分进行加权求和,得到综合得分,公式如下:

传统的新闻来源被赋予了更高的权重,因为这些来源更有可能报道重大的安全漏洞(相对于单个用户的黑客事件)。

我们在2020年1月1日至2020年10月30日的174个加密货币实体的名单上测试了我们的解决方案,并将结果与该时间段内的已知黑客案例进行了比较。我们发现,我们的风险评分方法表现相当出色,在37个已知的黑客案例中识别了32个。我们还分析了我们的解决方案对单个实体的有效性。下图显示了Binance从2020年1月1日至2020年10月30日的风险评分。虚线红线代表已知的黑客案例。从图中我们观察到,我们的解决方案报告了5个已知黑客中的4个黑客的风险得分增加。也有几个峰值与已知黑客案例不一致。然而,这并不构成一个主要问题,因为对我们的模型来说,更重要的是识别尽可能多的黑客,减少未识别的黑客数量。

在风险评分过程中,我们注意到,与规模较小的实体相比,规模较大的实体的风险评分往往有较大比例的假阳性记录。这是因为大型实体被谈论得更多,因此会有更多的负面帖子和虚假谣言,从而导致更高的不准确率。

另一个值得强调的有趣趋势是,围绕着黑客攻击通常有几个明显的高峰。这是由于不同数据源的反应时间不同。社交媒体网站Twitter和Reddit通常是第一个看到高风险事件发生时的高峰,因为用户会发帖提出他们观察到的异常情况,比如一个实体的网站在没有事先通知用户的情况下宕机。官方消息一般是在官方声明之后,稍后才会发布。

我们发现,我们的解决方案有两个潜在的局限性,首先是需要不断地维护收集器。网站设计可能会随着时间的推移而改变,这些网站的刮擦器需要更新,以确保相关信息仍能被检索到,从而达到风险评分的目的。

第二个限制是,验证一篇文章是否已被正确地标记为加密货币实体是具有挑战性的。例如,一篇报道Bancor可疑活动的文章可能也会因为一个不相关的事件提到Binance。我们的解决方案会错误地将新闻标记为两个实体,并将Binance标记为风险,即使它不是文本中的关键主题。然而,这并不是一个主要的限制,因为我们只使用新闻文章的标题和摘录来进行风险评分,这通常只包含文章的关键信息。

我们的项目让监管机构可以轻松挖掘开源信息,更好地识别加密货币领域发生的风险事件。我们提供了一个分析文章并预测风险分数的语言模型,以及根据实体和来源信息汇总这些分数的方法。这些方法都被编织成一个可以端到端运行的自动化流水线。将该项目整合到Cylynx平台中,将对其现有功能进行补充,并为监管机构识别高风险加密货币实体提供巨大的帮助。

标签:加密货币LYNLYNXBERT加密货币市场还有未来吗LYNX币EOS LYNXAmberTime Coin

币安币热门资讯
HER:Cypherium基于ISO20022标准的跨境支付改善方案

作为支付结算的传统巨头,SWIFT在银行间支付领域有着举足轻重的作用,SWIFT原始服务组成部分包括报文发送平台、报文处理计算机系统、精细的报文标准.

1900/1/1 0:00:00
USD:HECO项目FINCASH挖矿操作教程

DeFi流动性挖矿火爆一时,吸引了大量投资者参与。为了方便投资者及时了解DeFi挖矿项目的相关信息和挖矿流程,根据项目公开消息,为各位提供挖矿流程和相关资讯,不作为投资建议.

1900/1/1 0:00:00
CAR:三分钟了解 NEAR 生态 NFT 市场 Berry Cards 特色功能

原文标题:《Berry Cards — 一款可以挖矿的 NFT 应用》Berry Cards 是社区成员在 Berryclub.io 使用像素创作的生成艺术品的 NFT 市场.

1900/1/1 0:00:00
GAN:当2280万粉丝网红带着皮卡丘触电NFT 你会感到什么?

“皮卡皮卡”,相信大小朋友们都熟知皮卡丘标志性的可爱发音。作为“宠物小精灵”(Pokemon)家族的一种精灵,它陪伴了无数人的童年.

1900/1/1 0:00:00
区块链:风口浪尖的Gate

近期,比特儿海外版Gate.io推出Gatechain和GT受到广泛的关注,在抢点卡送GT活动中总计收到超过30亿美元价值的认购下单创造了历史.

1900/1/1 0:00:00
TAMA:金色说明书 | LAVAswap使用教程

DeFi流动性挖矿火爆一时,吸引了大量投资者参与。为了方便投资者及时了解DeFi挖矿项目的相关信息和挖矿流程,金色财经推出了“金色说明书”系列挖矿教程.

1900/1/1 0:00:00