火星链 火星链
Ctrl+D收藏火星链

GPT:火爆出圈的最强 AI GPT 是否可用于合约安全审计?

作者:

时间:1900/1/1 0:00:00

前言

近期ChatGPT爆火,其对传统文字工作的效率提高及总结能力让使用者惊艳。紧随其后CodeGPT这样基于GPT的插件出现,也充分体现了其对代码编写效率的提高。而最新GPT-4的发布,是否可以应用到对区块链、Solidity智能合约的审计中呢?

基于这样的疑问,我们进行了多种可行性测试。

测试环境及测试方法

测试使用的对比模型对象:GPT-3.5(Web),GPT-3.5-turbo-0301,GPT-4(Web)。

代码片段使用Prompt:HelpmediscovervulnerabilitiesinthisSoliditysmartcontract.

漏洞代码片段的检测对比

在此部分,我们分三次测试,使用历史上常见的漏洞代码作为测试一和测试二的用例,来验证其对基础漏洞的检测能力,测试三中使用中等难度的漏洞代码作为测试用例。

测试一

用例:《智能合约安全审计入门篇——Phishingwithtx.origin》

漏洞代码:

火币尖峰对话卡咩:Defi项目的火爆集中在基于Token的金融领域:6月24日下午,在由火币主办的火币尖峰对话“Waiting For ETH2.0”系列AMA活动中,火币矿池与dForce创始人杨民道、Infstones Head of Bussiness Sili、Stafi&Wetez创始人卡咩、真本聪联合创始人索老头就“乘风破浪的以太坊DeFi ”展开主题讨论,深度解读ETH2.0将给行业带来的重大影响。

在Stafi&Wetez创始人卡咩看来,目前Defi项目的火爆集中在基于Token的金融领域,无论是交易、稳定币、借贷还是衍生品。他表示,任何基于Token的创新金融业务都有可能是新的引爆点,也会在引爆点后形成更宽的赛道。基于Token的业务将会发展的越来越快,种类会越来越多。在这种情况下,进行组合、重组或者整合的机会就开始变多,而边缘一些为这些服务提供工具的机会也会出现。[2020/6/24]

对GPT进行提问:

GPT-3.5(Web)answer

GPT-3.5-turbo-0301answer

动态 | 新华网:炒币、挖矿再度火爆,警惕披着区块链马甲的金融重出江湖:新华网发文《新华视点:“炒币”“挖矿”再度火爆,警惕披着区块链“马甲”的金融“重出江湖”》。文章指出,一些不法分子打着区块链旗号推广宣传虚拟货币、资金盘,将区块链技术等同于虚拟货币,甚至出现“防范代币发行融资风险政策已过时”等言论,有的用“链”“挖矿”“IMO”“STO”等花样翻新的名目,披着区块链的“马甲”开展非法金融活动。目前,上海、北京、广东等多地金融监管部门相继出台措施,对虚拟货币交易场所进行摸排整治。国家互联网金融安全技术专家委员会区块链研究室主任毛洪亮告诉记者,近期、资金盘等不法活动利用区块链概念和发行虚拟货币进行包装,本身与区块链技术无关,涉及资金多,危害严重。[2019/12/4]

GPT-4(Web)answer

可以看到结果:3个测试版本都发现了关键的tx.origin相关问题。

比特币火爆:Coinbase去年营收超10亿美元:随着加密货币的价格暴涨,美国比特币交易平台Coinbase也实现了快速发展,并因此遭遇了硅谷创业公司难得一遇的烦恼:有太多投资者想要入股该公司。知情人士透露,这家成立6年的公司去年的营收突破10亿美元大关,主要是因为人们对比特币和其他虚拟货币的兴趣激增所致。该公司去年8月估值为16亿美元,现在至少翻了一番。知情人士表示,Coinbase截至去年9月30日仅能实现约6亿美元的年营收,但感恩节和圣诞节期间的比特币交易将其全年营收提升到10亿美元以上。[2018/1/23]

测试二

用例:《智能合约安全审计入门篇——溢出漏洞》

漏洞代码:

对?GPT?进行提问:

GPT-3.5(Web)answer

GPT-3.5-turbo-0301answer

区块链概念持续火爆,板块内再现涨停潮:区块链概念持续火爆,板块内再现涨停潮。截至发稿,沪指上涨0.1%,报收3425点;深成指上涨0.24%,报收11464点;创业板上涨0.73%,报收1804点。从盘面上看,区块链等板块涨幅居前。[2018/1/11]

GPT-4(Web)answer

可以看到GPT-3.5(Web)、GPT-3.5-turbo-0301都发现了关键的Overflow漏洞,出乎意料的是GPT-4(Web)居然没有相关提示。

测试三

用例:《空手套白狼——Popsicle被黑分析》

漏洞代码:

区块链概念行情火爆,多家公司回应参与情况:其中,汉王科技表示,目前暂时没有该业务领域的布局。华谊嘉信表示,暂未涉足区块链应用领域。浪潮信息、电连技术均表示未涉及区块链板块。第一创业则表示,是深圳市金融区块链联盟的发起会员,一直在参与区块链在证券行业应用的相关课题研究,并在积极寻找合适的应用场景应用。万达信息智慧城市业务涉及区块链技术。[2018/1/10]

对GPT进行提问:

GPT-3.5(Web)answer

GPT-3.5-turbo-0301answer

GPT-4(Web)answer

对比结果,我们可以看到3个版本都未发现关键的漏洞点。

代码片段的检测总结

可以看到GPT模型对简单的漏洞代码块的检测能力还是不错的,但是对稍微复杂一点的漏洞代码暂时还无法检测,并且在测试中可以看到GPT-4(Web)的整体上下文可读性很高,输出格式清晰、舒服,但是其对代码的审计能力暂时没有远超GPT-3.5(Web)、GPT-3.5-turbo-0301,甚至在部分测试中由于Transformer输出存在一定的不确定性反而导致GPT-4(Web)遗漏了一些关键问题。

对比已知漏洞的全量合约检测

为了更加契合普通项目方在合约审计中的简单操作需求,这里我们提高些难度,针对代码量大的合约进行全量导入上下文,让GPT-4模型进行审计。

用例:《千万美元被盗——DeFi平台MonoXFinance被黑分析》

整份合约分批输入,在对话最后提出检测漏洞请求

这里使用Prompt:

Hereisasoliditysmartcontract?

Contractcode

Theaboveisthecompletecode,helpmediscovervulnerabilitiesinthissmartcontract.

可以看到,GPT-4虽然在OpenAI公布的信息中其单次输入字符总数已经是当前最高,但还是会由于文本超长导致在最后提问时GPT会上下文缺失而只识别到部分内容,所以这样对大型合约而言就无法进行完整的上下文审计。

拆封整份合约,分批输入分批检测

这里使用Prompt:

对话1:

Helpmediscovervulnerabilitiesinthissoliditysmartcontract.

分段内容1

对话2:

Helpmediscovervulnerabilitiesinthissoliditysmartcontract.

分段内容2

对话3:

Helpmediscovervulnerabilitiesinthissoliditysmartcontract.

分段内容3

总结

GPT当前是否适合合约分析

优点

GPT对合约代码中基础的简单的漏洞具备部分检测能力,并且在检测出漏洞后会以很高的可读性来解释漏洞问题,这样的特性比较适合为初级合约审计工作者前期训练提供快速指导和简单答疑。

存在的问题

a.每次生成内容波动

GPT对每次对话的输出存在一定的波动,可以通过API接口参数进行调整,但是依旧不是恒定的输出,虽然这样的波动性对语言对话来说是好的方式,大大提高了对话给人的真实感。但是这对代码分析类的工作来说是一个不好的问题。因为为了覆盖AI可能告知我的多种漏洞回答,我需要多次请求同一问题并进行对比筛选,这无形中又提高了工作量,违背了AI辅助人类提高效率的基准目标。

例如这里再次运行"漏洞代码片段的检测对比测试二:

可以看到其输出结果比之前测试又多了一些额外内容。

b.?漏洞分析能力依旧有很大的提高空间

对稍微复杂的漏洞进行检测即会发现当前的训练模型不能正确的分析并找到相关关键漏洞点。

GPT辅助合约审计的可行性和潜力分析

虽然当前来看GPT对合约漏洞的分析及挖掘能力还处于相对较弱的状态,但它对普通漏洞小代码块的分析并生成报告文本的能力依旧让使用者兴奋,在可预见的未来几年伴随这GPT及其他AI模型的训练开发,相信对大型复杂合约的更快速,更智能,更全面的辅助审计一定会实现。当科技发展可指数级提高人工的效率时就会发生质变,我们非常期待AI对区块链安全的助力,我们会持续关注新AI产品对区块链安全的影响。最后可见的将来我们必将与AI在一定程度上进行融合,愿AI和区块链与你同在。

标签:GPT区块链WEBANSAll In GPT区块链币圈大佬排行榜WEB4价格ans币价格

芝麻开门交易所下载热门资讯
DAO:读懂加密内存池:解决 MEV 和审查问题的全新设计空间

撰文:JonCharbonneau编译:0x11,ForesightNews加密内存池是解决MEV和审查问题的强大工具,目前已有多种可以单独使用的相关方案,它们之间也可以组合使用.

1900/1/1 0:00:00
BIT:模块化区块链如何成为下一代Web3基础设施?

原文:《模块化区块链:推动Web3生态进化的基础设施》作者:Ray摘要毋庸置疑,模块化区块链将会成为下一轮周期的基建设施新叙事,但这并不意味着单体区块链将会被取代.

1900/1/1 0:00:00
MBS:美联储这次3000亿“扩表”和2008、2020年QE有何区别

作者:财主家的余粮来源:作者公号过去一周时间,美联储资产负债表暴增3000亿美元。 我想起来一个广为流传的规则,“人数越多、越大张旗鼓,事儿越不重要”:每次郑重其事、大张旗鼓,全体投票,要么.

1900/1/1 0:00:00
NFT:金色Web3日报|USDT 主导地位已升至 58.1% DeGods将于BTC网络开放500枚新系列NFT铸造

DeFi数据1、DeFi代币总市值:489.5亿美元 DeFi总市值及前十代币数据来源:coingecko2、过去24小时去中心化交易所的交易量71.

1900/1/1 0:00:00
OSM:一文探究 Cosmos 生态的 LSD 机遇

撰文:yyy这条推文来聊一聊Cosmos生态的LSD赛道,与近期火热的以太坊LSD相比,无论从市场关注度还是LSD资产总量,前者都鞭长莫及.

1900/1/1 0:00:00
TOKEN:NFT 市场的下一个新叙事:Open Loyalty

作者:starzq.ethTwitter:starzqethPFP之后,NFT市场的下一个新叙事是什么?大家都在呼唤更有实用价值的NFT,以星巴克为首在打造更多基于Loyalty的用例.

1900/1/1 0:00:00