火星链 火星链
Ctrl+D收藏火星链
首页 > BNB > 正文

技术入门 | Solidity编程语言 : 基本编译原理介绍与添加新指令

作者:

时间:1900/1/1 0:00:00

本文目标

本文的主要目的:1、了解solidity的基本编译原理2、通过示例的方式了解如何添加新的指令,不会涉及到solidity语言的语法讲解。

solidity简介

solidity是智能合约的开发语言,是一种语法类似于javascript的高级语言。合约源码经过编译生成虚拟机代码运行在虚拟机中。

开发文档:https://solidity

functionget()publicviewreturns(uint){returnstoredData;}}

abi,data,opcodes

以上代码在remix:

http://remix.ethereum.org/中使用0.5.1commit版本编译生成

abi=,"name":"get","outputs":,"payable":false,"stateMutability":"view","type":"function"},{"constant":false,"inputs":,"name":"set","outputs":,"payable":false,"stateMutability":"nonpayable","type":"function"}]

data="0x60806040526000805534801561001457600080fd5b5060c2806100236000396000f3fe6080604052600436106043576000357c0100000000000000000000000000000000000000000000000000000000900480636d4ce63c146048578063b8e010de146070575b600080fd5b348015605357600080fd5b50605a6084565b6040518082815260200191505060405180910390f35b348015607b57600080fd5b506082608d565b005b60008054905090565b4360008190555056fea165627a7a72305820825c534e94b487410e10fa0ba5da11584c0b0ad2bd9e56397a3dfa89e504ee1f0029"

opcodes="

固定指令:PUSH10x80PUSH10x40MSTORE

变量:PUSH10x0DUP1SSTORE//对应的storedData=0

内联函数:CALLVALUEDUP1ISZEROPUSH20x14JUMPIPUSH10x0DUP1REVERTJUMPDESTPOP//用于出错回滚

zkSync与加密基础设施公司Espresso Systems合作,将集成CAPE技术以实现隐私交易:1月19日消息,基于ZK Rollup的以太坊二层网络 zkSync 正与加密基础设施公司 Espresso Systems 合作,将集成“可配置资产隐私”CAPE(Configurable Asset Privacy)的新技术,以实现隐私交易。任何用户都可以在不暴露区块链的私人数据的情况下进行交易,从而为不希望余额、链上活动和其他可公开访问的私人数据暴露的机构消除障碍。

据悉,该合作仍在计划中,尚未部署在 zkSync 的测试网上,预计今年晚些时候将更新现实世界资产、供应链、身份、支付和贸易融资的代币化。[2023/1/19 11:20:18]

部署代码指令:PUSH10xC2DUP1PUSH20x23PUSH10x0CODECOPYPUSH10x0RETURNINVALID//部署合约的核心指令

固定指令:PUSH10x80PUSH10x40MSTORE

固定指令:PUSH10x4CALLDATASIZELT//用于校验input大小。

加载合约代码:PUSH10x43JUMPIPUSH10x0CALLDATALOADPUSH290x100000000000000000000000000000000000000000000000000000000SWAP1DIVDUP1PUSH40x6D4CE63CEQPUSH10x48JUMPIDUP1PUSH40xB8E010DEEQPUSH10x70JUMPIJUMPDESTPUSH10x0DUP1REVERTJUMPDEST

内联函数:CALLVALUEDUP1ISZEROPUSH10x53JUMPIPUSH10x0DUP1REVERTJUMPDESTPOP

get函数:PUSH10x5APUSH10x84JUMPJUMPDESTPUSH10x40MLOADDUP1DUP3DUP2MSTOREPUSH10x20ADDSWAP2POPPOPPUSH10x40MLOADDUP1SWAP2SUBSWAP1RETURNJUMPDEST

内联函数:CALLVALUEDUP1ISZEROPUSH10x7BJUMPIPUSH10x0DUP1REVERTJUMPDESTPOP

set函数:PUSH10x82PUSH10x8DJUMPJUMPDESTSTOPJUMPDESTPUSH10x0DUP1SLOADSWAP1POPSWAP1JUMPJUMPDESTNUMBERPUSH10x0DUP2SWAP1SSTOREPOPJUMPINVALID

其他指令:LOG1PUSH60x627A7A723058KECCAK256DUP30x5cMSTORE80x4eSWAP50xb4DUP8COINBASE0xeLTSTATICCALLSIGNEXTEND0xa50xdaGTPC0x4cSIGNEXTENDEXP0xd20xbdSWAP15JUMPCODECOPYPUSH270x3DFA89E504EE1F0029000000000000000000000000000000000000"//

上述abi,data是在部署合约和执行合约需要的数据。其中abi包含了合约中用到的函数名,函数的输入输出,与函数的属性。opcodes是虚拟机要执行的具体代码指令,data是opcodes的16进制,二者之间可以互相转化。下面介绍下如何生成abi与opcodes。

solidity编译原理简述

这里以上述合约代码为例,简单介绍下解析流程

1、以字符串的形式读入完整合约代码,转第2步;

2、去除字符串前的空格,然后遍历字符串,并以空格,‘{’,'}',';','(',')'等为分隔符将字符串进行分割,然后与TOKEN_LIST中定义的TOKEN进行对比,并替换为应的TOKEN,转第3步。

火币集团:火币泰国品牌授权已到期 将不再为该项目提供技术产品支持:9月6日消息,根据官方网站发布的公告,泰国证券交易委员会将提议财政部吊销火币在泰国子公司的数字资产交易许可证。对此,火币集团方面回应称,Huobi Thailand是基于原来火币云与本地合作方合作搭建的火币云泰国站项目,火币云仅为其提供技术产品支持及品牌授权。目前品牌授权及技术服务合同均已到期,后续火币云将不再为该项目提供技术产品支持,请注意防范有关风险。

此前消息,根据官方网站发布的公告,泰国证券交易委员会(SEC)将提议财政部吊销火币在泰国子公司的数字资产交易许可证。在9月2日的会议上,泰国SEC命令该加密交易所继续暂停其在泰国的服务,并给其三个月的时间归还或回购客户的资产。[2021/9/6 23:04:37]

3、第一个TOKEN是pragma,然后以pragma为开始,直到';'结束,确定语言为solidity,版本号大于等于0.5.0,并比较当前编译器版本是否匹配,转第4步。

4、继续遍历,TOKEN为contract,,然后从contract开始,确定下一个字符串storenumber为contractname,继续遍历,从‘{’开始,,到配对的‘}’结束,此时确定了合约名为storenumber的合约内容,转第9步。

5、继续遍历,TOKEN为uint,判断为数据类型,以‘;’为结尾,确定数据类型为uint,类型名为storedData,转第6步

6、继续遍历,TOKEN为function,后续字符串set为函数名,以‘(’,开始,以‘)’为终确定input为空,继续遍历TOKEN为public,确定函数属性,继续遍历TOKEN为‘{’,以配对的‘}’为结束,确定函数体,转第7步。

7、继续遍历,TOKEN为function,处理逻辑与第6步相同,但是增加了view属性与returns,returns的解析结果对应了abi中的outputs,转第8步。

8、继续遍历遇到与合约初始‘{’配对的‘}’,转第4步继续处理。

9、遍历结束,进行合法性检查(语法检查,命名规则检查,指令检查等),转第10步。

10、开始编译合约,即opcodes的生成过程。编译过程可分成三个过程,转第11步。

11、编译初始化。初始化指令是固定的:PUSH10x80PUSH10x40MSTORE。然后取出所有的状态变量,这里的状态变量会被编译为:PUSH10x0DUP1SSTORE,转到第12步。

备注:1、这里的指令并不是一开始就是这样,而是后期经过翻译过的,比如PUSH10x80在这里的正确表示方式是AssembllyItem(type:pushdata,data:0x80),之后经过token,instruction的对应转化为指令2、状态变量指令PUSH10x0DUP1SSTORE表示初始化变量为值为零,变量位置偏移为0。如果代码中初始化为1,这里的指令会编译成PUSH10x1PUSH10x0SSTORE。如果增加一个变量初始化为3,则会被编译为PUSH10x1PUSH10x0SSTOREPUSH10x3PUSH10x1SSTORE

12、继续编译,主要是完成对函数的编译,添加一个用于检查并回滚的内联函数。对应的指令:CALLVALUEDUP1ISZEROPUSH20x14JUMPIPUSH10x0DUP1REVERTJUMPDESTPOP,转13步;

13、添加合约初始化:PUSH10xC2DUP1PUSH20x23PUSH10x0CODECOPYPUSH10x0RETURN。至此,部署合约的主要opcodes生成完毕。下面开始编译函数,转14步;

14、先根据所有的函数名生成对应的函数地址,如例子中的0x6D4CE63C,0xB8E010DE,实际调用函数的时候在查看交易的input中,就有这个值,转15步;

声音 | 证券日报:发展区块链技术既要积极又要稳妥:11月2日,证券日报刊文“发展区块链技术既要积极又要稳妥”。文章称,区块链技术并非完美无瑕。全社会应对区块链技术秉持客观理性的态度。特别是在当下,区块链顶着万众瞩目的光环,笔者认为,当前对区块链技术要避免陷入三个认识和实践的误区:??第一,区块链等于虚拟货币。??第二,区块链就是完美技术。?第三,区块链应该全民参与。?下一步,我国应加大对区块链技术的研究和应用,把区块链作为核心技术自主创新的重要突破口。要加强区块链技术应用的顶层规划和制度安排,加速底层平台、业务应用等相关标准体系建设,一方面以此更好参与国际竞争;另一方面杜绝借机神化、炒作区块链。[2019/11/2]

15、编译函数,生成各个函数的指令,可参照前文示例。转16步;

16、最后编译missingFunctions。转17步;

17、打印结果,编译结束。

上述解析的流程只是介绍了基本的思路,实际的处理过程要复杂的多,因为合约中可以有类,继承,多态,接口,库等形式的存在,需要进行一些额外的处理。

生成abi:

abi的内容是合约内函数的相关信息,包括函数的constant,name,inputs,outputs,payable,stateMutability,type,从上述第2至8步的解析即可获取到上述信息,然后封装成json返回给前端即可。

生成opcodes:

上述第10到16步内流程即是生成cpcodes的过程,在实际使用中,用的opcodes的16进制。

添加新指令

影响范围

根据上述编译流程的解析,要添加新的指令,需要考虑以下4点

1、token的定义:语法定义,比如token{Add,+},将+与Add对应起来,解析的时候将代码中的+替换为Add

2、instruction的定义:提供给虚拟机执行的指令,需要在编译器和虚拟机中添加相同的定义

3、casetoken的处理:将token与instruction对应起来,编译的过程中将token::Add替换为instruction::ADD指令,供虚拟机识别。

4、新指令对编译的影响:比如对函数的影响,对存储的影响等,这个修改可以参考其他的同类型指令,比如添加的是运算符就参考加减乘除指令,添加的是块属性就参考已有的number,gaslimit指令。

5、虚拟机中对新加指令的定义与处理

示例:以添加RANDOM指令(获取块中的随机数属性,可参考number属性,合约中以block.number,block.random的方式进行使用)为例,说明在代码中添加的位置。

修改编译器代码

1、查看token定义,代码位置:liblangutil/Token.h。在TOKEN_LIST已定义了2中类型的token,一种是关键字token,一种是非关键字token,如括号,运算符,数据类型。要添加的random不是以上类型,不需要进行token定义。

#token定义示例,格式为M(name,string,precedence),M可以是T或者K,T表示非关键字token,K表示关键字token。name表示token名称,string为token的原生字符串,precedence表示优先级。

#defineTOKEN_LIST(T,K)

......

T(LParen,"(",0)

T(RParen,")",0)

T(LBrack,"[",0)

声音 | 张礼立:以区块链等技术为基础工具 推动数字转型:据经济日报消息,1月25日,上海市海外经济技术促进会秘书长张礼立撰文指出,实体经济是互联网经济的基础,数字转型是互联网经济的落地途径,其重点在于借助数字化共享平台,以大数据、物联网、区块链等技术为基础工具,对商业全过程的数据进行提炼。[2019/1/25]

T(RBrack,"]",0)

T(AssignShr,">>>=",2)

T(AssignAdd,"+=",2)

T(AssignSub,"-=",2)

......

K(Continue,"continue",0)

K(Contract,"contract",0)

K(Do,"do",0)

K(Else,"else",0)

......

2、指令定义,代码位置:libevmasm/Instruction.h。在enumcalssInstruction中找到block的相关属性,并在其后追加RANDOM指令。如下所示,RANDOM=0x46。注意添加的指令号不能与其他的冲突,比如不能再添加一个0x40的指令,会与现有的BLOCKHASH指令冲突。

enumclassInstruction:uint8_t{......BLOCKHASH=0x40,///<gethashofmostrecentcompleteblockCOINBASE,///<gettheblock'scoinbaseaddressTIMESTAMP,///<gettheblock'stimestampNUMBER,///<gettheblock'snumberDIFFICULTY,///<gettheblock'sdifficultyGASLIMIT,///<gettheblock'sgaslimitRANDOM,......

}

上述定义为16进制,需要有一个字符串的"RANDOM"与指令对应,代码位置libevmasm/Instruction.cpp中。

std::map<std::string,Instruction>constdev::solidity::c_instructions={......{"NUMBER",Instruction::NUMBER},{"DIFFICULTY",Instruction::DIFFICULTY},{"GASLIMIT",Instruction::GASLIMIT},{"RANDOM",Instruction::RANDOM},......}staticstd::map<Instruction,InstructionInfo>constc_instructionInfo={......{Instruction::ADD,{"ADD",0,2,1,false,Tier::VeryLow}},{Instruction::NUMBER,{"NUMBER",0,0,1,false,Tier::Base}},{Instruction::DIFFICULTY,{"DIFFICULTY",0,0,1,false,Tier::Base}},{Instruction::GASLIMIT,{"GASLIMIT",0,0,1,false,Tier::Base}},{Instruction::RANDOM,{"RANDOM",0,0,1,false,Tier::Base}},......}//后面的0,0,1,false,Tier::Base是可变的,根据指令的需要。第一个默认为0即可,第二个0表示参数个数,1表示需要1个返回值。false可理解为只在虚拟机内部使用,如果涉及到数据库的读写,这里要填成true。最后的Tier::Base是gasprice的级别,根据需要填写即可。

声音 | 阿里巴巴CEO张勇:阿里巴巴将通过区块链等技术赋能制造业:阿里巴巴集团CEO张勇在日前发布的致股东信中表示,阿里巴巴将通过云计算、人工智能、区块链和物联网等方面的布局,用技术赋能制造业,通过“新制造”帮助千千万万的制造业企业应对未来的挑战。[2018/11/22]

3、指令的处理:代码位置libsolidity/codegen/ExpressionCompiler.cpp

boolExpressionCompiler::visit(MemberAccessconst&_memberAccess){......caseType::Category::Magic:if(member=="coinbase")m_context<<Instruction::COINBASE;elseif(member=="timestamp")m_context<<Instruction::TIMESTAMP;elseif(member=="difficulty")m_context<<Instruction::DIFFICULTY;elseif(member=="number")m_context<<Instruction::NUMBER;elseif(member=="gaslimit")m_context<<Instruction::GASLIMIT;elseif(member=="random")m_context<<Instruction::RANDOM;......}//不同的指令有不同的case进行处理,比如token:Add的处理如下:voidExpressionCompiler::appendArithmeticOperatorCode(Token_operator,Typeconst&_type){......switch(_operator){caseToken::Add:m_context<<Instruction::ADD;break;caseToken::Sub:m_context<<Instruction::SUB;break;caseToken::Mul:m_context<<Instruction::MUL;break;......}//如果添加的是其他类型的指令,就找到对应的case添加即可。

4、对函数,存储的影响:

确定数据类型,代码位置libsolidity/ast/Types.cpp

MemberList::MemberMapMagicType::nativeMembers(ContractDefinitionconst*)const{//指定存储的数据类型......caseKind::Block:returnMemberList::MemberMap({{"coinbase",make_shared<AddressType>(StateMutability::Payable。,{"timestamp",make_shared<IntegerType>(256。,{"blockhash",make_shared<FunctionType>(strings{"uint"},strings{"bytes32"},FunctionType::Kind::BlockHash,false,StateMutability::View。,{"difficulty",make_shared<IntegerType>(256。,{"number",make_shared<IntegerType>(256。,{"gaslimit",make_shared<IntegerType>(256。,{"random",make_shared<IntegerType>(256。//注意这里,设置数据类型为uint256,如果需要其他数据类型,参考libsolidity/ast/Types.h中的类型定义});......

对函数的影响:代码位置libevmasm/Semanticlnformation.cpp

boolSemanticInformation::invalidInPureFunctions(Instruction_instruction)

{

switch(_instruction)

{

......

caseInstruction::TIMESTAMP:

caseInstruction::NUMBER:

caseInstruction::DIFFICULTY:

caseInstruction::GASLIMIT:

caseInstruction::RANDOM://增加的random指令影响函数的Pure属性。returntrue表示该函数不能使用pure关键字。

caseInstruction::STATICCALL:

caseInstruction::SLOAD:

returntrue;

default:

break;

}

returninvalidInViewFunctions(_instruction);

}

修改虚拟机代码

random指令的定义,代码位置:hvm/evm/opcodes.go

const(

//0x40range-blockoperations

BLOCKHASHOpCode=0x40+iota

COINBASE

TIMESTAMP

NUMBER

DIFFICULTY

GASLIMIT

RANDOM//新增

)

varopCodeToString=mapstring{

......

NUMBER:"NUMBER",

DIFFICULTY:"DIFFICULTY",

GASLIMIT:"GASLIMIT",

RANDOM:"RANDOM",//新增

......

}

varstringToOp=mapOpCode{

......

"NUMBER":NUMBER,

"DIFFICULTY":DIFFICULTY,

"GASLIMIT":GASLIMIT,

"RANDOM":RANDOM,//新增

......

}

指令操作的定义:代码位置:hvm/evm/jump_table.go,添加指令的操作属性

instructionSet=operation{

execute:opRandom,

gasCost:constGasFunc(GasQuickStep),

validateStack:makeStackFunc(0,1),

valid:true,

}

上述操作码对应函数opRandom的定义:代码位置hvm/evm/instrucitons.go,可参考number函数的定义

funcopNumber(pc*uint64,evm*EVM,contract*Contract,memory*Memory,stack*Stack)(byte,error){

stack.push(math.U256(new(big.Int).Set(evm.BlockNumber)))

returnnil,nil

}

funcopRandom(pc*uint64,evm*EVM,contract*Contract,memory*Memory,stack*Stack)(byte,error){

stack.push(math.U256(new(big.Int).Set(evm.Random)))

returnnil,nil

}

上述opRandom中使用了evm.Random,因此需要在evm结构体增加Random的属性。代码位置hvm/evm/evm.go

typeContextstruct{

......

Coinbasecommon.Address//ProvidesinformationforCOINBASE

GasLimit*big.Int//ProvidesinformationforGASLIMIT

BlockNumber*big.Int//ProvidesinformationforNUMBER

Time*big.Int//ProvidesinformationforTIME

Difficulty*big.Int//ProvidesinformationforDIFFICULTY

Random*big.Int//新增

}

上述增加了Random属性,需要对其进行初始化,代码位置为:hvm/hvm.go

funcNewEVMContext(msgMessage,header*types.Header,chainChainContext,author*common.Address)evm.Context{

......

returnevm.Context{

CanTransfer:CanTransfer,

Transfer:Transfer,

GetHash:GetHashFn(header,chain),

Origin:msg.From(),

Coinbase:beneficiary,

BlockNumber:new(big.Int).Set(header.Number),

Time:new(big.Int).Set(header.Time),

Difficulty:new(big.Int).Set(header.Difficulty),

GasLimit:new(big.Int).Set(header.GasLimit),

Random:new(big.Int).Set(header.Random),//新增

GasPrice:new(big.Int).Set(msg.GasPrice()),

}

}

上述获取的header为当前校验的块的header。header.Random的增加与生成此处不介绍了。

至此,编译源码与虚拟机源码添加Random指令修改完成。

生成编译器

1、下载源码:gitclone

https://github.com/ethereum/solidity

2、cdsolidity&&gitcheckoutv0.5.7#本文例子以v0.5.7版本为基础版本进行修改

3、按照前文介绍修改相关代码

4、编译源码生成编译器

二进制编译器:mkdirbuild&&cdbuild&&cmake..&&make#执行完成后生成二进制文件:solc

js编译器:执行./scripts/build_emscripten.sh#执行完成后生成js文件:soljson.js

5、使用编译器编译合约代码

使用二进制编译器:solc--abitest.sol#生成abi

solc--bintest.sol#生成data

solc--opcodestest.sol#查看opcodes

使用js编译器:可以将soljson.js替换到remix中进行测试。需要搭建remix环境并修改soljson.js的加载路径或者自行编写js脚本进行测试。

6、按照前文介绍修改虚拟机代码并部署到测试链,使用上述生成的abi,data进行链上测试,合约部署和调用过程不在赘述。

注:如有问题请在下方留言联系我们技术社群。

汪晓明博客:http://wangxiaoming.com/

汪晓明:HPB芯链创始人,巴比特专栏作家。十余年金融大数据、区块链技术开发经验,曾参与创建银联大数据。主创区块链教学视频节目《明说》30多期,编写了《以太坊官网文档中文版》,并作为主要作者编写了《区块链开发指南》,在中国区块链社区以ID“蓝莲花”知名。

标签:IONNSTUSHPUSHauction币黑客MONSTR币sushi币值得长期持有吗Pushswap

BNB热门资讯
比特币:江卓尔:减半牛市会不会来?会怎么来?

目前部分人认为还是熊市,部分人认为是牛市初期,不管是哪种意见,都意味着目前的牛熊周期位置,蕴含着能被减半引爆的上升势能。有人说大家都认为减半会牛市,提前透支了利好,所以减半牛市就不会来了.

1900/1/1 0:00:00
GAR:稳定币与DeFi这对天作之合将创造下一个大事件,Bitcoin Core前开发者Jeff Garzik这么说

稳定币和Layer1时代前比特币核心代码贡献者JeffGarzik说稳定币正在推动去中心化金融进入下一阶段.

1900/1/1 0:00:00
LIBRA:美国财长部长:Visa、PayPal等退出Libra是因为尚未达到监管标准,担心政府采取行动

在Facebook的天秤座加密货币的5个主要支持者宣布退出该项目后,美国财政部长史蒂芬·姆努钦表示,他认为这些公司可能担心政府会采取行动.

1900/1/1 0:00:00
DEF:速读 | EOS和Cosmos能否在DeFi领域和以太坊角力

作者:真本聪今天内容包括:1、以太坊吃定Defi了吗?还是说会输给这些新竞争者2、比特币与Decred的叙事3、“机构投资者何时会加入比特币盛宴?”4、SOV和四个转折点5、如果比特币不是“那一.

1900/1/1 0:00:00
EFI:以太坊深度评论:新增地址数预测价格走势 估值恐处历史低位

评论概要2017年的1CO在带来乱象的同时,也促进了以太坊生态的发展。根据标准梅特卡夫指数,目前的以太坊价格相比于价值处于历史低位.

1900/1/1 0:00:00
ORS:BTC短线走势偏弱,是洗盘还是趋势下行?

作者|哈希派分析团队推特创始人JackDorsey:我定期购买BTC:推特创始人JackDorsey在推特中表示自己虽然不编程和交易,也不从事加密货币行业,但是长期定投BTC.

1900/1/1 0:00:00