人工神经网络
一个最重要的创新:人工神经网络
简单来讲,神经网络意味着理论上它可以学习任何用户动作的映射!
为了介绍一会儿将使用的一些术语,从状态到行动的映射将被称为“策略”。
为了让拳手的神经网络学习策略,AI Arena将采取模拟学习和强化学习。其中神经网络架构存储在IPFS上。
在上图中,神经元之间的连接称为“权值”。当你的神经网络正在“学习”时,所发生的是它正在改变权值的值。
OpenAI CEO:已于今日注册Worldcoin:5月24日消息,OpenAI首席执行官Sam Altman在推特上透露,其于今日注册了Worldcoin,因为他目前不在美国。
据悉,Worldcoin是Sam Altman推出的加密项目,不提供服务给居住在有法律限制的国家,比如美国的居民。[2023/5/24 22:14:59]
权值最终将决定状态如何映射到动作,这意味着我们可以将权值解释为“智能”。
神经网络权值对于每个NFT都是唯一的,并存储在以太坊上。
AI设计机制全攻略
状态
(1)什么是状态?
状态是环境在某个时间点的表示。它并没有包含所有信息——只包含了其中必要的信息。
例如:研究人员使用屏幕上的所有像素作为状态,让AI计算出像素代表什么。然后根据他们认为对决策过程重要的因素进行人工调试。
OpenAI CEO:ChatGPT不会取代搜寻引擎,但AI系统未来或许可以:2月8日消息,OpenAI 创始人兼首席执行官 Sam Altman 日前受访时表示,ChatGPT 不会取代搜寻引擎,但相信 AI 系统将来或许能做到。Altman 指出,目前 ChatGPT 仍处于非常早期的阶段。自己一开始做 ChatGPT 就相信它会成功,因此,虽然他对反响规模有些惊讶,但他确实此前就希望并预料到,ChatGPT 会受到人们的关注和喜爱。[2023/2/8 11:55:03]
AI Arena一再强调其关心的是为所有人提供平等的机会——团队希望奖励能够更多地给予坚持训练AI的用户,而不是奖励拥有更多资源的用户。
(2)游戏将使用哪些变量?
下面是状态中包含的变量列表。需要注意的是,AI Arena将使用下标1表示用户自己的AI,下标2表示对手。
DeFi解决方案Shorter Finance获OpenAI Startup Fund投资:金色财经报道,DeFi 解决方案 Shorter Finance 获得 OpenAI Startup Fund 投资,具体金额暂未披露。总部位于旧金山的 OpenAI 致力于打造通用人工智能产品,也是AI 聊天机器人 ChatGPT 的创建者,于 2022 年 10 月设立了该创投基金,在收到 Shorter Finance 投资申请后进行了项目分析并最终决定投资。Shorter Finance 为用户提供链上基础设施服务,包括流动性挖矿、可定制衍生品交易等,而且还与Discord 和 Telegram 等消息服务、钱包应用程序、交易所进行了整合。(digitaljournal)[2023/1/31 11:38:50]
此外,竞技场的左边界的X位置为0,右边界的X位置为1。
韩国检方突击搜查TFL联创Daniel Shin旗下支付技术公司Chai Corporation:11月16日消息,首尔南区检察官办公室突击搜查了由 Terraform Labs 联合创始人 Daniel Shin 创立的支付技术公司 Chai Corporation。
据悉,Chai 曾与 Terraform Labs 建立了合作伙伴关系,将 Terra 韩元 Stablecoin KRT 整合到其支付服务中,检察官指控该公司在未经同意的情况下使用客户的个人信息来启动该服务。此外,本周早些时候,检察官办公室还传唤了 Daniel Shin,调查其在未通知普通投资者的情况下存储发行前的 LUNA,然后出售 Token 获利 1.06 亿美元的行为是否违反了资本市场法。[2022/11/16 13:13:00]
MakerDAO 宣布已部署至 StarkNet,支持用户使用跨链桥进行 Dai 转账:金色财经消息,MakerDAO 宣布该协议已部署至以太坊第 2 层扩展解决方案 StarkNet,支持用户使用跨链桥在以太坊1层和2层之间进行 Dai 转账,这也是该协议首度集成以太坊主网以外的网络。[2022/5/31 3:52:22]
训练
(1)训练概述
这是改变神经网络中权值的过程,以使AI能够起作用。
例如:如果我们在对手面前,我们可能希望我们的战士出击。
有一系列的权值可以实现这一点,训练的重点是让AI学会在特定场景中采取特定的行动。
AI Arena在应用程序中嵌入了以下培训计划:
模仿学习
为了学习如何战斗,你的AI将观察你并学习模仿你的动作。
自我学习
为了学习你无法教给它的技能,你的AI将与自己的副本对抗,以不断提高。
(2)为什么需要训练?
1·随机初始化
首次创建NFT拳手时,神经网络权值也随之生成。一开始它会随机采取行动,因为它不知道在什么情况下应该采取什么行动。
因此为了准备战斗,我们必须训练它,使它学会一个好的作战策略。
2·随机策略
正如上文“神经网络”部分中提到的,从状态到动作的映射称为策略。
换句话说,策略定义了代理在某些情况下的行为方式。在训练之前,NFT拳手还没有学会一个好的战斗策略,所以只是随机行动。
(1)通过观察学习
理解模仿学习的最好方法是想象你是一个师父,你的AI是一个你正在准备战斗的战士。
你用你的人工智能进行搏击,它学习模仿你在特定场景中的动作。
我们正在写一篇关于模仿学习的综合博文,到时候会将其链接到这里。
(2)演示
实际情况:你实际操控的是左边的灰色拳手,而你的AI在右边。你可以测试一些动作,观察AI如何模仿你。
请注意:它不会立即复刻你的动作,因为神经网络需要一点时间来学习,所以在AI学会之前,你可能需要多重复几次你的动作。
为简单演示,目前AI Arena只允许用户使用这些操作:向左跑、向右跑、单拳、双拳和防守。
(1)完美匹配
最完美的拳击搭档就是用户自己。通过自我学习,你的AI总是在不断地挑战自己,不断地改进。
(2)不同的学习范式
通过模仿学习,AI通过观看演示进行学习。在自我学习中,AI像对手一样学习和战斗没有多大意义,因为对手是人工智能本身的克隆。
但是如果没有专家向人AI展示如何战斗,那么它如何学习该做什么呢?——通过奖励。
AI将学会采取给予它更多正向奖励的行动,而减少采取给予它负面奖励的行动。
定制训练
Python环境[正在准备中]
AI Arena计划为玩家引入一个python环境来训练他们自己的模型。
目前,用户仅限于使用团队在应用程序中提供的两种培训方法;但不久的将来,应用程序将可以允许玩家导入其自定义培训模型并上链。
游戏模式探索
战斗
AI Arena目前有两种可用的作战模式:模拟赛和排位赛。除此之外,团队计划在不久后整合另外两种作战模式。
1)模拟赛
玩家可以在对抗竞技场测试他们的拳手来预先训练的AI。在这种模式下将没有任何奖励。
2)排位赛
玩家将让他们的拳手去对抗来自世界各地的拳手。玩家的唯一目标就是努力攀登排行榜,成为竞技场的冠军!
玩家在排行榜上的排名越高,赢得一场战斗的回报奖励就越高。
3)目标
虽然每种战斗模式都有其独特之处,但它们都有一个共同的胜利目标:在指定的时间内消耗对手所有生命值。
链金交易员总结
目前AI Arena尚处在早期,很适合提前埋伏观察。据官方透露,游戏正式版本大概率于明年推出,而今年年末推出的测试版本将只有白名单用户可以参与体验。
白名单用户名额的获取方式是参与团队即将推出的解密游戏,通过游戏后的用户将会被随机选择是否进入白名单。
有兴趣的玩家可以加入他们的Discord尝试体验,大概率后期会有早鸟空投奖励。
标签:CHAARERENARENitochainDarexTravelGalactic Arena: The NFTverseRENA
Yuga Labs向法国巴黎蓬皮杜中心捐赠CryptoPunk#110:金色财经报道,Yuga Labs宣布将其最新收购的NFT CryptoPunk#110捐赠给法国巴黎蓬皮杜中心.
1900/1/1 0:00:00元宇宙(Metaverse)一个狭义的定义是一个可穿越的、视觉沉浸式的、同步多用户异构的虚拟世界.
1900/1/1 0:00:009月2日,加密元素正式披露NFT计划中的第二个项目——PlayerOne,这是继加密元素进军NFT市场后的又一个重磅项目。最近发布内测的Element表现亮眼,被很多用户和业内著名投资者看好.
1900/1/1 0:00:00Web3的潜力令人兴奋,如果传统互联网应用都在Web3进行重塑,将会是一波巨大的浪潮。音乐平台Audius是其中的先行者,试图通过区块链的设计来重建音乐流媒体的共享方式.
1900/1/1 0:00:00撰文:Zoe Zhang互联网的发展推动人类文明进入信息大爆炸时代,我们需要花更多时间去甄别有效信息,而好的产品也进入到「酒香也怕巷子深」的困境.
1900/1/1 0:00:00Binemon是最近银柳实验室研究的N款GameFi游戏中的一款,也是目前比较看好的一款游戏,有着火爆的潜质.
1900/1/1 0:00:00