火星链 火星链
Ctrl+D收藏火星链

IND:横跨6种模态 Meta开源AI模型ImageBind 为虚拟世界打开大门

作者:

时间:1900/1/1 0:00:00

来源:《科创板日报》

编辑宋子乔

当地时间5月9日,Meta宣布开源了一种可以将可以横跨6种不同模态的全新AI模型ImageBind,包括视觉、温度、文本、音频、深度信息、运动读数。目前,相关源代码已托管至GitHub。

何为横跨6种模态?

Nansen:Coinbase和Binance当前已拥有55%的加密货币交易所ETH总持有量:金色财经报道,据区块链分析平台 Nansen 在社交媒体披露数据显示,当前加密货币交易所持有的以太坊大约为 2490 万枚,其中 35% 存放在 Coinbase 上(约 872 万枚),而 Binance 的持有占比约为 20%(约 494 万枚),这意味着两家交易所合计已占有交易所持有 ETH 余额的 55%。此外,加密货币交易所 Kraken 持有的以太坊占到交易所 ETH 总持有量的 7.89%(约 197 万枚),OKX 和 Gemini 占比分别为 5.02%(约 182 万枚) 和 4.66%(约 125 万枚)。[2023/1/30 11:35:47]

即以视觉为核心,ImageBind可做到6个模态之间任意的理解和转换。Meta展示了一些案例,如听到狗叫画出一只狗,同时给出对应的深度图和文字描述;如输入鸟的图像+海浪的声音,得到鸟在海边的图像。

知情人士:FTX和SBF的公关公司M Group与纽约时报关系密切:11月24日消息,加密KOL Autism Capital发推称,一位消息人士透露,FTX和SBF使用M Group作为他们的公关代理。M Group之前曾与纽约时报及其专栏作家Andrew Sorkin密切合作,并为公关目的发表文章,这或许可以解释近期关于FTX与SBF的相关软文。[2022/11/24 8:03:22]

国际刑警组织在新加坡成立致力于加密货币犯罪的团队:10月18日消息,国际刑警组织宣布在新加坡成立了一个致力于加密货币犯罪的团队。对此,国际刑警组织秘书长Jurgen Stock表示:“加密货币正在成为全世界的主要威胁,在缺乏法律框架的情况下,加密货币对执法框架构成了挑战。”

此前消息,国际刑警组织已向Terra创始人Do Kwon发出红色通缉令。(Coingape)[2022/10/18 17:30:32]

而此前的多模态AI模型一般只支持一个或两个模态,且不同模态之间难以进行互动和检索。ImageBind无疑具有突破性意义,Meta称,ImageBind是第一个能够同时处理6种感官数据的AI模型,也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。

ImageBind能做到这些,核心方法是把所有模态的数据放入统一的联合嵌入空间,无需使用每种不同模态组合对数据进行训练

先利用最近的大型视觉语言模型它将最近的大规模视觉语言模型的零样本能力扩展到新的模态,它们与图像的自然配对,如视频-音频和图像-深度数据,来学习一个联合嵌入空间。

而以图像/视频为中心训练好AI后,对于原始数据中没有直接联系的模态,比如语音和热量,ImageBind表现出涌现能力,把他们自发联系起来。

有行业观察者已经迫不及待地将ImageBind于元宇宙联系在一起。

正如Meta的研究团队所说,ImageBind为设计和体验身临其境的虚拟世界打开了大门。该团队还表示,未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号,进一步探索多模态大模型的可能性,“人类可使用多种感官学习、了解世界,借助ImageBin,机器离人类又近了一步”。

值得注意的是,Meta还表示,ImageBind可以利用DINOv2强大的视觉功能进一步提高其能力。DINOv2是Meta开源的计算机视觉领域的预训练大模型,同样与Meta的元宇宙愿景密不可分,MetaCEO扎克伯格此前强调,DINOv2可以极大地加持元宇宙的建设,让用户在元宇宙中的沉浸体验更出色。

尽管ImageBind目前只是研究项目,没有直接的消费者用户或实际应用。但可以想象的是,随着ImageBind模型逐步完善,AI应用场景将进一步拓展,元宇宙建设也将更进一步。

比如当ImageBind融入虚拟现实设备,使用者能获得更沉浸式的体验,玩家进入游戏后不仅能感受游戏场景的温度,还能感知物理层面上运动。

国盛证券分析师刘高畅此前大胆预测,1-5年内,随着多模态的发展带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。未来5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

标签:BINMAGEMAGINDBINU币imagecoinMagiLayer 1 Quality Index

比特币行情热门资讯
VER:去中心化的Prover如何实现?Opside创新性提出ZKP的两步提交算法

为什么我们需要去中心化的?prover当前,以太坊主网上已经有多个?ZK-Rollups?在运行了。然而?ZK-Rollup?的去中心化设计仍然处于早期阶段.

1900/1/1 0:00:00
STE:Sui推出学术研究奖计划,首轮将提供25万美元支持

人工智能和机器学习领域是当今世界科技领域中最热门的领域之一,它涉及到计算机科学、应用数学、统计学、物理学、生物学等众多学科的交叉.

1900/1/1 0:00:00
OIN:看不下去AI胡说八道,英伟达出手给大模型安了个“护栏”

来源:量子位作者:萧箫大模型们胡说八道太严重,英伟达看不下去了。他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题.

1900/1/1 0:00:00
OIN:AI 成谎言制造机,资本涌向打假科技

作者|Lexie编辑|Lu来源丨硅兔赛跑 图片来源:由无界AI工具生成过去几个月掀起AI小高潮,先是OpenAI的大模型GPT-4公布,多家测评表示比ChatGPT准确许多.

1900/1/1 0:00:00
DAY:Sui是下一轮的行业叙事 or 上一轮的末日余晖

前两天,Sui主网正式上线。新上任的Sui基金会董事总经理GregSioourounis表示,“对于整个Sui社区和整个数字资产生态系统来说都是一个里程碑……为世界各地的用户解锁了无限的可能性.

1900/1/1 0:00:00
区块链:金色图览 | NFT行业周报(4.30 - 5.06)

周报概要:1、上周NFT总交易额:187,377,632(美元)2、上周NFT总交易笔数:283.

1900/1/1 0:00:00