火星链 火星链
Ctrl+D收藏火星链
首页 > ADA > 正文

OIN:看不下去AI胡说八道,英伟达出手给大模型安了个“护栏”

作者:

时间:1900/1/1 0:00:00

来源:量子位

作者:萧箫

大模型们胡说八道太严重,英伟达看不下去了。

他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题。

这个新工具名叫“护栏技术”,相当于给大模型加上一堵安全围墙,既能控制它的输出、又能过滤输入它的内容。

一方面,用户诱导大模型生成攻击性代码、输出不道德内容的时候,它就会被护栏技术“束缚”,不再输出不安全的内容。

另一方面,护栏技术还能保护大模型不受用户的攻击,帮它挡住来自外界的“恶意输入”。

美OCC代理署长:同时实现去中心化、安全性和规模化对于公共区块链是不可能的:6月18日消息,美国货币监理署 (OCC) 代理署长Michael Hsu周五在美国银行家协会的一次活动中表示,资产代币化是金融未来的重大进步,但去中心化区块链可能存在太多问题,无法应对这一趋势。他认为,代币化不需要权力下放和去信任,同时实现去中心化、安全性和规模化对于公共区块链是不可能的。

Hsu称,加密行业在很大程度上仍然是自我参照的,并且与现实世界脱节,尽管多年来一直处于主流聚光灯下,他们宣扬数十亿美元的风险投资和数百万小时的代码承诺,但该行业不成熟且充满风险。[2023/6/18 21:45:36]

现在,这个大模型护栏工具已经开源,一起来看看它的效果和生成方法。

防止大模型胡言乱语的三类“护栏”

根据英伟达介绍,目前NeMoGuardrails一共提供三种形式的护栏技术:

Binance资产储备总值超过630亿美元:3月7日消息,Binance公告,其储备证明系统升级,添加了另外11种代币,包括MASK、ENJ、WRX、GRT、CHR、CRV、1INCH、CVP、HFT、SSV和DOGE,现在显示的24项资产储备总值超过630亿美元。[2023/3/7 12:47:52]

话题限定护栏、对话安全护栏和攻击防御护栏。

话题限定护栏,简单来说就是“防止大模型跑题”。

大模型具备更丰富的想象力,相比其他AI更容易完成创造性的代码和文字编写工作。

外媒:币安强烈倾向于取消FTX收购计划:11月9日消息,知情人士透露,在审查 FTX 的内部数据大约半天后,币安强烈反对完成交易。据知情人士透露,在 FTX 寻求帮助并被其他大型交易所 Coinbase 和 OKX 拒绝后,币安随后达成了交易。币安拒绝就拟议交易的现状发表评论。(CoinDesk)[2022/11/10 12:40:36]

但对于特定场景应用如写代码、当客服而言,至少用户不希望它在解决问题时“脱离目标范围”,生成一些与需求无关的内容。

这种情况下就需要用到话题限定护栏,当大模型生成超出话题范围的文字或代码时,护栏就会将它引导回限定的功能和话题上。

Coinbase NFT上线近三个月总交易额不足300万美元:7月7日消息,据Dune Analytics数据显示,自4月20日推出以来,Coinbase NFT交易量仅290万美元,截至目前为2,953,077美元,交易量为22,766笔。NFT市场OpenSea同期交易额已超过59亿美元,截至目前为5,916,983,738美元,交易量为8,793,893笔;LooksRare的交易额为2,355,991,932美元,交易量为136,916笔。[2022/7/7 1:58:44]

对话安全护栏,指避免大模型输出时“胡言乱语”。

胡言乱语包括两方面的情况。

一方面是大模型生成的答案中包括事实性错误,即“听起来很有道理,但其实完全不对”的东西;

另一方面是大模型生成带偏见、恶意的输出,如在用户引导下说脏话、或是生成不道德的内容。

攻击防御护栏,即防止AI平台受到来自外界的恶意攻击。

这里不仅包括诱导大模型调用外部病APP从而攻击它,也包括黑客主动通过网络、恶意程序等方式攻击大模型。护栏会通过各种方式防止这些攻击,避免大模型瘫痪。

所以,这样的护栏要如何打造?

如何打造一个大模型“护栏”?

这里我们先看看一个标准的“护栏”包含哪些要素。

具体来说,一个护栏应当包括三方面的内容,即格式规范、消息和交互流。

首先是格式规范,即面对不同问题的问法时,规定大模型要输出的内容。

例如被问到“XX文章是什么”,大模型必须给出特定类型的“文章”,而非别的东西;被问到“谁发表了什么”,大模型必须给出“人名”,而非别的回答。

然后是消息定义,这里以“用户问候”话题为例,大模型可以输出这些内容:

最后是交互流的定义,例如告诉大模型,怎么才是问候用户的最好方式:

一旦问候用户的机制被触发,大模型就会进入这个护栏,规规矩矩地问候用户。

具体工作流程如下:首先,将用户输入转换成某种格式规范,据此生成对应的护栏;随后,生成行动步骤,以交互流指示大模型一步步完成对应的操作;最后,根据格式规范生成输出。

类似的,我们就能给大模型定义各种各样的护栏,例如“应对用户辱骂”的护栏。

这样即使用户说出“你是个傻瓜”,大模型也能学会冷静应对:

目前,英伟达正在将护栏技术整合进他们的AI框架NeMo中,这是个方便用户创建各种AI模型、并在英伟达GPU上加速的框架。

对“护栏”技术感兴趣的小伙伴们,可以试一试了~

标签:COINCOIOINBASEHtmlcoinDoge Floki CoinYetiCoinEBASE币

ADA热门资讯
LUCA:揭秘Pudgy Penguins CEO的成长之路:从流浪街头到人生巅峰

原文作者:RealmHunter研究顾问roxi编译:Odaily星球日报NFT项目“胖企鹅”的首席执行官LucaNets曾经历过流浪街头的窘迫,但现在他不但可以用250万美元收购“胖企鹅”.

1900/1/1 0:00:00
VER:去中心化的Prover如何实现?Opside创新性提出ZKP的两步提交算法

为什么我们需要去中心化的?prover当前,以太坊主网上已经有多个?ZK-Rollups?在运行了。然而?ZK-Rollup?的去中心化设计仍然处于早期阶段.

1900/1/1 0:00:00
STE:Sui推出学术研究奖计划,首轮将提供25万美元支持

人工智能和机器学习领域是当今世界科技领域中最热门的领域之一,它涉及到计算机科学、应用数学、统计学、物理学、生物学等众多学科的交叉.

1900/1/1 0:00:00
IND:横跨6种模态 Meta开源AI模型ImageBind 为虚拟世界打开大门

来源:《科创板日报》编辑宋子乔当地时间5月9日,Meta宣布开源了一种可以将可以横跨6种不同模态的全新AI模型ImageBind,包括视觉、温度、文本、音频、深度信息、运动读数.

1900/1/1 0:00:00
OIN:AI 成谎言制造机,资本涌向打假科技

作者|Lexie编辑|Lu来源丨硅兔赛跑 图片来源:由无界AI工具生成过去几个月掀起AI小高潮,先是OpenAI的大模型GPT-4公布,多家测评表示比ChatGPT准确许多.

1900/1/1 0:00:00
DAY:Sui是下一轮的行业叙事 or 上一轮的末日余晖

前两天,Sui主网正式上线。新上任的Sui基金会董事总经理GregSioourounis表示,“对于整个Sui社区和整个数字资产生态系统来说都是一个里程碑……为世界各地的用户解锁了无限的可能性.

1900/1/1 0:00:00