火星链 火星链
Ctrl+D收藏火星链
首页 > 火必APP > 正文

GPT:从GPT-1到GPT-4看ChatGPT的崛起

作者:

时间:1900/1/1 0:00:00

ChatGPT是个啥?

近期,OpenAI发布了ChatGPT,是一个可以对话的方式进行交互的模型,因为它的智能化,得到了很多用户的欢迎。ChatGPT也是OpenAI之前发布的InstructGPT的亲戚,ChatGPT模型的训练是使用RLHF也许ChatGPT的到来,也是OpenAI的GPT-4正式推出之前的序章。

什么是GPT?从GPT-1到GPT-3

GenerativePre-trainedTransformer(GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。

2018年,GPT-1诞生,这一年也是NLP的预训练模型元年。性能方面,GPT-1有着一定的泛化能力,能够用于和监督任务无关的NLP任务中。其常用任务包括:

自然语言推理:判断两个句子的关系问答与常识推理:输入文章及若干答案,输出答案的准确率语义相似度识别:判断两个句子语义是否相关分类:判断输入文本是指定的哪个类别虽然GPT-1在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,因此GPT-1只能算得上一个还算不错的语言理解工具而非对话式AI。

Elliptic:Atomic Wallet黑客已将资金发送到加密混合商Sinbad.io:金色财经报道,区块链合规分析公司Elliptic报告称,其调查团队已经追踪到3500万美元的Atomic Wallet损失资金被发送到加密货币混合商Sinbad.io。该混合服务之前被用来清洗朝鲜Lazarus集团盗窃的超过1亿美元的加密货币资产。

Elliptic没有具体说明向混合器发送多少,但指出赃物正在被交换为比特币。[2023/6/6 21:18:37]

GPT-2也于2019年如期而至,不过,GPT-2并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,学习目标则使用无监督预训练模型做有监督任务。在性能方面,除了理解能力外,GPT-2在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在“变得更大”之后,GPT-2的确展现出了普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。

之后,GPT-3出现了,作为一个无监督模型,几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器,更令人惊讶的是在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是GPT-3影响如此之大的主要原因

SITA和Indicio开始为阿鲁巴旅行试点去中心化身份护照:金色财经报道,阿鲁巴交通运输部门旗下的技术提供商SITA与数字身份初创公司Indicio联合推出了最新的去中心化身份试点项目。游客在加勒比阿鲁巴岛旅游时,就可以使用SITA的数字旅游凭证(DTC)。这将护照数据作为可验证的凭证存储在用户的移动钱包中。

除了不需要输入数据的便利之外,另一个优点是用户可以控制并同意共享数据。政府当局应该是唯一有权访问所有护照信息的机构。该证书也可以在酒店和租车时使用。[2023/3/21 13:15:56]

GPT-3模型到底是什么?

实际上,GPT-3就是一个简单的统计语言模型。从机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度,同时也可以用来预测生成新的句子。例如,对于一个片段“中午12点了,我们一起去餐厅”,语言模型可以预测“餐厅”后面可能出现的词语。一般的语言模型会预测下一个词语是“吃饭”,强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语“吃午饭”。

通常,一个语言模型是否强大主要取决于两点:首先看该模型是否能够利用所有的历史上下文信息,上述例子中如果无法捕捉“中午12点”这个远距离的语义信息,语言模型几乎无法预测下一个词语“吃午饭”。其次,还要看是否有足够丰富的历史上下文可供模型学习,也就是说训练语料是否足够丰富。由于语言模型属于自监督学习,优化目标是最大化所见文本的语言模型概率,因此任何文本无需标注即可作为训练数据。

弗吉尼亚州养老基金向Genesis债权人VanEck基金投资3500万美元:金色财经报道,Genesis Global Capital周四晚些时候申请了破产保护,Genesis欠其前50名债权人超过35亿美元。其中一个债权人与弗吉尼亚州费尔法克斯县68亿美元的养老基金系统有关系。该县的两只养老基金向一只VanEck基金投资了3500万美元,后者被列为Genesis的债权人。

VanEck对Genesis提出5300万美元的索赔。根据VanEck的网站,该基金于2021年12月推出,其策略是与数字资产实体形成短期借贷安排,以实现高收益。[2023/1/21 11:24:10]

由于GPT-3更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的GPT-2。作为目前最大的密集型神经网络,GPT-3能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且GPT-3不需要微调,在处理语法难题方面,它只需要一些输出类型的样本。可以说GPT-3似乎已经满足了我们对于语言专家的一切想象。

注:上文主要参考以下文章:1.GPT4发布在即堪比人脑,多位圈内大佬坐不住了!-徐杰承、云昭-公众号51CTO技术栈-2022-11-2418:082.一文解答你对GPT-3的好奇!GPT-3是什么?为何说它如此优秀?-张家俊中国科学院自动化研究所2020-11-1117:25发表于北京3.TheBatch:329|InstructGPT,一种更友善、更温和的语言模型-公众号DeeplearningAI-2022-02-0712:30

报告:Gemini-DCG Fiasco可能会成为2023年的“市场底部事件”:金色财经报道,根据Arcane Research报告,尽管仍存在一些不确定性,但整个市场似乎正在趋于稳定。所有的目光都集中在DCG的下一步行动上,这可能会进一步加剧价格的下行走势。

此外,数据表明,BTC的7天波动率跌至0.7%,达到两年半以来的最低点。30天波动率也遵循类似趋势,目前徘徊在1.4%附近,与11月初FTX崩盘前短暂触及的水平相吻合。事实上,自2019年2月以来,该数字仅出现过七次下降。Arcane表示,这些低波动期很少会持续很长时间。因此,波动率压缩期之后往往会出现剧烈波动,即使在市场低迷时也是如此。[2023/1/8 11:00:45]

GPT-3存在什么问题?

但是GTP-3并不完美,当前有人们最担忧人工智能的主要问题之一,就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏,地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出,这将会充分影响到它们的下一步应用。

OpenAI也曾经提出,会在不久的将来发布更为强大的GPT-4:

欧盟采用基于区块链和其他分布式账本技术的市场基础设施试点制度:金色财经报道,2022年6月2日,关于基于分布式账本技术的市场基础设施试点制度的 (EU) 2022/858 条例(条例)在欧盟官方公报上发布。该法规旨在消除以加密资产形式发行、交易和交易后金融工具的监管障碍,并确保欧盟监管机构在多边交易设施和分布式账本技术(DLT)应用方面获得经验,结算系统。这是欧盟委员会于 2020年9月24日通过的数字金融一揽子计划中宣布的三项立法举措的第一个实施。?

该条例强调,欧盟在促进金融部门采用变革性技术方面具有政策利益。就此而言,该条例的序言明确指出,虽然许多加密资产可能不属于当前欧盟金融服务立法的范围,但许多其他加密资产确实符合欧盟法律规定的金融工具的条件。因此,一整套欧盟金融服务立法现在已经适用于开展与此类加密资产相关活动的发行人和公司。

为了促进其发展,以及总体上 DLT 的发展,同时保持对投资者、市场完整性、金融稳定性和透明度的高水平保护,欧洲机构已采用该条例,为基于 DLT 的市场基础设施建立试点制度。[2022/7/12 2:08:04]

将?GPT-3与GPT-4、?人脑进行比较

据说,GPT-4会在明年发布,它能够通过图灵测试,并且能够先进到和人类没有区别,除此之外,企业引进GPT-4的成本也将大规模下降。

ChatGP与InstructGPT

ChatGPT与InstructGPT

谈到Chatgpt,就要聊聊它的“前身”InstructGPT。

2022年初,OpenAI发布了InstructGPT;在这项研究中,相比GPT-3而言,OpenAI采用对齐研究,训练出更真实、更无害,而且更好地遵循用户意图的语言模型InstructGPT,InstructGPT是一个经过微调的新版本GPT-3,可以将有害的、不真实的和有偏差的输出最小化。

InstructGPT的工作原理是什么?

开发人员通过结合监督学习+从人类反馈中获得的强化学习。来提高GPT-3的输出质量。在这种学习中,人类对模型的潜在输出进行排序;强化学习算法则对产生类似于高级输出材料的模型进行奖励。

训练数据集以创建提示开始,其中一些提示是基于GPT-3用户的输入,比如“给我讲一个关于青蛙的故事”或“用几句话给一个6岁的孩子解释一下登月”。

开发人员将提示分为三个部分,并以不同的方式为每个部分创建响应:

人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的GPT-3,将它变成InstructGPT以生成每个提示的现有响应。

下一步是训练一个模型,使其对更好的响应做出更高的奖励。对于第二组提示,经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后,一个奖励模型(另一个预先训练的GPT-3)学会了为评分高的响应计算更高的奖励,为评分低的回答计算更低的奖励。

开发人员使用第三组提示和强化学习方法近端策略优化(ProximalPolicyOptimization,PPO)进一步微调了语言模型。给出提示后,语言模型会生成响应,而奖励模型会给予相应奖励。PPO使用奖励来更新语言模型。

本段参考:TheBatch:329|InstructGPT,一种更友善、更温和的语言模型-公众号DeeplearningAI-2022-02-0712:30

重要在何处?核心在于——人工智能需要是能够负责任的人工智能

OpenAI的语言模型可以助力教育领域、虚拟治疗师、写作辅助工具、角色扮演游戏等,在这些领域,社会偏见、错误信息和害信息存在都是比较麻烦的,能够避免这些缺陷的系统才能更具备有用性。

Chatgpt与InstructGPT的训练过程有哪些不同?

总体来说,Chatgpt和上文的InstructGPT一样,是使用RLHF训练的。不同之处在于数据是如何设置用于训练的。

ChatGPT存在哪些局限性?

如下:a)在训练的强化学习(RL)阶段,没有真相和问题标准答案的具体来源,来答复你的问题。b)训练模型更加谨慎,可能会拒绝回答。c)监督训练可能会误导/偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应

注意:ChatGPT对措辞敏感。,有时模型最终对一个短语没有反应,但对问题/短语稍作调整,它最终会正确回答。训练者更倾向于喜欢更长的答案,因为这些答案可能看起来更全面,导致倾向于更为冗长的回答,以及模型中会过度使用某些短语,如果初始提示或问题含糊不清,则模型不会适当地要求澄清。

标签:GPTUCTINSTRUCFGPT价格UCT价格INSTINCTFitness Instructor

火必APP热门资讯
Flare:5 个好用且免费的加密数据研究工具

许多人已经知道DeFiLlama和Etherscan。为了超越市场,你需要一个工具来使得自己有竞争优势。这里有5个鲜为人知的加密货币研究工具,将帮助你在其他人之前找到Alpha.

1900/1/1 0:00:00
DAO:万向年度回顾丨应用篇:从 NFT 到创新领域

2022年接近尾声,驻足回看行业这一年的跌宕起伏,无论是技术的突破,应用的创新,还是生态的兴衰,皆成为了行业发展的历史注脚.

1900/1/1 0:00:00
FTX:MarsBit日报 | 香港虚拟资产服务提供者发牌制度于明年6月生效;Waves生态算稳USDN已脱锚

MarsBitCryptoDaily2022年12月8日一、今日要闻数据:自FTX事件后,Solana平均每日链上流动价值下降96%据DelphiDigital数据,今年10月初.

1900/1/1 0:00:00
RAN:加密风投们的悲哀:如何避免局

加密货币交易所FTX的崩盘仍在给科技界带来冲击,与欺诈性的生物科技公司Theranos的演员不同,FTX成功地吸引了许多据称是该领域最精明的投资者.

1900/1/1 0:00:00
KAVA:不良资产投资者盯上FTX客户的被套资金,但仅以面值5%左右价格成交

知情人士透露,众多知名投资公司正在洽谈收购这些债权,包括阿波罗全球管理公司和Atestor。小型投资公司507Capital已经从希望快速退出的对冲基金手中购买了几笔债权.

1900/1/1 0:00:00
区块链:Aztec 筹集 1 亿美元用于构建加密以太坊

本文是AztecNetwork获得1亿美金B轮融资的官方公告,MarsBit编译如下: AztecNetwork宣布由a16zcrypto领投的1亿美元B轮融资.

1900/1/1 0:00:00