火星链 火星链
Ctrl+D收藏火星链
首页 > Polygon > 正文

ERG:金融圈注意了 BloombergGPT来了

作者:

时间:1900/1/1 0:00:00

ChatGPT引爆的AI热潮也“烧到了”金融圈,彭博社重磅发布为金融界打造的大型语言模型(LLM)——BloombergGPT。

3月30日,根据彭博社最新发布的报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。

报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。

一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。

北京市金融监管局局长霍学文:今年北京市的目标是把数字人民币应用场景扩展到“100万+”:10月21日消息,北京市金融监管局局长霍学文在接受采访时表示:目前北京数字人民币冬奥全场景试点应用正稳步推进,全市白名单用户数量占全国的15%,试点场景数量占全国的20%。今年北京市的目标是把数字人民币应用场景扩展到“100万+”,并将在人民银行指导下探索数字人民币在预付费管理、供应链金融等社会治理和产业链金融等领域率先应用。(央广网)[2021/10/21 20:45:50]

关于BloombergGPT

报告指出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,通过构建迄今为止最大的特定领域数据集来完成BloomberGPT,并基于通用和金融业务的场景进行混合模型训练:

彭博社主要是一家金融数据公司,数据分析师在公司成立的四十年的时间里收集了大量的金融文件,拥有广泛的金融数据档案,涵盖了一系列的主题。

数脉链与澳门雅文保险联合践行“区块链+金融保险”新模式:近日,数脉链正式与澳门雅文理财保险服务有限公司(为全球最大保险集团法国安盛公司仅有的三家代理经纪业务商之一)正式宣布合作关系,数脉链已为雅文理财保险提供“数据存、管、用”三项企业级定制服务,并实现长达3个月的运行测试,具体表现为:

1、DAG存储链已成功存储和备份了10TB的保险业务数据;

2、企业级分布式数据库对业务文本和图片视频进行统一管理和分类处理;

3、联邦学习加密数据流助力其特殊保险业务定制、保险套餐推荐、险种智能选择、险种风险分析、理赔过程中图像识别等等服务研发。[2020/5/19]

我们将这些数据添加到公共数据集中,以创建一个拥有超过7000亿个标签的大型训练语料库。

使用这个训练语料库的一部分,我们训练了一个具有彭博风格的,达500亿参数的模型,该模型是根据Hoffmann和Le Scao等人的指导方针设计,基于通用和金融业务的场景进行混合模型训练。

声音 | 银河证券首席经济学家:粤港澳大湾区应积极实施区块链金融:据中证网报道,中国银河证券首席经济学家刘锋、中国银河证券研究院战略研究员聂无逸刊文《金融基础设施一体化是粤港澳发展关键》表示,粤港澳大湾区进一步吸引来自全世界的优秀科技人才、资金,形成面向全球的高端产业链,需要将金融创新和高新科技成果应用相结合。充分运用区块链“去中心化”的平台优势,整合信息资源,积极实施区块链金融,降低传统金融业成本。[2019/2/21]

结果表明,我们的混合训练方法使我们的模型在金融任务上的表现大大超过了现有的模型,而在通用场景上的表现则与之相当甚至优于现有模型。

1.BloombergGPT优势:特定领域模型仍有其不可替代性且彭博数据来源可靠

纳斯达克CEO:加密货币正处于炒作周期的颠峰,可能会成为“互联网的金融元素”:在Bloomberg Businessweek的采访中,纳斯达克总裁兼首席执行官阿德纳`弗里德曼表示,加密货币正处于“炒作周期的巅峰”,并可能成为“互联网的金融元素”。她表示,该公司一直在采取以研究为导向的方法以确定何时以及是否想要参与数字货币。她相信加密货币的结构已经开始成为公司能够理解的东西,并且有可能成为互联网的金融元素。[2018/6/6]

在论文中,彭博社指出,现阶段,通用的自然语言处理模型可以涵盖许多领域,但针对特定领域模型仍有其不可替代性,因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型尤其优势,同时可以在通用LLM基准测试上保持竞争力:

除了构建金融领域的LLM外,本文的经验也为其他研究领域的专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用基准上表现优异的模型。

新加坡金融管理局认为比特币没有内在价值:新加坡金管局首席金融科技官莫汉蒂(Sopnendu Mohanty)接受英国《每日电讯报》(Daily Telegraph)访问时对近日价格飙涨的比特币发表看法。他认为比特币不能用来购买房屋及进行日常交易,并认为当投资者将比特币转换为现金时存在风险。相对的,他认为另一种加密货币以太币(ethereum)有社会效用。他表示,因为以太币至少有经济价值。可以使用以太币让软件在云端上运行。”[2017/12/20]

此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。

2.BloombergGPT的训练数据集:

BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。

为了提高数据质量,FINPILE数据集也使用了公共数据集,例如The Pile、C4和Wikipedia。FINPILE的训练数据集中大约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。

对金融领域的理解更准

报告指出,在金融领域中的自然语言处理在通用模型中也很常见,但是,针对金融领域,这些任务执行时将面临挑战:

以情感分析为例,一个题为“某公司将裁员1万人”,在一般意义上表达了负面情感,但在金融情感方面,它有时可能被认为是积极的,因为它可能导致公司的股价或投资者信心增加。

报告指出,从测试来看,BloombergGPT在五项任务中的四项(ConvFinQA,FiQA SA,FPB和Headline)表现最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT有其优势性。

测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。

测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。

测试三:标题,数据集包括关于黄金商品领域的英文新闻标题,标注了不同的子集。任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。

测试四:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。

测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。

对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。

ChatGPT为彭博点赞

华尔街见闻就这个问题专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步:

它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。

这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。

华尔街见闻

媒体专栏

阅读更多

金色财经 善欧巴

金色早8点

白话区块链

欧科云链

Odaily星球日报

Arcane Labs

MarsBit

深潮TechFlow

BTCStudy

链得得

标签:GPTMBEERGLOOMCGPT币ATOMBEAR价格CMERGE币LOOM价格

Polygon热门资讯
ETF:美国SEC警示投资者:谨慎投资加密资产证券(全文)

来源:美国SEC投资者教育和宣传办公室 译/金色财经xiaozou美国证券交易委员会(SEC)投资者教育和宣传办公室继续敦促投资者在做加密资产证券有关投资考虑时需保持谨慎.

1900/1/1 0:00:00
比特币:比特币NFT:能否复制甚至超越以太坊NFT盛况?

比特币NFT近期热度持续上升,目前在比特币上铸造的铭文(即比特币NFT)总量已经超过了52万个(据 Dune 3月19日数据).

1900/1/1 0:00:00
Aptos:以技术见长的Sui 能成为MOVE系新公链“话事人”吗?

原文:《加速发展的Sui,能否成为下一个Layer1破局者》作者:Daniel LiSui正在从幕后走向前台,向人们展示多年来积累的技术实力.

1900/1/1 0:00:00
KEN:深度:探索Web3与生成式AI的联姻

原文标题:《 Generative AI and Web3 》原文作者:Joel John原文编译:Kxp,BLockBeats自 2022 年底 OpenAI 的 ChatGPT 上线以来.

1900/1/1 0:00:00
BIT:Arbitrum权力下放的下一阶段

作者寄语:(1) Arbitrum 基金会和 DAO Governance为Arbitrum One 和Arbitrum Nova网络启动.

1900/1/1 0:00:00
DEFI:代币战争打响 如何为产品构建护城河?

当你考虑像游戏或DeFi等面向散户利基市场时,很明显,普通人并不关心使用哪个链或者事物有多么去中心化,他们关心的是他们可以从中获得的价值,区块链可以帮助增加最终用户可以获得的价值.

1900/1/1 0:00:00