火星链 火星链
Ctrl+D收藏火星链
首页 > KuCoin > 正文

ERG:金融圈注意了 BloombergGPT来了

作者:

时间:1900/1/1 0:00:00

ChatGPT引爆的AI热潮也“烧到了”金融圈,彭博社重磅发布为金融界打造的大型语言模型——BloombergGPT。

3月30日,根据彭博社最新发布的报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。

报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。

一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。

新加坡金融监管局谴责Three Arrows Capital提供虚假信息和超过注册基金管理公司允许的AUM限制:6月30日消息,新加坡金融监管局(MAS)发布声明谴责Three Arrows Capital提供虚假信息和超过注册基金管理公司允许的资产管理规模(AUM)限制。MAS正在评估Three Arrows Capital是否存在进一步的违规行为。(Techin Asia)[2022/6/30 1:41:54]

关于BloombergGPT

报告指出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,通过构建迄今为止最大的特定领域数据集来完成BloomberGPT,并基于通用和金融业务的场景进行混合模型训练:

彭博社主要是一家金融数据公司,数据分析师在公司成立的四十年的时间里收集了大量的金融文件,拥有广泛的金融数据档案,涵盖了一系列的主题。

我们将这些数据添加到公共数据集中,以创建一个拥有超过7000亿个标签的大型训练语料库。

亚洲区块链金融商学院于9月8日全资收购翰林学院:2020年9月8日,亚洲区块链金融商学院全资收购翰林学院。此次收购后,翰林学院的团队及业务加入亚洲区块链金融商学院。今后,亚洲区块链金融商学院将整合资源构建更完善的区块链教育体系,致力打造集数字货币、数字合约、线上培训、金融综合投资为一体的金融服务机构,推动区块行业健康良性发展。

翰林学院是一个致力打造区块链教育培训一体化解决方案提供商,通过教育培训促进区块链产业生态健康发展,为用户提供区块链培训、区块链投资、区块链项目孵化等一站式区块链服务。

亚洲区块链金融商学院综合投资研究、培训为一体的数字金融服务机构,通过定期发布权威研究报告及举办大型投资报告会,以国内直播台为载体,为广大投资者及合作伙伴提供服务。[2020/9/8]

使用这个训练语料库的一部分,我们训练了一个具有彭博风格的,达500亿参数的模型,该模型是根据Hoffmann和LeScao等人的指导方针设计,基于通用和金融业务的场景进行混合模型训练。

直播|陈哲 > Cardano最具亲历的区块链金融:金色财经 · 直播主办的《 Focus 价值50》6:00准时开始,本期Cardano 大使 陈哲“将在直播间聊聊“Cardano最具潜力的区块链金融”,感兴趣的朋友扫码移步收听![2020/6/15]

结果表明,我们的混合训练方法使我们的模型在金融任务上的表现大大超过了现有的模型,而在通用场景上的表现则与之相当甚至优于现有模型。

1.BloombergGPT优势:特定领域模型仍有其不可替代性且彭博数据来源可靠

在论文中,彭博社指出,现阶段,通用的自然语言处理模型可以涵盖许多领域,但针对特定领域模型仍有其不可替代性,因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型尤其优势,同时可以在通用LLM基准测试上保持竞争力:

声音 | Nigel Green:英国脱欧后或可通过加密货币重振金融服务业:金融咨询巨头deVere Group首席执行官Nigel Green近期接受采访时表示,推行积极的加密货币监管应该成为英国脱欧后的核心任务。Green称:“脱欧后的英国将处于独特的地位,它能够走得更远。如果英国能够拥抱加密技术,或可重振其金融服务业。”同时,该公司担心,如果不达成脱欧协议,英国将陷入衰退。[2019/7/9]

除了构建金融领域的LLM外,本文的经验也为其他研究领域的专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用基准上表现优异的模型。

此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。

动态 | 乌克兰或将数字货币视作金融工具进行监管:据Forklog消息,乌克兰国家证券和股票市场委员会(SSMCS)负责人Timur Khromaev近日表示,数字货币法案于2018年底或2019年初提交议会审议后,该国很有可能将数字货币视作金融工具进行监管,但不能被当作法币。[2018/8/15]

2.BloombergGPT的训练数据集:

BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。

为了提高数据质量,FINPILE数据集也使用了公共数据集,例如ThePile、C4和Wikipedia。FINPILE的训练数据集中大约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。

对金融领域的理解更准

报告指出,在金融领域中的自然语言处理在通用模型中也很常见,但是,针对金融领域,这些任务执行时将面临挑战:

以情感分析为例,一个题为“某公司将裁员1万人”,在一般意义上表达了负面情感,但在金融情感方面,它有时可能被认为是积极的,因为它可能导致公司的股价或投资者信心增加。

报告指出,从测试来看,BloombergGPT在五项任务中的四项表现最佳,在NER中排名第二。因此,BloombergGPT有其优势性。

测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。

测试二:FiQASA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。

测试三:标题,数据集包括关于黄金商品领域的英文新闻标题,标注了不同的子集。任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。

测试四:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。

测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。

对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。

ChatGPT为彭博点赞

华尔街见闻就这个问题专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步:

它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。

这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。

标签:GPT区块链ERGBLOgpt币团队区块链用大白话解释aergo币未来WeBlock

KuCoin热门资讯
STA:L2 Summer将至?一文掌握StarkNet技术原理及生态

原文作者:Biteye核心贡献者?Hankester原文编辑:Biteye核心贡献者Crush1.Layer?2Summer的前奏??Arbitrum的DeFi生态已初具规模.

1900/1/1 0:00:00
WEB:香港财务司司长:发展Web3 守正创新 稳慎前行

来源:香港特别行政区官网撰文:香港财务司司长陈茂波“我期待下星期数场的大型论坛,能为数字经济和Web3发展带来更多深入交流和思想碰撞,为未来的实践路径作更有前瞻性、更具体的探索.

1900/1/1 0:00:00
MAN:为什么公共产品对 Web3 至关重要?

撰文:AzeemKhan编译:aididiaojp.eth,ForesightNews公共产品和新所有权模式的结合将推动互联网的下一次迭代.

1900/1/1 0:00:00
区块链:医保遇上区块链 看病报销再也不怕弄丢票据

许多人有过这种经历:看完病不小心把医疗发票或者费用明细弄丢了,没法报销。现在,这种经历即将成为历史——手机上点点,就可以进行医保报销,并且无需拍照上传相关票据及资料.

1900/1/1 0:00:00
zkSync:都尚未发币 zkSync Era这些生态项目值得交互

zkSyncEra主网于2023年3月24日正式向公众开放,?3天内单一地址数便突破10万个,?1.8万枚ETH跨链进入zkSyncEra.

1900/1/1 0:00:00
ETA:Meta高官重申坚持元宇宙战略 这是漫长的挑战

3月29日消息,Meta全球事务总裁、英国前副首相尼克克莱格周三表示,Meta会继续发展元宇宙,计算的未来将出现在这个仍未被充分定义的虚拟世界中.

1900/1/1 0:00:00