火星链 火星链
Ctrl+D收藏火星链

GPT:不爽AI 偷推特数据!马斯克喊告微软,发生了什么?

作者:

时间:1900/1/1 0:00:00

在此之前,AI大模型开发商都在低成本地使用互联网公开的内容数据训练自家的大模型,如今,各种科技巨头们加持的大模型纷纷开始商业化,互联网内容平台们突然反应过来,不能让这些巨头们噜羊毛「白嫖」数据了。

「现在是诉讼时间。」4月20日,推特被微软踢出其数字营销平台后,新掌门人马斯克立马发推回击称,微软用推特的数据做「非法训练」。这一怼,直接揭开了AI大模型开发商与数据源的利益之争。

此前,在线社区论坛Reddit与程序员社区StackOverflow先后宣布,将向使用平台API训练数据的公司收费;环球音乐集团直接表示,将阻止AI从其版权歌曲中抓取歌手的声音。

在此之前,AI大模型开发商都在低成本地使用互联网公开的内容数据训练自家的大模型,如今,各种科技巨头们加持的大模型纷纷开始商业化,互联网内容平台们突然反应过来,不能让这些巨头们噜羊毛「白嫖」数据了。????????

Gutter Cat Gang:已收回昨日被攻击的Twitter账户的控制权,正在与执法部门合作调查漏洞:7月9日消息,Gutter Cat Gang 发推称,昨日 Twitter 账户遭遇攻击,恶意推文于北京时间 7 月 8 日上午发布。目前,团队已经重新获得对 Twitter 账户的控制权,并及时联系在 Twitter、执法部门与移动网络供应商的联系人,采取措施提醒未受影响的账户的社区。恶意推文与链接已被删除。

目前,团队正对 Twitter 账户漏洞进行调查,团队一直使用多重身份认证与安全措施。此外,团队正在与执法部门合作,调查该漏洞,并采取措施防止其再次发生。[2023/7/9 22:26:59]

当推特将API收费门槛摆在微软面前时,AI大模型训练要给付的成本就不止芯片算力和研发算法的人才了,现在还要加上「为数据付费」。

马斯克直怼微软「非法训练」

「他们非法使用推特的数据进行训练。现在是诉讼时间。」4月20日,「宇宙顶流」马斯克直接在推特上明示要告微软。他以推特CEO的身份亲自下场,以此直怼微软把推特踢出MicrosoftDigitalMarketingCenter的做法。

Kraken上的BTC合约未平仓合约达到6个月高点:金色财经报道,Glassnode alerts数据显示,BTC期货未平仓合约刚刚在Kraken上达到80,375,642.92美元的6个月高点。[2023/6/2 11:54:48]

这个「中心」是干嘛的呢?它其实是微软利用大数据和AI技术开发的一个广告和营销的管理平台,聚合了包括推特、脸书、Ins等海外所有主流的社交平台,方便企业主们在一个平台上完成广告和营销活动的推送,还能管理各种账号、分析推流数据。你刷微博、微信朋友圈时突然冒出的广告,就有类似微软这种工具的贡献。

微软这个数字营销中心能实现这些功能,很重要的一环是接入了这些社交平台的API,这是企业主推送广告、分析数据的基础。

结果,马斯克收购推特后,直接把推特API的企业套餐初始订阅费用定为4.2万美元/月,折合人民币28.9万元,以这个价格能获得2,500万条推文,一条差不多1块多钱了。如果每月支付12.5万美元,能获得1亿条推文,后续还会按照使用量加钱。

比特币/GBP的交易量昨天为8.81亿美元:金色财经报道,CoinShares研究主管James Butterfill在社交媒体上称,比特币/GBP的交易量昨天为8.81亿美元(平均为7000万美元),当法定货币受到威胁时,投资者开始青睐比特币。[2022/9/28 5:58:47]

推特API的新收费标准直接劝退了不少小公司,连财大气粗的微软数字营销中心都直言「要价太高」,于是,直接把推特踢出了管理库。这意味着,借助微软这个平台执行广告和营销计划的广告主们,没法在推特上搞投放了。

原本这是企业主、分发平台、渠道商之间的广告业内事,马斯克跳出来了,直指微软用推特的数据搞非法训练。

谁都知道,爆火的ChatGPT背后有微软的资本加持。而马斯克和GPT大模型的开发方OpenAI不仅渊源颇深,还积怨许久。

Yearn Finance不支持以太坊PoW分叉,旧版本的Yearn保险库许可功能存在风险:9月6日消息,Yearn Finance发布关于许可功能的安全公告,低于0.4.4版本的Yearn保险库具有许可功能,容易受到分叉网络中的重放攻击。Yearn不鼓励在其他分叉网络中的Yearn保险库中使用许可方法。

Yearn不打算在合并后支持任何以太坊工作量证明 (PoW) 分叉,并且不能保证除了官方支持的其他网络中的保险库的正确功能。如果之前在以太坊主网中使用过该功能,请使用该approve(spender, 0)功能重置permit限额,并使用一个非无限的到期期限。[2022/9/6 13:11:24]

2015年,马斯克与SamAltman等6人共同创立OpenAI人工智能实验室,致力于建设开源的、研发人工智能的非营利机构,来抗衡当时在人工智能领域大有一家独大之势的谷歌。为此,马斯克捐了1亿美元,承诺未来继续捐9亿。结果不到2年,马斯克就退出了OpenAI董事会,这里既有烧钱开发大模型短期没烧出成果的问题,也有马斯克和Altman对OpenAI的管理权之争。

Circle允许从固定收益国债产品中 \"免费 \"提前提取USDC:金色财经消息,Circle首席执行官Jeremy Allaire表示,在加密货币市场出现多年来最糟糕的表现时,Circle Yield的用户可以提前取款而不会面临处罚。自2月推出以来,该贷款部门已完成约2.48亿美元的业务。(beincrypto)[2022/7/8 1:59:15]

马斯克退出1年后,即2019年3月,OpenAI成立子公司OpenLP,将其定位为「有限营利机构」,重组后的OpenAI很快拿到了来自微软的10亿美元投资。谁也没想到又一个3年过去后,OpenAI站上了全球科技舞台的最前沿。

ChatGPT爆火后,当初为OpenAI掏过钱、站过台的马斯克频频表达怨念。

2月17日,马斯克发推指称OpenAI从开源、非营利变成了微软控制的「闭源、追求利益最大化」的公司;后来还多次在公开场合强调人工智能对人类社会的潜在危害,甚至认为「风险比飞机、汽车、更大」;3月29日,那封科技大佬联署签名「暂停AI巨型实验」的公开信上,他也第一时间签名表态。

马斯克为人工智能的健康发展操碎了心,看上去,这位将巨型载人飞船送入太空的现实版「钢铁侠」似乎不打算跟风人工智能了。

然而,4月17日,马斯克在媒体采访中披露,将推出一款生成式AI大模型TruthGPT。很快就有媒体爆料,马斯克买了1万个英伟达A100芯片。这是AI大模型训练的重要硬件。

撕微软非法训练数据,怼OpenAI变成逐利公司,无论马斯克如何批评这两家公司,这下也难掩他对人工智能的兴趣了。左手拦下推特数据低成本外流,右手高价囤芯片,在AI大模型赛道上,马斯克开始跑马圈地。

多平台API拟收费,AI训练成本被推高

不过,最近要向AI大模型开发商们收取API费用的平台不止推特。

4月18日,海外最大的社区论坛Reddit宣布,将向使用其API做数据训练的公司收取数据使用费。

Reddit暂未公布具体收费标准,业内推测,Reddit很可能会按数据数量分等级收费,这也是业内的常规做法。此外,程序员问答网站StackOverflow也计划向AI巨头收取训练数据费用。

要知道,研发AI大模型,算法、算力和算据这「三算」缺一不可。以OpenAI训练GPT-3.5为例,这个模型容纳了多达45TB的文本语料,这些语料既包括书籍期刊等出版物的内容,也包括社交平台、问答网站、论坛小组等在线数据中的用户生成内容。而从OpenAI的公开信息看,该公司并没有提及获取线上数据是否支付过费用。用「爬虫」爬、和第三方合作、以及购买都有可能是OpenAI获得数据的方式。

此前,各个生成式大模型似乎都在没啥限制地使用互联网上的公开内容,影响大模型性能的要素就集中在算法和算力差异上。从推特、Reddit等平台明确为API收费后,大模型开发商自在地使用数据的好日子到头了。

2019年之前,OpenAI是非营利机构,如今,ChatGPT都有Plus收费版了,更别提该公司还开通了API的付费渠道。当前,OpenAI的估值接近300亿美元,研究机构PitchBook预测,该公司今年的收入将达到2亿美元,明年会翻五番。

社交平台们明确API收费,剑指大模型开发商,双方也正式变成了「商业对商业」的关系,收费与付费实属正常。这也意味着,AI大模型成为科技巨头们狂卷的赛道后,像Reddit这样的海量内容平台将增加商业来源,数据将成为重要要素。

以成立于2008年的Reddit为例,它是全球互联网中最有活力的社区之一,目前日活达到3.3亿,大量的用户创建了超过14万个活跃社区,帖子总量超3.6亿。尤其在很多小众领域,Reddit论坛贡献了很多有价值的讨论内容。换句话说,Reddit提供了英语互联网中最重要的语料库。

OpenAI的CEOSamAltman也表示,公司在积极与内容公司进行合作,并愿意「为高质量数据支付高价」。

尽管Altman宣称「目前没在训练GPT-5」,但OpenAI应该不会停下数据训练的脚步,因为GPT-4仍有很多需要打磨的地方,比如通识知识的准确性、对人类语言的理解进化等等,这些仍然需要语料数据的持续投入。

放眼全球,研究AI大模型的公司还不止OpenAI一家,海外有谷歌,国内有百度、华为、阿里。可以预见,切入大模型赛道的公司,都将面对数据所有者的收费关卡,训练成本将水涨船高。

另一个值得深思的问题是,Twitter也好,Reddit也罢,他们手握数据向大模型开发公司收取价格不菲的费用,那么,为这些平台贡献了海量内容和数据的用户又得到了什么?

欢迎私信进交流群,今天的分享到此结束了,非常感谢各位朋友们百忙之中抽出时间来看这篇文章,希望文章对你有帮助,可以关注我和给我留言评论,一起交流Billions项目组

标签:马斯克APIGPT马斯克五大发明改变世界马斯克什么星座马斯克资产多少亿美元API价格API币GPT价格GPT币

狗狗币价格热门资讯
加密货币:梅西与加密货币交易所 Bitget 签署合作伙伴关系

Bitget是一家总部位于新加坡的加密货币交易所,最近宣布与标志性的阿根廷足球运动员莱昂内尔·梅西建立合作伙伴关系。这是Bitget为粉丝提供进入和探索加密世界的体验和机会的方式.

1900/1/1 0:00:00
比特币:斯诺登自荐当推特CEO:接受比特币支付!马斯克:Twitter不安全

马斯克稍早表示:尽管已控制住了Twitter开支,但目前仍不安全,还有很多工作要做。此外,神鬼骇客史诺登自荐愿当推特新CEO,并接受以比特币支薪.

1900/1/1 0:00:00
FTX:针对 FTX 支持者的诉讼会让其他加密货币影响者沉默吗?

简单来说 一场大规模的集体诉讼针对的是众多推广FTX交易所的知名影响者和名人。这些有影响力的人被指控积极推广FTX,并且没有披露他们与现已倒闭的加密平台的财务关系.

1900/1/1 0:00:00
Solana:市场领先者:这种“加密钻石”山寨币可以赚 100 倍!

山寨币SOL背后的Solana联合创始人RojGokal的最新声明引起了人们的注意。Gokal在5月29日接受TechCrunch采访时透露了他公司的目标.

1900/1/1 0:00:00
科技股:美联储即将加息,美股多头不敢轻举妄动

美国股市脱离盘中低点,但无力继续大幅上攻,因有关美国劳动力市场走强的数据,增强了市场对美联储不顾衰退忧虑继续大幅收紧货币政策的预期。 在这个货币政策的关键节点,传统上的好消息被认为是坏消息.

1900/1/1 0:00:00
BTC:数据显示,加密鲸鱼正在“大量”增持稳定币和比特币

区块链数据显示,加密货币鲸鱼一直在“大量”增持稳定币,包括BinanceUSD、DAI和TethersUSDT,与此同时,比特币鲸鱼也一直在增加他们的资金储备.

1900/1/1 0:00:00