来源:量子位
从Meta的LLaMA发展出的羊驼家族一系列大模型,已成为开源AI重要力量。
但LLamA开源了又没全开,只能用于研究用途,还得填申请表格等,也一直被业界诟病。
好消息是,两大对标LLaMA的完全开源项目同时有了新进展。
可商用开源大模型来了,还一下来了俩:
MosaicML推出MPT系列模型,其中70亿参数版在性能测试中与LLaMA打个平手。
Together的RedPajama系列模型,30亿参数版在RTX2070游戏显卡上就能跑。
两大Ripple客户分别与Visa和PayDo达成合作:金色财经报道,在线银行应用程序PayDo已与德国顶级银行之一Fidor银行达成合作伙伴关系,后者是Ripple Labs的客户。Fidor与PayDo将一起计划建立更好的支付基础设施,并尽最大努力吸引欧洲和世界各地的客户开始使用在线支付。与此同时,Ripple客户Nium已与支付巨头Visa和FuiouPay合作,以在中国香港创建并推出B2B全球支付工具。[2021/7/20 1:03:31]
对于这些进展,特斯拉前AI主管AndrejKarpathy认为,开源大模型生态有了寒武纪大爆发的早期迹象。
MPT,与LLaMA五五开
山西长治高新区签约18亿元两大区块链平台建设项目:山西长治市高新区与北京芯际科技有限公司、山西晋睿世通科技有限公司签约总投入18亿元区块链项目,着力推进“中国区块链公链及分布式商业平台项目”和“山西综合能源区块链项目”两大平台构建,助力长治市区块链产业发展。据悉,“中国区块链公链及分布式商业平台项目”将首先建设开发一套自主可控可扩展区块链底层,为政务、产业和金融等区块链应用提供基础支撑。在能源革命方面,“山西综合能源区块链项目”将打造“煤炭贸易+智慧能源服务”一体化综合能源区块链,发挥长治市资源优势,并在全市范围内率先开展能源交易上链运行示范,借助金融赋能,打造年交易量千亿元以上数字化平台,助推长治市能源革命及产业转型跨越发展。(长治日报)[2020/5/19]
MPT系列模型,全称MosaicMLPretrainedTransformer,基础版本为70亿参数。
MPT在大量数据上训练,与LLaMA相当,高于StableLM,Pythia等其他开源模型。
动态 | 美国两大监管机构发布关于数字货币投资虚假声明的警告:据Bitcoinexchangeguide报道,美国证券交易委员会(SEC)和商品期货交易委员会(CFTC)近日发布了关于数字货币投资虚假声明的警告。根据该机构官方声明,欺诈者可能会使用虚假声明来诱投资者并购买数字货币和其他代币,例如ICO提供的代币。SEC通报称,“当有人声称于任何联邦政府机构有关联时,请不要相信此人提供的投资信息,并且在向任何你不认识的人提供个人信息时要保持谨慎”。[2018/10/15]
支持84ktokens超长输入,并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。
在各类性能评估中,与原版LLaMA不相上下。
澳大利亚两大银行明确表态:不会阻止客户进行比特币交易:与劳埃德银行集团、摩根大通、美国银行和花旗银行的态度不同,澳大利亚两家大型银行表示目前还没有禁止其客户使用信用卡和借记卡买卖比特币的计划。澳新银行(ANZ Bank全澳四大银行之一)告诉美国广播公司,“不会禁止客户购买数字或加密货币,或者接受其作为支付方式”。不过,该银行的发言人也透露,若发现“异常行为”,将履行自己的监管义务。西太平洋银行是澳大利亚市值第二大的银行,该行发言人也表示:“我们目前没有对使用信用卡购买加密货币设限。”澳大利亚国民银行(NAB)暗示,如果某些安全标记被触发,那么可能会限制部分“银行卡交易”以降低客户风险。但他们这样的表态,似乎也说明了并没有禁止客户购买数字货币。[2018/2/7]
除了MPT-7BBase基础模型外还有三个变体。
MPT-7B-Instruct,用于遵循简短指令。
MPT-7B-Chat,用于多轮聊天对话。
MPT-7B-StoryWriter-65k+,用于阅读和编写故事,支持65ktokens的超长上下文,用小说数据集微调。
两大交易所将发行比特币期货,美国政府严阵以待:以美国国会和特朗普麾下团队为首的美国监管机构目前看来将开始进行加密货币的立法。美国政府对于加密货币的注意开始于出现在立法委员会的一项法案,旨在对任何没有披露加密货币资产所有权的行为定罪。这一动议在美国政界受到广泛的支持。[2017/12/7]
MosaicML由前英特尔AI芯片项目Nervana负责人NaveenRao创办。
该公司致力于降低训练神经网络的成本,推出的文本和图像生成推理服务成本只有OpenAI的1/15。
RedPajama,2070就能跑
RedPajama系列模型,在5TB的同名开源数据上训练而来。
除70亿参数基础模型外,还有一个30亿参数版本,可以在5年前发售的RTX2070游戏显卡上运行。
目前70亿版本完成了80%的训练,效果已经超过了同规模的Pythia等开源模型,略逊于LLamA。
预计在完成1Ttokens的训练后还能继续改进。
背后公司Together,由苹果前高管VipulVedPrakash,斯坦福大模型研究中心主任PercyLiang,苏黎世联邦理工大学助理教授张策等人联合创办。
开源模型发布后,他们的近期目标是继续扩展开源RedPajama数据集到两倍规模。
OneMoreThing
来自南美洲的无峰驼类动物一共4种,已被各家大模型用完了。
Meta发布LLaMA之后,斯坦福用了Alpaca,伯克利等单位用了Alpaca,JosephCheung等开发者团队用了Guanaco。
以至于后来者已经卷到了其他相近动物,比如IBM的单峰骆驼Dromedary,Databricks的Dolly来自克隆羊多莉。
国人研究团队也热衷于用古代传说中的神兽,如UCSD联合中山大学等推出的白泽。
港中文等推出的凤凰……
最绝的是哈工大基于中文医学知识的LLaMA微调模型,命名为华驼。
参考链接:
https://www.mosaicml.com/blog/mpt-7b
https://www.together.xyz/blog/redpajama-models-v1
https://twitter.com/karpathy/status/1654892810590650376?s=20
标签:AMALlamaLAMA区块链tamadoge币涨到多少LlamaSwapLlamaverse区块链的五大应用领域
头条▌OpenAI完成3亿美元融资,估值达到270亿至290亿美元金色财经报道,ChatGPT背后的初创公司OpenAI完成3亿美元新融资,估值达到270至290亿美元.
1900/1/1 0:00:00来源:江南时报网作者:南京产业协会元宇宙正逐步从概念变为现实,各类带有元宇宙标签的文旅实践案例频繁涌现.
1900/1/1 0:00:00原文作者:CONCODA原文编译:Blockunicorn 银行恐慌已经接近尾声,但美联储已经重新开始实行紧缩政策,这不仅会导致不可避免的破产和随后的救助,还会增强美国中央银行的全球影响力.
1900/1/1 0:00:00来源:中国经营报4月14日,据外媒援引美国内华达州的一份文件报道,特斯拉、推特、SpaceX的公司CEO埃隆·马斯克已于3月9日注册了一家新的人工智能公司,名称为“X.AI”.
1900/1/1 0:00:00随着近两周BRC-20走热,比特币交易费用飙升。BTC.com数据显示,BTC每日手续费从两周前的13.6BTC增长至403.9BTC,两周增幅2870%?,创下自2018年1月20日以来的最高.
1900/1/1 0:00:00四月即将结束,在这一月中,耐克、阿迪和彪马三大运动品牌在Web3领域里动作频频,下面就让我们一起来梳理看看他们最近都在忙些什么吧。首先,来看看耐克.
1900/1/1 0:00:00