重训“羊驼”大模型并彻底开放商用,UC伯克利博士生:Meta不愿做就自己做
时间:2023-06-22 07:12:45来源:腾讯网

丰色 发自 凹非寺


(资料图片仅供参考)

量子位 | 公众号 QbitAI

Meta“羊驼”(LLaMA)的开源可商用复现品OpenLLaMA发布重大更新:

1T token上训练出来的130亿参数版本现已正式上线。

至此,这一训练量和原版羊驼已完全一致。

与此同时,之前发布的70亿以及30亿参数版本也完成了1T token的训练,并发布PyTorch和JAX权重。

可谓“一家人整整齐齐”。

性能测试显示,OpenLLaMA在多项任务中的表现都与原始LLaMA相当,并且不乏超越的情况。

一个彻底开源且供商用的LLaMA竞品家族就此诞生了。

目前,OpenLLaMA在GitHub上的标星数已近5k。

重训“羊驼”,最香替代品全面开放商用

OpenLLaMA是UC伯克利的博士生Hao Liu发起的项目(Xinyang Geng拥有同等贡献,也是该校博士生)。

它在Together公司发布的RedPajama数据集上训练,该数据集其实也是LLaMA训练集的复制品,一共包含1.2T token。

除了数据集不太一样之外,OpenLLaMA使用了与原始LLaMA完全相同的预处理步骤和训练超参数,包括模型架构、上下文长度、训练步骤、学习率时间表和优化器,可以说是“重训”了一把。

今年5月,该团队率先发布了70亿参数版本,不过当时训练token还是3000亿。

按照计划,如今和原LLaMA训练数据量一致的130亿参数版本和70亿、30亿版本一同发布。

据介绍,130亿版本是与Stability AI合作训练的,后者主要提供计算资源(当初Stable Diffusion也是这么与Stability AI合作)。

和另外两个版本一样,OpenLLaMA-13B也以两种格式发布权重:

一是用于Hugging Face transformer的PyTorch格式。

使用该格式时需要注意先避免使用Hugging Face快速分词器(tokenizer),因为它的自动转换功能有时会给出不正确的tokenization。

所以可以先直接使用LlamaTokenizer class来实现,或者用AutoTokenizer class,将use_fast赋为False。

二是用于EasyLM框架的EasyLM格式。

在此请注意,与原始LLaMA不同,该OpenLLaMA的分词器和权重是完全从头开始训练的,因此不再需要获取原始 LLaMA的这俩信息。

接下来,在训练量已达成一致的情况下,看OpenLLaMA各规模模型的性能表现如何。

在这里,作者使用EleutherAI发布的自回归语言模型few-shot评估框架(lm-evaluation-harness)对两只“羊驼”进行评估,以及还加入了“第三者”:

EleutherAI在Pile数据集上训练的60亿参数模型GPT-J,它的训练token数是5000亿。

需要注意的是,可能是因为不同的评估协议,作者跑出来的LLaMA结果与原始LLaMA略有不同。

以下是结果:

红色小方框为OpenLLaMA超过或者与原LLaMA表现一样的情况。

在红框之外,两者的差距也不大。

从平均表现来看,OpenLLaMA-7B和LLaMA-7B得分都是0.55,OpenLLaMA-13B和LLaMA-13B也都一样,为0.57,主打一个势均力敌

与此同时,只有30亿参数的OpenLLaMA平均性能超越60亿参数的GPT-J。

Meta也要发可商用大模型了

特斯拉前AI高级总监Andrej Karpathy在上个月的微软Build大会的演讲上,曾多次表达一个意思:

LLaMA-65b就是目前最好的开源基础模型,可惜没能商用。

现在,650亿的商用平替羊驼虽然还没出现,130亿和70亿是已经妥妥安排好了。

不过,也有一则好消息。

就在几天前,据The Information爆料,Meta AI正计划发布一个新的LLM,并且免费供大家商用

有观点指出,在如今行业大佬如谷歌Bard和OpenAI ChatGPT都“紧闭大门”的情况下,Meta这一做法可能会引发连锁反应,并且开源模型和闭源模型的差距会越来越小。

就且拭目以待。

关于OpenLLaMA的所有相关链接:

https://github.com/openlm-research/open_llama

https://huggingface.co/openlm-research/open_llama_13b

标签:

最新
  • 重训“羊驼”大模型并彻底开放商用,UC伯克利博士生:Meta不愿做就自己做

    丰色发自凹非寺量子位|公众号QbitAIMeta“羊驼”(LLaMA)的开源可商用

  • 抖音:无相关资质认证用户 不得使用具有误导性的资讯类账号信息

    据抖音消息,为规范用户行为,打击假冒仿冒类自媒体账号,创建良好的社

  • 热点在线丨二零一二年欧洲杯冠军得主是谁?18年欧洲杯冠军是谁?

    二零一二年欧洲杯冠军得主是谁?2012年欧洲杯是欧洲足坛的一项重大赛

  • 楼兰古国在哪里?楼兰古城怎么消失的?

    楼兰古国,是古丝绸之路上的一个小国,位于罗布泊西部,处于西域的

  • 债券和基金有什么区别?债券和基金哪个更安全? 当前观点

    债券和基金有什么区别?1、发行机构不同:债券由政府、企业、银行等

  • 世界热头条丨原神巨渊主矿区铁门怎么开?巨渊主矿区铁门打开的方法步骤是什么?

    原神巨渊主矿区铁门怎么开?铁门位置1、在角色所在地有个铁门。2、无

  • 《最终幻想14》陆行鸟怎么获得?ff14陆行鸟房在什么地方买? 世界最资讯

    《最终幻想14》陆行鸟怎么获得?现在就为大家来简单介绍下有关最终幻

  • 方城县法院:走访辖区律所 优化营商环境-焦点要闻

    为深入开展观念能力作风提升年活动,提升司法服务水平,进一步优化营商

  • 加工企业管理优化 河南仙佑加工产业前景广阔

    仙佑膏药了解到,随着中医药的越来越受到大众的欢迎,膏药代加工

  • 申请农行网捷贷需要开通手机银行吗?有钱花负债率高需要等多久再申请?

    备用金逾期一天锁了可以打给客服吗?别看备用金额度比较少,但对逾期

  • 大酱汤的做法是什么?大酱汤里放什么食材?|快播报

    大酱汤的做法是什么?1 羊肉切片,并用清水浸泡20-30分钟,去掉血

  • 仙佑集团:传承千年中药文化,引领未来健康产业 世界实时

    仙佑膏药了解到,随着中医药的越来越受到大众的欢迎,膏药代加工也

  • 全球速看:棚改新动态|重大进展!塘湾组危旧住房全部拆除!

    棚改新动态|重大进展!塘湾组危旧住房全部拆除!,拆迁,塘湾,棚改,危旧

  • 华夏幸福:未能如期偿还债务合计279.38亿元

    新增发生的诉讼、仲裁事项涉案金额合计12 11亿元。

  • 全球资讯:高校毕业生就业创业政策有哪些?教育部多渠道多举措宣传解读

    为加力加大就业创业政策宣传力度,推动各项政策加快落实,近日,教育部

  • 全球短讯!奋战正酣!中铁装备这些项目建设迎来新节点

    炎炎夏日,大干正当时中铁装备建设者们锚定目标,踔厉奋发抢工期、赶进

  • 旅游
    • 什么是交行理财卡?交通标准白是套卡还是双币卡? 焦点短讯

    • 断亲是什么意思?网络用语断亲的意思解释

    • 匡衡是谁介绍 匡衡最后为啥会被贬?

    • 4s店贷款买车要提供征信报告吗?4s店贷款利息一般几个点?|环球简讯