LLaMA 产品介绍
LLaMA 不像 ChatGPT 或 Bing;这不是一个任何人都可以与之交谈的系统。相反,它是一种研究工具,Meta 表示它正在分享,希望“在这个快速变化的重要领域实现民主化访问”。换句话说:帮助专家梳理 AI 语言模型的问题,从偏见和毒性到他们简单地编造信息的倾向。
为此,Meta 在“专注于研究用例的非商业许可”下发布了 LLaMA(实际上不是一个系统,而是四个不同大小的模型),并授予大学、非政府组织和行业实验室等团体访问权限.
该公司在其帖子中写道:“我们认为,整个人工智能社区——学术研究人员、民间社会、政策制定者和行业——必须共同努力,围绕负责任的人工智能,特别是负责任的大型语言模型,制定明确的指导方针。” “我们期待看到社区可以使用 LLaMA 学习并最终构建什么。”
在一篇研究论文中,Meta 声称 LLaMA 模型的第二小版本 LLaMA-13B“在大多数基准测试中”比 OpenAI 流行的 GPT-3 模型表现更好,而最大的版本 LLaMA-65B“与最佳模型”,例如 DeepMind 的 Chinchilla70B 和 Google 的 PaLM 540B。(这些名称中的数字指的是每个模型中的数十亿个参数——系统规模的衡量标准和复杂程度的粗略近似值,尽管这两种特性不一定同步扩展。)
经过训练后,LLaMA-13B 还可以在单个数据中心级 Nvidia Tesla V100 GPU 上运行。对于希望在这些系统上进行测试的小型机构来说,这将是一个好消息,但对于无法获得此类设备的独立研究人员来说,这并不意味着什么。
Meta 的发布也很引人注目,部分原因是它错过了围绕 AI 聊天机器人的一些热门话题。(不过,考虑到微软因仓促推出 Bing 而受到的批评以及谷歌在其聊天机器人在演示中出错后股价暴跌,这可能不是一件坏事。)
Meta 过去确实发布过自己的可访问 AI 聊天机器人,但反响不佳。一个名为 BlenderBot 的软件被批评只是…不太好,而另一个名为 Galactica 的软件是用来写科学论文的,因为它不停地制造科学废话才三天就被下线了。
对于 LLaMA 四重奏,Meta 大概希望得到更友善的接待。
“今天我们发布了一种新的最先进的 AI 大型语言模型,称为 LLaMA,旨在帮助研究人员推进他们的工作,”首席执行官马克扎克伯格在 Facebook 帖子中说。“LLMs在生成文本、进行对话、总结书面材料以及解决数学定理或预测蛋白质结构等更复杂的任务方面表现出了很大的潜力。Meta 致力于这种开放的研究模式,我们会将我们的新模型提供给 AI 研究社区。”