Meta 正式发布了 Llama 3.1,该模型包含4050 亿个参数,是迄今为止最大的开源 AI 模型。除了 4050 亿个参数版本外,Llama 3.1 还将提供 700 亿个和 80 亿个参数的较小版本,以满足各种应用需求和容量。
新模型在编码、数学问题解决和跨多种语言的文档摘要方面表现出色。Meta 声称 Llama 3.1 支持更大的上下文窗口(128,000 个标记),大大增强了其处理和分析大量文本数据的能力。
与专有模型的性能比较
Meta 声称 Llama 3.1 在多个基准测试中的表现优于OpenAI的GPT-4 o 和 Anthropic 的 Claude 3.5 等专有模型。该公司指出,该模型在一般知识获取、数学推理和工具利用等领域具有竞争力。
该模型的训练投入巨大,开发阶段使用了 16,000 个 Nvidia H100 GPU。这种广泛的训练框架有助于提高 Llama 3.1 的稳健性和效率。
Meta 表示,Llama 3.1 的生产成本大约是运行OpenAI的GPT-4的一半,这可以为寻求实施先进 AI 解决方案的企业节省大量成本。
Meta 对开源 AI 的愿景
Meta 首席执行官马克·扎克伯格预计 Llama 3.1 代表着人工智能领域的一个关键时刻,他坚信其模型的使用量将很快超过ChatGPT 。他将向开源操作系统的过渡与 Linux 向支持大多数手机的操作系统的演变进行了比较,并暗示 Llama 3.1 可能会加速这一转变。
为了促进 Llama 3.1 的开发和集成,Meta 与Amazon 、微软和 Nvidia 等多家科技巨头合作。这些合作旨在创建一个支持性生态系统,使人们能够轻松访问跨云平台的模型,最终实现更广泛地部署开源 AI 解决方案。
新功能和应用程序
Meta 正在积极探索开发 Llama 3.1 的多模式功能,重点是将图像和视频识别与文本相结合,但这些功能尚未发布。
Llama 现在可以在 AWS、Azure 和Google Cloud 上使用,并且它已在美国通过 WhatsApp 和 Meta AI 网站等平台推出,可供聊天机器人使用,Llama 3.1 很快将集成到Facebook和Instagram中。
用户可以期待增强语言支持的更新,最终支持法语、德语、印地语、意大利语和西班牙语。