Meta 正式發布了 Llama 3.1,其中包含4050 億個參數,使其成為迄今為止最大的開源人工智慧模型。除了 4050 億個變體之外,Llama 3.1 還將提供 700 億和 80 億個參數的較小版本,以滿足各種應用需求和容量。
新模型在跨多種語言的編碼、數學問題解決和文件摘要方面表現出色。 Meta 聲稱 Llama 3.1 支援 128,000 個標記的更大上下文窗口,顯著增強了其處理和分析大量文字資料的能力。
與專有型號的性能比較
Meta 斷言,Llama 3.1 在多個基準測試中優於OpenAI的GPT-4 o 和 Anthropic 的 Claude 3.5 等專有模型。該公司指出,該模型在一般知識獲取、數學推理和工具利用等領域具有競爭力。
此模型的訓練投入相當大,在開發階段使用了 16,000 個 Nvidia H100 GPU。這種廣泛的培訓框架有助於提高 Llama 3.1 的穩健性和效率。
Meta 表示,Llama 3.1 的生產成本約為運行OpenAI的GPT-4 o 營運成本的一半,這可以為尋求實施高級 AI 解決方案的企業節省大量成本。
Meta 的開源人工智慧願景
Meta 執行長 Mark Zuckerberg 預計 Llama 3.1 代表著人工智慧領域的關鍵時刻,並堅信其模型的使用率將很快超過ChatGPT 。他將向開源作業系統的過渡與 Linux 演進成為大多數手機提供支援的作業系統進行了比較,表明 Llama 3.1 可能會加速這一轉變。
為了促進 Llama 3.1 的開發和集成,Meta 與Amazon 、微軟和 Nvidia 等多家科技巨頭合作。這些合作旨在創建一個支援性生態系統,使跨雲平台能夠輕鬆存取模型,最終實現開源人工智慧解決方案的更廣泛部署。
新特性與應用
Meta 正在積極探索 Llama 3.1 的多模態功能開發,重點關注圖像和視訊識別與文字的集成,但這些功能尚未發布。
Llama 現在可以在 AWS、Azure 和Google Cloud 上使用,同時它在美國透過 WhatsApp 和 Meta AI 網站等平台推出供聊天機器人使用,Llama 3.1 很快就會整合到Facebook和Instagram中。
使用者可以期待增強語言支援的更新,最終支援法語、德語、印地語、義大利語和西班牙語。