Meta는 4,050억 개의 매개변수를 포함하는 Llama 3.1을 공식 공개하여 현재까지 가장 큰 오픈 소스 AI 모델로 자리매김했습니다. 4,050억 변형과 함께 Llama 3.1은 다양한 응용 프로그램 요구 사항과 용량에 맞춰 700억 및 80억 매개 변수의 작은 버전으로 제공됩니다.
새로운 모델은 여러 언어에 대한 코딩, 수학 문제 해결 및 문서 요약에 탁월합니다. Meta는 Llama 3.1이 128,000개 토큰의 더 큰 컨텍스트 창을 지원하여 광범위한 텍스트 데이터를 처리하고 분석하는 능력을 크게 향상시켰다고 주장합니다.
독점 모델과 비교한 성능
Meta는 Llama 3.1이 여러 벤치마크에서 OpenAI 의 GPT-4 o 및 Anthropic의 Claude 3.5와 같은 독점 모델보다 성능이 뛰어나다고 주장합니다. 회사는 이 모델이 일반 지식 습득, 수학적 추론, 도구 활용 등 분야에서 경쟁력이 있다고 언급합니다.
이 모델은 개발 단계에서 사용되는 16,000개의 Nvidia H100 GPU와 관련하여 상당한 투자를 통해 학습되었습니다. 이 광범위한 훈련 프레임워크는 Llama 3.1의 견고성과 효율성에 기여했습니다.
Meta에 따르면 Llama 3.1은 OpenAI 의 GPT-4 o 운영 비용의 약 절반으로 생산할 수 있으며, 이는 고급 AI 솔루션을 구현하려는 기업에 상당한 비용 절감을 제공할 수 있습니다.
오픈 소스 AI에 대한 Meta의 비전
Meta의 CEO인 Mark Zuckerberg는 Llama 3.1이 AI 부문에서 중추적인 순간이 될 것으로 예상하며 해당 모델의 사용이 곧 ChatGPT 능가할 것이라는 강한 믿음을 갖고 있습니다. 그는 오픈 소스 운영 체제로의 전환을 Linux가 대부분의 휴대폰에 사용되는 운영 체제로 진화한 것과 비교하며 Llama 3.1이 이러한 전환을 가속화할 수 있음을 시사했습니다.
Llama 3.1의 개발 및 통합을 촉진하기 위해 Meta는 Amazon , Microsoft 및 Nvidia를 포함한 여러 거대 기술 기업과 파트너십을 맺었습니다. 이러한 협력의 목표는 클라우드 플랫폼 전반에서 모델에 쉽게 액세스할 수 있는 지원 생태계를 구축하여 궁극적으로 오픈 소스 AI 솔루션을 더욱 광범위하게 배포하는 것입니다.
새로운 기능 및 애플리케이션
Meta는 텍스트와 함께 이미지 및 비디오 인식 통합에 중점을 두고 Llama 3.1의 다중 모드 기능 개발을 적극적으로 모색하고 있지만 이러한 기능은 아직 출시되지 않았습니다.
Llama는 이제 AWS, Azure 및 Google Cloud에서 사용할 수 있으며 미국에서는 WhatsApp 및 챗봇 사용을 위한 Meta AI 웹사이트와 같은 플랫폼을 통해 출시되었습니다. Llama 3.1은 곧 Facebook 및 Instagram 에 통합될 예정입니다.
사용자는 언어 지원을 강화하여 최종적으로 프랑스어, 독일어, 힌디어, 이탈리아어 및 스페인어를 수용하는 업데이트를 기대할 수 있습니다.