Meta oficjalnie zaprezentowała Llamę 3.1, która zawiera 405 miliardów parametrów, co czyni ją największym jak dotąd modelem sztucznej inteligencji typu open source. Oprócz wariantu 405 miliardów, Llama 3.1 będzie dostępna w mniejszych wersjach o 70 miliardach i 8 miliardach parametrów, dostosowanych do różnych potrzeb i możliwości aplikacji.
Nowy model przoduje w kodowaniu, rozwiązywaniu problemów matematycznych i podsumowywaniu dokumentów w wielu językach. Meta twierdzi, że Llama 3.1 obsługuje większe okno kontekstowe zawierające 128 000 tokenów, znacznie zwiększając jego zdolność do przetwarzania i analizowania obszernych danych tekstowych.
Wydajność w porównaniu z modelami zastrzeżonymi
Meta twierdzi, że Llama 3.1 przewyższa w wielu testach zastrzeżone modele, takie jak GPT-4 o OpenAI i Claude 3.5 firmy Anthropic. Firma twierdzi, że model jest konkurencyjny w takich obszarach, jak zdobywanie wiedzy ogólnej, rozumowanie matematyczne i wykorzystanie narzędzi.
Model został wytrenowany przy znacznych inwestycjach, związanych z 16 000 procesorów graficznych Nvidia H100 używanych w fazie rozwojowej. Te obszerne ramy szkoleniowe przyczyniły się do solidności i wydajności Lamy 3.1.
Meta twierdzi, że Llamę 3.1 można wyprodukować przy w przybliżeniu połowie kosztów operacyjnych obsługi GPT-4 o OpenAI , co może zapewnić znaczne oszczędności firmom pragnącym wdrożyć zaawansowane rozwiązania AI.
Wizja Meta dotycząca sztucznej inteligencji typu open source
Mark Zuckerberg, dyrektor generalny Meta, przewiduje, że Llama 3.1 stanowi kluczowy moment w sektorze AI i jest głęboko przekonany, że wykorzystanie jej modelu wkrótce przewyższy ChatGPT . Porównuje przejście na system operacyjny typu open source z ewolucją Linuksa w kierunku tego systemu operacyjnego, na którym działa większość telefonów, sugerując, że Llama 3.1 może przyspieszyć tę zmianę.
Aby wspierać rozwój i integrację Llama 3.1, Meta nawiązała współpracę z kilkoma gigantami technologicznymi, w tym Amazon , Microsoft i Nvidia. Celem tej współpracy jest stworzenie wspierającego ekosystemu, który umożliwi łatwy dostęp do modelu na platformach chmurowych, co ostatecznie doprowadzi do szerszego wdrożenia rozwiązań AI typu open source.
Nowe funkcje i zastosowania
Meta aktywnie bada rozwój możliwości multimodalnych dla Llama 3.1, koncentrując się na integracji rozpoznawania obrazów i wideo z tekstem, ale funkcje te nie zostały jeszcze udostępnione.
Llama jest teraz dostępna do użytku na platformach AWS, Azure i Google Cloud, natomiast została uruchomiona w Stanach Zjednoczonych za pośrednictwem platform takich jak WhatsApp i witryna Meta AI do użytku z chatbotem. Llama 3.1 wkrótce zostanie zintegrowana z Facebook i Instagram .
Użytkownicy mogą spodziewać się aktualizacji poprawiających obsługę języków, ostatecznie obejmując język francuski, niemiecki, hindi, włoski i hiszpański.