A Meta revelou oficialmente o Llama 3.1, que contém 405 bilhões de parâmetros, estabelecendo-o como o maior modelo de IA de código aberto até o momento. Juntamente com a variante de 405 bilhões, o Llama 3.1 estará disponível em versões menores de 70 bilhões e 8 bilhões de parâmetros, atendendo a diversas necessidades e capacidades de aplicação.
O novo modelo é excelente em codificação, resolução de problemas matemáticos e resumo de documentos em vários idiomas. Meta afirma que o Llama 3.1 suporta uma janela de contexto maior de 128.000 tokens, melhorando significativamente sua capacidade de processar e analisar extensos dados textuais.
Desempenho comparado a modelos proprietários
Meta afirma que o Llama 3.1 supera modelos proprietários, como GPT-4 o da OpenAI e o Claude 3.5 da Anthropic em vários benchmarks. A empresa cita que o modelo é competitivo em áreas como aquisição de conhecimentos gerais, raciocínio matemático e utilização de ferramentas.
O modelo foi treinado com um investimento considerável, referente às 16.000 GPUs Nvidia H100 utilizadas na fase de desenvolvimento. Esta extensa estrutura de treinamento contribuiu para a robustez e eficiência do Llama 3.1.
Meta afirma que o Llama 3.1 pode ser produzido com aproximadamente metade do custo operacional de execução do GPT-4 da OpenAI , o que poderia oferecer economias significativas para empresas que buscam implementar soluções avançadas de IA.
Visão da Meta para IA de código aberto
Mark Zuckerberg, CEO da Meta, antecipa que o Llama 3.1 representa um momento crucial no setor de IA, com uma forte convicção de que o uso do seu modelo ultrapassará ChatGPT em breve. Ele compara a transição para o sistema operacional de código aberto com a evolução do Linux para este sistema operacional que alimenta a maioria dos telefones, sugerindo que o Llama 3.1 pode acelerar essa mudança.
Para promover o desenvolvimento e integração do Llama 3.1, a Meta fez parceria com vários gigantes da tecnologia, incluindo Amazon , Microsoft e Nvidia. Essas colaborações visam criar um ecossistema de suporte que permita fácil acesso ao modelo em plataformas de nuvem, levando, em última análise, a uma implantação mais ampla de soluções de IA de código aberto.
Novos recursos e aplicativos
A Meta está explorando ativamente o desenvolvimento de recursos multimodais para o Llama 3.1, com foco na integração de reconhecimento de imagem e vídeo junto com texto, mas essas funções ainda não foram lançadas.
Llama agora está disponível para uso em AWS, Azure e Google Cloud enquanto é lançado nos Estados Unidos por meio de plataformas como WhatsApp e o site Meta AI para uso de chatbot, Llama 3.1 em breve será integrado ao Facebook e Instagram .
Os usuários podem esperar atualizações que melhoram o suporte a idiomas, eventualmente acomodando francês, alemão, hindi, italiano e espanhol.