Meta ha presentado oficialmente Llama 3.1, que contiene 405 mil millones de parámetros, lo que lo establece como el modelo de IA de código abierto más grande hasta la fecha. Además de la variante de 405 mil millones, Llama 3.1 estará disponible en versiones más pequeñas de 70 mil millones y 8 mil millones de parámetros, atendiendo a diversas necesidades y capacidades de aplicaciones.
El nuevo modelo destaca en codificación, resolución de problemas matemáticos y resumen de documentos en varios idiomas. Meta afirma que Llama 3.1 admite una ventana de contexto más grande de 128.000 tokens, lo que mejora significativamente su capacidad para procesar y analizar datos textuales extensos.
Rendimiento en comparación con modelos propietarios
Meta afirma que Llama 3.1 supera a los modelos propietarios como GPT-4 o de OpenAI y Claude 3.5 de Anthropic en múltiples puntos de referencia. La empresa cita que el modelo es competitivo en áreas como la adquisición de conocimientos generales, el razonamiento matemático y la utilización de herramientas.
El modelo fue entrenado con una inversión considerable, considerando las 16.000 GPU Nvidia H100 que se utilizan en la fase de desarrollo. Este amplio marco de capacitación contribuyó a la solidez y eficiencia de Llama 3.1.
Meta afirma que Llama 3.1 se puede producir a aproximadamente la mitad del costo operativo de ejecutar GPT-4 o de OpenAI , lo que podría ofrecer ahorros significativos para las empresas que buscan implementar soluciones avanzadas de IA.
La visión de Meta para la IA de código abierto
Mark Zuckerberg, director ejecutivo de Meta, anticipa que Llama 3.1 representa un momento crucial en el sector de la inteligencia artificial, y cree firmemente que el uso de su modelo superará pronto ChatGPT . Compara la transición al sistema operativo de código abierto con la evolución de Linux hacia este sistema operativo que impulsa la mayoría de los teléfonos, sugiriendo que Llama 3.1 puede acelerar este cambio.
Para fomentar el desarrollo y la integración de Llama 3.1, Meta se ha asociado con varios gigantes tecnológicos, incluidos Amazon , Microsoft y Nvidia. Estas colaboraciones tienen como objetivo crear un ecosistema de apoyo que permita un fácil acceso al modelo a través de plataformas en la nube, lo que en última instancia conducirá a una implementación más amplia de soluciones de inteligencia artificial de código abierto.
Nuevas funciones y aplicaciones
Meta está explorando activamente el desarrollo de capacidades multimodales para Llama 3.1, enfocándose en la integración de reconocimiento de imágenes y videos junto con texto, pero estas funciones aún no se han lanzado.
Llama ahora está disponible para su uso en AWS, Azure y Google Cloud, mientras se lanza en los Estados Unidos a través de plataformas como WhatsApp y el sitio web Meta AI para uso de chatbot, Llama 3.1 pronto se integrará en Facebook e Instagram .
Los usuarios pueden esperar actualizaciones que mejoren la compatibilidad con idiomas y que eventualmente incluyan francés, alemán, hindi, italiano y español.