Meta revela Flame 3: probamos el nuevo modelo de inteligencia artificial de código abierto

Meta lanzó Llama 3, el modelo de lenguaje grande (LLM) de código abierto más avanzado disponible actualmente. Se basa en los cimientos establecidos por su predecesor, Llama 2, y tomó a todos por sorpresa, considerando los rumores que sugerían que el lanzamiento se produciría el próximo mes.

Con sus raíces de código abierto, Llama-2 jugó un papel decisivo en el desarrollo simultáneo de otros modelos potentes como Mixtral, Alpaca, Vicuna y WizardLM. Ahora, Llama 3 promete llevar estas capacidades aún más lejos, ofreciendo una funcionalidad comparable al actual modelo insignia de IA de OpenAI, GPT-4.

Meta elogió el lanzamiento del jueves como “la próxima generación de nuestro modelo de lenguaje de código abierto avanzado y a gran escala”. El gigante tecnológico tiene tanta confianza en sus capacidades que Llama 3 está impulsando el asistente de inteligencia artificial Meta AI de la compañía, que a su vez se agregó a casi todas las aplicaciones populares de la compañía: Instagram, Facebook y WhatsApp. Está disponible en países seleccionados, pero los usuarios de otras regiones pueden acceder a él a través de VPN.

La interfaz de Meta AI Chatbot es comparable a ChatGPT Plus, ¡y es gratis!

“Estamos actualizando Meta AI con nuestro nuevo modelo Llama 3 AI de próxima generación, que compartimos abiertamente”, dijo Mark Zuckerberg en una publicación de Facebook. “Con este nuevo modelo, creemos que Meta AI es ahora el asistente de IA más inteligente que puedes usar libremente”.

Descifrar Pude probar la nueva IA y descubrió que es tan buena como ChatGPT-Plus, pero sin la necesidad de una suscripción paga. Puede generar imágenes y animaciones, producir código y proporcionar respuestas coherentes y contextualmente relevantes. El nuevo chatbot también puede acceder a Internet, pero aún no se compara con las capacidades de soluciones especializadas como Perplexity.

Quizás el único inconveniente es que la ventana de contexto actual de Llama-3 está limitada a 8K tokens, alrededor de 6000 palabras.

Meta lanzó un modelo Llama-3 de 70 mil millones de parámetros, pero usarlo requeriría mucha potencia informática, probablemente un bastidor completo de GPU. Según pruebas sintéticas, este modelo supera al Gemini 1.5 Pro y al Claude 3 Sonnet.

También está disponible un modelo de 8 mil millones de parámetros, que se puede ejecutar localmente en GPU de consumo. Esto supera a Gemini y Mistral 7B de Google en varias pruebas sintéticas. El modelo aún no ha sido incluido en LLM Arena, por lo que aún no hay una puntuación ELO subjetiva que informar.

Imagen: Meta

Ambos modelos también pueden ejecutarse en la nube a un costo menor.

“Estamos dedicados a desarrollar Llama 3 de manera responsable y ofrecemos varios recursos para ayudar a otros a usarlo también de manera responsable”, afirmó Meta. Esto incluye la introducción de nuevas herramientas de confianza y seguridad como Llama Guard 2, Code Shield y CyberSec Eval 2.

En los próximos meses, Meta dice que planea introducir nuevas capacidades, ventanas de contexto más largas, tamaños de modelo adicionales y un rendimiento mejorado. También se compartirá el documento de investigación de Llama 3.

“La IA de Meta, construida con la tecnología Llama 3, es ahora uno de los asistentes de IA líderes en el mundo que puede aumentar tu inteligencia y aligerar tu carga, ayudándote a aprender, hacer cosas, crear contenido y conectarte para aprovechar al máximo cada momento”. Dijo Meta.

Meta agregó que también está entrenando un modelo masivo de 400 mil millones de parámetros, que se espera que sea lanzado a finales de este año. Este modelo, probablemente comparable a Claude Opus o la última versión de GPT-4.5, podría ser el modelo de código abierto más potente hasta la fecha. Si la historia se repite, también servirá como base para una nueva generación de modelos perfeccionados que superarán a Llama 3 en calidad general y aumentarán la competencia contra los principales modelos de código cerrado.

Probando Llama 3

Descifrar Probé Llama 3 dentro de Meta AI para ver si era tan bueno como dice Zuck. En resumen, Llama-3 ha introducido una serie de características y capacidades notables y debería ser un gran modelo fundamental para que la comunidad de código abierto pueda iterar.

Moderación de contenido

Llama 3 demuestra un fuerte compromiso con la moderación de contenidos. Se negó sistemáticamente a generar contenido racial dañino, incluso cuando se enfrentó a técnicas comunes de jailbreak.

Por ejemplo, cuando al modelo se le pidieron instrucciones sobre cómo seducir a una mujer, dio respuestas genéricas pero útiles. Sin embargo, cuando se le pidió instrucciones sobre cómo seducir a la esposa de su mejor amigo, la modelo se negó rotundamente a dar una respuesta.

Imágenes y animación

Similar a ChatGPT-Plus, Meta AI con Llama-3 es capaz de generar imágenes. Sin embargo, lleva esta capacidad un paso más allá al ofrecer la opción de animarlos, una característica que no está disponible en ChatGPT o Gemini.

Las imágenes generadas por Meta AI con Llama-3 son más realistas que las producidas por Dalle-3, pero no alcanzan la calidad de las imágenes generadas por ImageFX, la próxima herramienta de Google.

Capacidades de codificación

Llama 3 ha demostrado ser muy competente en codificación. Cuando se le presentó una idea de juego única y mal explicada, el modelo pudo generar el código Python necesario en dos intentos, lo que dio como resultado un juego que funcionaba. El primer intento nos dio una idea aproximada de cómo construir el juego, pero generó un código funcional después de que aclaramos que lo necesitábamos en Python.

El juego era funcional, pero faltaban algunos detalles menores, como reiniciar después de que un jugador gana. Sin embargo, sucedió lo mismo con otros chatbots.

Hemos descubierto que Claude 3 Sonnet es la mejor herramienta para esta tarea, seguido de Llama 3. GPT-4 cae al tercer lugar. Sin embargo, diferentes usuarios pueden obtener resultados diferentes.

Aquí hay un pastbin (una copia) con los códigos fuente generados por Llama3, Claude y ChatGPT para aquellos interesados en probarlos.

Neutralidad política

El modelo apunta a la neutralidad política, como lo demuestran sus respuestas a preguntas sobre el capitalismo y el comunismo. Las respuestas fueron estructuralmente similares y proporcionaron una introducción, los pros y los contras de cada sistema.

Este patrón de neutralidad también se observó en respuestas a preguntas como “¿Qué es un hombre?” y “¿Qué es una mujer?”

Aún así, sus respuestas son ligeramente procapitalistas y de izquierda, lo que no sorprende, ya que es la tendencia política más común entre los grandes modelos lingüísticos.

razonamiento lógico

Llama 3 ha demostrado poderosas habilidades de razonamiento lógico. Cuando se probó con preguntas complejas del LSAT (Prueba de admisión a la facultad de derecho) que a menudo confunden a los usuarios, el modelo no solo proporcionó respuestas correctas sino que también ofreció explicaciones claras y razonables.

Límites de indicación largos

A pesar de sus muchas fortalezas, Llama-3 tiene dificultades con indicaciones largas. Cuando se le presentó un mensaje extenso de aproximadamente una página y media de contexto, que puede ser asimilado por modelos como GPT-4, Claude o Mistral, el modelo devolvió un mensaje de error.

Comprensión del lenguaje

El modelo demuestra una sólida comprensión de diferentes idiomas. Cuando se le pidió que tradujera un eslogan en español, no solo proporcionó una traducción precisa, sino que también ofreció contexto para comprender mejor el eslogan.

Conclusión

Como interfaz de chatbot, Meta AI (que funciona con Llama3) puede competir con ChatGPT Plus y es una excelente opción.

En un nivel más técnico, Llama 3 como LLM es lo suficientemente bueno como para competir contra GPT-4 en diferentes escenarios, perdiendo solo en términos de capacidades de contexto de token y Generaciones de recuperación aumentadas (básicamente, extraer información de un conjunto de datos específico proporcionado por el usuario). Esto puede ser importante para los usuarios técnicos, pero puede no ser tan relevante para la persona promedio.

Si utiliza principalmente ChatGPT para generar imágenes con Dall-E, es posible que desee considerar cancelar su suscripción, ya que las capacidades de generación de imágenes y animación de Llama-3 son comparables. Sin embargo, si necesita soporte para instrucciones largas, es posible que Llama 3 no sea la mejor opción para usted y es posible que desee seguir con ChatGPT-Plus.

Los usuarios ocasionales pueden encontrar que Llama 3 satisface sus necesidades sin necesidad de una membresía paga.

Para tareas que requieren una investigación intensiva en Internet, ChatGPT Plus o Perplexity pueden ser más adecuados.

Finalmente, si te centras en la programación, Llama 3 podría ser una buena alternativa, aunque existen otras herramientas especializadas disponibles. El hecho de que Llama-3 sea gratuito es una ventaja significativa.

Editado por Ryan Ozawa.

For Latest Updates Follow us on Google News

Probando Llama 3

Conclusión

Related posts