Meta Presenta el Mayor Modelo de IA Llama 3, destacando avances en lenguaje y matemáticas

Meta Presenta el Mayor Modelo de IA Llama 3, destacando avances en lenguaje y matemáticas

Meta Platforms lanzó el martes la versión más grande de sus modelos de inteligencia artificial Llama 3, mayormente gratuitos, destacando habilidades multilingües y métricas de rendimiento general que rivalizan con los modelos de pago de competidores como OpenAI.

El nuevo modelo Llama 3 puede conversar en ocho idiomas, escribir código informático de mayor calidad y resolver problemas matemáticos más complejos que las versiones anteriores, según informó la empresa matriz de Facebook en publicaciones de blog y un artículo de investigación al anunciar el lanzamiento.

Sus 405 mil millones de parámetros, o variables que el algoritmo considera para generar respuestas a las consultas de los usuarios, superan con creces a la versión anterior lanzada el año pasado, aunque sigue siendo más pequeño que los modelos líderes ofrecidos por los competidores.

En contraste, se informa que el modelo GPT-4 de OpenAI tiene un billón de parámetros y Amazon está invirtiendo en un modelo con 2 billones de parámetros.

El lanzamiento se produce mientras las empresas tecnológicas compiten por demostrar que sus crecientes carteras de modelos de lenguaje grandes y exigentes en recursos pueden ofrecer ganancias significativas en áreas problemáticas conocidas, como el razonamiento avanzado, para justificar las enormes sumas que se han invertido en ellos.

Además de su modelo insignia de 405 mil millones de parámetros, Meta también está lanzando versiones actualizadas de sus modelos Llama 3 de 8 mil millones y 70 mil millones de parámetros, presentados inicialmente en primavera, dijo la compañía.

Los tres nuevos modelos son multilingües y pueden manejar solicitudes de usuarios más grandes a través de una «ventana de contexto» ampliada, que Ahmad Al-Dahle, jefe de IA generativa de Meta, dijo mejoraría la experiencia de generar código informático en particular.

«Ese fue el comentario número uno que recibimos de la comunidad», dijo Al-Dahle a Reuters en una entrevista, señalando que las ventanas de contexto más grandes dan a los modelos algo parecido a una memoria más larga que ayuda en el procesamiento de solicitudes de varios pasos.

Meta lanza sus modelos Llama mayormente de forma gratuita para uso de desarrolladores, una estrategia que el CEO Mark Zuckerberg dice que dará sus frutos en forma de productos innovadores y mayor participación en las redes sociales centrales de la empresa. Sin embargo, algunos inversores han expresado su preocupación por los costos involucrados.

La compañía también se beneficiaría si los desarrolladores optan por usar sus modelos gratuitos en lugar de los de pago, lo que socavaría los modelos de negocio de sus rivales. Con su anuncio, Meta destacó mejoras en pruebas clave de matemáticas y conocimientos que podrían hacer que esa perspectiva sea más atractiva.

Aunque el progreso en el desarrollo de IA es notoriamente difícil de medir, los resultados de las pruebas proporcionados por Meta parecían sugerir que su mayor modelo Llama 3 casi igualaba y, en algunos casos, superaba a Claude 3.5 Sonnet de Anthropic y GPT-4o de OpenAI, que son considerados ampliamente como los dos modelos más poderosos del mercado.

En la prueba MATH de problemas de palabras de matemáticas a nivel de competencia, por ejemplo, el modelo de Meta obtuvo una puntuación de 73.8, en comparación con los 76.6 de GPT-4o y los 71.1 de Claude 3.5 Sonnet.

El modelo obtuvo 88.6 en MMLU, un referente que cubre docenas de materias de matemáticas, ciencias y humanidades, mientras que GPT-4o obtuvo 88.7 y Claude 3.5 Sonnet obtuvo 88.3.

En su artículo, los investigadores de Meta también adelantaron versiones «multimodales» próximas de los modelos que se lanzarán a finales de este año, que añadirán capacidades de imagen, video y voz sobre el modelo de texto Llama 3 principal.

Los experimentos iniciales indican que esos modelos pueden desempeñarse de manera «competitiva» con otros modelos multimodales como el Gemini 1.5 de Google y el Claude 3.5 Sonnet de Anthropic, dijeron.