Pereira, Colombia - Edición: 13.247-827

Fecha: Domingo 21-04-2024

 

 TECNOLOGÍA

 

-14

 

Meta está entrenando a un sucesor más potente que Llama 3




El jueves por la mañana, Meta presentó su último modelo de inteligencia artificial, Llama 3, promocionándolo como el más potente de código abierto para que cualquiera pueda utilizarlo. Esa misma tarde, Yann LeCun, científico en jefe de IA de Meta, declaró que preparan un sucesor aún más potente de Llama. Sugirió que podría eclipsar a los mejores modelos cerrados de IA del mundo, como GPT-4 de OpenAI y Gemini de Google.

En Meta están entrenando a un titán

Meta presentó dos versiones de Llama 3, una con 8,000 millones de parámetros (término industrial que refleja aproximadamente la potencia de un modelo) y otra con 70,000 millones de parámetros. LeCun anunció que se están preparando modelos más potentes, y que el más poderoso, con más de 400,000 millones de parámetros, está actualmente en fase de entrenamiento.

"Lleva mucho tiempo ajustarlo, pero en los próximos meses saldrán a la luz un montón de variaciones de estos modelos", prometió LeCun en Imagination in Action, una conferencia en el Instituto Tecnológico de Massachusetts (MIT) centrada en la IA generativa. No está claro cuándo saldrá a la venta el modelo con más de 400,000 millones de parámetros.

El futuro está en el código abierto


Meta lanzó el martes un nuevo asistente llamado Meta AI, con base en Llama 3, y afirma que sus pruebas demuestran que los modelos son mejores que los anteriores de código abierto con un número similar de parámetros. Aunque la mayoría de los grandes desarrolladores de IA, como Google y OpenAI, mantienen su tecnología cerrada, LeCun predijo que los modelos de IA de código abierto avanzarán más rápidamente. En teoría, dijo, empujarán a la IA hacia una inteligencia de nivel humano más rápidamente.
 

LeCun argumentó que, si se observa el sector del software en general, se ve que la tecnología de código abierto acaba imponiéndose. El enfoque abierto se ha convertido en predominante en la infraestructura de software, expresó, porque permite que las mejoras se compartan más rápidamente, además de que el código se examine de forma más exhaustiva. "La IA es mejor cuando más gente mira el código", opinó.

 

 

 
 "La infraestructura tiene que ser de código abierto, simplemente progresa más rápido".



La estrategia de IA de código abierto de Meta ha contribuido a acelerar el frenesí actual en torno a la IA generativa. Cuando la empresa lanzó su modelo Llama 2 en julio de 2023, proporcionó a muchas startups, investigadores y emprendedores, acceso a modelos de IA mucho más potentes que podían descargar para experimentar con ellos.

GPT-4 de OpenAI y Gemini de Google solamente están disponibles a través de API de pago, aunque Google puso a disposición de los usuarios un modelo más pequeño, llamado Gemma, para su descarga en febrero. Otras empresas han optado por unirse a Meta en la publicación de potentes modelos de IA de código abierto. Hace apenas un par de semanas, un nuevo modelo de la startup Databricks era la variante abierta más potente disponible. Llama 3 parece ser más capaz, si los resultados de las pruebas comparativas comunicados por Meta son correctos.

Regalar para ganar

 

LeCun también reconoció el martes que la estrategia de Meta consiste en regalar modelos de inteligencia artificial cuyo desarrollo le ha costado a la empresa muchos recursos informáticos y de investigación. Mark Zuckerberg, fundador y CEO de Meta, declaró en enero a CNBC que Meta está gastando miles de millones de dólares en 2024 para adquirir las GPU necesarias para entrenar algoritmos de aprendizaje automático. Ese mismo mes señaló que el objetivo último de Meta (como el que profesan OpenAI y Google) es desarrollar la llamada inteligencia artificial general, máquinas que pueden hacer cualquier cosa y todo lo que el intelecto humano.

Zuckerberg acudió a Instagram para explicar que Meta incorporará el nuevo asistente de IA Meta, impulsado por Llama 3, a productos como Whatsapp, Instagram, Facebook y Messenger.

En la entrada de su blog en la que anunciaba Llama 3, Meta decía que se había centrado mucho en mejorar los datos de entrenamiento utilizados para desarrollar el modelo. Según la empresa, el modelo recibió siete veces más datos que su predecesor, Llama 2. Algunos expertos en IA señalaron que las cifras publicadas por Meta también mostraban que la creación de Llama 3 requería enormes cantidades de energía para alimentar los servidores necesarios.

 

 

 

 

 

¿Llama se portará bien?


Las crecientes capacidades de los modelos de IA de código abierto han llevado a algunos expertos a temer que faciliten el desarrollo de armas cibernéticas, químicas o biológicas, o incluso que se vuelvan hostiles hacia los humanos. Meta ha lanzado herramientas que, según apunta, pueden ayudar a garantizar que Llama no emita expresiones potencialmente dañinas.

Otros en el campo de la IA mencionan que los modelos Llama de Meta no son todo lo abiertos que podrían ser. La licencia de código abierto de los modelos de la empresa impone algunas restricciones a lo que los investigadores y desarrolladores pueden crear.

"Es estupendo ver que cada vez más modelos publican abiertamente sus pesos", destacó Luca Soldaini, científico principal de investigación aplicada del Allen Institute for AI, un laboratorio sin fines de lucro, en un comunicado posterior a la publicación de Llama 3. "Pero la comunidad abierta necesita acceso a todas las demás partes del proceso de IA: sus datos, entrenamiento, registros, código y evaluaciones. Esto es lo que, en última instancia, acelerará nuestra comprensión colectiva de estos modelos".

¿Tan abierto?

Stella Biderman, investigadora de IA que participa en EleutherAI, un proyecto de IA de código abierto sin fines de lucro, indica que la licencia de Meta para Llama 2 limitaba los experimentos que los investigadores de IA pueden realizar con ella, y añade que la licencia de Llama 3 parece aún más restrictiva. "Meta libera pesos, pero es famosa por restringir lo que se puede hacer con ellos", advierte Biderman.

Una parte de la licencia del modelo dice que las empresas con "más de 700 millones de usuarios activos mensuales" deben solicitar una licencia especial a Meta, una cláusula aparentemente diseñada para evitar que el proyecto ayude a los rivales más cercanos de la empresa.



Aun así, parece probable que Llama 3 provoque un nuevo estallido de experimentación con IA. Clement Delange, director general de HuggingFace, un repositorio de modelos abiertos de IA, incluido Llama 3, afirma que los desarrolladores crearon más de 30.000 variantes de Llama 2. "Estoy seguro de que también veremos una avalancha de nuevos modelos basados en Llama 3", afirma. "Impresionante movimiento comunitario por parte de Meta".

 

 

  

 

 

EL IMPARCIAL

Submit

 

 

© El Imparcial Editores S.A.S  |   Contacto 57 606 348 6207  

 

    © 1948-2009 - 2024 - El Imparcial - La idea y concepto de este periódico fue hecho en Online Periodical Format (OPF) que es un Copyright de ZahurK.

    Queda prohibido el uso de este formato e idea (OPF) sin previa autorización escrita de ZahurK