Meta está entrenando a un sucesor
más potente que Llama 3
El jueves por la mañana, Meta presentó su último modelo de
inteligencia artificial, Llama 3, promocionándolo como el más
potente de código abierto para que cualquiera pueda utilizarlo. Esa
misma tarde, Yann LeCun, científico en jefe de IA de Meta, declaró
que preparan un sucesor aún más potente de Llama. Sugirió que podría
eclipsar a los mejores modelos cerrados de IA del mundo, como GPT-4
de OpenAI y Gemini de Google.
En Meta están entrenando a un titán
Meta presentó dos versiones de Llama 3, una con 8,000 millones de
parámetros (término industrial que refleja aproximadamente la
potencia de un modelo) y otra con 70,000 millones de parámetros.
LeCun anunció que se están preparando modelos más potentes, y que el
más poderoso, con más de 400,000 millones de parámetros, está
actualmente en fase de entrenamiento.
"Lleva mucho tiempo ajustarlo, pero en los próximos meses saldrán a
la luz un montón de variaciones de estos modelos", prometió LeCun en
Imagination in Action, una conferencia en el Instituto Tecnológico
de Massachusetts (MIT) centrada en la IA generativa. No está claro
cuándo saldrá a la venta el modelo con más de 400,000 millones de
parámetros.
El futuro está en el código abierto
Meta lanzó el martes un nuevo asistente llamado Meta AI, con base en
Llama 3, y afirma que sus pruebas demuestran que los modelos son
mejores que los anteriores de código abierto con un número similar
de parámetros. Aunque la mayoría de los grandes desarrolladores de
IA, como Google y OpenAI, mantienen su tecnología cerrada, LeCun
predijo que los modelos de IA de código abierto avanzarán más
rápidamente. En teoría, dijo, empujarán a la IA hacia una
inteligencia de nivel humano más rápidamente.
LeCun argumentó que, si se observa el sector del software en
general, se ve que la tecnología de código abierto acaba
imponiéndose. El enfoque abierto se ha convertido en predominante en
la infraestructura de software, expresó, porque permite que las
mejoras se compartan más rápidamente, además de que el código se
examine de forma más exhaustiva. "La IA es mejor cuando más gente
mira el código", opinó.
|
|
"La
infraestructura tiene que ser de código abierto, simplemente
progresa más rápido".
La estrategia de IA de código abierto de Meta ha contribuido a
acelerar el frenesí actual en torno a la IA generativa. Cuando la
empresa lanzó su modelo Llama 2 en julio de 2023, proporcionó a
muchas startups, investigadores y emprendedores, acceso a modelos de
IA mucho más potentes que podían descargar para experimentar con
ellos.
GPT-4 de OpenAI y Gemini de Google solamente están disponibles a
través de API de pago, aunque Google puso a disposición de los
usuarios un modelo más pequeño, llamado Gemma, para su descarga en
febrero. Otras empresas han optado por unirse a Meta en la
publicación de potentes modelos de IA de código abierto. Hace apenas
un par de semanas, un nuevo modelo de la startup Databricks era la
variante abierta más potente disponible. Llama 3 parece ser más
capaz, si los resultados de las pruebas comparativas comunicados por
Meta son correctos.
Regalar para ganar
LeCun también reconoció
el martes que la estrategia de Meta consiste en regalar modelos de
inteligencia artificial cuyo
desarrollo le ha costado a la
empresa muchos recursos informáticos y de investigación. Mark
Zuckerberg, fundador y CEO de Meta, declaró en enero a CNBC que Meta
está gastando miles de millones de dólares en 2024 para adquirir las
GPU necesarias para entrenar algoritmos de aprendizaje automático.
Ese mismo mes señaló que el objetivo último de Meta (como el que
profesan OpenAI y Google) es desarrollar la llamada inteligencia
artificial general, máquinas que pueden hacer cualquier cosa y todo
lo que el intelecto humano.
Zuckerberg acudió a Instagram para explicar que Meta incorporará el
nuevo asistente de IA Meta, impulsado por Llama 3, a productos como
Whatsapp, Instagram, Facebook y Messenger.
En la entrada de su blog en la que anunciaba Llama 3, Meta decía que
se había centrado mucho en mejorar los datos de entrenamiento
utilizados para desarrollar el modelo. Según la empresa, el modelo
recibió siete veces más datos que su predecesor, Llama 2. Algunos
expertos en IA señalaron que las cifras publicadas por Meta también
mostraban que la creación de Llama 3 requería enormes cantidades de
energía para alimentar los servidores necesarios.
|
|
¿Llama se portará bien?
Las crecientes capacidades de los modelos de IA de código abierto han llevado a
algunos expertos a temer que faciliten el desarrollo de armas cibernéticas,
químicas o biológicas, o incluso que se vuelvan hostiles hacia los humanos. Meta
ha lanzado herramientas que, según apunta, pueden ayudar a garantizar que Llama
no emita expresiones potencialmente dañinas.
Otros en el campo de la IA mencionan que los modelos Llama de Meta no son todo
lo abiertos que podrían ser. La licencia de código abierto de los modelos de la
empresa impone algunas restricciones a lo que los investigadores y
desarrolladores pueden crear.
"Es estupendo ver que cada vez más modelos publican abiertamente sus pesos",
destacó Luca Soldaini, científico principal de investigación aplicada del Allen
Institute for AI, un laboratorio sin fines de lucro, en un comunicado posterior
a la publicación de Llama 3. "Pero la comunidad abierta necesita acceso a todas
las demás partes del proceso de IA: sus datos, entrenamiento, registros, código
y evaluaciones. Esto es lo que, en última instancia, acelerará nuestra
comprensión colectiva de estos modelos".
¿Tan abierto?
Stella Biderman, investigadora de IA que participa en EleutherAI, un proyecto de
IA de código abierto sin fines de lucro, indica que la licencia de Meta para
Llama 2 limitaba los experimentos que los investigadores de IA pueden realizar
con ella, y añade que la licencia de Llama 3 parece aún más restrictiva. "Meta
libera pesos, pero es famosa por restringir lo que se puede hacer con ellos",
advierte Biderman.
Una parte de la licencia del modelo dice que las empresas con "más de 700
millones de usuarios activos mensuales" deben solicitar una licencia especial a
Meta, una cláusula aparentemente diseñada para evitar que el proyecto ayude a
los rivales más cercanos de la empresa.
Aun así, parece probable que Llama 3 provoque un nuevo estallido de
experimentación con IA. Clement Delange, director general de HuggingFace, un
repositorio de modelos abiertos de IA, incluido Llama 3, afirma que los
desarrolladores crearon más de 30.000 variantes de Llama 2. "Estoy seguro de que
también veremos una avalancha de nuevos modelos basados en Llama 3", afirma.
"Impresionante movimiento comunitario por parte de Meta".
|