Esta Semana en IA: Midjourney apuesta a vencer a la policía de derechos de autor

Esta Semana en IA: Midjourney apuesta a vencer a la policía de derechos de autor

Mantenerse al día con una industria tan dinámica como la inteligencia artificial AI es todo un desafío. Hasta que un AI pueda hacerlo por ti, aquí tienes un resumen útil de historias recientes en el mundo del aprendizaje automático, junto con investigaciones y experimentos destacados que no cubrimos por separado.

La semana pasada, Midjourney, la startup de AI que construye generadores de imágenes (y pronto videos), realizó un cambio insignificante en sus términos de servicio relacionado con la política de la empresa en torno a disputas de propiedad intelectual. Principalmente, el cambio sirvió para reemplazar un lenguaje jocoso con cláusulas más legales, sin duda fundamentadas en la jurisprudencia. Pero el cambio también puede interpretarse como una señal de la convicción de Midjourney de que los proveedores de AI como ellos saldrán victoriosos en las batallas judiciales con creadores cuyas obras forman parte de los datos de entrenamiento de los proveedores.

Los modelos generativos de AI, como los de Midjourney, se entrenan con un número enorme de ejemplos, como imágenes y texto, generalmente obtenidos de sitios web públicos y repositorios en línea. Los proveedores afirman que el uso legítimo, la doctrina legal que permite el uso de obras protegidas por derechos de autor para crear una creación secundaria siempre que sea transformadora, los protege en lo que respecta al entrenamiento del modelo. Pero no todos los creadores están de acuerdo, especialmente a la luz de un creciente número de estudios que muestran que los modelos pueden, y lo hacen, «regurgitar» los datos de entrenamiento.

Algunos proveedores han tomado un enfoque proactivo, firmando acuerdos de licencia con creadores de contenido y estableciendo esquemas de «exclusión» para conjuntos de datos de entrenamiento. Otros han prometido que, si los clientes se ven involucrados en una demanda por derechos de autor derivada del uso de herramientas de GenAI de un proveedor, no tendrán que pagar los honorarios legales.

Midjourney no es uno de los proactivos.

Por el contrario, Midjourney ha sido un tanto descarado en su uso de obras protegidas por derechos de autor, llegando a mantener una lista de miles de artistas, incluidos ilustradores y diseñadores de marcas importantes como Hasbro y Nintendo, cuyas obras fueron utilizadas o serían utilizadas para entrenar los modelos de Midjourney. Un estudio muestra pruebas convincentes de que Midjourney utilizó programas de televisión y franquicias cinematográficas en sus datos de entrenamiento, como «Toy Story», «Star Wars», «Dune» y «Avengers».

Ahora, existe un escenario en el que las decisiones judiciales favorecerán a Midjourney al final. Si el sistema judicial decide que el uso legítimo es aplicable, nada impedirá que la startup continúe como lo ha estado haciendo, rascando y entrenando con datos protegidos por derechos de autor antiguos y nuevos.

Pero parece ser una apuesta arriesgada.

Midjourney está en la cima en este momento, habiendo alcanzado, según informes, alrededor de $200 millones en ingresos sin una inversión externa. Sin embargo, los abogados son costosos. Y si se determina que el uso legítimo no se aplica en el caso de Midjourney, la compañía sería diezmada de la noche a la mañana.

No hay recompensa sin riesgo, ¿verdad?