Los sistemas de IA y los grandes modelos de lenguaje necesitan ser entrenados con enormes cantidades de datos para ser precisos, pero no deberían entrenarse con datos para los que no tengan los derechos de uso. Los acuerdos de licencia de OpenAI con The Atlantic y Vox la semana pasada muestran que ambas partes están interesadas en asegurar estos acuerdos de licencias de contenido de entrenamiento de IA.
Human Native AI es una startup con sede en Londres que está construyendo un mercado para negociar tales acuerdos entre las muchas empresas que construyen proyectos de LLM y aquellas dispuestas a licenciarles datos.
Su objetivo es ayudar a las empresas de IA a encontrar datos para entrenar sus modelos, asegurando que los titulares de derechos opten y sean compensados. Los titulares de derechos suben su contenido sin cargo y se conectan con empresas de IA para cerrar acuerdos de participación en los ingresos o suscripción. Human Native AI también ayuda a los titulares de derechos a preparar y fijar el precio de su contenido y monitorea cualquier infracción de derechos de autor. Human Native AI se lleva una comisión de cada acuerdo y cobra a las empresas de IA por sus servicios de transacción y monitoreo.
James Smith, CEO y cofundador, dijo a TechCrunch que tuvo la idea para Human Native AI a partir de su experiencia pasada trabajando en el proyecto DeepMind de Google. DeepMind también tuvo problemas al no tener suficientes buenos datos para entrenar adecuadamente el sistema. Luego vio que otras empresas de IA tenían el mismo problema.
«Se siente como si estuviéramos en la era Napster de la IA generativa», dijo Smith. «¿Podemos llegar a una era mejor? ¿Podemos facilitar la adquisición de contenido? ¿Podemos dar a los creadores algún nivel de control y compensación? Seguí pensando, ¿por qué no hay un mercado?»
Presentó la idea a su amigo Jack Galilee, ingeniero en GRAIL, durante un paseo en el parque con sus respectivos hijos, como Smith lo había hecho con muchas otras ideas potenciales de startups. Pero a diferencia de otras veces, Galilee dijo que deberían hacerlo.
La empresa se lanzó en abril y actualmente está operando en fase beta. Smith dijo que la demanda de ambas partes ha sido realmente alentadora y ya han firmado varias asociaciones que se anunciarán en un futuro próximo. Human Native AI anunció una ronda de financiación de semillas de £2.8 millones liderada por LocalGlobe y Mercuri, dos micro VCs británicos, esta semana. Smith dijo que la empresa planea utilizar la financiación para ampliar su equipo.
«Soy el CEO de una empresa de dos meses y he podido tener reuniones con CEOs de empresas editoriales de 160 años», dijo Smith. «Eso me sugiere que hay una gran demanda en el lado editorial. Igualmente, cada conversación con una gran empresa de IA sigue exactamente el mismo camino».
Aunque aún es muy temprano, lo que Human Native AI está construyendo parece ser una pieza faltante de infraestructura en la creciente industria de la IA. Los grandes jugadores de IA necesitan muchos datos para entrenar y dar a los titulares de derechos una manera más fácil de trabajar con ellos, al tiempo que les dan control total sobre cómo se utiliza su contenido, parece ser un buen enfoque que puede satisfacer a ambas partes.
«Sony Music acaba de enviar cartas a 700 empresas de IA pidiendo que cesen y desistan», dijo Smith. «Ese es el tamaño del mercado y los clientes potenciales que podrían estar adquiriendo datos. El número de editoriales y titulares de derechos podría ser de miles, si no de decenas de miles. Creemos que esa es la razón por la que necesitamos infraestructura».
También creo que esto podría ser aún más beneficioso para los sistemas de IA más pequeños que no necesariamente tienen los recursos para cerrar un acuerdo con Vox o The Atlantic para seguir teniendo acceso a datos para entrenar. Smith dijo que también esperan eso y que todos los acuerdos de licencia notables hasta ahora han involucrado a los jugadores de IA más grandes. Espera que Human Native AI pueda ayudar a nivelar el campo de juego.
«Uno de los principales desafíos con la licencia de contenido es que tienes costos iniciales grandes y restringes masivamente con quién puedes trabajar», dijo Smith. «¿Cómo aumentamos el número de compradores para tu contenido y reducimos las barreras de entrada? Creemos que eso es realmente emocionante».
La otra pieza interesante aquí es el potencial futuro de los datos que recopila Human Native AI. Smith dijo que en el futuro podrán dar a los titulares de derechos más claridad sobre cómo fijar el precio de su contenido basándose en un historial de datos de acuerdos en la plataforma.
También es un momento inteligente para el lanzamiento de Human Native AI. Smith dijo que con la evolución de la Ley de IA de la Unión Europea y la posible regulación de la IA en los EE. UU. en el futuro, las empresas de IA que obtienen sus datos de manera ética, y tener los recibos para probarlo, solo será más urgente.
«Somos optimistas sobre el futuro de la IA y lo que hará, pero tenemos que asegurarnos de que como industria seamos responsables y no destruyamos industrias que nos han llevado hasta este punto», dijo Smith. «Eso no sería bueno para la sociedad humana. Necesitamos asegurarnos de encontrar las formas correctas de permitir que las personas participen. Somos optimistas sobre la IA del lado de los humanos».