Hace un par de años, Alex Yu y Amit Jain se unieron para fundar una empresa que permitiría a las personas capturar objetos en 3D utilizando sus teléfonos inteligentes, sin necesidad de equipo adicional. En ese momento, Yu era un investigador de inteligencia artificial en la Universidad de California en Berkeley, mientras que Jain era un empleado de Apple que desarrollaba las experiencias multimedia de Vision Pro.
Su empresa, Luma, lanzó una aplicación para teléfonos inteligentes en 2021, que rápidamente ganó popularidad, atrayendo a millones de usuarios (apenas más de dos millones en el momento de la publicación). Pero ahora, a medida que la tecnología de inteligencia artificial generativa inunda los canales, Yu y Jain esperan evolucionar Luma en algo más grande, y con suerte, mejor de lo que originalmente habían imaginado.
Luma anunció hoy que comenzará a utilizar un clúster de cálculo de ~3,000 GPU Nvidia A100 para entrenar nuevos modelos de inteligencia artificial que, en palabras de Yu, «pueden ver y comprender, mostrar y explicar, y eventualmente interactuar con el mundo».
La primera fase de este plan implica la creación de modelos capaces de generar objetos 3D a partir de descripciones de texto; Luma lanzó un modelo de este tipo en su servidor de Discord a principios de este año, llamado Genie. El siguiente paso será desarrollar modelos de inteligencia artificial generativa «de próxima generación» que aborden lo que Yu caracteriza como el problema del «valle inquietante» en la generación actual de GenAI.
«Creemos que la multimodalidad es fundamental para la inteligencia. Para ir más allá de los modelos de lenguaje, el próximo avance vendrá de la visión», dijo Yu a TechCrunch en una entrevista por correo electrónico. «Sin embargo, la inteligencia artificial necesita ser mucho más inteligente para alcanzar el potencial que el mundo ve en ella».
Para hacer realidad esta visión (perdón por el juego de palabras), Luma ha recaudado $43 millones en una ronda de financiación de la Serie B con la participación de Andreessen Horowitz, entre otros inversores antiguos y nuevos. Según una fuente familiarizada con el asunto, la ronda valora a Luma entre $200 y $300 millones; el fondo de guerra de Luma ahora supera los $70 millones.
El enfoque actual de Luma, lanzando modelos de inteligencia artificial que crean modelos 3D, es un espacio cada vez más competitivo. Existen plataformas de creación de objetos como 3DFY y Scenario, así como startups como Hypothetic, Kaedim, Auctoria y Mirage. Stability AI recientemente lanzó una herramienta independiente de generación de modelos 3D, al igual que la nueva empresa Atlas. Incluso empresas establecidas como Autodesk y Nvidia están comenzando a incursionar en el sector con aplicaciones como Get3D, que convierte imágenes en modelos 3D, y ClipForge, que genera modelos a partir de descripciones de texto.
Entonces, ¿cómo se destacarán las herramientas de Luma? Principalmente en cuanto a fidelidad, según Yu.
«Los modelos actuales se están entrenando en imágenes bidimensionales y, cuando se les pide que generen escenas, deforman los espacios, los cuerpos y los movimientos», dijo. «Es muy difícil generar algo coherente y utilizable en los primeros intentos, limitando dónde se pueden utilizar las salidas… [Estamos introduciendo] las tecnologías generativas fotorrealistas más avanzadas en una aplicación intuitiva».
Eso promete mucho considerando que es el principio de la ambiciosa nueva hoja de ruta de Luma. Una versión mejorada de Genie se lanza hoy, pero los futuros modelos de inteligencia artificial generativa más capaces aún están por venir.
Sin embargo, Luma no pierde el tiempo, planeando duplicar su fuerza laboral de 24 personas para finales del próximo año, al mismo tiempo que ensambla un clúster de servidores para ejecutar modelos con «miles» de GPUs. Quizás logren avanzar; el tiempo lo dirá.
«Hemos estado creciendo el equipo en investigación de inteligencia artificial generativa, ingeniería, diseño y productos para dar vida a nuestra visión, y planeamos acelerar significativamente el ritmo aquí después de esta ronda», dijo Yu. «Con Genie, por primera vez, se ha vuelto posible crear cosas en 3D a escala con Inteligencia Artificial, y eso ha crecido a 100,000 usuarios en solo cuatro semanas… [Pero queremos] construir modelos visuales mucho más capaces, inteligentes y útiles para nuestros usuarios».