La inteligencia artificial está en auge, especialmente la inteligencia artificial generadora de texto, también conocida como grandes modelos de lenguaje (piensa en modelos como ChatGPT). En una reciente encuesta de aproximadamente 1,000 organizaciones empresariales, el 67.2% dice que adoptar grandes modelos de lenguaje (LLMs) es una prioridad principal para principios de 2024.
Sin embargo, hay barreras en el camino. Según la misma encuesta, la falta de personalización y flexibilidad, junto con la incapacidad para preservar el conocimiento y la propiedad intelectual de la empresa, han estado impidiendo que muchas empresas implementen LLMs en producción.
Esto llevó a Varun Vummadi y Esha Manideep Dinne a pensar: ¿cómo podría ser una solución al desafío de adopción empresarial de LLMs? En busca de una solución, fundaron Giga ML, una startup que está construyendo una plataforma que permite a las empresas implementar LLMs en sus propias instalaciones, reduciendo costos y preservando la privacidad en el proceso.
«Giga ML se centra en dos de los mayores desafíos enfrentados por las empresas al adoptar LLMs para resolver problemas», dijo Vummadi a TechCrunch en una entrevista por correo electrónico. «La privacidad de los datos y la personalización de los LLMs son algunos de los mayores desafíos que enfrentan las empresas al adoptar LLMs. Giga ML aborda ambos desafíos».
Giga ML ofrece su propio conjunto de LLMs, la «serie X1», para tareas como la generación de código y la respuesta a preguntas comunes de los clientes. La startup afirma que los modelos, construidos sobre el Llama 2 de Meta, superan a los LLMs populares en ciertas pruebas y benchmarks. Pero es difícil decir cómo se compara cualitativamente el X1; este reportero intentó la demostración en línea de Giga ML pero encontró problemas técnicos. (La aplicación siempre se quedaba sin tiempo, sin importar la pregunta que escribiera).
Incluso si los modelos de Giga ML son superiores en algunos aspectos, ¿realmente pueden destacar en el océano de LLMs de código abierto, sin conexión y gratuitos?
En conversación con Vummadi, tuve la sensación de que Giga ML no está tratando tanto de crear los mejores LLMs, sino de construir herramientas que permitan a las empresas ajustar los LLMs localmente sin depender de recursos y plataformas de terceros.
«La misión de Giga ML es ayudar a las empresas a implementar de manera segura y eficiente LLMs en sus propias infraestructuras locales o en la nube privada virtual», dijo Vummadi. «Giga ML simplifica el proceso de entrenamiento, ajuste y ejecución de LLMs a través de una API fácil de usar, eliminando cualquier problema asociado».
Vummadi enfatizó las ventajas de privacidad de ejecutar modelos sin conexión, ventajas que probablemente sean persuasivas para algunas empresas.
Predibase, la plataforma de desarrollo de inteligencia artificial de bajo código, encontró que menos de una cuarta parte de las empresas se sienten cómodas utilizando LLMs comerciales debido a preocupaciones sobre compartir datos sensibles o propietarios con proveedores. Casi el 77% de los encuestados dijo que no usan o no planean usar LLMs comerciales más allá de los prototipos en producción, citando problemas relacionados con la privacidad, el costo y la falta de personalización.
«Los gerentes de TI de nivel C encuentran valiosas las ofertas de Giga ML debido a la implementación segura en las instalaciones de LLMs, modelos personalizables adaptados a su caso de uso específico», Vummadi dijo.
Hasta la fecha, Giga ML ha recaudado aproximadamente $3.74 millones en financiamiento de capital de riesgo de Nexus Venture Partners, Y Combinator, Liquid 2 Ventures, 8vdx y otros. La startup planea, en el corto plazo, expandir su equipo y aumentar la investigación y desarrollo de productos. Parte del capital también se destinará a apoyar la base de clientes de Giga ML, que incluye empresas «empresariales» en los sectores financiero y de la salud.