El cofundador y CEO de Rabbit, Jesse Lyu, no teme a la muerte … la muerte de la empresa, al menos. Él le dijo a TechCrunch que la empresa es una startup cuyo destino puede ser influenciado por los caprichos de rivales multimillonarios, pero eso no es motivo para rendirse y volver a casa.
Apareciendo en el escenario en StrictlyVC LA, Lyu explicó su enfoque bastante filosófico ante la amenaza de que Google, Microsoft o Apple vengan a aplastarlos. (Las citas han sido ligeramente editadas para mayor claridad).
Rabbit’s r1, el asistente de inteligencia artificial de bolsillo que atrajo considerable hype después de su debut en el CES, es sin duda una propuesta original. La mitad del tamaño de un teléfono, el dispositivo actúa estrictamente como un asistente impulsado por voz pero es capaz de operar de forma remota tus aplicaciones y realizar acciones complejas, además de responder preguntas y mantener una conversación como ChatGPT. Describió las dos partes como «intención» y «acción».
«Tuve esta visión hace muchos años, de hecho hace 10 años, pero la tecnología no estaba lista. Esta es la primera vez en la historia que un dispositivo como este es realmente posible», dijo Lyu.
Explicó que había estado intrigado por las capacidades de LLM para entender el lenguaje e intención y que con la aparente versatilidad de los sistemas basados en transformers, era natural intentar hacer que realicen acciones también.
«Nuevamente intentamos usar super-prompts para que este modelo de lenguaje hiciera cosas, y el resultado fue muy miserable», recordó. «Hay una demostración de otra empresa que utiliza un LLM para ir al último video de YouTube de MrBeast y dejar un comentario. Sí, en teoría, los modelos de lenguaje pueden hacer eso. Pero te obligaría a literalmente ver tu pantalla haciendo ese paso a paso. Y toma aproximadamente entre dos y tres minutos para completar una tarea así. Simplemente no creemos que pueda convertirse en una buena experiencia para el usuario final.»
Su solución es el «modelo de acción grande», que está entrenado en horas y horas de usuarios reales interactuando con aplicaciones populares: «Spotify, Uber, Expedia, DoorDash, lo que sea. Tenemos las 800 aplicaciones de mayor frecuencia. Luego configuramos esta red simbólica neuronal y pedimos a este AI, que ahora llamamos modelo de acción grande, que revise esos clips, pero frame por frame. La idea es que, simbólicamente, el AI eventualmente será lo suficientemente inteligente como para extraer todos los botones, todos los elementos, y luego podemos básicamente construir una lógica para automatizar.»
La parte del lenguaje todavía se ejecuta en servicios de LLM de terceros como Perplexity, que parece estar tratando de capitalizar el éxito de Rabbit, ofreciendo un año de servicio gratuito además de lo que proporciona el r1. Sugerí que los costos de la API y otras consideraciones podrían representar un peligro para la solvencia de la startup.
«En primer lugar, no estamos perdiendo dinero vendiendo el r1, lo cual es un logro muy, muy, muy significativo, especialmente para una nueva startup en la primera generación. No vamos a quebrar vendiendo más unidades. Agradezco a mi equipo de hardware de chicos increíbles por poder negociar a la baja los componentes y los costos de BOM», dijo. «Estamos muy cerca de 100,000 pedidos. Dos días antes de la presentación clave, le dije a mi equipo que sería realmente bueno si pudiéramos vender 500 unidades en el primer día. Pero vendimos 18,000.»
Respecto a una suscripción, Lyu simplemente no lo ve funcionando, especialmente cuando la tesis del dispositivo es ser barato y simple. Aunque mencionó que los usuarios podrán entrenar y vender sus propios modelos específicos de aplicaciones más adelante, y Rabbit se llevaría una parte de eso, pero advirtió que esto es un plan a largo plazo sin especificaciones aún.
Por último, cuando se enfrentó al hecho de que las mayores y más ricas compañías del mundo están gastando miles de millones para avanzar en la inteligencia artificial, Lyu ofreció una perspectiva casi zen sobre la perspectiva de ser aplastado bajo el talón de Google, Microsoft o Apple (cuyo CEO Tim Cook acaba de decir que «romperá nuevas barreras» en IA este año).
«No soy delirante, pensando que no somos una startup. Somos una startup», dijo. «Quiero decir, la primera lección que aprendí de Y Combinator hace dos años es que el 99% de las startups morirán. Si tu mentalidad como emprendedor es, ‘Oh, tengo una idea genial, y puedo garantizar que funcionará, sin importar lo que todas estas grandes compañías de tecnología intenten …’ Quiero decir, estás delirando. No hay algo así. La realidad es que una startup es un juego de supervivencia, y es mejor que pases tu tiempo concentrándote en tus propias cosas.»
«Ellos van a hacer lo que van a hacer, y yo voy a hacer lo que voy a hacer, ¿verdad? Tiene que haber algunos fundadores, cuando escucharon que Apple está haciendo Apple Cars, se detuvieron, ¿verdad? Simplemente cancelaron. Ahora ¿qué? Creo que es bueno tener este nivel de competencia que solo va a ayudarnos a crecer más rápido, o a morir más rápido, que es la naturaleza de las startups. Es una cosa u otra, no lo sé todavía. Pero estoy haciendo mi mejor esfuerzo – como dije, es un juego de supervivencia.»
Puedes ver el panel completo más abajo.