El CEO Sundar Pichai le dice a WIRED que el nuevo y más poderoso chatbot de Google, Gemini, es un experimento para ofrecer a los usuarios una forma de hacer cosas sin un motor de búsqueda. También es un disparo directo a ChatGPT.
El CEO DE GOOGLE, SUNDAR Pichai, todavía ama la web. Se despierta todas las mañanas y lee Techmeme, un agregador de noticias resplandeciente con enlaces, accesible solo a través de la web. La web es dinámica y resistente, dice, y todavía puede, con ayuda de un motor de búsqueda, proporcionar la información que una persona está buscando.
Sin embargo, la web y su capa de búsqueda crítica están cambiando. Todos podemos ver que está sucediendo: las aplicaciones de redes sociales, los videos de formato corto y la inteligencia artificial generativa están desafiando nuestros ideales obsoletos sobre lo que significa encontrar información en línea. Información de calidad en línea. Pichai también lo ve. Pero tiene más poder que la mayoría para dirigirlo.
La forma en que Pichai está lanzando Gemini, el modelo de IA más poderoso de Google hasta ahora, sugiere que, por mucho que le guste la buena y vieja web, está mucho más interesado en una versión futurista de la misma. Él tiene que estarlo: los chatbots vienen por él.
Hoy Google anunció que el chatbot que lanzó para contrarrestar al ChatGPT de OpenAI, Bard, está recibiendo un nuevo nombre: Gemini, como el modelo de IA en el que se basa que fue presentado por primera vez en diciembre. El chatbot Gemini también se está volviendo móvil y alejándose de su fase «experimental» y acercándose más a la disponibilidad general. Tendrá su propia aplicación en Android y una ubicación privilegiada en la aplicación de búsqueda de Google en iOS. Y la versión más avanzada de Gemini también se ofrecerá como parte de un paquete de suscripción de Google One de $20 al mes.
Al lanzar la versión más poderosa de Gemini con un muro de pago, Google apunta directamente al rápido ascenso de ChatGPT y al servicio de suscripción ChatGPT Plus. Pichai también está experimentando con una nueva visión de lo que ofrece Google, no reemplazando la búsqueda, aún no, sino construyendo una alternativa para ver qué funciona.
«Así es como siempre hemos abordado la búsqueda, en el sentido de que a medida que la búsqueda evolucionaba, a medida que llegaba lo móvil y cambiaban las interacciones de los usuarios, nos adaptábamos a ello», dice Pichai, hablando con WIRED antes del lanzamiento de Gemini. «En algunos casos estamos guiando a los usuarios, como lo estamos haciendo con la IA multimodal. Pero quiero ser flexible sobre el futuro, porque de lo contrario nos equivocaremos».
Sobrecarga sensorial «Multimodal» es una de las cosas favoritas de Pichai sobre el modelo de IA de Gemini, uno de los elementos que Google afirma que lo diferencia de las entrañas de los asistentes de IA ChatGPT de OpenAI y Copilot de Microsoft, que también están alimentados por tecnología de OpenAI. Significa que Gemini fue entrenado con datos en múltiples formatos, no solo texto, sino también imágenes, audio y código. Como resultado, el modal terminado también es fluido en todos esos modos, y se puede instar a responder usando texto o voz o tomando y compartiendo una foto.
«Así es como funciona la mente humana, donde constantemente estás buscando cosas y tienes un deseo real de conectarte con el mundo que ves», entusiasma Pichai, diciendo que desde hace mucho tiempo ha buscado agregar esa capacidad a la tecnología de Google. «Por eso en la Búsqueda de Google agregamos la búsqueda múltiple, por eso hicimos Google Lens [para búsqueda visual]. Entonces, con Gemini, que es nativamente multimodal, puedes poner imágenes en él y luego comenzar a hacerle preguntas. Ese vistazo al futuro es donde realmente brilla».
Google también ha estado llevando a cabo un experimento paralelo con el uso de la IA para remodelar su interfaz de búsqueda principal, lanzando una experiencia de búsqueda generativa que ofrece respuestas tipo chatbot antes de la lista familiar de anuncios y enlaces.
La compañía dijo hace unas semanas que no anticipa un «momento de interruptor de luz» en el que la experiencia de búsqueda generativa reemplace por completo la Búsqueda de Google tal como la conocemos. Pero Google planea empujar «los límites de lo posible» y pensar en «qué casos de uso son útiles» y «tienen el equilibrio adecuado entre latencia, calidad y factualidad», dijo Liz Reid, vicepresidenta y gerente general de Búsqueda, en ese momento. Al igual que Pichai, parece que ella piensa que es hora de experimentar con algunas alternativas radicales al modelo establecido de Google.
Pichai dice que Google se está enfocando en este momento en hacer bien la experiencia de IA generativa, pero que está «abierto a posibilidades en torno a ambos» experiencias de IA generativa de pago y con publicidad. Se niega a decir si la oferta paga de Gemini permanecerá totalmente libre de anuncios, pero señaló otro producto propiedad de Google donde es posible eliminar los anuncios por completo.
«YouTube ha sido un muy buen ejemplo de esto», dice Pichai, haciendo referencia al nivel pagado y sin publicidad que YouTube comenzó a experimentar hace varios años. «Los anuncios nos permiten dar productos a más personas, pero habrá casos de suscripciones que permitan a las personas obtener una experiencia diferente». Agrega: «Puedo imaginar al mismo usuario yendo y viniendo entre la búsqueda gratuita y una suscripción a Gemini». En otras palabras, la búsqueda generativa ya no sería un plato acompañante de la búsqueda, sino un plato principal, aunque más caro.
Precaución recomendada Hay otra gran razón por la que Google podría querer cobrar dinero por sus servicios de IA: ayuda a compensar los enormes costos informáticos asociados con el entrenamiento y la ejecución de un gran modelo de lenguaje.
«Podemos proyectar hacia adelante durante nuestros 25 años, si algo en el día cero cuesta tanto, entonces ¿cuánto costará realizar la misma tarea dentro de un año y así sucesivamente?» Pichai dice. «Hemos tenido en cuenta las eficiencias que obtendremos en los modelos subyacentes, y luego lo fijamos de una manera que creemos que tiene sentido».
Independientemente de las motivaciones de Google para vender suscripciones a un chatbot, la tecnología que ofrece tiene que funcionar de manera confiable. Pichai reconoce que Google Gemini, incluso la versión avanzada, todavía corre el riesgo de alucinar de la misma manera que lo hizo Bard o como lo han hecho otras aplicaciones de IA generativa. «Queremos que la gente sea consciente de eso», dice Pichai. «Creo que la tecnología es útil para muchas personas. Pero tiene que usarse de la manera correcta y todavía tengo preocupaciones sobre las personas que dependen de ella».
Pichai dice, por supuesto, que Google está tratando de reducir el fenómeno de los modelos descontrolados. Pero también advierte que la palabra «alucinar» debe usarse con cuidado, y sugiere que alucinar era tanto una característica como un error, lo que es un rediseño fascinante de la desinformación. Él cree que la tecnología debería estar fundamentada en la factualidad, pero si la reduces demasiado, tu chatbot se vuelve realmente aburrido realmente rápido.
Una experiencia de IA generativa debería ser «imaginativa», dice Pichai. «Como un niño que no sabe cuáles son las limitaciones cuando está imaginando algo». Un poco como los primeros días de la web.