Retell AI permite a empresas crear ‘agentes de voz’ para responder llamadas telefónicas

Retell AI permite a empresas crear ‘agentes de voz’ para responder llamadas telefónicas

Los centros de llamadas están abrazando la automatización. Hay debate sobre si eso es algo bueno, pero está sucediendo, y posiblemente se está acelerando.

Según la firma de investigación TechSci Research, el mercado global de IA para centros de contacto podría crecer a casi $3 mil millones en 2028, desde $2.4 mil millones en 2022. Mientras tanto, una encuesta reciente encontró que alrededor de la mitad de los centros de llamadas planean adoptar alguna forma de IA en el próximo año.

La motivación es bastante obvia: los centros de llamadas buscan reducir costos mientras escalan sus operaciones.

«Las empresas con operaciones pesadas en centros de llamadas, que buscan escalar rápidamente sin las limitaciones de agentes humanos en el centro de contacto, son altamente receptivas a adoptar soluciones efectivas de agentes de voz de IA», dijo la empresaria Evie Wang a TechCrunch. «Este enfoque no solo reduce sus costos totales, sino que también disminuye los tiempos de espera.»

Wang es una de las cofundadoras de Retell AI, que proporciona una plataforma que las empresas pueden utilizar para crear «agentes de voz» impulsados por IA que responden a las llamadas telefónicas de los clientes y realizan tareas básicas como programar citas. Los agentes de Retell están impulsados por una combinación de grandes modelos de lenguaje (LLMs) afinados para casos de uso de servicio al cliente y un modelo de voz que da voz al texto generado por los LLMs.

Los clientes de Retell incluyen algunos operadores de centros de contacto, pero también pequeñas y medianas empresas que lidian regularmente con volúmenes altos de llamadas, como la empresa de telemedicina Ro. Pueden construir agentes de voz utilizando las herramientas de código bajo de la plataforma, o pueden cargar un LLM personalizado (por ejemplo, un modelo abierto como Llama 3 de Meta) para adaptar aún más la experiencia.

«Invertimos mucho en la experiencia de conversación por voz, ya que vemos que como el aspecto más crítico de la experiencia de los agentes de voz de IA», dijo Wang. «No vemos a los agentes de voz de IA como meros juguetes que se pueden crear con unas pocas líneas de comandos, sino más bien como herramientas que pueden ofrecer un valor sustancial a las empresas y reemplazar flujos de trabajo complejos.»

Retell funcionó lo suficientemente bien en mis breves pruebas, al menos en el lado de la llamada.

Programé una llamada con un bot de Retell utilizando el formulario demo en el sitio web de Retell. El bot me guió a través del proceso de programar una cita dental hipotética, haciendo preguntas como mi fecha y hora preferidas, número de teléfono, entre otras.

No puedo decir que la voz sintética del bot fue la mejor que he escuchado en términos de realismo, ciertamente no al nivel de Eleven Labs o la API de texto a voz de OpenAI. Wang, en defensa de Retell, dijo que el equipo se ha centrado principalmente en reducir la latencia y manejar casos particulares, como las interrupciones que puedan ocurrir en una conversación.

La latencia es baja: en mi prueba, el bot respondió prácticamente sin dudar a mis respuestas y preguntas de seguimiento. Y se mantuvo en su guion. Por más que lo intenté, no pude confundirlo o hacer que se comportara de manera incorrecta. (Cuando le pregunté al bot sobre mis registros dentales, insistió en que hablara con la gerente de la oficina.)

Entonces, ¿son plataformas como Retell el futuro de los centros de llamadas?

Quizás. Para tareas básicas como la programación de citas, la automatización tiene mucho sentido, lo que probablemente explica por qué tanto las startups como las grandes empresas de tecnología ofrecen soluciones que compiten directamente con Retell. Es una fruta al alcance de la mano, y aparentemente generadora de ingresos. Retell afirma tener cientos de clientes, todos los cuales pagan por minuto de conversación de agente de voz. Retell ha recaudado un total de $4.53 millones en capital hasta la fecha, gracias a respaldos que incluyen a Y Combinator (donde la empresa fue incubada).

Pero el veredicto está pendiente en consultas más complicadas, particularmente dada la tendencia de los LLMs a inventar datos e irse por las ramas, incluso con salvaguardias en su lugar.

A medida que las ambiciones de Retell crecen, me intriga ver cómo la empresa navega por los muchos desafíos técnicos bien establecidos en el espacio. Al menos, Wang parece confiada en el enfoque de Retell.

«Con la llegada de los LLMs y los avances recientes en la síntesis de voz, la IA conversacional está siendo lo suficientemente buena como para crear casos de uso realmente emocionantes,» dijo Wang. «Por ejemplo, con una latencia inferior a un segundo y la capacidad de interrumpir a la IA, hemos observado que los usuarios hablan en oraciones más completas y conversan como lo harían con otra persona. Estamos tratando de hacer que sea fácil para los desarrolladores construir, probar, implementar y monitorear agentes de voz de IA, en última instancia, para ayudarles a lograr una preparación para la producción.»