Saltar al contenido
Industry

Por qué el CSAT falla al evaluar el rendimiento del soporte al cliente con IA

El CSAT puede ser engañoso para evaluar la IA en soporte porque deja a los agentes humanos los casos más difíciles y sesga las puntuaciones. Un sistema pensado para IA puede medir mejor la contribución de la IA y de los humanos.

Guillaume LuccisanoMay 23, 20255 min de lectura
Por qué el CSAT falla al evaluar el rendimiento del soporte al cliente con IA

Sí, el CSAT no sirve para evaluar bien el rendimiento de tu IA. Quizá era aceptable antes de introducir IA, pero con IA en la ecuación se ha quedado anticuado. Te explico por qué.

Primero, algo de contexto sobre el CSAT

A pesar de sus límites, el CSAT se usa mucho en atención al cliente como métrica clave para medir la calidad del departamento de soporte. Su sencillez y adopción generalizada lo han convertido en un estándar reconocible.

El CSAT es una puntuación que da el cliente para valorar la calidad del soporte recibido, normalmente en una escala de 1 a 5 en ecommerce.

Pero el CSAT tiene sesgos conocidos, principalmente el sesgo de respuesta y el sesgo temporal. A menudo, solo los clientes insatisfechos se toman el tiempo de puntuar el servicio. Además, la puntuación suele recogerse justo después de una interacción y puede no reflejar todo el recorrido del cliente. A esto se suma que el CSAT depende mucho del modelo de negocio y de los productos vendidos. Puede variar mucho entre merchants, y no siempre por la calidad de su equipo de soporte.

Con todo esto en mente, y pese a esos defectos, el CSAT todavía puede considerarse un buen indicador general para vigilar la salud de tu organización de soporte.

La IA al rescate

La introducción de la IA supone un cambio importante y aporta muchas ventajas a tus clientes.

Por decir lo obvio, la IA garantiza soporte 24/7, tiempos de respuesta más rápidos, mayor calidad media de los tickets gracias a una base de conocimientos compartida y procedimientos centralizados más eficientes. Si quieres una visión completa de cómo llevarlo a la práctica, merece la pena leer el playbook completo de CX ecommerce con IA generativa antes de apostar por una herramienta nueva.

Aunque la IA impulsa mucho tu operación de soporte, es clave no basarse solo en el CSAT para medir su eficiencia. Aunque algunas herramientas presuman de su CSAT de IA, estas son las razones por las que no deberías tomar esas puntuaciones al pie de la letra.

IA frente a humanos

Por defecto, tu IA empezará gestionando los casos más sencillos y respondiéndolos rápido, lo que a menudo genera puntuaciones CSAT más altas. Esto ocurre porque para una buena IA es relativamente fácil lograr buen CSAT, sobre todo cuando gestiona casos alineados con lo que el cliente espera, como evitar denegar reembolsos. Que tu IA tenga buen CSAT es básicamente un requisito, y es fácil de conseguir. Para más contexto sobre por qué esto cambia tanto respecto a modelos anteriores, consulta por qué la IA generativa supera a la CX tradicional.

Pero ¿qué pasa después? Tu equipo humano se queda con los casos más complejos, tickets que quizá van contra los deseos del cliente o problemas reales, como un paquete perdido, que tienen más probabilidades de acabar con puntuaciones CSAT bajas.

Por tanto, cuando separas el CSAT entre humanos e IA, estás comparando dos conjuntos de datos muy distintos. La comparación queda completamente sesgada. Además, a medida que la IA escala, su CSAT se mantiene alto y estable, mientras que el CSAT humano puede seguir bajando porque los agentes se quedan con los casos más difíciles.

Esto es injusto para tu equipo humano y puede darte una impresión demasiado positiva de tu IA. La IA simplemente está gestionando las tareas fáciles y quizá no está haciendo el trabajo más duro.

Si aun así quieres usar CSAT, al menos intenta comparar tickets con intents similares. Eso te dará una imagen más precisa de cómo rinde realmente tu IA (por ejemplo, filtrando por etiqueta o campos de ticket). Y sobra decirlo: elige una herramienta de IA que pueda automatizar soporte ecommerce de verdad. Necesitas agentes de IA autónomos capaces de extraer información de servicios externos y ejecutar acciones en ellos, es decir, automatizar de verdad, no solo responder preguntas sencillas sobre tu negocio. Eso significa gestionar tickets L2 y L3, no solo L1.

¿Un nuevo sistema de puntuación para la era de la IA?

Está claro que, a medida que cada merchant adopta IA para mejorar la calidad y eficiencia del soporte, tenemos que repensar cómo medimos la calidad de cada interacción. Probablemente eso implique crear una nueva puntuación preparada para la era de la IA, sin sesgos por aplicación de políticas, velocidad o errores fuera del control de los agentes de soporte. Para una visión más amplia de hacia dónde va todo esto, consulta nuestras 7 predicciones audaces sobre la IA en 2035.

En Yuma estamos desarrollando un sistema de puntuación alternativo que planeamos lanzar este próximo junio. Nuestro objetivo es crear un sistema justo para los humanos y capaz de evaluar tanto la calidad global de las interacciones como el cumplimiento de las políticas. Si tienes ideas sobre qué deberíamos incluir en este nuevo sistema, compártelas. ¿Cuál sería el mecanismo de puntuación perfecto para ti? ¿Puede existir una puntuación única realmente perfecta?

En conclusión, aunque el CSAT sigue siendo un proxy general razonablemente útil, evita usarlo para distinguir entre humanos e IA. Y si aun así lo haces, hazlo siendo plenamente consciente de todos los sesgos de esa separación :) Más allá de las métricas, las defensas arquitectónicas también importan: mira cómo la arquitectura de control de calidad evita alucinaciones de IA. Si estás listo para ir más allá del CSAT y evaluar un enfoque más inteligente, explora las opciones de precios de la plataforma de soporte con IA de Yuma.

Mantente al día

Recibe lo último sobre atención al cliente con IA directamente en tu bandeja de entrada.