Cómo medir el ROI real de un agente de IA en WhatsApp (con la planilla que uso con mis clientes)

El mes que un cliente reporta a su CFO "el chatbot va bien" sin tener números, sé que tarde o temprano me van a llamar a explicar por qué deberían seguir pagando la suscripción. Esta planilla y este marco son lo que armé después de varias de esas conversaciones — sirve tanto para defender la inversión como para detectar a tiempo si la implementación no está rindiendo.

El error que invalida todo lo demás: no tener línea base

Si no documentaste cómo operaba el equipo antes de prender el bot, cualquier número posterior es indefendible. "Bajamos de 14 minutos a 4 segundos en primera respuesta" suena bien — hasta que alguien pregunta "¿de dónde sale el 14 minutos?". Si no tienes screenshots de tu panel de WhatsApp del trimestre anterior, no tienes evidencia.

Las cinco cosas que mido durante 4 semanas antes de prender un bot:

Volumen entrante diario, separado entre horario hábil y fuera de horario.
Tiempo medio y mediano de primera respuesta (la mediana es más honesta).
Tasa de conversión actual (mensaje a venta, mensaje a cita, lo que aplique).
Costo total mensual del equipo que hoy atiende WhatsApp (sueldos brutos + prestaciones + costo de oportunidad si están multitasking).
Mensajes "perdidos" — los que ya pasaron 4 horas sin respuesta o se leyeron y nunca se contestaron.

Métrica 1 — Costo total por conversación atendida

Fórmula: (Costo del SaaS + Costo del modelo de IA + Costo de personas que aún atienden) / Total de conversaciones del mes

En Florería Suspiros, antes del bot, atender una conversación costaba ~$11.30 MXN (sumando sueldo prorrateado y tiempo de respuesta). Hoy cuesta $1.85 MXN. La regla práctica: si tu costo no baja al menos 50% en los primeros 60 días, algo está mal en la configuración. Si bajó pero menos del 50%, probablemente el flujo elegido no era el más repetitivo y deberías reasignar el alcance del bot.

Métrica 2 — Tasa de resolución autónoma auditada

Énfasis en auditada. Cualquier plataforma te dirá "el bot resolvió el 87%". Eso lo cuentan como "el cliente dejó de escribir y no escaló a humano" — pero el cliente puede haber dejado de escribir por frustración, no por satisfacción.

Una vez al mes, tomo 50 conversaciones al azar del mes anterior y las clasifico a mano en cuatro categorías:

Resuelta: el cliente compró, agendó, o explícitamente confirmó que la respuesta resolvió.
Escalada: pasó a humano con éxito.
Abandonada por frustración: el cliente respondió molesto y no volvió.
Inconclusa: ni resolvió ni escaló, simplemente se perdió.

La resolución real es el porcentaje de la categoría 1. Suele ser entre 8 y 15 puntos porcentuales menor que el número que reporta la plataforma. Benchmarks reales que veo:

E-commerce con catálogo estable: 70-85% (vs 80-92% que reportan plataformas).
Servicios profesionales (clínicas, consultorías): 50-65% (vs 65-78%).
Inmobiliarias: 35-50% (vs 50-65%). El proceso comercial requiere humano para cerrar.
Soporte técnico complejo: 25-40% (vs 40-55%).

Métrica 3 — Tiempo de primera respuesta (la métrica de "fricción cero")

Hay un estudio clásico de InsideSales (replicado por Drift en 2024) que muestra que la tasa de cierre cae exponencialmente con el tiempo de respuesta: responder en menos de 5 minutos da 5-10x más probabilidad de cierre que responder a la hora. Después de las 4 horas, la mitad de los leads ya compraron en otro lado.

Un bot baja esta métrica de minutos/horas a segundos. Es el cambio más subestimado de toda la operación. En Florería Suspiros, esto solo (sin contar nada más) atribuye aproximadamente 30% del incremento de revenue.

Métrica 4 — Conversión por flujo (no global)

"Tasa de conversión global" es ruido. Lo útil es separar por flujo:

Flujo de catálogo (cliente entra preguntando por producto): conversión a venta.
Flujo de cita (cliente entra preguntando disponibilidad): conversión a cita confirmada.
Flujo de cotización (cliente pide precio personalizado): conversión a propuesta enviada.
Flujo de soporte (cliente reporta problema): conversión a "resuelto sin queja".

Cada uno se compara contra su propia línea base. Mezclarlos esconde dónde brilla y dónde cojea el bot.

Métrica 5 — Revenue recuperado de mensajes que antes morían

Esta es la métrica que más impacta al CFO porque no requiere descontar costos — es revenue puro que antes no existía.

Fórmula: (Mensajes fuera de horario que el bot ahora contesta × tasa de conversión histórica × ticket promedio)

Ejemplo concreto: una clínica dental recibe ~80 mensajes por semana fuera de horario hábil. Antes del bot, el 35% de esos pacientes ya estaba agendado con otra clínica el lunes en la mañana. Hoy el bot agenda directo a Calendly fuera de horario. Tasa de conversión a cita confirmada de esos 80: 22%. Ticket promedio (consulta + tratamiento típico): $2,400 MXN. Revenue mensual recuperado: ~$15,000 MXN.

Métrica 6 — Tiempo del equipo redireccionado

El bot no debería despedir gente — debería liberarla. Mide explícitamente:

Horas semanales que el equipo dedicaba a responder dudas repetitivas.
Horas semanales que ahora dedican a tareas de mayor valor (cierre, cobranza activa, upsell, soporte personalizado).

Si tu equipo no se reasignó a algo más rentable, no estás capturando todo el ROI — estás dejando dinero en la mesa. He visto cuentas donde el bot funciona y el equipo simplemente trabaja "menos horas" en lugar de mover su tiempo a actividades de mayor margen. Eso es desperdiciar el activo.

Cálculo final del ROI mensual

Fórmula simplificada: ((Revenue recuperado + Ahorro de costos) − Costo total del bot) / Costo total del bot × 100

Donde:

Revenue recuperado = mensajes ahora contestados × tasa de conversión × ticket promedio.
Ahorro de costos = horas liberadas × costo por hora del equipo.
Costo total del bot = suscripción del SaaS + costos del modelo de IA + costo de Meta API si aplica + costo de implementación amortizado.

Para una pyme mexicana promedio (1,500 conv/mes, ticket $400 MXN, 2 personas atendiendo), el ROI mensual típico que veo está entre 600% y 1,800%. Es decir: por cada $1 invertido en el bot, regresan entre $6 y $18. No es "10x universal" — depende del verticales y del cuidado de la implementación.

Cuándo el ROI no se materializa

Tres situaciones donde el ROI cae por debajo del 200% (y vale la pena saberlo a tiempo):

Negocios con menos de 200 conv/mes. La complejidad operativa del bot pesa más que el ahorro.
Negocios donde el catálogo o las políticas cambian semanal y nadie actualiza la base. El bot se desactualiza y daña la marca.
Implementaciones sin handoff calibrado. Los clientes molestos quedan atrapados en el bot y abandonan a la competencia.

Reporte mensual al equipo o al consejo

Un buen reporte mensual cabe en una sola página y tiene esto:

Las 6 métricas anteriores, con comparación vs línea base.
Tres ejemplos concretos de conversaciones exitosas (capturas).
Tres ejemplos de conversaciones que fallaron y qué se ajustó.
El número de ROI mensual con desglose.
Plan de iteración para el mes siguiente (qué se va a ajustar y por qué).

Si quieres la plantilla en Notion que uso con clientes (ya con las fórmulas calculadas y formato listo para presentar), escríbeme a [email protected] con "planilla ROI" en el asunto y te la mando. Es gratis aunque no seas cliente — me importa más que esta categoría madure que vender un mes extra de suscripción.

Si lo que necesitas es montar las métricas desde el día uno en tu propia operación, el panel de Yolani ya las trae integradas. Solo conectas tu WhatsApp, el sistema mide la línea base las primeras 4 semanas y después de prender el bot, ves la comparación automática.