Saltar al contenido

Analítica Avanzada para reducir la fuga de clientes: diseño de algoritmos para la predicción de fuga

FUGA 2

En el artículo anterior, "Analítica Avanzada para reducir la fuga de clientes: definición de métricas clave y segmentación de clientes", establecimos el pilar fundamental para cualquier estrategia de retención: definir qué significa la fuga en el contexto del negocio, segmentar a los clientes de manera inteligente y validar estas métricas con los stakeholders clave. Establecimos que sin una definición clara y consensuada con el negocio, los esfuerzos predictivos carecerán de un objetivo sólido.

 

Una vez que hemos pasado de la intuición a una métrica robusta, es posible dar el siguiente paso. Este artículo se enfoca en la segunda etapa de nuestra metodología: el diseño de algoritmos para la predicción de fuga de clientes. Típicamente, en esta etapa buscamos utilizar los datos históricos y las métricas previamente definidas para crear una solución que utilice Machine Learning u otra(s) metodología(s) de analítica avanzada que sea capaz de asignar, por ejemplo, una probabilidad de fuga a cada cliente, o de determinar cuándo es más probable que un cliente se fugue, entre otros. El objetivo en esta etapa es claro: intervenir antes de que sea demasiado tarde, personalizando los esfuerzos de retención y optimizando la asignación de recursos para maximizar el impacto en el negocio.

Figuras blog rectangulares (1920 x 900 px)-1
Figura 1. Etapas típicas de la hoja de ruta en el uso de Analítica Avanzada para impactar fuga en organizaciones.

Diseño de algoritmos para la predicción de fuga de clientes

El éxito de un modelo predictivo no depende únicamente de la complejidad del algoritmo, sino también de la calidad de los cimientos construidos en la etapa anterior. Las métricas de fuga, los segmentos de cliente y el entendimiento profundo de los datos que logramos en la primera fase son los insumos directos y esenciales para esta segunda etapa.

Definición del objetivo de negocio

El primer paso cuando buscamos diseñar una solución predictiva siempre es traducir nuestro objetivo de negocio en un problema técnico bien definido. 

Dependiendo de la madurez analítica de la empresa y de la estrategia de negocio, podemos enmarcar el problema predictivo de formas distintas para extraer y aportar valor. A continuación exploramos 3 enfoques diferentes (aunque no los únicos), que podemos usar para definir la estrategia con el cliente.

venn diagram 2
Figura 2. Ejemplo de algunos tipos de enfoques predictivos para impactar la fuga

Identificación de riesgo de fuga (Clasificación binaria)

El enfoque de identificación de riesgo de fuga busca responder la siguiente pregunta de negocio: 

¿Qué clientes están en mayor riesgo de fugarse dentro de un período de tiempo futuro específico?

El enfoque técnico que buscamos en este caso, es modelar la probabilidad de que un cliente cruce el umbral de fuga dentro de una ventana de predicción fija (por ejemplo, 90 días). El resultado es una puntuación de riesgo para cada cliente. De manera general, este tipo de modelo implica una clasificación binaria.

En términos de valor para el negocio, típicamente este es el punto de partida ideal, pues es directo, interpretable y accionable, ya que permite una priorización sencilla y la implementación de campañas de retención masivas o segmentadas. Es la base sobre la cual se pueden construir  estrategias más complejas.

Algunos modelos/algoritmos que pueden utilizarse para resolver un problema de clasificación binaria que nos ayude a identificar personas en riesgo de fuga son los siguientes:

  • Árboles de Decisión y Random Forest: Un árbol de decisión crea un conjunto de reglas para segmentar a los clientes. Un Random Forest  va un paso más allá: construye cientos de árboles de decisión sobre diferentes subconjuntos de datos y características, y promedia sus predicciones. Esto lo hace mucho más robusto, preciso y menos propenso al sobreajuste que un solo árbol.
  • XGBoost (Extreme Gradient Boosting): Este tipo de modelo es conocido por su velocidad, rendimiento y por incluir regularización para evitar el sobreajuste. Estos modelos construyen árboles de forma secuencial, donde cada nuevo árbol corrige los errores del anterior, resultando en un modelo final extremadamente preciso.

La limitación estratégica de este enfoque, es que trata la fuga como un evento único y estático dentro de una ventana de tiempo. No busca predecir cuándo es más probable que el cliente se fugue dentro de esa ventana, ni cuantifica el impacto financiero de su partida. Para ello, pueden explorarse otros enfoques, como los descritos a continuación.

Análisis del horizonte de riesgo (Análisis de supervivencia)

El enfoque de análisis del horizonte de riesgo es responder una pregunta de negocio como la siguiente:

Para un cliente en riesgo, ¿cuándo es más probable que ocurra la fuga? ¿Cuál es la probabilidad de que un cliente no se fugue o permanezca activo más allá de los próximos 30, 60 o 90 o N días?

El enfoque técnico en este caso no es predecir quién se va a fugar en los próximos meses o semanas, si no, predecir una curva de riesgo en el tiempo, que nos ayude a entender cuándo un cierto cliente tiene mayor probabilidad de fuga.

Este tipo de enfoque es valioso porque permite secuenciar las acciones de retención. Por ejemplo, puede priorizarse contactar primero a clientes con un riesgo de fuga inminente (por ejemplo en los próximos 15-30 días) y programar acciones menos urgentes para aquellos cuyo riesgo aumenta a más largo plazo.

Adicionalmente, esto nos permite un mejor entendimiento del ciclo de vida del cliente, y puede ayudar a identificar posibles puntos críticos de inflexión en la relación. Por ejemplo, tal vez detectar si el riesgo de fuga se dispara después de cierto tiempo, o si hay estacionalidades detectables que nos den luz sobre fenómenos subyacentes que puedan afectar la retención.

Este enfoque, más avanzado que la clasificación binaria, es ideal por ejemplo para negocios de suscripción (SaaS, telecomunicaciones, streaming) donde la duración de la relación con el cliente es una métrica fundamental.

Los modelos que pueden utilizarse en este enfoque están diseñados específicamente para predecir el tiempo hasta un evento, es decir que no predicen una simple probabilidad, sino más bien una curva de riesgo a lo largo del tiempo. Algunos son:

  • Estimador de Kaplan-Meier: No es un modelo predictivo por sí mismo, sino una técnica no paramétrica para visualizar la probabilidad de supervivencia a lo largo del tiempo para diferentes cohortes de clientes (ej: clientes del plan A vs. clientes del plan B). Es una herramienta de análisis exploratorio fundamental en este enfoque.
  • Modelo de Riesgos Proporcionales de Cox (CoxPH): Es el modelo semi-paramétrico más conocido y utilizado en el análisis de supervivencia. Este nos permite incluir múltiples variables (características del cliente) para modelar cómo afectan la tasa de riesgo de fuga en un momento dado. Es el equivalente de la Regresión Logística, pero para predecir el riesgo en el tiempo.
  • Random Survival Forests (RSF):  Es la adaptación del algoritmo Random Forest al dominio del análisis de supervivencia. Combina el poder predictivo de los modelos de ensamble con la capacidad de manejar datos censurados y predecir una función de riesgo individual para cada cliente. Es ideal cuando se sospecha que las relaciones son no lineales y complejas.

Priorización por impacto financiero (Enfoque híbrido) 

Los enfoques híbridos buscan responder preguntas más complejas, o que necesitan posiblemente varios modelos para ser respondidas. Una muy común y que puede aportar un inmenso valor al negocio tiene que ver con el valor monetario de los clientes con probabilidad de fuga, y su priorización de acuerdo al impacto financiero.

Este enfoque nos podría permitir responder preguntas como esta:

De los clientes que probablemente se fugarán, ¿cuáles representan la mayor pérdida de valor para la compañía?

Responder una pregunta como esta, implicaría potencialmente construir dos modelos:

  1. Un modelo de clasificación que predice la probabilidad de fuga, digamos P(fuga)
  2. Un modelo de regresión que predice el Valor de Vida del Cliente (LTV) o el gasto esperado en un período futuro definido, por ejemplo, N meses (Ingreso_esperado_N_meses). 

El resultado final en este caso, podría ser un score de "Valor en Riesgo" para cada cliente, calculado como:

Valor en Riesgo=P(fuga) × Ingreso_esperado_N_meses

El valor para el negocio de una estrategia híbrida como esta, es que permite transformar la estrategia  de retención priorizando el valor económico aportado por el cliente. Por ejemplo, un cliente con un 95% de probabilidad de fuga que gastará $100 en los próximos 6 meses sería menos prioritario que un cliente con un 60% de probabilidad de fuga pero que gasta $1000 dólares al mes.

Esto permite justificar la inversión en acciones de retención costosas (como una llamada personal de un ejecutivo de cuenta) para los clientes cuyo valor perdido justifica el esfuerzo, y así priorizar la estrategia para clientes de distintos tipos. Esta estrategia es de alto valor por ejemplo en retail, e-commerce, banca y cualquier negocio donde el valor de los clientes sea muy heterogéneo.

Ingeniería de Características

La ingeniería de características (en: feature engineering) es el proceso de crear las variables (o features) que el modelo utilizará para aprender. Aquí es donde transformamos datos brutos en señales predictivas. Típicamente un modelo es tan bueno como las características que se le proporcionan. Basándonos en las fuentes de datos identificadas en la etapa 1, podemos construir un conjunto robusto de características, por ejemplo:

  • Características Demográficas y Estáticas: Atributos que no cambian o cambian poco con el tiempo.
    • Ejemplos: Antigüedad del cliente, ubicación geográfica, plan o servicio contratado, segmento de cliente definido en la etapa 1.
  • Características Transaccionales (RFM Dinámico): Evolución de la Recencia, Frecuencia y Valor Monetario.
    • Ejemplos: Días desde la última compra, número de transacciones en los últimos 30/90/180 días, cambio porcentual en el gasto del último trimestre vs. el anterior, valor monetario promedio por transacción.
  • Características de Comportamiento de Uso (Para Servicios/Plataformas):
    • Ejemplos: Frecuencia de inicio de sesión, cantidad de funciones clave utilizadas, tiempo promedio por sesión, adopción de nuevos productos/servicios.
  • Características de Interacción y Soporte:
    • Ejemplos: Número de tickets de soporte creados, tiempo promedio de resolución, cantidad de interacciones con el centro de ayuda, encuestas de satisfacción post-servicio.
  • Características de Tendencia: Estas son especialmente poderosas, ya que capturan cambios en el comportamiento.
    • Ejemplos: ¿La frecuencia de compra está disminuyendo?, ¿el valor del ticket promedio está bajando?, ¿el uso de la plataforma ha caído en el último mes?

Es fundamental en este paso evitar la fuga de datos, que ocurre cuando se utiliza información del futuro para predecir el pasado. Por ejemplo, al crear características para predecir la fuga en digamos marzo, solo deberíamos usar datos disponibles hasta finales de febrero.

Evaluación del modelo

Una vez entrenado un modelo predictivo, un paso fundamental es su evaluación. En el contexto de la clasificación binaria, la métrica de exactitud (accuracy), aunque comúnmente utilizada, puede ser insuficiente y potencialmente engañosa, especialmente en problemas de fuga de clientes donde típicamente existe un desbalance de clases (la gran mayoría de clientes no se fuga).

Para ilustrar esto, podemos pensar en un escenario donde la tasa de fuga mensual es del 3%. Un modelo que clasifique sistemáticamente a todos los clientes como "no fugados" alcanzaría una exactitud del 97%, pero carecería de toda utilidad práctica para el negocio, pues su capacidad para identificar clientes en riesgo sería nula. Por tanto, una evaluación rigurosa debe centrarse en los tipos de error del modelo y en el costo asociado a cada uno.

Para modelos de clasificación, la matriz de confusión es una herramienta para analizar el rendimiento del modelo de forma granular. 

Esta herramienta clasifica las predicciones en cuatro categorías distintas, permitiendo un diagnóstico preciso del comportamiento del modelo:

  1. Verdaderos Positivos (VP): Representan los casos en que el modelo predijo correctamente la fuga de un cliente.
  2. Verdaderos Negativos (VN): Corresponden a los clientes que no se fugaron y que el modelo clasificó correctamente como tales.
  3. Falsos Positivos (FP) / Error Tipo I: Ocurren cuando el modelo predice la fuga de un cliente que, en realidad, permanece activo.
  4. Falsos Negativos (FN) / Error Tipo II: Son los casos en que el modelo no detecta la fuga de un cliente que efectivamente abandona la empresa.

La discusión estratégica sobre los márgenes de error aceptables se enfoca en determinar el impacto relativo y el costo de los Falsos Positivos frente a los Falsos Negativos.

Cuantificación del Impacto Financiero de los Errores

La relevancia de cada tipo de error puede ser estimada por su impacto financiero para alinear el modelo con los objetivos de negocio.

  • Costo del Falso Positivo (FP): Se asocia al costo de una intervención innecesaria. Esto incluye, por ejemplo, el margen cedido en un descuento ofrecido o el costo operativo de una llamada de retención a un cliente que no tenía intención de fugarse.
    • Costo (FP) = Costo de la acción de retención
  • Costo del Falso Negativo (FN): Representa la pérdida de ingresos futuros debido a un cliente que se fuga sin haber sido detectado. Este costo se asocia directamente al Valor de Vida del Cliente (LTV) perdido.
    • Costo (FN) = LTV perdido

En la mayoría de los modelos de negocio, el costo asociado a un Falso Negativo es significativamente superior al costo de un Falso Positivo: Costo (FN) >> Costo (FP). Esta asimetría en los costos es un factor determinante en la calibración y optimización del modelo. En muchas ocasiones, es difícil llegar a tener un dato exacto para estos costos, sin embargo, es aquí donde el conocimiento de negocio puede ayudar con heurísticas o reglas de dedo que ayuden a estimarlos y entender el impacto de los errores para delimitar cotas.

Como explicamos anteriormente, los modelos de clasificación generan una probabilidad de fuga para cada cliente. El umbral de decisión es el valor de probabilidad a partir del cual se clasifica a un cliente como "en riesgo de fuga". La selección de este umbral es una palanca estratégica para gestionar el “trade-off” entre los dos tipos de error:

  • Reducción del Umbral: Un umbral más bajo incrementa la sensibilidad del modelo, lo que resulta en una mayor captura de fugas reales y una minimización de los Falsos Negativos. El problema con esto es un previsible aumento en el número de Falsos Positivos. Esta estrategia es preferible cuando el costo de perder un cliente es muy elevado.
  • Aumento del Umbral: Un umbral más alto aumenta la precisión de las predicciones positivas, minimizando así los Falsos Positivos y el gasto en retenciones innecesarias. Sin embargo, esto se logra a expensas de un mayor número de Falsos Negativos, es decir, más clientes fugados pasarían desapercibidos.

Con esto, vemos que la definición del margen de error aceptable trasciende el análisis puramente técnico y se convierte en una decisión de negocio. Es importante recordar que el objetivo final en este caso, no es necesariamente alcanzar la máxima exactitud teórica, sino diseñar una solución predictiva cuyo perfil de error se alinee con la estructura de costos y también con la estrategia de retención de la organización.

Por otra parte, a  diferencia de los modelos de clasificación, cuya evaluación se centra en la correcta asignación de una clase, los modelos de supervivencia para estimar horizontes de riesgos, requieren métricas que validen tanto su capacidad para discriminar entre sujetos de alto y bajo riesgo como su calibración para predecir la probabilidad de supervivencia en un momento específico.

Para evaluar estos modelos, pueden utilizarse índices como el Índice de Concordancia, el Brier Score, o el AUC Dependiente del Tiempo, entre otros.

El Índice de Concordancia, o C-index, es la métrica de discriminación más utilizada para modelos de supervivencia. Es análogo al área bajo la curva ROC (AUC) en modelos de clasificación. Este índice mide la capacidad del modelo para ordenar correctamente los tiempos de supervivencia de los clientes.

En concreto, responde a la pregunta: De todos los pares de clientes posibles, ¿qué proporción de ellos fue ordenada correctamente por el modelo, de tal manera que al cliente con mayor riesgo predicho le corresponde un menor tiempo de supervivencia real? Por ejemplo:

  • Un C-index de 1.0 indica una discriminación perfecta.
  • Un C-index de 0.5 sugiere que el modelo no tiene una capacidad de discriminación mejor que el azar.

El C-index, por tanto, evalúa si las predicciones de riesgo relativo del modelo son consistentes con la secuencia real en que los clientes se fugan.

indice
Figura 3. Ilustración de indice de concordancia

El Brier Score, por su parte,  evalúa la calibración del modelo, es decir, la precisión de las probabilidades de supervivencia predichas en un instante de tiempo. Se calcula como el error cuadrático medio entre el estado real del cliente (1 si se fugó, 0 si no) y la probabilidad de supervivencia predicha por el modelo en ese momento.

Un Brier Score más bajo indica un mejor rendimiento, ya que significa que las probabilidades predichas por el modelo están mejor calibradas con las tasas de fuga observadas en la realidad. Es una métrica crucial para determinar si se puede confiar en el valor numérico de la predicción. Por ejemplo, si el modelo predice un 80% de probabilidad de supervivencia a 6 meses, ¿qué tan fiable es esta predicción?

Por último, el AUC dependiente del tiempo es una extensión del AUC tradicional que permite evaluar el poder discriminatorio del modelo en diferentes horizontes temporales. En lugar de un único valor, esta métrica calcula el AUC en puntos de tiempo específicos a definir (por ejemplo a los 3, 6 y 12 meses).

Esto permite responder preguntas de negocio más específicas, como por ejemplo: ¿Qué tan bueno es el modelo para distinguir entre los clientes que se fugarán y los que no en el próximo trimestre?. Un modelo puede tener un excelente rendimiento predictivo a corto plazo, pero uno menor a largo plazo, y esta métrica nos permite visualizar esa dinámica.

Conclusión

Contar con un modelo predictivo de fuga de clientes es un salto cualitativo en la madurez analítica de una organización. Este tipo de soluciones permite a la empresas pasar de ser reactivas a los problemas, a ser proactivas en la búsqueda de soluciones. Sin embargo, el modelo no es un fin en sí mismo, su verdadero poder se desata cuando se integra en una estrategia de negocio que impulsa acciones medibles y efectivas.

Un modelo robusto y correctamente evaluado trasciende la pregunta de quién está en riesgo de fuga, pues permite a la organización responder interrogantes más profundas, como cuándo es más probable que ocurra la fuga o cuánto valor financiero está realmente en riesgo. Esta inteligencia predictiva se convierte en el insumo para ir más allá de las campañas de retención, habilitando mejoras estratégicas en el producto, el servicio y la experiencia general del cliente, basadas en un entendimiento cuantitativo de los factores que impulsan la fuga.

Si en su organización existe el deseo o necesidad de incorporar soluciones basadas en inteligencia artificial generativa (por ejemplo: LLMs), podemos incluirlo como interfaz hacia el usuario. Hacer la predicción y crear los insights sobre fuga necesitan otro tipo de metodologias y modelos como descrito arriba. Pero vemos que el valor de soluciones predictivas se pueden aumentar con una interfaz adecuada, para convertirlo en una solución de inteligencia aumentada en su organización.  Una interfaz de texto, como es posible con LLM puede ser parte de esta solución, por ejemplo para automáticamente mandar emails personalizados a los clientes con riesgo de fuga. 

Con esta capacidad predictiva establecida, la etapa final del viaje analítico se enfoca en el diseño y optimización de estrategias de fidelización. En nuestro próximo artículo, exploraremos esta última etapa del la hoja de ruta para el uso de la Analítica Avanzada para impactar fuga en organizaciones.

 

Referencias

Mares, T., Mugge, R., & van Stiphout, J. (2021). Predicting customer churn in the telecom industry: a comparison of the added value of survival models versus binary classification models. International Journal of Market Research.
Chang, V., Hall, K., Xu, Q. A., Amao, F. O., Ganatra, M. A., & Benson, V. (2024). Prediction of customer churn behavior in the telecommunication industry using machine learning models. 
Gerds, T. A., & Schumacher, M. (2006). Consistent estimation of the expected Brier score in general survival models with right-censored data.
Fader, P. S., & Hardie, B. G. (2007). How to project customer retention. Journal of Interactive Marketing.
Ascarza, E., & Hardie, B. G. (2013). A joint model of customer churn and usage for subscription-based services.
Ishwaran, H., Kogalur, U. B., Blackstone, E. H., & Lauer, M. S. (2008). Random survival forests.