Apprendre Calcul des indicateurs de rétention et de désabonnement | Segmentation Avancée des Cohortes et Métriques de Rétention

Glissez pour afficher le menu

Les métriques de rétention et de churn sont des outils essentiels en analyse de cohortes, permettant de mesurer la capacité de votre produit à fidéliser les utilisateurs au fil du temps et d’identifier les moments où vous risquez de les perdre. Le taux de rétention quantifie le pourcentage d’utilisateurs d’une cohorte qui restent actifs après une période donnée. Le taux de churn est le complément, indiquant le pourcentage d’utilisateurs ayant cessé d’interagir. Le taux de survie mesure la probabilité qu’un utilisateur reste actif jusqu’à chaque période, offrant une vue sur la longévité des utilisateurs.

Formules :

Taux de rétention (à la période n) :
Retention Rate = (Number of users active in period n) / (Number of users in cohort at period 0);
Taux de churn (à la période n) :
Churn Rate = 1 - Retention Rate (at period n);
Taux de survie (à la période n) :
Survival Rate = (Number of users still active at period n) / (Number of users in cohort at period 0).

Ces métriques sont souvent visualisées à l’aide de courbes de rétention ou de graphiques de survie, qui permettent d’identifier rapidement des tendances, telles que des chutes brutales ou des périodes de stabilité. En suivant ces taux sur plusieurs cohortes et périodes, il est possible de repérer les stratégies d’engagement efficaces et les axes d’amélioration.


              123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566
            
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Example cohort data: each row is a user, columns are activity in each month (1 = active, 0 = inactive)
data = {
    "user_id": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    "cohort_month": ["2023-01"] * 5 + ["2023-02"] * 5,
    "month_0": [1, 1, 1, 1, 1, 1, 1, 1, 1, 1],  # All users active at signup
    "month_1": [1, 0, 1, 1, 0, 1, 1, 0, 1, 1],
    "month_2": [1, 0, 0, 1, 0, 1, 0, 0, 1, 0],
    "month_3": [0, 0, 0, 1, 0, 1, 0, 0, 0, 0],
}

df = pd.DataFrame(data)

# Calculating retention, churn, and survival rates for each cohort
results = []
for cohort, group in df.groupby("cohort_month"):
    cohort_size = len(group)
    retention = []
    churn = []
    survival = []
    users_remaining = cohort_size

    for month in ["month_0", "month_1", "month_2", "month_3"]:
        active = group[month].sum()
        retention_rate = active / cohort_size
        retention.append(retention_rate)
        churn.append(1 - retention_rate)
        survival.append(users_remaining / cohort_size)
        users_remaining = active  # Update for next period

    results.append({
        "cohort_month": cohort,
        "retention": retention,
        "churn": churn,
        "survival": survival,
    })

# Converting results to DataFrame for plotting
metrics_df = pd.DataFrame(results)
months = ["month_0", "month_1", "month_2", "month_3"]

# Plot retention curves
plt.figure(figsize=(10, 5))
for idx, row in metrics_df.iterrows():
    plt.plot(months, row["retention"], marker="o", label=f"Cohort {row['cohort_month']}")
plt.title("Cohort Retention Curves")
plt.xlabel("Months Since Signup")
plt.ylabel("Retention Rate")
plt.legend()
plt.show()

# Plot survival curves
plt.figure(figsize=(10, 5))
for idx, row in metrics_df.iterrows():
    plt.plot(months, row["survival"], marker="o", label=f"Cohort {row['cohort_month']}")
plt.title("Cohort Survival Curves")
plt.xlabel("Months Since Signup")
plt.ylabel("Survival Rate")
plt.legend()
plt.show()

# Printing calculated metrics
print(metrics_df[["cohort_month", "retention", "churn", "survival"]])

Ce code montre comment calculer et visualiser les taux de rétention, de churn et de survie pour des cohortes d’utilisateurs en utilisant pandas et matplotlib en Python.

Objectif : analyser le comportement des groupes d’utilisateurs (cohortes) dans le temps, en se concentrant sur leur engagement et leur longévité avec un produit.

Structure des données :

Les données sont organisées sous forme de DataFrame, chaque ligne représentant un utilisateur ;
Les colonnes incluent un identifiant utilisateur unique, le mois de cohorte (date d’inscription) et des indicateurs binaires d’activité pour chaque mois (1 = actif, 0 = inactif).

Logique de calcul :
Pour chaque cohorte, le code :

Calcule le taux de rétention pour chaque mois comme la proportion d’utilisateurs encore actifs par rapport à la taille initiale de la cohorte ;
Calcule le taux de churn comme le complément de la rétention (1 - taux de rétention) ;
Suit le taux de survie, qui indique la probabilité qu’un utilisateur reste actif jusqu’à chaque période, en mettant à jour le nombre d’utilisateurs restants après chaque mois.

Visualisation :

Les courbes de rétention et de survie sont tracées pour chaque cohorte avec matplotlib ;
Ces graphiques permettent de comparer visuellement la rapidité avec laquelle les utilisateurs décrochent (churn) ou restent engagés (rétention/survie) selon les cohortes et les périodes, révélant ainsi des tendances et des schémas d’engagement utilisateur.

L'interprétation des indicateurs de rétention et de churn est essentielle pour prendre des décisions commerciales éclairées. Des taux de rétention élevés indiquent que les utilisateurs perçoivent une valeur continue dans votre produit, ce qui suggère un engagement fort et une adéquation produit-marché. À l'inverse, des taux de churn élevés peuvent signaler des problèmes tels que des besoins utilisateurs non satisfaits, un onboarding insuffisant ou une pression concurrentielle. Les courbes de survie permettent de visualiser la rapidité avec laquelle les cohortes diminuent – des chutes abruptes peuvent révéler le moment où les utilisateurs perdent généralement de l'intérêt.

En suivant régulièrement ces indicateurs, il est possible d'identifier des tendances dans le temps et entre différentes cohortes. Par exemple, si le lancement d'une nouvelle fonctionnalité coïncide avec une augmentation de la rétention, il peut être pertinent d'investir davantage dans cette direction. À l'inverse, si le churn augmente après une mise à jour particulière, cela peut indiquer un besoin d'amélioration du produit ou d'un support utilisateur supplémentaire. En définitive, ces indicateurs permettent de tester des hypothèses, d'optimiser les parcours utilisateurs et d'allouer efficacement les ressources.

Tout était clair ?

Merci pour vos commentaires !

Section 2. Chapitre 2

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 2. Chapitre 2