Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Обчислення Показників Утримання та Відтоку | Розширена сегментація когорт і метрики утримання
Когортний аналіз з Python

Обчислення Показників Утримання та Відтоку

Свайпніть щоб показати меню

Метрики утримання та відтоку є ключовими інструментами когортного аналізу, які допомагають вимірювати, наскільки добре ваш продукт утримує користувачів з часом і на яких етапах ви їх втрачаєте. Коефіцієнт утримання визначає відсоток користувачів з когорти, які залишаються активними після певного періоду. Коефіцієнт відтоку є доповненням, що показує відсоток користувачів, які припинили взаємодію. Коефіцієнт виживання відстежує ймовірність того, що користувач залишиться активним до кожного періоду, надаючи уявлення про тривалість життя користувача.

Формули:

  • Коефіцієнт утримання (за період n):
    Retention Rate = (Number of users active in period n) / (Number of users in cohort at period 0);
  • Коефіцієнт відтоку (за період n):
    Churn Rate = 1 - Retention Rate (at period n);
  • Коефіцієнт виживання (за період n):
    Survival Rate = (Number of users still active at period n) / (Number of users in cohort at period 0).

Ці метрики часто візуалізують за допомогою кривих утримання або графіків виживання, які дозволяють швидко виявити закономірності, такі як різкі падіння або періоди стабільності. Відстежуючи ці показники для кількох когорт і часових періодів, можна визначити ефективні стратегії залучення та області, що потребують покращення.

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566
import pandas as pd import numpy as np import matplotlib.pyplot as plt # Example cohort data: each row is a user, columns are activity in each month (1 = active, 0 = inactive) data = { "user_id": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], "cohort_month": ["2023-01"] * 5 + ["2023-02"] * 5, "month_0": [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], # All users active at signup "month_1": [1, 0, 1, 1, 0, 1, 1, 0, 1, 1], "month_2": [1, 0, 0, 1, 0, 1, 0, 0, 1, 0], "month_3": [0, 0, 0, 1, 0, 1, 0, 0, 0, 0], } df = pd.DataFrame(data) # Calculating retention, churn, and survival rates for each cohort results = [] for cohort, group in df.groupby("cohort_month"): cohort_size = len(group) retention = [] churn = [] survival = [] users_remaining = cohort_size for month in ["month_0", "month_1", "month_2", "month_3"]: active = group[month].sum() retention_rate = active / cohort_size retention.append(retention_rate) churn.append(1 - retention_rate) survival.append(users_remaining / cohort_size) users_remaining = active # Update for next period results.append({ "cohort_month": cohort, "retention": retention, "churn": churn, "survival": survival, }) # Converting results to DataFrame for plotting metrics_df = pd.DataFrame(results) months = ["month_0", "month_1", "month_2", "month_3"] # Plot retention curves plt.figure(figsize=(10, 5)) for idx, row in metrics_df.iterrows(): plt.plot(months, row["retention"], marker="o", label=f"Cohort {row['cohort_month']}") plt.title("Cohort Retention Curves") plt.xlabel("Months Since Signup") plt.ylabel("Retention Rate") plt.legend() plt.show() # Plot survival curves plt.figure(figsize=(10, 5)) for idx, row in metrics_df.iterrows(): plt.plot(months, row["survival"], marker="o", label=f"Cohort {row['cohort_month']}") plt.title("Cohort Survival Curves") plt.xlabel("Months Since Signup") plt.ylabel("Survival Rate") plt.legend() plt.show() # Printing calculated metrics print(metrics_df[["cohort_month", "retention", "churn", "survival"]])

Цей код демонструє, як розраховувати та візуалізувати коефіцієнти утримання, відтоку та виживання для когорт користувачів за допомогою pandas і matplotlib у Python.

Мета — проаналізувати, як групи користувачів (когорти) поводяться з часом, зосереджуючись на їхній залученості та тривалості взаємодії з продуктом.

Структура даних:

  • Дані організовані у вигляді DataFrame, де кожен рядок відповідає користувачу;
  • Стовпці містять унікальний ідентифікатор користувача, місяць когорти (коли користувач приєднався) та бінарні індикатори активності для кожного місяця (1 = активний, 0 = неактивний).

Логіка розрахунків:
Для кожної когорти код:

  1. Обчислює коефіцієнт утримання для кожного місяця як частку користувачів, що залишилися активними, від початкового розміру когорти;
  2. Обчислює коефіцієнт відтоку як доповнення до утримання (1 - коефіцієнт утримання);
  3. Відстежує коефіцієнт виживання, який показує ймовірність того, що користувач залишиться активним до кожного періоду, оновлюючи кількість користувачів, що залишилися, після кожного місяця.

Візуалізація:

  • Криві утримання та виживання будуються для кожної когорти за допомогою matplotlib;
  • Ці графіки дозволяють візуально порівнювати, як швидко користувачі відпадають (відтік) або залишаються залученими (утримання/виживання) у різних когортах і часових періодах, виявляючи тенденції та закономірності у залученні користувачів.

Інтерпретація метрик утримання та відтоку є ключовою для прийняття обґрунтованих бізнес-рішень. Високі показники утримання свідчать про те, що користувачі знаходять постійну цінність у вашому продукті, що вказує на сильну залученість і відповідність продукту ринку. Навпаки, високі показники відтоку можуть сигналізувати про такі проблеми, як незадоволені потреби користувачів, неефективний онбординг або конкурентний тиск. Криві виживання допомагають візуалізувати, як швидко зменшуються когорти — різкі падіння можуть показувати, коли користувачі зазвичай втрачають інтерес.

Регулярне відстеження цих метрик дозволяє виявляти тенденції з часом і між різними когортами. Наприклад, якщо запуск нової функції збігається зі зростанням утримання, можливо, варто інвестувати в цьому напрямку. З іншого боку, якщо після певного оновлення спостерігається сплеск відтоку, це може свідчити про необхідність покращення продукту або додаткової підтримки користувачів. Зрештою, ці метрики дають змогу перевіряти гіпотези, оптимізувати користувацькі шляхи та ефективно розподіляти ресурси.

question mark

Яке з наведених тверджень щодо метрик утримання та відтоку в когортному аналізі є правильним?

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 2

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 2. Розділ 2
some-alt