Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Techniques d'Attribution de Cohorte | Structuration et Préparation des Données de Cohorte
Analyse de Cohortes avec Python
Section 1. Chapitre 1
single

single

Techniques d'Attribution de Cohorte

Glissez pour afficher le menu

L'analyse de cohorte est une technique puissante en analytique qui permet de regrouper les utilisateurs selon des caractéristiques ou des expériences communes sur une période définie. La méthode la plus courante consiste à affecter les utilisateurs à des cohortes en fonction de la date de leur première transaction ou interaction. Cette approche permet de suivre le comportement de différents groupes au fil du temps, révélant des tendances telles que la rétention, l'engagement et l'attrition qui seraient invisibles dans des données agrégées.

L'affectation des utilisateurs à des cohortes constitue une étape fondamentale de l'analyse de cohorte. En définissant des règles claires pour l'affectation aux cohortes – comme le regroupement par mois ou par semaine du premier achat d'un utilisateur – il est possible de créer des segments pertinents pour une analyse approfondie. Ce processus aide non seulement à identifier les évolutions du comportement utilisateur, mais aussi à soutenir des décisions commerciales plus ciblées, telles que l'évaluation de l'impact des modifications produit ou des campagnes marketing sur des groupes d'utilisateurs spécifiques.

Comprendre et mettre en œuvre une affectation correcte des cohortes garantit que votre analyse reflète les véritables parcours utilisateurs et fournit des informations exploitables. L'exemple de code suivant montre comment affecter des utilisateurs à des cohortes en utilisant la date de leur première transaction en Python avec pandas.

12345678910111213141516171819
import pandas as pd # Sample transaction data data = { "user_id": [1, 2, 1, 3, 2, 4], "transaction_date": [ "2024-01-15", "2024-01-20", "2024-02-10", "2024-03-05", "2024-03-10", "2024-03-15" ], "amount": [100, 150, 200, 120, 80, 90] } df = pd.DataFrame(data) df["transaction_date"] = pd.to_datetime(df["transaction_date"]) # Assigning each user to a cohort based on their first transaction month df["cohort_month"] = df.groupby("user_id")["transaction_date"].transform("min").dt.to_period("M") print(df[["user_id", "transaction_date", "cohort_month"]])

La logique de l'affectation aux cohortes consiste à identifier un événement ou une caractéristique unique – le plus souvent la date de la première transaction de l'utilisateur – et à l'utiliser pour définir la cohorte de chaque utilisateur. Dans l'exemple de code ci-dessus, pandas est utilisé pour regrouper les données par user_id et trouver la valeur minimale de transaction_date pour chaque utilisateur. Cette date est ensuite convertie en période mensuelle, créant ainsi un cohort_month qui représente la cohorte de l'utilisateur.

Lors de la mise en œuvre de l'affectation aux cohortes, il convient de prendre en compte les cas particuliers tels que les utilisateurs ayant plusieurs transactions le même jour, les dates de transaction manquantes ou les utilisateurs qui pourraient revenir après une longue absence. Il est recommandé de s'assurer que la logique d'affectation aux cohortes est robuste face à ces situations en gérant les valeurs manquantes et en validant que chaque utilisateur est affecté à une seule cohorte sur la base de sa véritable première interaction.

Le respect de ces principes permet de préserver l'intégrité des cohortes, garantissant que les analyses ultérieures reflètent fidèlement le comportement des utilisateurs et soutiennent des décisions commerciales pertinentes.

Tâche

Glissez pour commencer à coder

Vous disposez d'un DataFrame df avec les colonnes user_id et signup_date représentant les inscriptions des utilisateurs. Effectuez les étapes suivantes :

  • Convertir la colonne signup_date au format datetime.
  • Identifier, pour chaque utilisateur, sa première signup_date.
  • Créer une nouvelle colonne cohort_week qui contient la période hebdomadaire (YYYY-MM-DD avec une fréquence hebdomadaire) correspondant à la première date d'inscription de chaque utilisateur, en utilisant la fonctionnalité de période de pandas avec la fréquence 'W'.
  • Afficher le DataFrame résultant, qui doit inclure la nouvelle colonne cohort_week.

Ne modifiez aucune autre colonne ni la structure du DataFrame, à l'exception de l'ajout de la colonne cohort_week requise.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 1
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

some-alt