Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Techniken zur Kohortenzuordnung | Cohort Data Structuring and Preparation
Kohortenanalyse mit Python
Abschnitt 1. Kapitel 1
single

single

Techniken zur Kohortenzuordnung

Swipe um das Menü anzuzeigen

Die Kohortenanalyse ist eine leistungsstarke Technik in der Analytik, mit der Benutzer auf Grundlage gemeinsamer Merkmale oder Erfahrungen innerhalb eines definierten Zeitraums gruppiert werden. Die gebräuchlichste Methode besteht darin, Benutzer nach dem Datum ihrer ersten Transaktion oder Interaktion Kohorten zuzuweisen. Dieser Ansatz ermöglicht es, das Verhalten verschiedener Gruppen im Zeitverlauf zu verfolgen und so Trends wie Bindung, Engagement und Abwanderung zu erkennen, die in aggregierten Daten verborgen bleiben würden.

Die Zuweisung von Benutzern zu Kohorten ist ein grundlegender Schritt in der Kohortenanalyse. Durch die Definition klarer Regeln für die Kohortenzuweisung – beispielsweise die Gruppierung nach Monat oder Woche des ersten Kaufs eines Benutzers – können sinnvolle Segmente für eine tiefere Analyse erstellt werden. Dieser Prozess hilft nicht nur, Veränderungen im Nutzerverhalten zu identifizieren, sondern unterstützt auch gezieltere Geschäftsentscheidungen, wie etwa die Bewertung der Auswirkungen von Produktänderungen oder Marketingkampagnen auf bestimmte Nutzergruppen.

Das Verständnis und die Umsetzung einer korrekten Kohortenzuweisung stellen sicher, dass die Analyse die tatsächlichen Nutzerverläufe widerspiegelt und umsetzbare Erkenntnisse liefert. Das folgende Codebeispiel zeigt, wie Benutzer in Python mit pandas anhand ihres ersten Transaktionsdatums Kohorten zugewiesen werden.

12345678910111213141516171819
import pandas as pd # Sample transaction data data = { "user_id": [1, 2, 1, 3, 2, 4], "transaction_date": [ "2024-01-15", "2024-01-20", "2024-02-10", "2024-03-05", "2024-03-10", "2024-03-15" ], "amount": [100, 150, 200, 120, 80, 90] } df = pd.DataFrame(data) df["transaction_date"] = pd.to_datetime(df["transaction_date"]) # Assigning each user to a cohort based on their first transaction month df["cohort_month"] = df.groupby("user_id")["transaction_date"].transform("min").dt.to_period("M") print(df[["user_id", "transaction_date", "cohort_month"]])

Die Logik hinter der Kohortenzuweisung besteht darin, ein einzigartiges Ereignis oder Merkmal – meist das Datum der ersten Transaktion eines Benutzers – zu identifizieren und dieses zur Definition der Kohorte für jeden Benutzer zu verwenden. Im obigen Codebeispiel wird mit pandas die Daten nach user_id gruppiert und das minimale transaction_date für jeden Benutzer ermittelt. Dieses Datum wird anschließend in einen monatlichen Zeitraum umgewandelt, wodurch ein cohort_month entsteht, der die Kohorte des Benutzers repräsentiert.

Bei der Implementierung der Kohortenzuweisung sollten Sonderfälle wie Benutzer mit mehreren Transaktionen am selben Tag, fehlende Transaktionsdaten oder Benutzer, die nach längerer Abwesenheit zurückkehren, berücksichtigt werden. Es ist bewährte Praxis, sicherzustellen, dass die Logik zur Kohortenzuweisung robust gegenüber diesen Situationen ist, indem fehlende Werte behandelt und validiert wird, dass jeder Benutzer genau einer Kohorte auf Grundlage seiner tatsächlichen ersten Interaktion zugewiesen wird.

Die Beachtung dieser Prinzipien trägt zur Integrität der Kohorten bei und stellt sicher, dass die anschließende Analyse das Nutzerverhalten korrekt widerspiegelt und fundierte Geschäftsentscheidungen unterstützt.

Aufgabe

Wischen, um mit dem Codieren zu beginnen

Gegeben ist ein DataFrame df mit den Spalten user_id und signup_date, die Benutzeranmeldungen darstellen. Führen Sie die folgenden Schritte aus:

  • Umwandlung der Spalte signup_date in das Datetime-Format.
  • Ermittlung des frühesten signup_date für jeden Benutzer.
  • Erstellung einer neuen Spalte cohort_week, die den wöchentlichen Zeitraum (YYYY-MM-DD mit wöchentlicher Frequenz) des ersten Anmeldedatums jedes Benutzers enthält, unter Verwendung der Periodenfunktionalität von pandas mit der Frequenz 'W'.
  • Ausgabe des resultierenden DataFrames, das die neue Spalte cohort_week enthält.

Andere Spalten oder die Struktur des DataFrames dürfen außer der Hinzufügung der erforderlichen Spalte cohort_week nicht verändert werden.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 1
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

some-alt