Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Feature Engineering für Kohortenanalyse | Cohort Data Structuring and Preparation
Kohortenanalyse mit Python

Feature Engineering für Kohortenanalyse

Swipe um das Menü anzuzeigen

Feature Engineering ist der Prozess, neue Variablen aus Rohdaten zu erstellen, um Analysen, Modellierung oder Segmentierung zu verbessern. Im Rahmen der Kohortenanalyse ermöglicht effektives Feature Engineering, tiefere Einblicke in das Nutzerverhalten über die Zeit zu gewinnen. Typische Merkmale sind Nutzerlebensdauer (wie lange ein Nutzer aktiv war), Aktivitätsanzahl (wie oft ein Nutzer eine bestimmte Aktion ausgeführt hat) und Aktualität (wie kürzlich ein Nutzer aktiv war). Diese Merkmale ermöglichen eine sinnvollere Gruppierung von Nutzern und offenbaren Muster in Bindung, Engagement und Abwanderung. Durch das Entwickeln solcher Merkmale können Sie über die grundlegende Kohortenzuordnung hinausgehen und reichhaltigere, handlungsorientierte Kohorten erstellen.

12345678910111213141516171819202122232425262728
import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)

Die im Codebeispiel erstellten Merkmale – Nutzerlebensdauer, Aktivitätsanzahl und Aktualität – sind leistungsstarke Werkzeuge für Kohortensegmentierung und -analyse. Durch die Messung, wie lange ein Nutzer aktiv bleibt, wie häufig er sich engagiert und wie kürzlich er interagiert hat, lassen sich bedeutende Unterschiede zwischen Kohorten identifizieren. Beispielsweise können Nutzer mit langer Lebensdauer und häufiger Aktivität hoch engagierten Kohorten angehören, während solche mit hohen Aktualitätswerten ein erhöhtes Abwanderungsrisiko aufweisen könnten. Diese entwickelten Merkmale ermöglichen eine mehrdimensionale Segmentierung, die tiefere Verhaltensmuster aufdeckt und gezieltere Geschäftsstrategien unterstützt.

question mark

Welche der folgenden Aussagen beschreibt am besten den Zweck von Feature Engineering in der Kohortenanalyse?

Wählen Sie die richtige Antwort aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 2

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 1. Kapitel 2
some-alt