Feature Engineering für Kohortenanalyse
Swipe um das Menü anzuzeigen
Feature Engineering ist der Prozess, neue Variablen aus Rohdaten zu erstellen, um Analysen, Modellierung oder Segmentierung zu verbessern. Im Rahmen der Kohortenanalyse ermöglicht effektives Feature Engineering, tiefere Einblicke in das Nutzerverhalten über die Zeit zu gewinnen. Typische Merkmale sind Nutzerlebensdauer (wie lange ein Nutzer aktiv war), Aktivitätsanzahl (wie oft ein Nutzer eine bestimmte Aktion ausgeführt hat) und Aktualität (wie kürzlich ein Nutzer aktiv war). Diese Merkmale ermöglichen eine sinnvollere Gruppierung von Nutzern und offenbaren Muster in Bindung, Engagement und Abwanderung. Durch das Entwickeln solcher Merkmale können Sie über die grundlegende Kohortenzuordnung hinausgehen und reichhaltigere, handlungsorientierte Kohorten erstellen.
12345678910111213141516171819202122232425262728import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)
Die im Codebeispiel erstellten Merkmale – Nutzerlebensdauer, Aktivitätsanzahl und Aktualität – sind leistungsstarke Werkzeuge für Kohortensegmentierung und -analyse. Durch die Messung, wie lange ein Nutzer aktiv bleibt, wie häufig er sich engagiert und wie kürzlich er interagiert hat, lassen sich bedeutende Unterschiede zwischen Kohorten identifizieren. Beispielsweise können Nutzer mit langer Lebensdauer und häufiger Aktivität hoch engagierten Kohorten angehören, während solche mit hohen Aktualitätswerten ein erhöhtes Abwanderungsrisiko aufweisen könnten. Diese entwickelten Merkmale ermöglichen eine mehrdimensionale Segmentierung, die tiefere Verhaltensmuster aufdeckt und gezieltere Geschäftsstrategien unterstützt.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen