Funksjonsutvikling for Kohortanalyse
Sveip for å vise menyen
Feature engineering er prosessen med å lage nye variabler fra rådata for å forbedre analyse, modellering eller segmentering. I kohortanalyse hjelper effektiv feature engineering deg med å hente ut dypere innsikt om brukeradferd over tid. Typiske egenskaper inkluderer brukerens levetid (hvor lenge en bruker har vært aktiv), aktivitetsantall (hvor mange ganger en bruker har utført en spesifikk handling), og recency (hvor nylig en bruker var aktiv). Disse egenskapene gjør det mulig å gruppere brukere på en mer meningsfull måte, og avdekker mønstre i lojalitet, engasjement og frafall. Ved å konstruere slike egenskaper kan du gå utover enkel kohortinndeling og bygge rikere, mer handlingsrettede kohorter.
12345678910111213141516171819202122232425262728import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)
Egenskapene som er laget i kodeeksempelet – brukerens levetid, aktivitetsantall og recency – er kraftige verktøy for kohortsegmentering og analyse. Ved å måle hvor lenge en bruker forblir aktiv, hvor ofte de engasjerer seg, og hvor nylig de har vært aktive, kan du identifisere meningsfulle forskjeller mellom kohorter. For eksempel kan brukere med lang levetid og hyppig aktivitet tilhøre svært engasjerte kohorter, mens de med høye recency-verdier kan være i fare for frafall. Disse konstruerte egenskapene gjør det mulig å gå utover enkel tidsbasert gruppering, og gir flerdimensjonal segmentering som avdekker dypere adferdsmønstre og støtter mer målrettede forretningsstrategier.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår