Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Funksjonsutvikling for Kohortanalyse | Kohortdatastrukturering og forberedelse
Kohortanalyse med Python

Funksjonsutvikling for Kohortanalyse

Sveip for å vise menyen

Feature engineering er prosessen med å lage nye variabler fra rådata for å forbedre analyse, modellering eller segmentering. I kohortanalyse hjelper effektiv feature engineering deg med å hente ut dypere innsikt om brukeradferd over tid. Typiske egenskaper inkluderer brukerens levetid (hvor lenge en bruker har vært aktiv), aktivitetsantall (hvor mange ganger en bruker har utført en spesifikk handling), og recency (hvor nylig en bruker var aktiv). Disse egenskapene gjør det mulig å gruppere brukere på en mer meningsfull måte, og avdekker mønstre i lojalitet, engasjement og frafall. Ved å konstruere slike egenskaper kan du gå utover enkel kohortinndeling og bygge rikere, mer handlingsrettede kohorter.

12345678910111213141516171819202122232425262728
import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)

Egenskapene som er laget i kodeeksempelet – brukerens levetid, aktivitetsantall og recency – er kraftige verktøy for kohortsegmentering og analyse. Ved å måle hvor lenge en bruker forblir aktiv, hvor ofte de engasjerer seg, og hvor nylig de har vært aktive, kan du identifisere meningsfulle forskjeller mellom kohorter. For eksempel kan brukere med lang levetid og hyppig aktivitet tilhøre svært engasjerte kohorter, mens de med høye recency-verdier kan være i fare for frafall. Disse konstruerte egenskapene gjør det mulig å gå utover enkel tidsbasert gruppering, og gir flerdimensjonal segmentering som avdekker dypere adferdsmønstre og støtter mer målrettede forretningsstrategier.

question mark

Hvilket av følgende beskriver best formålet med feature engineering i kohortanalyse?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 2

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 1. Kapittel 2
some-alt