Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Feature Engineering för Kohortanalys | Strukturering och förberedelse av kohortdata
Kohortanalys med Python

Feature Engineering för Kohortanalys

Svep för att visa menyn

Feature engineering är processen att skapa nya variabler från rådata för att förbättra analys, modellering eller segmentering. Inom kohortanalys hjälper effektiv feature engineering dig att få djupare insikter om användarbeteende över tid. Typiska egenskaper inkluderar användarlivslängd (hur länge en användare har varit aktiv), aktivitetsantal (hur många gånger en användare har utfört en specifik handling) och recency (hur nyligen en användare var aktiv). Dessa egenskaper gör det möjligt att gruppera användare på ett mer meningsfullt sätt och avslöjar mönster i retention, engagemang och avhopp. Genom att konstruera sådana egenskaper kan du gå bortom grundläggande kohortindelning och skapa rikare, mer handlingskraftiga kohorter.

12345678910111213141516171819202122232425262728
import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)

De egenskaper som skapats i kodexemplet – användarlivslängd, aktivitetsantal och recency – är kraftfulla verktyg för kohortsegmentering och analys. Genom att mäta hur länge en användare är aktiv, hur ofta de engagerar sig och hur nyligen de interagerat kan du identifiera meningsfulla skillnader mellan kohorter. Till exempel kan användare med lång livslängd och frekvent aktivitet tillhöra mycket engagerade kohorter, medan de med höga recency-värden kan vara i riskzonen för avhopp. Dessa konstruerade egenskaper gör det möjligt att gå bortom enkel tidsbaserad gruppering och möjliggör multidimensionell segmentering som avslöjar djupare beteendemönster och stödjer mer riktade affärsstrategier.

question mark

Vilket av följande beskriver bäst syftet med feature engineering i kohortanalys?

Vänligen välj det korrekta svaret

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 2

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 1. Kapitel 2
some-alt