Engenharia de Atributos para Análise de Coorte
Deslize para mostrar o menu
Engenharia de atributos é o processo de criar novas variáveis a partir de dados brutos para aprimorar a análise, modelagem ou segmentação. Na análise de coorte, uma engenharia de atributos eficaz ajuda a extrair insights mais profundos sobre o comportamento dos usuários ao longo do tempo. Os atributos típicos incluem tempo de vida do usuário (quanto tempo um usuário permaneceu ativo), contagem de atividades (quantas vezes um usuário realizou uma ação específica) e recência (há quanto tempo o usuário esteve ativo pela última vez). Esses atributos permitem agrupar usuários de forma mais significativa, revelando padrões de retenção, engajamento e evasão. Ao criar esses atributos, é possível ir além da simples atribuição de coortes e construir grupos mais ricos e acionáveis.
12345678910111213141516171819202122232425262728import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)
Os atributos criados no exemplo de código — tempo de vida do usuário, contagem de atividades e recência — são ferramentas poderosas para segmentação e análise de coortes. Ao medir por quanto tempo um usuário permanece ativo, com que frequência ele interage e há quanto tempo ocorreu a última interação, é possível identificar diferenças significativas entre as coortes. Por exemplo, usuários com longo tempo de vida e alta frequência de atividade podem pertencer a coortes altamente engajadas, enquanto aqueles com valores elevados de recência podem estar em risco de evasão. Esses atributos criados permitem ir além do agrupamento simples por tempo, possibilitando uma segmentação multidimensional que revela padrões comportamentais mais profundos e apoia estratégias de negócio mais direcionadas.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo