Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Engenharia de Atributos para Análise de Coorte | Estruturação e Preparação de Dados de Coorte
Análise de Coorte com Python

Engenharia de Atributos para Análise de Coorte

Deslize para mostrar o menu

Engenharia de atributos é o processo de criar novas variáveis a partir de dados brutos para aprimorar a análise, modelagem ou segmentação. Na análise de coorte, uma engenharia de atributos eficaz ajuda a extrair insights mais profundos sobre o comportamento dos usuários ao longo do tempo. Os atributos típicos incluem tempo de vida do usuário (quanto tempo um usuário permaneceu ativo), contagem de atividades (quantas vezes um usuário realizou uma ação específica) e recência (há quanto tempo o usuário esteve ativo pela última vez). Esses atributos permitem agrupar usuários de forma mais significativa, revelando padrões de retenção, engajamento e evasão. Ao criar esses atributos, é possível ir além da simples atribuição de coortes e construir grupos mais ricos e acionáveis.

12345678910111213141516171819202122232425262728
import pandas as pd # Sample user activity data data = { "user_id": [1, 1, 1, 2, 2, 3, 3, 3, 3], "activity_date": [ "2024-01-01", "2024-01-10", "2024-02-01", "2024-01-05", "2024-02-20", "2024-01-03", "2024-01-10", "2024-01-20", "2024-03-01" ] } df = pd.DataFrame(data) df["activity_date"] = pd.to_datetime(df["activity_date"]) # Calculate user lifetime (days between first and last activity) user_lifetime = df.groupby("user_id")["activity_date"].agg(["min", "max"]) user_lifetime["user_lifetime_days"] = (user_lifetime["max"] - user_lifetime["min"]).dt.days # Calculate activity count per user activity_counts = df.groupby("user_id").size().rename("activity_count") # Calculate recency (days since last activity, assuming analysis date is 2024-03-15) analysis_date = pd.to_datetime("2024-03-15") recency = df.groupby("user_id")["activity_date"].max().apply(lambda x: (analysis_date - x).days).rename("recency_days") # Combine features into a single DataFrame features = pd.concat([user_lifetime["user_lifetime_days"], activity_counts, recency], axis=1) print(features)

Os atributos criados no exemplo de código — tempo de vida do usuário, contagem de atividades e recência — são ferramentas poderosas para segmentação e análise de coortes. Ao medir por quanto tempo um usuário permanece ativo, com que frequência ele interage e há quanto tempo ocorreu a última interação, é possível identificar diferenças significativas entre as coortes. Por exemplo, usuários com longo tempo de vida e alta frequência de atividade podem pertencer a coortes altamente engajadas, enquanto aqueles com valores elevados de recência podem estar em risco de evasão. Esses atributos criados permitem ir além do agrupamento simples por tempo, possibilitando uma segmentação multidimensional que revela padrões comportamentais mais profundos e apoia estratégias de negócio mais direcionadas.

question mark

Qual das alternativas a seguir melhor descreve o objetivo da engenharia de atributos na análise de coorte?

Selecione a resposta correta

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 2

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 1. Capítulo 2
some-alt