Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Filtragem de Regras sem Significado e Identificação de Pacotes de Produtos de Alto Valor | Mineração de Regras de Alto Desempenho e Otimização de Escala
Análise de Cesta de Mercado e Sistemas de Recomendação

Filtragem de Regras sem Significado e Identificação de Pacotes de Produtos de Alto Valor

Deslize para mostrar o menu

Para maximizar o impacto da análise de cesta de compras, é necessário separar as regras de associação realmente valiosas daquelas que são triviais ou irrelevantes para os objetivos do negócio. Esse processo garante que as recomendações e promoções sejam baseadas em insights acionáveis, e não em ruídos ou padrões óbvios.

Critérios de Filtragem

O primeiro passo para filtrar regras de associação é definir limites mínimos para suporte, confiança e lift. Essas métricas ajudam a eliminar regras que são raras demais para serem úteis ou que não são estatisticamente significativas.

  • Limite de suporte: ignorar regras que ocorrem em poucas transações, pois podem ser exceções ou não ter impacto no negócio;
  • Limite de confiança: descartar regras que não apresentam associação forte o suficiente entre antecedente e consequente;
  • Limite de lift: remover regras com valores de lift próximos ou inferiores a 1, pois não indicam uma associação significativa além do acaso.

Redundância

Muitas regras nos resultados da mineração podem ser redundantes, ou seja, não fornecem novas informações em comparação com outras regras. Por exemplo, se tanto "milk → bread" quanto "milk, butter → bread" possuem suporte e confiança semelhantes, a regra mais específica pode não agregar valor. Identificar e remover regras redundantes ajuda a focar nos padrões mais concisos e informativos.

Relevância para o Negócio

Nem todas as regras estatisticamente fortes são úteis para o negócio. Para determinar se uma regra é acionável, pergunte:

  • A regra sugere um pareamento de produtos que pode ser promovido em conjunto?
  • A combinação é logisticamente viável (por exemplo, não parear produtos de departamentos não relacionados)?
  • A regra pode informar estratégias de layout de loja ou de venda cruzada?
  • A regra está alinhada com os objetivos do negócio, como aumentar o tamanho da cesta ou introduzir novos produtos?

Exemplo: Filtrando Regras para Isolar Combos de Alto Valor

Suponha que você tenha minerado um conjunto de regras de associação a partir dos seus dados de transação. Aplicando limites e removendo redundâncias, é possível isolar um pequeno conjunto de combos de produtos de alto valor que são estatisticamente significativos e alinhados com os objetivos do negócio.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. Qual é o principal motivo para definir um limite mínimo de lift ao filtrar regras de associação?

2. Qual das alternativas melhor descreve uma regra de associação redundante?

question mark

Qual é o principal motivo para definir um limite mínimo de lift ao filtrar regras de associação?

Selecione a resposta correta

question mark

Qual das alternativas melhor descreve uma regra de associação redundante?

Selecione a resposta correta

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 4

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 2. Capítulo 4
some-alt