Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Filtrado de reglas sin sentido e identificación de paquetes de productos de alto valor | Minería de Reglas de Alto Rendimiento y Optimización de Escala
Análisis de Canasta de Mercado y Sistemas de Recomendación

Filtrado de reglas sin sentido e identificación de paquetes de productos de alto valor

Desliza para mostrar el menú

Para maximizar el impacto del análisis de canasta de mercado, es necesario separar las reglas de asociación realmente valiosas de aquellas que son triviales o irrelevantes para los objetivos empresariales. Este proceso garantiza que las recomendaciones y promociones se basen en conocimientos accionables y no en ruido o patrones evidentes.

Criterios de filtrado

El primer paso para filtrar reglas de asociación es establecer umbrales mínimos para soporte, confianza y lift. Estas métricas ayudan a eliminar reglas que son demasiado raras para ser útiles o que no son estadísticamente significativas.

  • Umbral de soporte: ignorar reglas que aparecen en muy pocas transacciones, ya que pueden ser valores atípicos o carecer de impacto comercial;
  • Umbral de confianza: descartar reglas que no muestran una asociación lo suficientemente fuerte entre el antecedente y el consecuente;
  • Umbral de lift: eliminar reglas con valores de lift cercanos o inferiores a 1, ya que no indican una asociación significativa más allá del azar.

Redundancia

Muchas reglas en los resultados del análisis pueden ser redundantes, es decir, no aportan información nueva en comparación con otras reglas. Por ejemplo, si tanto "milk → bread" como "milk, butter → bread" tienen soporte y confianza similares, la regla más específica puede no aportar valor. Identificar y eliminar reglas redundantes ayuda a centrarse en los patrones más concisos e informativos.

Relevancia empresarial

No todas las reglas estadísticamente fuertes son útiles para el negocio. Para determinar si una regla es accionable, considere:

  • ¿Sugiere la regla una combinación de productos que se pueda promocionar conjuntamente?
  • ¿Es la combinación logísticamente viable (por ejemplo, no agrupar productos de departamentos no relacionados)?
  • ¿Puede la regla informar sobre la disposición de la tienda o estrategias de venta cruzada?
  • ¿La regla se alinea con los objetivos empresariales, como aumentar el tamaño de la canasta o introducir nuevos productos?

Ejemplo: Filtrado de reglas para aislar paquetes de alto valor

Suponga que ha extraído un conjunto de reglas de asociación de los datos de transacciones. Al aplicar umbrales y eliminar redundancias, puede aislar un pequeño conjunto de paquetes de productos de alto valor que sean estadísticamente significativos y estén alineados con los objetivos empresariales.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. ¿Cuál es la razón principal para establecer un umbral mínimo de lift al filtrar reglas de asociación?

2. ¿Cuál de las siguientes opciones describe mejor una regla de asociación redundante?

question mark

¿Cuál es la razón principal para establecer un umbral mínimo de lift al filtrar reglas de asociación?

Selecciona la respuesta correcta

question mark

¿Cuál de las siguientes opciones describe mejor una regla de asociación redundante?

Selecciona la respuesta correcta

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 2. Capítulo 4
some-alt