Contenido del Curso
El Arte del A/B Testing
El Arte del A/B Testing
Estadística Descriptiva
Antes de pasar a la visualización de la distribución, conviene examinar las estadísticas descriptivas de cada parámetro del conjunto de datos.
Entre los parámetros clave que necesitamos están los siguientes:
- Número de observaciones;
- Valor medio;
- Desviación típica;
- Mediana;
- Valor mínimo;
- Valor máximo.
Manos a la obra. Tenemos los resultados de un experimento controlado para dos grupos de usuarios.
Las pruebas preliminares A/A mostraron que el experimento era adecuado. Vamos a mostrar nuestros archivos:
# Import pandas import pandas as pd # Read .csv file df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') # Print head of the control dataframe print(df_control.head())
En esta tabla, tenemos 4 columnas:
'Impresión'
- el número de visitas a la página del producto;
'Click'
- el número de transiciones a la página del producto;
Compra: número de compras del producto;
'Ganancia'
- beneficio de la venta del producto.
# Import pandas import pandas as pd # Read .csv file df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Print head of the test dataframe print(df_test.head())
Ahora vamos a calcular los estadísticos descriptivos y mostrarlos en la pantalla:
# Import pandas import pandas as pd # Read .csv files df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Calculate descriptive statistics using .agg method control_descriptive = df_control['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) test_descriptive = df_test['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) # Concat the results of aggregations result = pd.concat([control_descriptive, test_descriptive], axis=1) result.columns = ['Control', 'Test'] print(result)
Utilizamos el método .agg()
para calcular estadísticas descriptivas. Este método se denomina agregación. Las agregaciones son una forma de colapsar, resumir o agrupar datos.
Además, utilizamos el método .concat()
para mostrar convenientemente los resultados de la agregación en la pantalla.
**Los promedios parecen bastante cercanos. ¿O no?
¡Gracias por tus comentarios!