Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Estadística Descriptiva | Verificación de Normalidad
El Arte del A/B Testing
course content

Contenido del Curso

El Arte del A/B Testing

El Arte del A/B Testing

1. ¿Qué es la prueba A/B?
2. Verificación de Normalidad
3. Variaciones en las Pruebas A/B
4. Prueba T
5. U-Test

bookEstadística Descriptiva

Antes de pasar a la visualización de la distribución, conviene examinar las estadísticas descriptivas de cada parámetro del conjunto de datos.

Entre los parámetros clave que necesitamos están los siguientes:

  • Número de observaciones;
  • Valor medio;
  • Desviación típica;
  • Mediana;
  • Valor mínimo;
  • Valor máximo.

Manos a la obra. Tenemos los resultados de un experimento controlado para dos grupos de usuarios.

Las pruebas preliminares A/A mostraron que el experimento era adecuado. Vamos a mostrar nuestros archivos:

12345678
# Import pandas import pandas as pd # Read .csv file df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') # Print head of the control dataframe print(df_control.head())
copy

En esta tabla, tenemos 4 columnas:

'Impresión' - el número de visitas a la página del producto; 'Click' - el número de transiciones a la página del producto; Compra: número de compras del producto; 'Ganancia' - beneficio de la venta del producto.

12345678
# Import pandas import pandas as pd # Read .csv file df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Print head of the test dataframe print(df_test.head())
copy

Ahora vamos a calcular los estadísticos descriptivos y mostrarlos en la pantalla:

12345678910111213141516
# Import pandas import pandas as pd # Read .csv files df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Calculate descriptive statistics using .agg method control_descriptive = df_control['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) test_descriptive = df_test['Impression'].agg(['count', 'mean', 'std', 'median', 'min', 'max']).round(2) # Concat the results of aggregations result = pd.concat([control_descriptive, test_descriptive], axis=1) result.columns = ['Control', 'Test'] print(result)
copy

Utilizamos el método .agg() para calcular estadísticas descriptivas. Este método se denomina agregación. Las agregaciones son una forma de colapsar, resumir o agrupar datos. Además, utilizamos el método .concat() para mostrar convenientemente los resultados de la agregación en la pantalla.

**Los promedios parecen bastante cercanos. ¿O no?

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 2
some-alt