Contenido del Curso
El Arte del A/B Testing
El Arte del A/B Testing
La Primera Prueba U-Test
La prueba U, también conocida como prueba Mann-Whitney, es una prueba estadística no paramétrica utilizada para comparar dos muestras independientes. Se utiliza cuando los datos no cumplen los supuestos de las pruebas paramétricas, como cuando la distribución de los datos no es normal o cuando los datos se miden en una escala ordinal.
La prueba U evalúa si existe una diferencia estadísticamente significativa entre las medianas de los dos grupos. No se basa en ninguna suposición previa sobre la distribución de los datos y es relativamente robusta frente a valores atípicos o inusuales. Veamos cómo funciona la prueba U para nuestras muestras. Formulemos las hipótesis:
H₀: Las medianas de la métrica 'Conversión'
en los grupos de control y de prueba son iguales.
Hₐ: Las medianas de la métrica 'Conversión'
difieren entre los grupos de control y de prueba.
# Import libraries import pandas as pd from scipy.stats import mannwhitneyu # Read .csv files df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';') df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';') # Define the metric df_test['Conversion'] = df_test['Purchase'] / df_test['Click'] df_control['Conversion'] = df_control['Purchase'] / df_control['Click'] # U-Test statistic, p_value = mannwhitneyu(df_control['Conversion'], df_test['Conversion']) # Result of the U-Test print('Statistic:', statistic) print('p-value:', p_value)
El valor estadístico obtenido y el bajo valor p indican una diferencia estadísticamente significativa entre las medianas de la métrica "Conversión" en los grupos de control y de prueba. Tenemos pruebas suficientes para rechazar la hipótesis nula y aceptar la hipótesis alternativa de que las medianas difieren.
Esto significa que existen diferencias estadísticamente significativas en la métrica "Conversión" entre los grupos de control y de prueba.
Según el gráfico de cajas, podemos concluir que la mediana de la métrica "Conversión" en el grupo de prueba es superior a la mediana en el grupo de control.
Ahora te toca a ti realizar la prueba U.
¡Gracias por tus comentarios!