Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Segunda prueba T | Prueba T
El Arte del A/B Testing

book
Desafío: Segunda prueba T

Tarea

Swipe to start coding

Su tarea consiste en realizar una prueba t. Recuerde que la distribución en la columna "Clic" tiene una distribución normal en ambos conjuntos de datos. Además, existe una diferencia estadísticamente significativa entre las varianzas. Ahora es el momento de averiguar si hay pruebas estadísticas de que las medias de las dos muestras son iguales.

Recuerde esto: Aquí no estamos haciendo la prueba T habitual, sino una modificación de la prueba T de Welch. Para muestras con diferentes varianzas, es necesario especificar un parámetro adicional equal_var=False en la función ttest_ind(). Esto conducirá al uso de una modificación de la prueba Welch T, que está diseñada para trabajar con muestras con diferentes varianzas.

    1. Calcule los valores medios.
    1. Realice una prueba T.

Solución

# Import libraries
import pandas as pd
from scipy.stats import ttest_ind

# Read .csv files
df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';')
df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';')

# Select only the 'Click' columns
data_control = df_control['Click']
data_test = df_test['Click']

# Calculate the mean values
print('The mean of control group = ', data_control.mean())
print('The mean of test group = ', data_test.mean())

# Do T-Test
statistic, p_value = ttest_ind(data_control, data_test, equal_var=False)

# Print the result of T-Test
print('Statistic:', statistic)
print('p-value:', p_value)

# Determine whether there is a statistically significant difference between the means of the two samples
if p_value > 0.05:
print('The means of the two groups are NOT statistically different')
else:
print('The means of the two groups are statistically different')
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 3
# Import libraries
import pandas as pd
from scipy.stats import ttest_ind

# Read .csv files
df_control = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_control.csv', delimiter=';')
df_test = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/c3b98ad3-420d-403f-908d-6ab8facc3e28/ab_test.csv', delimiter=';')

# Select only the 'Click' columns
data_control = df_control['Click']
data_test = df_test['Click']

# Calculate the mean values
print('The mean of control group = ', data_control.___)
print('The mean of test group = ', data_test.___)

# Do T-Test
statistic, p_value = ___(data_control, data_test, equal_var=False)

# Print the result of T-Test
print('Statistic:', statistic)
print('p-value:', p_value)

# Determine whether there is a statistically significant difference between the means of the two samples
if p_value > 0.05:
print('The means of the two groups are NOT statistically different')
else:
print('The means of the two groups are statistically different')
toggle bottom row
some-alt