Contenido del Curso
Aprendiendo Estadística con Python
Aprendiendo Estadística con Python
Realización de una Prueba t en Python
Para realizar una prueba t en Python, solo es necesario especificar la hipótesis alternativa e indicar si las varianzas son aproximadamente iguales (homocedasticidad).
La función ttest_ind()
dentro de scipy.stats
se encarga del resto. A continuación se muestra la sintaxis:
python
Parámetros:
a
— primera muestra;b
— segunda muestra;equal_var
— establecer enTrue
si las varianzas son aproximadamente iguales, y enFalse
si no lo son;alternative
— tipo de hipótesis alternativa:'two-sided'
— indica que las medias no son iguales;'less'
— implica que la primera media es menor que la segunda;'greater'
— implica que la primera media es mayor que la segunda.
Valores de retorno:
statistic
— valor del estadístico t;pvalue
— valor p.
El enfoque principal está en el p-value
. Si el p-value
es menor que α (usualmente 0.05), el estadístico t cae dentro de la región crítica, lo que lleva a aceptar la hipótesis alternativa. Si el p-value
es mayor que α, se acepta la hipótesis nula, lo que indica que las medias son iguales.
A continuación se muestra un ejemplo de aplicación de la prueba t al conjunto de datos de alturas:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
¡Gracias por tus comentarios!