Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Realización de una Prueba t en Python | Pruebas Estadísticas
Aprendiendo Estadística con Python
course content

Contenido del Curso

Aprendiendo Estadística con Python

Aprendiendo Estadística con Python

1. Conceptos Básicos
2. Media, Mediana y Moda con Python
3. Varianza y Desviación Estándar
4. Covarianza vs Correlación
5. Intervalo de Confianza
6. Pruebas Estadísticas

book
Realización de una Prueba t en Python

Para realizar una prueba t en Python, solo es necesario especificar la hipótesis alternativa e indicar si las varianzas son aproximadamente iguales (homocedasticidad).

La función ttest_ind() dentro de scipy.stats se encarga del resto. A continuación se muestra la sintaxis:

python

Parámetros:

  • a — primera muestra;

  • b — segunda muestra;

  • equal_var — establecer en True si las varianzas son aproximadamente iguales, y en False si no lo son;

  • alternative — tipo de hipótesis alternativa:

    • 'two-sided' — indica que las medias no son iguales;

    • 'less' — implica que la primera media es menor que la segunda;

    • 'greater' — implica que la primera media es mayor que la segunda.

Valores de retorno:

  • statistic — valor del estadístico t;

  • pvalue — valor p.

El enfoque principal está en el p-value. Si el p-value es menor que α (usualmente 0.05), el estadístico t cae dentro de la región crítica, lo que lleva a aceptar la hipótesis alternativa. Si el p-value es mayor que α, se acepta la hipótesis nula, lo que indica que las medias son iguales.

A continuación se muestra un ejemplo de aplicación de la prueba t al conjunto de datos de alturas:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 6. Capítulo 6

Pregunte a AI

expand
ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

course content

Contenido del Curso

Aprendiendo Estadística con Python

Aprendiendo Estadística con Python

1. Conceptos Básicos
2. Media, Mediana y Moda con Python
3. Varianza y Desviación Estándar
4. Covarianza vs Correlación
5. Intervalo de Confianza
6. Pruebas Estadísticas

book
Realización de una Prueba t en Python

Para realizar una prueba t en Python, solo es necesario especificar la hipótesis alternativa e indicar si las varianzas son aproximadamente iguales (homocedasticidad).

La función ttest_ind() dentro de scipy.stats se encarga del resto. A continuación se muestra la sintaxis:

python

Parámetros:

  • a — primera muestra;

  • b — segunda muestra;

  • equal_var — establecer en True si las varianzas son aproximadamente iguales, y en False si no lo son;

  • alternative — tipo de hipótesis alternativa:

    • 'two-sided' — indica que las medias no son iguales;

    • 'less' — implica que la primera media es menor que la segunda;

    • 'greater' — implica que la primera media es mayor que la segunda.

Valores de retorno:

  • statistic — valor del estadístico t;

  • pvalue — valor p.

El enfoque principal está en el p-value. Si el p-value es menor que α (usualmente 0.05), el estadístico t cae dentro de la región crítica, lo que lleva a aceptar la hipótesis alternativa. Si el p-value es mayor que α, se acepta la hipótesis nula, lo que indica que las medias son iguales.

A continuación se muestra un ejemplo de aplicación de la prueba t al conjunto de datos de alturas:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 6. Capítulo 6
Lamentamos que algo salió mal. ¿Qué pasó?
some-alt