Contenido del Curso

Aprendiendo Estadística con Python

1. Conceptos Básicos

Muestra vs Población Tipos de Estadística Tipos de Datos Valor Medio Valor Mediano Valor Mediano de un Número Par de Valores Media o Mediana Valor Modal Cuestionario de Estadística Descriptiva

2. Media, Mediana y Moda con Python

Examinar el Conjunto de Datos Cálculo de Valores de Media y Mediana con Python Estadísticas con Pandas Calcular la Media y la Mediana Salarial

3. Varianza y Desviación Estándar

Varianza Poblacional Varianza Muestral Calcular la Varianza con Python Desviación Estándar Desviación Estándar con Python Cálculo de la Varianza y la Desviación Estándar

4. Covarianza vs Correlación

Covarianza Correlación Cuestionario de Covarianza y Correlación Calcular Covarianza y Correlación

5. Intervalo de Confianza

Explorar el Conjunto de Datos Intervalo de Confianza Cálculo del Intervalo de Confianza con Python Cuestionario Sobre el Ancho del Intervalo de Confianza Calcular Intervalo de Confianza del 95%Cálculo Avanzado de Intervalos de Confianza con Python Emparejar las Funciones

6. Pruebas Estadísticas

Qué es la Prueba t Hipótesis T-test Matemáticamente Prueba Unilateral y Prueba Bilateral Supuestos del T-Test Realización de una Prueba t en Python Realizar una Prueba T T de Student Pareada

Realización de una Prueba t en Python

Para realizar una prueba t en Python, solo es necesario especificar la hipótesis alternativa e indicar si las varianzas son aproximadamente iguales (homocedasticidad).

La función ttest_ind() dentro de scipy.stats se encarga del resto. A continuación se muestra la sintaxis:

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')

Parámetros:

a — primera muestra;
b — segunda muestra;
equal_var — establecer en True si las varianzas son aproximadamente iguales, y en False si no lo son;
alternative — tipo de hipótesis alternativa:
- 'two-sided' — indica que las medias no son iguales;
- 'less' — implica que la primera media es menor que la segunda;
- 'greater' — implica que la primera media es mayor que la segunda.

Valores de retorno:

statistic — valor del estadístico t;
pvalue — valor p.

El enfoque principal está en el p-value. Si el p-value es menor que α (usualmente 0.05), el estadístico t cae dentro de la región crítica, lo que lleva a aceptar la hipótesis alternativa. Si el p-value es mayor que α, se acepta la hipótesis nula, lo que indica que las medias son iguales.

A continuación se muestra un ejemplo de aplicación de la prueba t al conjunto de datos de alturas:


              123456789101112131415
            
import pandas as pd
import scipy.stats as st

# Load the data
male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze()
female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze()

# Apply t-test
t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater")

if pvalue > 0.05:
# Check if we should support or not the null hypothesis if pvalue > 0.05:
    print("We support the null hypothesis, the mean values are equal")
else:
    print("We reject the null hypothesis, males are taller")

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 6. Capítulo 6

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla