Summary  
This chapter covers how to perform an independent two-sample t-test, including checking variance equality, specifying a one-sided alternative hypothesis, and using the `ttest_ind` function to compare means.  

General domain of usage  
Employee productivity comparison

Una empresa desea determinar si existe una diferencia significativa en los niveles de productividad de los desarrolladores que trabajan desde casa frente a aquellos que trabajan en la oficina. Por suerte, ya sabes que una prueba t puede ayudar con esto.

La empresa cuenta con dos equipos de desarrolladores independientes: uno trabaja de forma remota y el otro desde la oficina. Se te han proporcionado dos archivos, `'work_from_home.csv'` y `'work_from_office.csv'`, que contienen los recuentos mensuales de tareas completadas por cada desarrollador.

La tarea consiste en realizar una prueba t. La empresa desea saber si los desarrolladores que trabajan en la oficina son más productivos que los que trabajan desde casa. En caso afirmativo, también obligarán al segundo equipo a trabajar desde la oficina. Si los trabajadores desde casa resultan ser más productivos, la empresa no realizará cambios. Por lo tanto, la hipótesis alternativa deseada es "La productividad media de los trabajadores de oficina es mayor que la de los trabajadores desde casa".

import pandas as pd

home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze()
office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze()
# Printing sample standard deviations
print('Home workers std:', home_workers.std())
print('Office workers std:', office_workers.std())

La segunda desviación estándar es el doble de la primera, por lo que las varianzas difieren.
Recordar la función `ttest_ind` para realizar una prueba t.
```python
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
```

import unittest
import pandas as pd
import scipy.stats as st

def _dynamic_test(test_case, condition, success_msg, failure_msg):
    if condition:
        test_case._testMethodName = success_msg
        test_case.assertTrue(True, success_msg)
    else:
        test_case._testMethodName = failure_msg
        test_case.fail(failure_msg)


class TestImport(unittest.TestCase):
    def test_import_alias(self):
        import user_code
        condition = hasattr(user_code, 'st') and user_code.st is st
        _dynamic_test(
            self,
            condition,
            "The scipy.stats library is correctly imported with the alias 'st'.",
            "The scipy.stats library is not imported correctly with the alias 'st'."
        )


class TestTTest(unittest.TestCase):
    def test_ttest_parameters(self):
        import user_code

        home_workers = pd.read_csv(
            'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv'
        ).squeeze()

        office_workers = pd.read_csv(
            'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv'
        ).squeeze()

        expected_tstat, expected_pvalue = st.ttest_ind(
            office_workers,
            home_workers,
            equal_var=False,
            alternative='greater'
        )

        condition = (
            abs(user_code.tstat - expected_tstat) < 1e-6
            and abs(user_code.pvalue - expected_pvalue) < 1e-6
        )

        _dynamic_test(
            self,
            condition,
            "The t-test is applied correctly with the given parameters.",
            "The t-test is not applied correctly. Check your function arguments."
        )


class TestTTestResult(unittest.TestCase):
    def test_hypothesis_decision(self):
        import user_code

        # ÐÑÑÐºÑÐ²Ð°Ð½Ðµ Ð¿Ð¾Ð²ÑÐ´Ð¾Ð¼Ð»ÐµÐ½Ð½Ñ Ð·Ð°Ð»ÐµÐ¶Ð½Ð¾ Ð²ÑÐ´ pvalue
        if user_code.pvalue > 0.05:
            expected_message = "We support the null hypothesis, the mean values are equal"
        else:
            expected_message = "We reject the null hypothesis, the mean values are different"

        # Ð¢ÐµÑÑ Ð¿ÑÐ¾ÑÑÐ¾ Ð¿ÐµÑÐµÐ²ÑÑÑÑ Ð»Ð¾Ð³ÑÐºÑ ÑÐ¼Ð¾Ð²Ð½Ð¾Ð³Ð¾ Ð±Ð»Ð¾ÐºÑ
        condition = expected_message is not None

        _dynamic_test(
            self,
            condition,
            "The hypothesis decision logic is implemented correctly.",
            "The hypothesis decision logic is incorrect."
        )


if __name__ == "__main__":
    unittest.main()


test_code.py

Construya una base sólida en estadística utilizando Python. Aprenda conceptos estadísticos esenciales y aplíquelos a través de NumPy y pandas. Avance desde medidas básicas como la media y la varianza hasta pruebas de hipótesis, intervalos de confianza y obtención de conclusiones basadas en datos mediante práctica práctica.

Descubra los principios estadísticos fundamentales, incluidos los tipos de datos, las medidas de tendencia central y las diferencias clave entre muestras y poblaciones.

Aprenda a calcular e interpretar la media, mediana y moda utilizando Python. Practique estas operaciones con pandas para analizar conjuntos de datos reales.

Comprender cómo la varianza y la desviación estándar miden la dispersión de los datos. Aprender a calcular ambas manualmente y utilizando herramientas de Python.

Explora cómo la covarianza y la correlación describen las relaciones entre variables. Practica el cálculo y la comparación de ambas métricas en Python.

Domina los intervalos de confianza para estimar parámetros poblacionales. Utiliza NumPy, pandas y bibliotecas de visualización para calcular e interpretar intervalos con datos reales.

Aprenda los fundamentos de las pruebas de hipótesis y la prueba t. Comprenda cómo diseñar, realizar e interpretar pruebas utilizando Python para respaldar decisiones basadas en datos.

Realizar una Prueba T

Solución