Utföra ett t-test
Ett företag vill avgöra om det finns en signifikant skillnad i produktivitetsnivåerna mellan utvecklare som arbetar hemifrån och de som arbetar på kontoret. Tur att du redan vet att ett t-test kan hjälpa till med detta.
Företaget har två oberoende utvecklarteam: ett arbetar på distans och det andra arbetar från kontoret. Du har fått två filer, 'work_from_home.csv'
och 'work_from_office.csv'
, som innehåller de månatliga antalen slutförda uppgifter för varje utvecklare.
Uppgiften är att genomföra ett t-test. Företaget vill veta om utvecklare som arbetar från kontoret är mer produktiva än de som arbetar hemifrån. Om så är fallet kommer de även att tvinga det andra teamet att arbeta från kontoret. Om hemarbetarna är mer produktiva kommer företaget inte att göra några förändringar. Den önskade alternativa hypotesen är därför "Medelproduktiviteten för kontorsarbetare är högre än för hemarbetare".
Låt oss kontrollera om varianserna är desamma:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Den andra standardavvikelsen är dubbelt så stor som den första, så varianserna skiljer sig åt.
Kom ihåg funktionen ttest_ind
för att utföra ett t-test.
python
Swipe to start coding
- Importera
scipy.stats
med aliasetst
. - Utför ett t-test med följande inställningar:
- Urval:
home_workers
,office_workers
; - Alternativ hypotes: office > home;
- Ingen homogenitet av varians.
- Urval:
Lösning
Tack för dina kommentarer!