Utføre en t-test
Et selskap ønsker å finne ut om det er en signifikant forskjell i produktivitetsnivået til utviklere som jobber hjemmefra sammenlignet med de som jobber på kontoret. Heldigvis vet du allerede at en t-test kan hjelpe med dette.
Selskapet har to uavhengige utviklerteam: ett jobber eksternt, og det andre jobber fra kontoret. Du har fått to filer, 'work_from_home.csv'
og 'work_from_office.csv'
, som inneholder månedlige antall fullførte oppgaver for hver utvikler.
Oppgaven er å gjennomføre en t-test. Selskapet ønsker å vite om utviklere som jobber fra kontoret er mer produktive enn de som jobber hjemmefra. Hvis det er tilfelle, vil de også tvinge det andre teamet til å jobbe fra kontoret. Dersom hjemmearbeidere er mer produktive, vil selskapet ikke gjøre noen endringer. Den ønskede alternative hypotesen er derfor: "Gjennomsnittlig produktivitet for kontorarbeidere er høyere enn for hjemmearbeidere".
Sjekk om variansene er like:
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Den andre standardavviket er dobbelt så stort som det første, så variansene er forskjellige.
Husk funksjonen ttest_ind
for å utføre en t-test.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Du sammenligner produktiviteten til ansatte som jobber hjemmefra og på kontoret. Målet ditt er å avgjøre om kontoransatte har høyere gjennomsnittlig produktivitet enn hjemmearbeidere ved å bruke en t-test for uavhengige utvalg.
- Importer
scipy.stats
-biblioteket med aliasetst
. - Bruk funksjonen
st.ttest_ind()
for å gjennomføre t-testen med følgende oppsett:
- Utvalg:
office_workers
,home_workers
. - Alternativ hypotese: office > home.
- Variansene er ikke like (
equal_var=False
).
- Lagre resultatene i variablene
tstat
ogpvalue
. - Basert på
pvalue
, skriv ut en av følgende meldinger:
"We support the null hypothesis, the mean values are equal"
hvispvalue > 0.05
."We reject the null hypothesis, the mean values are different"
ellers.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 2.63
Utføre en t-test
Sveip for å vise menyen
Et selskap ønsker å finne ut om det er en signifikant forskjell i produktivitetsnivået til utviklere som jobber hjemmefra sammenlignet med de som jobber på kontoret. Heldigvis vet du allerede at en t-test kan hjelpe med dette.
Selskapet har to uavhengige utviklerteam: ett jobber eksternt, og det andre jobber fra kontoret. Du har fått to filer, 'work_from_home.csv'
og 'work_from_office.csv'
, som inneholder månedlige antall fullførte oppgaver for hver utvikler.
Oppgaven er å gjennomføre en t-test. Selskapet ønsker å vite om utviklere som jobber fra kontoret er mer produktive enn de som jobber hjemmefra. Hvis det er tilfelle, vil de også tvinge det andre teamet til å jobbe fra kontoret. Dersom hjemmearbeidere er mer produktive, vil selskapet ikke gjøre noen endringer. Den ønskede alternative hypotesen er derfor: "Gjennomsnittlig produktivitet for kontorarbeidere er høyere enn for hjemmearbeidere".
Sjekk om variansene er like:
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Den andre standardavviket er dobbelt så stort som det første, så variansene er forskjellige.
Husk funksjonen ttest_ind
for å utføre en t-test.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Du sammenligner produktiviteten til ansatte som jobber hjemmefra og på kontoret. Målet ditt er å avgjøre om kontoransatte har høyere gjennomsnittlig produktivitet enn hjemmearbeidere ved å bruke en t-test for uavhengige utvalg.
- Importer
scipy.stats
-biblioteket med aliasetst
. - Bruk funksjonen
st.ttest_ind()
for å gjennomføre t-testen med følgende oppsett:
- Utvalg:
office_workers
,home_workers
. - Alternativ hypotese: office > home.
- Variansene er ikke like (
equal_var=False
).
- Lagre resultatene i variablene
tstat
ogpvalue
. - Basert på
pvalue
, skriv ut en av følgende meldinger:
"We support the null hypothesis, the mean values are equal"
hvispvalue > 0.05
."We reject the null hypothesis, the mean values are different"
ellers.
Løsning
Takk for tilbakemeldingene dine!
single