Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utføre en t-test | Statistisk Testing
Lære Statistikk med Python

bookUtføre en t-test

Et selskap ønsker å finne ut om det er en signifikant forskjell i produktivitetsnivået til utviklere som jobber hjemmefra sammenlignet med de som jobber på kontoret. Heldigvis vet du allerede at en t-test kan hjelpe med dette.

Selskapet har to uavhengige utviklerteam: ett jobber eksternt, og det andre jobber fra kontoret. Du har fått to filer, 'work_from_home.csv' og 'work_from_office.csv', som inneholder månedlige antall fullførte oppgaver for hver utvikler.

Oppgaven er å gjennomføre en t-test. Selskapet ønsker å vite om utviklere som jobber fra kontoret er mer produktive enn de som jobber hjemmefra. Hvis det er tilfelle, vil de også tvinge det andre teamet til å jobbe fra kontoret. Dersom hjemmearbeidere er mer produktive, vil selskapet ikke gjøre noen endringer. Den ønskede alternative hypotesen er derfor: "Gjennomsnittlig produktivitet for kontorarbeidere er høyere enn for hjemmearbeidere".

Sjekk om variansene er like:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Den andre standardavviket er dobbelt så stort som det første, så variansene er forskjellige. Husk funksjonen ttest_ind for å utføre en t-test.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Oppgave

Swipe to start coding

Du sammenligner produktiviteten til ansatte som jobber hjemmefra og på kontoret. Målet ditt er å avgjøre om kontoransatte har høyere gjennomsnittlig produktivitet enn hjemmearbeidere ved å bruke en t-test for uavhengige utvalg.

  1. Importer scipy.stats-biblioteket med aliaset st.
  2. Bruk funksjonen st.ttest_ind() for å gjennomføre t-testen med følgende oppsett:
  • Utvalg: office_workers, home_workers.
  • Alternativ hypotese: office > home.
  • Variansene er ikke like (equal_var=False).
  1. Lagre resultatene i variablene tstat og pvalue.
  2. Basert på pvalue, skriv ut en av følgende meldinger:
  • "We support the null hypothesis, the mean values are equal" hvis pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" ellers.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 6. Kapittel 7
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 2.63

bookUtføre en t-test

Sveip for å vise menyen

Et selskap ønsker å finne ut om det er en signifikant forskjell i produktivitetsnivået til utviklere som jobber hjemmefra sammenlignet med de som jobber på kontoret. Heldigvis vet du allerede at en t-test kan hjelpe med dette.

Selskapet har to uavhengige utviklerteam: ett jobber eksternt, og det andre jobber fra kontoret. Du har fått to filer, 'work_from_home.csv' og 'work_from_office.csv', som inneholder månedlige antall fullførte oppgaver for hver utvikler.

Oppgaven er å gjennomføre en t-test. Selskapet ønsker å vite om utviklere som jobber fra kontoret er mer produktive enn de som jobber hjemmefra. Hvis det er tilfelle, vil de også tvinge det andre teamet til å jobbe fra kontoret. Dersom hjemmearbeidere er mer produktive, vil selskapet ikke gjøre noen endringer. Den ønskede alternative hypotesen er derfor: "Gjennomsnittlig produktivitet for kontorarbeidere er høyere enn for hjemmearbeidere".

Sjekk om variansene er like:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Den andre standardavviket er dobbelt så stort som det første, så variansene er forskjellige. Husk funksjonen ttest_ind for å utføre en t-test.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Oppgave

Swipe to start coding

Du sammenligner produktiviteten til ansatte som jobber hjemmefra og på kontoret. Målet ditt er å avgjøre om kontoransatte har høyere gjennomsnittlig produktivitet enn hjemmearbeidere ved å bruke en t-test for uavhengige utvalg.

  1. Importer scipy.stats-biblioteket med aliaset st.
  2. Bruk funksjonen st.ttest_ind() for å gjennomføre t-testen med følgende oppsett:
  • Utvalg: office_workers, home_workers.
  • Alternativ hypotese: office > home.
  • Variansene er ikke like (equal_var=False).
  1. Lagre resultatene i variablene tstat og pvalue.
  2. Basert på pvalue, skriv ut en av følgende meldinger:
  • "We support the null hypothesis, the mean values are equal" hvis pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" ellers.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 6. Kapittel 7
single

single

some-alt