Parret T-test
Følgende funksjon utfører en paret t-test:
python
Denne prosessen ligner på den som brukes for uavhengige utvalg, men her trenger vi ikke å sjekke homogenitet av varians. Den parete t-testen forutsetter ikke at variansene er like.
Vær oppmerksom på at for en paret t-test er det avgjørende at utvalgsstørrelsene er like.
Med denne informasjonen kan du gå videre til oppgaven med å utføre en paret t-test.
Her har du data om antall nedlastinger for en bestemt app. Se på utvalgene: gjennomsnittsverdiene er nesten identiske.
import pandas as pd import matplotlib.pyplot as plt # Read the data before = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/before.csv').squeeze() after = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/after.csv').squeeze() # Plot histograms plt.hist(before, alpha=0.7) plt.hist(after, alpha=0.7) # Plot the means plt.axvline(before.mean(), color='blue', linestyle='dashed') plt.axvline(after.mean(), color='gold', linestyle='dashed')
Oppgave
Swipe to start coding
Hypoteser er etablert:
- H₀: Gjennomsnittlig antall nedlastinger før og etter endringene er det samme;
- Hₐ: Gjennomsnittlig antall nedlastinger er høyere etter endringene.
Utfør en paret t-test med dette alternative hypoteset, ved å bruke before
og after
som utvalg.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 6. Kapittel 8