Parret T-test
Følgende funktion udfører en parret t-test:
python
Denne proces ligner den, der anvendes for uafhængige stikprøver, men her behøver vi ikke at kontrollere homogenitet af varians. Den parrede t-test forudsætter ikke, at varianserne er ens.
Bemærk, at for en parret t-test er det afgørende, at stikprøvestørrelserne er ens.
Med denne information i baghovedet kan du gå videre til opgaven med at udføre en parret t-test.
Her har du data vedrørende antallet af downloads for en bestemt app. Se på stikprøverne: gennemsnitsværdierne er næsten identiske.
import pandas as pd import matplotlib.pyplot as plt # Read the data before = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/before.csv').squeeze() after = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/after.csv').squeeze() # Plot histograms plt.hist(before, alpha=0.7) plt.hist(after, alpha=0.7) # Plot the means plt.axvline(before.mean(), color='blue', linestyle='dashed') plt.axvline(after.mean(), color='gold', linestyle='dashed')
Opgave
Swipe to start coding
Hypoteser opstilles:
- H₀: Det gennemsnitlige antal downloads før og efter ændringerne er det samme;
- Hₐ: Det gennemsnitlige antal downloads er større efter ændringerne.
Udfør en parret t-test med denne alternative hypotese, hvor before
og after
bruges som prøver.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 6. Kapitel 8