Parat t-test
Följande funktion utför ett parat t-test:
python
Denna process liknar den som används för oberoende urval, men här behöver vi inte kontrollera homogenitet av varians. Det parata t-testet förutsätter uttryckligen inte att varianserna är lika.
Observera att för ett parat t-test är det avgörande att stickprovsstorlekarna är lika.
Med denna information i åtanke kan du gå vidare till uppgiften att utföra ett parat t-test.
Här har du data om antalet nedladdningar för en viss app. Titta på urvalen: medelvärdena är nästan identiska.
import pandas as pd import matplotlib.pyplot as plt # Read the data before = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/before.csv').squeeze() after = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/after.csv').squeeze() # Plot histograms plt.hist(before, alpha=0.7) plt.hist(after, alpha=0.7) # Plot the means plt.axvline(before.mean(), color='blue', linestyle='dashed') plt.axvline(after.mean(), color='gold', linestyle='dashed')
Uppgift
Swipe to start coding
Hypoteser fastställs:
- H₀: Det genomsnittliga antalet nedladdningar före och efter ändringarna är detsamma;
- Hₐ: Det genomsnittliga antalet nedladdningar är högre efter modifieringarna.
Utför ett parat t-test med detta alternativa hypotes, använd before
och after
som urval.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 6. Kapitel 8