Cursusinhoud
Statistiek Leren Met Python
Statistiek Leren Met Python
Het Uitvoeren van een T-toets in Python
Om een t-toets uit te voeren in Python, hoeft u alleen de alternatieve hypothese te specificeren en aan te geven of de varianties ongeveer gelijk zijn (homogeen).
De functie ttest_ind()
binnen scipy.stats
verzorgt de rest. Hieronder staat de syntaxis:
python
Parameters:
a
— de eerste steekproef;b
— de tweede steekproef;equal_var
— stel in opTrue
als de varianties ongeveer gelijk zijn, en opFalse
als dat niet zo is;alternative
— het type alternatieve hypothese:'two-sided'
— geeft aan dat de gemiddelden niet gelijk zijn;'less'
— impliceert dat het eerste gemiddelde kleiner is dan het tweede;'greater'
— impliceert dat het eerste gemiddelde groter is dan het tweede.
Returnwaarden:
statistic
— de waarde van de t-statistiek;pvalue
— de p-waarde.
De nadruk ligt op de p-value
. Als de p-value
lager is dan α (meestal 0,05), valt de t-statistiek binnen het kritieke gebied, wat leidt tot acceptatie van de alternatieve hypothese. Als de p-value
groter is dan α, wordt de nulhypothese geaccepteerd, wat aangeeft dat de gemiddelden gelijk zijn.
Hier volgt een voorbeeld van het toepassen van de t-toets op de hoogtedataset:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Bedankt voor je feedback!