Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Het Uitvoeren van een T-toets in Python | Statistische Toetsing
Statistiek Leren Met Python
course content

Cursusinhoud

Statistiek Leren Met Python

Statistiek Leren Met Python

1. Basisconcepten
2. Gemiddelde, Mediaan en Modus met Python
3. Variantie en Standaarddeviatie
4. Covariantie Versus Correlatie
5. Betrouwbaarheidsinterval
6. Statistische Toetsing

book
Het Uitvoeren van een T-toets in Python

Om een t-toets uit te voeren in Python, hoeft u alleen de alternatieve hypothese te specificeren en aan te geven of de varianties ongeveer gelijk zijn (homogeen).

De functie ttest_ind() binnen scipy.stats verzorgt de rest. Hieronder staat de syntaxis:

python

Parameters:

  • a — de eerste steekproef;

  • b — de tweede steekproef;

  • equal_var — stel in op True als de varianties ongeveer gelijk zijn, en op False als dat niet zo is;

  • alternative — het type alternatieve hypothese:

    • 'two-sided' — geeft aan dat de gemiddelden niet gelijk zijn;

    • 'less' — impliceert dat het eerste gemiddelde kleiner is dan het tweede;

    • 'greater' — impliceert dat het eerste gemiddelde groter is dan het tweede.

Returnwaarden:

  • statistic — de waarde van de t-statistiek;

  • pvalue — de p-waarde.

De nadruk ligt op de p-value. Als de p-value lager is dan α (meestal 0,05), valt de t-statistiek binnen het kritieke gebied, wat leidt tot acceptatie van de alternatieve hypothese. Als de p-value groter is dan α, wordt de nulhypothese geaccepteerd, wat aangeeft dat de gemiddelden gelijk zijn.

Hier volgt een voorbeeld van het toepassen van de t-toets op de hoogtedataset:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 6. Hoofdstuk 6

Vraag AI

expand
ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

course content

Cursusinhoud

Statistiek Leren Met Python

Statistiek Leren Met Python

1. Basisconcepten
2. Gemiddelde, Mediaan en Modus met Python
3. Variantie en Standaarddeviatie
4. Covariantie Versus Correlatie
5. Betrouwbaarheidsinterval
6. Statistische Toetsing

book
Het Uitvoeren van een T-toets in Python

Om een t-toets uit te voeren in Python, hoeft u alleen de alternatieve hypothese te specificeren en aan te geven of de varianties ongeveer gelijk zijn (homogeen).

De functie ttest_ind() binnen scipy.stats verzorgt de rest. Hieronder staat de syntaxis:

python

Parameters:

  • a — de eerste steekproef;

  • b — de tweede steekproef;

  • equal_var — stel in op True als de varianties ongeveer gelijk zijn, en op False als dat niet zo is;

  • alternative — het type alternatieve hypothese:

    • 'two-sided' — geeft aan dat de gemiddelden niet gelijk zijn;

    • 'less' — impliceert dat het eerste gemiddelde kleiner is dan het tweede;

    • 'greater' — impliceert dat het eerste gemiddelde groter is dan het tweede.

Returnwaarden:

  • statistic — de waarde van de t-statistiek;

  • pvalue — de p-waarde.

De nadruk ligt op de p-value. Als de p-value lager is dan α (meestal 0,05), valt de t-statistiek binnen het kritieke gebied, wat leidt tot acceptatie van de alternatieve hypothese. Als de p-value groter is dan α, wordt de nulhypothese geaccepteerd, wat aangeeft dat de gemiddelden gelijk zijn.

Hier volgt een voorbeeld van het toepassen van de t-toets op de hoogtedataset:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 6. Hoofdstuk 6
Onze excuses dat er iets mis is gegaan. Wat is er gebeurd?
some-alt