Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Durchführung Eines T-Tests in Python | Statistische Tests
Statistik Lernen mit Python
course content

Kursinhalt

Statistik Lernen mit Python

Statistik Lernen mit Python

1. Grundlagen
2. Mittelwert, Median und Modus mit Python
3. Varianz und Standardabweichung
4. Kovarianz vs. Korrelation
5. Konfidenzintervall
6. Statistische Tests

book
Durchführung Eines T-Tests in Python

Um einen t-Test in Python durchzuführen, müssen lediglich die Alternativhypothese angegeben und festgelegt werden, ob die Varianzen ungefähr gleich (homogen) sind.

Die Funktion ttest_ind() aus scipy.stats übernimmt den Rest. Nachfolgend die Syntax:

python

Parameter:

  • a — die erste Stichprobe;

  • b — die zweite Stichprobe;

  • equal_var — auf True setzen, wenn die Varianzen ungefähr gleich sind, und auf False, wenn sie es nicht sind;

  • alternative — Art der Alternativhypothese:

    • 'two-sided' — zeigt an, dass die Mittelwerte ungleich sind;

    • 'less' — impliziert, dass der erste Mittelwert kleiner als der zweite ist;

    • 'greater' — impliziert, dass der erste Mittelwert größer als der zweite ist.

Rückgabewerte:

  • statistic — Wert der t-Statistik;

  • pvalue — p-Wert.

Der Fokus liegt auf dem p-value. Ist der p-value kleiner als α (in der Regel 0,05), fällt die t-Statistik in den kritischen Bereich, was zur Annahme der Alternativhypothese führt. Ist der p-value größer als α, wird die Nullhypothese angenommen, was darauf hinweist, dass die Mittelwerte gleich sind.

Hier ein Beispiel für die Anwendung des t-Tests auf den Datensatz mit Körpergrößen:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 6. Kapitel 6

Fragen Sie AI

expand
ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

course content

Kursinhalt

Statistik Lernen mit Python

Statistik Lernen mit Python

1. Grundlagen
2. Mittelwert, Median und Modus mit Python
3. Varianz und Standardabweichung
4. Kovarianz vs. Korrelation
5. Konfidenzintervall
6. Statistische Tests

book
Durchführung Eines T-Tests in Python

Um einen t-Test in Python durchzuführen, müssen lediglich die Alternativhypothese angegeben und festgelegt werden, ob die Varianzen ungefähr gleich (homogen) sind.

Die Funktion ttest_ind() aus scipy.stats übernimmt den Rest. Nachfolgend die Syntax:

python

Parameter:

  • a — die erste Stichprobe;

  • b — die zweite Stichprobe;

  • equal_var — auf True setzen, wenn die Varianzen ungefähr gleich sind, und auf False, wenn sie es nicht sind;

  • alternative — Art der Alternativhypothese:

    • 'two-sided' — zeigt an, dass die Mittelwerte ungleich sind;

    • 'less' — impliziert, dass der erste Mittelwert kleiner als der zweite ist;

    • 'greater' — impliziert, dass der erste Mittelwert größer als der zweite ist.

Rückgabewerte:

  • statistic — Wert der t-Statistik;

  • pvalue — p-Wert.

Der Fokus liegt auf dem p-value. Ist der p-value kleiner als α (in der Regel 0,05), fällt die t-Statistik in den kritischen Bereich, was zur Annahme der Alternativhypothese führt. Ist der p-value größer als α, wird die Nullhypothese angenommen, was darauf hinweist, dass die Mittelwerte gleich sind.

Hier ein Beispiel für die Anwendung des t-Tests auf den Datensatz mit Körpergrößen:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 6. Kapitel 6
Wir sind enttäuscht, dass etwas schief gelaufen ist. Was ist passiert?
some-alt