Зміст курсу
Вивчення Статистики з Python
Вивчення Статистики з Python
Виконання t-Тесту в Python
Щоб провести t-тест у Python, потрібно лише вказати альтернативну гіпотезу та зазначити, чи є дисперсії приблизно однаковими (гомогенними).
Функція ttest_ind()
з модуля scipy.stats
виконує решту. Нижче наведено синтаксис:
python
Параметри:
a
— перша вибірка;b
— друга вибірка;equal_var
— встановітьTrue
, якщо дисперсії приблизно однакові, іFalse
, якщо ні;alternative
— тип альтернативної гіпотези:'two-sided'
— означає, що середні значення не рівні;'less'
— означає, що перше середнє менше за друге;'greater'
— означає, що перше середнє більше за друге.
Повертає:
statistic
— значення t-статистики;pvalue
— p-значення.
Основна увага приділяється p-value
. Якщо p-value
менше за α (зазвичай 0.05), t-статистика потрапляє у критичну область, що призводить до прийняття альтернативної гіпотези. Якщо p-value
більше за α, приймається нульова гіпотеза, що вказує на рівність середніх значень.
Нижче наведено приклад застосування t-тесту до набору даних із зростом:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Дякуємо за ваш відгук!