Contenuti del Corso
Statistica con Python
Statistica con Python
Esecuzione di un t-test in Python
Per eseguire un t-test in Python, è sufficiente specificare l'ipotesi alternativa e indicare se le varianze sono approssimativamente uguali (omogenee).
La funzione ttest_ind()
all'interno di scipy.stats
gestisce il resto. Di seguito la sintassi:
python
Parametri:
a
— primo campione;b
— secondo campione;equal_var
— impostare suTrue
se le varianze sono approssimativamente uguali, suFalse
se non lo sono;alternative
— tipo di ipotesi alternativa:'two-sided'
— indica che le medie non sono uguali;'less'
— implica che la prima media è inferiore alla seconda;'greater'
— implica che la prima media è superiore alla seconda.
Valori restituiti:
statistic
— valore della statistica t;pvalue
— valore p.
L'attenzione è rivolta al p-value
. Se il p-value
è inferiore ad α (solitamente 0,05), la statistica t ricade nella regione critica, portando all'accettazione dell'ipotesi alternativa. Se il p-value
è superiore ad α, si accetta l'ipotesi nulla, indicando che le medie sono uguali.
Ecco un esempio di applicazione del t-test al dataset delle altezze:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Grazie per i tuoi commenti!