Conteúdo do Curso
Aprendendo Estatística com Python
Aprendendo Estatística com Python
Realização de um Teste t em Python
Para realizar um teste t no Python, basta especificar a hipótese alternativa e indicar se as variâncias são aproximadamente iguais (homogêneas).
A função ttest_ind()
do módulo scipy.stats
executa o restante do procedimento. Veja abaixo a sintaxe:
python
Parâmetros:
a
— primeira amostra;b
— segunda amostra;equal_var
— defina comoTrue
se as variâncias forem aproximadamente iguais, eFalse
caso não sejam;alternative
— tipo de hipótese alternativa:'two-sided'
— indica que as médias não são iguais;'less'
— implica que a primeira média é menor que a segunda;'greater'
— implica que a primeira média é maior que a segunda.
Valores de retorno:
statistic
— valor da estatística t;pvalue
— valor-p.
A atenção deve ser dada ao p-value
. Se o p-value
for menor que α (geralmente 0,05), a estatística t está dentro da região crítica, levando à aceitação da hipótese alternativa. Se o p-value
for maior que α, aceita-se a hipótese nula, indicando que as médias são iguais.
Veja um exemplo de aplicação do teste t ao conjunto de dados de alturas:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Obrigado pelo seu feedback!