Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio 3: Teste de Hipóteses | Estatísticas
Desafio de Entrevista em Ciência de Dados

Deslize para mostrar o menu

book
Desafio 3: Teste de Hipóteses

O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.

Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.

Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

123456789101112131415161718
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
copy
Tarefa

Swipe to start coding

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 6. Capítulo 3
Sentimos muito que algo saiu errado. O que aconteceu?

Pergunte à IA

expand
ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

book
Desafio 3: Teste de Hipóteses

O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.

Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.

Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

123456789101112131415161718
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
copy
Tarefa

Swipe to start coding

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 6. Capítulo 3
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Sentimos muito que algo saiu errado. O que aconteceu?
some-alt