Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Compreensão da Tendência Central e Dispersão | Probabilidade e Estatística
Matemática para Ciência de Dados

bookCompreensão da Tendência Central e Dispersão

Média (Média Aritmética)

Note
Definição

A média é a soma de todos os valores dividida pelo número de valores. Representa o valor "central" ou "típico" do seu conjunto de dados.

Fórmula:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Exemplo:
Se seu site teve 100, 120 e 110 visitantes em três dias:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretação:
Em média, o site recebeu 110 visitantes por dia.

Variância

Note
Definição

A variância mede o quão distante cada número do conjunto está da média. Ela fornece uma noção de quão "dispersos" os dados estão.

Fórmula:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Exemplo (usando os dados anteriores):

  • Média = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Soma = 200

Variaˆncia=200366.67\text{Variância} = \frac{200}{3} \approx 66.67

Interpretação:
A distância quadrática média em relação à média é de aproximadamente 66,67.

Desvio Padrão

Note
Definição

O desvio padrão é a raiz quadrada da variância. Ele traz a dispersão de volta para as unidades originais dos dados.

Fórmula:

σ=σ2\sigma = \sqrt{\sigma^2}

Exemplo:
Se a variância é 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretação:
Em média, a contagem de visitantes por dia está cerca de 8,16 distante da média.

Problema do Mundo Real: Análise de Tráfego de Site

Problema:
Um cientista de dados registra o número de visitantes de um site durante 5 dias:

120,150,130,170,140120, 150, 130, 170, 140

Etapa 1 — Média:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Etapa 2 — Variância:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Variaˆncia=484+64+144+784+45=14805=296\text{Variância} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Etapa 3 — Desvio Padrão:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusão:

  • Média = 142 visitantes por dia;
  • Variância = 296;
  • Desvio padrão = 17,2.

O tráfego do site varia cerca de 17,2 visitantes em relação à média diária.

question mark

Qual é a relação entre variância e desvio padrão?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 7

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 1.96

bookCompreensão da Tendência Central e Dispersão

Deslize para mostrar o menu

Média (Média Aritmética)

Note
Definição

A média é a soma de todos os valores dividida pelo número de valores. Representa o valor "central" ou "típico" do seu conjunto de dados.

Fórmula:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Exemplo:
Se seu site teve 100, 120 e 110 visitantes em três dias:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretação:
Em média, o site recebeu 110 visitantes por dia.

Variância

Note
Definição

A variância mede o quão distante cada número do conjunto está da média. Ela fornece uma noção de quão "dispersos" os dados estão.

Fórmula:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Exemplo (usando os dados anteriores):

  • Média = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Soma = 200

Variaˆncia=200366.67\text{Variância} = \frac{200}{3} \approx 66.67

Interpretação:
A distância quadrática média em relação à média é de aproximadamente 66,67.

Desvio Padrão

Note
Definição

O desvio padrão é a raiz quadrada da variância. Ele traz a dispersão de volta para as unidades originais dos dados.

Fórmula:

σ=σ2\sigma = \sqrt{\sigma^2}

Exemplo:
Se a variância é 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretação:
Em média, a contagem de visitantes por dia está cerca de 8,16 distante da média.

Problema do Mundo Real: Análise de Tráfego de Site

Problema:
Um cientista de dados registra o número de visitantes de um site durante 5 dias:

120,150,130,170,140120, 150, 130, 170, 140

Etapa 1 — Média:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Etapa 2 — Variância:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Variaˆncia=484+64+144+784+45=14805=296\text{Variância} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Etapa 3 — Desvio Padrão:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusão:

  • Média = 142 visitantes por dia;
  • Variância = 296;
  • Desvio padrão = 17,2.

O tráfego do site varia cerca de 17,2 visitantes em relação à média diária.

question mark

Qual é a relação entre variância e desvio padrão?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 7
some-alt