Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Comprendere la Tendenza Centrale e la Dispersione | Probabilità e Statistica
Matematica per la Data Science

bookComprendere la Tendenza Centrale e la Dispersione

Media (Media Aritmetica)

Note
Definizione

La media è la somma di tutti i valori divisa per il numero dei valori. Rappresenta il valore "centrale" o "tipico" nel tuo insieme di dati.

Formula:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Esempio:
Se il tuo sito web ha avuto 100, 120 e 110 visitatori in tre giorni:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretazione:
In media, il sito ha ricevuto 110 visitatori al giorno.

Varianza

Note
Definizione

La varianza misura quanto ciascun numero nel set si discosta dalla media. Fornisce un'indicazione di quanto i dati siano "dispersi".

Formula:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Esempio (utilizzando i dati precedenti):

  • Media = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Somma = 200

Varianza=200366.67\text{Varianza} = \frac{200}{3} \approx 66.67

Interpretazione:
La distanza quadratica media dalla media è circa 66,67.

Deviazione standard

Note
Definizione

La deviazione standard è la radice quadrata della varianza. Riporta la dispersione alle unità originali dei dati.

Formula:

σ=σ2\sigma = \sqrt{\sigma^2}

Esempio:
Se la varianza è 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretazione:
In media, il numero di visitatori giornalieri si discosta di circa 8.16 dalla media.

Problema Reale: Analisi del Traffico di un Sito Web

Problema:
Un data scientist registra il numero di visitatori di un sito web in 5 giorni:

120,150,130,170,140120, 150, 130, 170, 140

Passo 1 — Media:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Passo 2 — Varianza:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varianza=484+64+144+784+45=14805=296\text{Varianza} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Passo 3 — Deviazione Standard:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusione:

  • Media = 142 visitatori al giorno;
  • Varianza = 296;
  • Deviazione standard = 17.2.

Il traffico del sito web varia di circa 17.2 visitatori rispetto alla media giornaliera.

question mark

Qual è la relazione tra varianza e deviazione standard?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 7

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain why variance is important in data analysis?

How do I interpret standard deviation in real-world scenarios?

Can you provide more examples of calculating mean, variance, and standard deviation?

Awesome!

Completion rate improved to 1.96

bookComprendere la Tendenza Centrale e la Dispersione

Scorri per mostrare il menu

Media (Media Aritmetica)

Note
Definizione

La media è la somma di tutti i valori divisa per il numero dei valori. Rappresenta il valore "centrale" o "tipico" nel tuo insieme di dati.

Formula:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Esempio:
Se il tuo sito web ha avuto 100, 120 e 110 visitatori in tre giorni:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretazione:
In media, il sito ha ricevuto 110 visitatori al giorno.

Varianza

Note
Definizione

La varianza misura quanto ciascun numero nel set si discosta dalla media. Fornisce un'indicazione di quanto i dati siano "dispersi".

Formula:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Esempio (utilizzando i dati precedenti):

  • Media = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Somma = 200

Varianza=200366.67\text{Varianza} = \frac{200}{3} \approx 66.67

Interpretazione:
La distanza quadratica media dalla media è circa 66,67.

Deviazione standard

Note
Definizione

La deviazione standard è la radice quadrata della varianza. Riporta la dispersione alle unità originali dei dati.

Formula:

σ=σ2\sigma = \sqrt{\sigma^2}

Esempio:
Se la varianza è 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretazione:
In media, il numero di visitatori giornalieri si discosta di circa 8.16 dalla media.

Problema Reale: Analisi del Traffico di un Sito Web

Problema:
Un data scientist registra il numero di visitatori di un sito web in 5 giorni:

120,150,130,170,140120, 150, 130, 170, 140

Passo 1 — Media:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Passo 2 — Varianza:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varianza=484+64+144+784+45=14805=296\text{Varianza} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Passo 3 — Deviazione Standard:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusione:

  • Media = 142 visitatori al giorno;
  • Varianza = 296;
  • Deviazione standard = 17.2.

Il traffico del sito web varia di circa 17.2 visitatori rispetto alla media giornaliera.

question mark

Qual è la relazione tra varianza e deviazione standard?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 7
some-alt