Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Implementazione della Dispersione in Python | Probabilità e Statistica
Matematica per la Data Science

bookImplementazione della Dispersione in Python

Definizione del Dataset

In questo esempio, assegniamo un array alla variabile data per garantire un dataset coerente su cui effettuare tutti i calcoli.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Calcolo delle Statistiche della Popolazione

Questa funzione prende l'array come input e restituisce il valore medio di tutti gli elementi, che riassume la tendenza centrale del dataset.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) calcola la media aritmetica;
  • np.var(data) calcola la varianza della popolazione (divide per nn);
  • np.std(data) calcola la deviazione standard della popolazione (radice quadrata della varianza).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Calcolare le Statistiche Campionarie

Per ottenere stime non distorte da un campione, si utilizza ddof=1. Questo applica la correzione di Bessel, dividendo la varianza per $(n-1)$ invece che per $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - varianza campionaria;
  • np.std(data, ddof=1) - deviazione standard campionaria.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Nota

La deviazione standard è la radice quadrata della varianza e fornisce una misura della dispersione negli stessi unità dei dati originali, rendendola più facile da interpretare.

question mark

Come si calcola la deviazione standard con la libreria numpy?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 8

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Awesome!

Completion rate improved to 1.96

bookImplementazione della Dispersione in Python

Scorri per mostrare il menu

Definizione del Dataset

In questo esempio, assegniamo un array alla variabile data per garantire un dataset coerente su cui effettuare tutti i calcoli.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Calcolo delle Statistiche della Popolazione

Questa funzione prende l'array come input e restituisce il valore medio di tutti gli elementi, che riassume la tendenza centrale del dataset.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) calcola la media aritmetica;
  • np.var(data) calcola la varianza della popolazione (divide per nn);
  • np.std(data) calcola la deviazione standard della popolazione (radice quadrata della varianza).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Calcolare le Statistiche Campionarie

Per ottenere stime non distorte da un campione, si utilizza ddof=1. Questo applica la correzione di Bessel, dividendo la varianza per $(n-1)$ invece che per $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - varianza campionaria;
  • np.std(data, ddof=1) - deviazione standard campionaria.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Nota

La deviazione standard è la radice quadrata della varianza e fornisce una misura della dispersione negli stessi unità dei dati originali, rendendola più facile da interpretare.

question mark

Come si calcola la deviazione standard con la libreria numpy?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 8
some-alt