Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Riassumere i Dati con i Box Plot | Sezione
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Visualizzazione Statistica con Seaborn

bookRiassumere i Dati con i Box Plot

Un boxplot è un modo standardizzato di visualizzare la distribuzione dei dati basato su un riassunto a cinque numeri:

  1. Minimo (valore più basso esclusi gli outlier);
  2. Primo quartile (Q1) (25° percentile);
  3. Mediana (50° percentile);
  4. Terzo quartile (Q3) (75° percentile);
  5. Massimo (valore più alto esclusi gli outlier).

Perché utilizzare un Boxplot?

È lo strumento migliore per il confronto delle distribuzioni tra gruppi. Fornisce immediatamente informazioni su:

  • Tendenza centrale: dove si trova la linea della mediana?;
  • Dispersione: quanto è alta la scatola? (l'intervallo interquartile);
  • Simmetria: la mediana è al centro della scatola?;
  • Outlier: ci sono punti fuori dai baffi?

Parametri principali

  • saturation: controlla l'intensità dei colori (da 0 a 1). Valori più bassi rendono i colori più tenui;
  • linewidth: controlla lo spessore dei bordi della scatola e dei baffi;
  • width: controlla la larghezza della scatola stessa.

Esempio

Ecco un boxplot che analizza il dataset "Tips". Nota come i punti che rappresentano i valori anomali compaiono sopra i baffi.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Compito

Swipe to start coding

Visualizzazione della distanza dei pianeti scoperti con diversi metodi.

  1. Impostare lo stile su 'ticks'. Personalizzare il tema passando un dizionario per modificare lo sfondo in 'grey' ('figure.facecolor') e il colore dei tick in 'white' ('xtick.color' e 'ytick.color').
  2. Creare un boxplot utilizzando il dataset planets (df):
  • Mappare 'distance' sull'asse x e 'method' sull'asse y.
  • Impostare la width della box a 0.6.
  • Rendere le linee più spesse utilizzando linewidth=2.
  • Attenuare significativamente i colori impostando saturation a 0.4.
  • Utilizzare la palette 'vlag'.
  1. Visualizzare il grafico.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 11
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

bookRiassumere i Dati con i Box Plot

Scorri per mostrare il menu

Un boxplot è un modo standardizzato di visualizzare la distribuzione dei dati basato su un riassunto a cinque numeri:

  1. Minimo (valore più basso esclusi gli outlier);
  2. Primo quartile (Q1) (25° percentile);
  3. Mediana (50° percentile);
  4. Terzo quartile (Q3) (75° percentile);
  5. Massimo (valore più alto esclusi gli outlier).

Perché utilizzare un Boxplot?

È lo strumento migliore per il confronto delle distribuzioni tra gruppi. Fornisce immediatamente informazioni su:

  • Tendenza centrale: dove si trova la linea della mediana?;
  • Dispersione: quanto è alta la scatola? (l'intervallo interquartile);
  • Simmetria: la mediana è al centro della scatola?;
  • Outlier: ci sono punti fuori dai baffi?

Parametri principali

  • saturation: controlla l'intensità dei colori (da 0 a 1). Valori più bassi rendono i colori più tenui;
  • linewidth: controlla lo spessore dei bordi della scatola e dei baffi;
  • width: controlla la larghezza della scatola stessa.

Esempio

Ecco un boxplot che analizza il dataset "Tips". Nota come i punti che rappresentano i valori anomali compaiono sopra i baffi.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Compito

Swipe to start coding

Visualizzazione della distanza dei pianeti scoperti con diversi metodi.

  1. Impostare lo stile su 'ticks'. Personalizzare il tema passando un dizionario per modificare lo sfondo in 'grey' ('figure.facecolor') e il colore dei tick in 'white' ('xtick.color' e 'ytick.color').
  2. Creare un boxplot utilizzando il dataset planets (df):
  • Mappare 'distance' sull'asse x e 'method' sull'asse y.
  • Impostare la width della box a 0.6.
  • Rendere le linee più spesse utilizzando linewidth=2.
  • Attenuare significativamente i colori impostando saturation a 0.4.
  • Utilizzare la palette 'vlag'.
  1. Visualizzare il grafico.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 11
single

single

some-alt