Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Diagramma a Scatola | Ulteriori Grafici Statistici
Visualizzazione Avanzata con Python

bookDiagramma a Scatola

Note
Definizione

Box plot è un altro grafico estremamente comune in statistica, utilizzato per visualizzare la tendenza centrale, la dispersione e i potenziali valori anomali all'interno dei dati tramite i loro quartili.

Quartili

quartili

I quartili suddividono i punti dati (ordinati in ordine crescente) in quattro parti di uguale dimensione. Sono tre:

  • Il primo quartile (Q1) è il valore centrale tra il valore più piccolo del campione e la mediana (il 25% dei dati si trova in questo intervallo);
  • Il secondo quartile (Q2) è la mediana stessa (il 50% dei dati si trova al di sotto della mediana);
  • Il terzo quartile (Q3) è il valore centrale tra la mediana del campione e il valore più alto del campione (il 75% dei dati si trova al di sotto del Q3).

Elementi del Box Plot

box_plot_explained
  • Il lato destro del rettangolo rosso rappresenta il terzo quartile e il lato sinistro rappresenta il primo quartile;
  • Q3 - Q1 è chiamato intervallo interquartile (IQR), rappresentato dal rettangolo in cui la linea gialla indica la mediana;
  • Le linee nere all'esterno del rettangolo sono chiamate baffi. Quella a sinistra rappresenta Q11.5IR\text{Q1} - 1.5 \cdot \text{IR}, mentre quella a destra rappresenta Q3+1.5IR\text{Q3} + 1.5 \cdot \text{IR};
  • I punti dati che si trovano al di fuori dei baffi sono chiamati outlier.

Il passo successivo consiste nel generare un box plot utilizzando la libreria matplotlib:

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Dati del Box Plot

La funzione boxplot() del modulo pyplot viene utilizzata con il primo e unico parametro obbligatorio x che rappresenta i dati. Questi dati possono essere un oggetto di tipo array (ad esempio, una Series), un array 2D (viene disegnato un box plot per ogni colonna) o una sequenza di array 1D (viene disegnato un box plot per ogni array).

Parametri opzionali

Il parametro tick_labels rappresenta un'eccezione. Questo, in particolare, è utile non solo per etichettare un singolo box plot, ma anche per etichettare i box plot quando è presente più di un array:

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

In questo esempio, l'intero DataFrame con due colonne è stato passato a boxplot(), generando box plot separati per ciascuna colonna con le etichette appropriate assegnate automaticamente.

Note
Approfondisci

Sono disponibili anche numerosi parametri opzionali per personalizzare il box plot, che è possibile esplorare nella documentazione di boxplot(), anche se nella pratica potrebbero essere utilizzati raramente.

Compito

Swipe to start coding

Crea due box plot utilizzando due campioni dalla distribuzione normale standard:

  1. Utilizza la funzione corretta per creare i box plot.
  2. Usa la lista di normal_sample_1 e normal_sample_2 (in quest'ordine da sinistra a destra) come dati.
  3. Etichetta il box plot di sinistra come First sample e quello di destra come Second sample utilizzando la list.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 2
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

Awesome!

Completion rate improved to 3.85

bookDiagramma a Scatola

Scorri per mostrare il menu

Note
Definizione

Box plot è un altro grafico estremamente comune in statistica, utilizzato per visualizzare la tendenza centrale, la dispersione e i potenziali valori anomali all'interno dei dati tramite i loro quartili.

Quartili

quartili

I quartili suddividono i punti dati (ordinati in ordine crescente) in quattro parti di uguale dimensione. Sono tre:

  • Il primo quartile (Q1) è il valore centrale tra il valore più piccolo del campione e la mediana (il 25% dei dati si trova in questo intervallo);
  • Il secondo quartile (Q2) è la mediana stessa (il 50% dei dati si trova al di sotto della mediana);
  • Il terzo quartile (Q3) è il valore centrale tra la mediana del campione e il valore più alto del campione (il 75% dei dati si trova al di sotto del Q3).

Elementi del Box Plot

box_plot_explained
  • Il lato destro del rettangolo rosso rappresenta il terzo quartile e il lato sinistro rappresenta il primo quartile;
  • Q3 - Q1 è chiamato intervallo interquartile (IQR), rappresentato dal rettangolo in cui la linea gialla indica la mediana;
  • Le linee nere all'esterno del rettangolo sono chiamate baffi. Quella a sinistra rappresenta Q11.5IR\text{Q1} - 1.5 \cdot \text{IR}, mentre quella a destra rappresenta Q3+1.5IR\text{Q3} + 1.5 \cdot \text{IR};
  • I punti dati che si trovano al di fuori dei baffi sono chiamati outlier.

Il passo successivo consiste nel generare un box plot utilizzando la libreria matplotlib:

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Dati del Box Plot

La funzione boxplot() del modulo pyplot viene utilizzata con il primo e unico parametro obbligatorio x che rappresenta i dati. Questi dati possono essere un oggetto di tipo array (ad esempio, una Series), un array 2D (viene disegnato un box plot per ogni colonna) o una sequenza di array 1D (viene disegnato un box plot per ogni array).

Parametri opzionali

Il parametro tick_labels rappresenta un'eccezione. Questo, in particolare, è utile non solo per etichettare un singolo box plot, ma anche per etichettare i box plot quando è presente più di un array:

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

In questo esempio, l'intero DataFrame con due colonne è stato passato a boxplot(), generando box plot separati per ciascuna colonna con le etichette appropriate assegnate automaticamente.

Note
Approfondisci

Sono disponibili anche numerosi parametri opzionali per personalizzare il box plot, che è possibile esplorare nella documentazione di boxplot(), anche se nella pratica potrebbero essere utilizzati raramente.

Compito

Swipe to start coding

Crea due box plot utilizzando due campioni dalla distribuzione normale standard:

  1. Utilizza la funzione corretta per creare i box plot.
  2. Usa la lista di normal_sample_1 e normal_sample_2 (in quest'ordine da sinistra a destra) come dati.
  3. Etichetta il box plot di sinistra come First sample e quello di destra come Second sample utilizzando la list.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 2
single

single

some-alt