Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Diagramma a Scatola | Ulteriori Grafici Statistici
Quizzes & Challenges
Quizzes
Challenges
/
Visualizzazione Avanzata con Python

bookDiagramma a Scatola

Note
Definizione

Box plot è un altro grafico estremamente comune in statistica, utilizzato per visualizzare la tendenza centrale, la dispersione e i potenziali valori anomali all'interno dei dati tramite i loro quartili.

Quartili

quartili

I quartili suddividono i dati ordinati in quattro parti uguali:

  • Q1 — il punto medio tra il valore minimo e la mediana (25% dei dati al di sotto);
  • Q2 — la mediana (50% dei dati al di sotto);
  • Q3 — il punto medio tra la mediana e il valore massimo (75% dei dati al di sotto).

Elementi del Box Plot

box_plot_explained
  • Il lato sinistro della scatola mostra Q1, il lato destro mostra Q3;
  • IQR = Q3 − Q1, rappresentato come la larghezza della scatola, con la mediana indicata da una linea gialla;
  • I baffi si estendono fino a (Q1 - 1.5 \cdot IQR) e (Q3 + 1.5 \cdot IQR);
  • I punti al di fuori dei baffi sono outlier.

Un box plot può essere generato utilizzando matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Dati del Box Plot

Utilizzare plt.boxplot(x), dove x può essere un oggetto array-like 1D, un array 2D (una scatola per colonna), o una sequenza di array 1D.

Parametri opzionali

tick_labels è utile per assegnare nomi ai box plot — particolarmente quando si tracciano più array.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Passando un DataFrame con due colonne numeriche a boxplot() si ottengono due box plot separati con etichette assegnate automaticamente.

Note
Approfondisci

Sono disponibili anche numerosi parametri opzionali per personalizzare il box plot, che puoi esplorare nella documentazione di boxplot(), anche se nella pratica potresti utilizzarli raramente.

Compito

Swipe to start coding

Crea due box plot utilizzando due campioni dalla distribuzione normale standard:

  1. Utilizza la funzione corretta per creare i box plot.
  2. Usa la lista di normal_sample_1 e normal_sample_2 (in quest'ordine da sinistra a destra) come dati.
  3. Etichetta il box plot di sinistra come First sample e quello di destra come Second sample utilizzando la list.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 2
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain how to interpret a box plot?

What does the IQR tell us about the data?

How do I identify outliers using a box plot?

close

bookDiagramma a Scatola

Scorri per mostrare il menu

Note
Definizione

Box plot è un altro grafico estremamente comune in statistica, utilizzato per visualizzare la tendenza centrale, la dispersione e i potenziali valori anomali all'interno dei dati tramite i loro quartili.

Quartili

quartili

I quartili suddividono i dati ordinati in quattro parti uguali:

  • Q1 — il punto medio tra il valore minimo e la mediana (25% dei dati al di sotto);
  • Q2 — la mediana (50% dei dati al di sotto);
  • Q3 — il punto medio tra la mediana e il valore massimo (75% dei dati al di sotto).

Elementi del Box Plot

box_plot_explained
  • Il lato sinistro della scatola mostra Q1, il lato destro mostra Q3;
  • IQR = Q3 − Q1, rappresentato come la larghezza della scatola, con la mediana indicata da una linea gialla;
  • I baffi si estendono fino a (Q1 - 1.5 \cdot IQR) e (Q3 + 1.5 \cdot IQR);
  • I punti al di fuori dei baffi sono outlier.

Un box plot può essere generato utilizzando matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Dati del Box Plot

Utilizzare plt.boxplot(x), dove x può essere un oggetto array-like 1D, un array 2D (una scatola per colonna), o una sequenza di array 1D.

Parametri opzionali

tick_labels è utile per assegnare nomi ai box plot — particolarmente quando si tracciano più array.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Passando un DataFrame con due colonne numeriche a boxplot() si ottengono due box plot separati con etichette assegnate automaticamente.

Note
Approfondisci

Sono disponibili anche numerosi parametri opzionali per personalizzare il box plot, che puoi esplorare nella documentazione di boxplot(), anche se nella pratica potresti utilizzarli raramente.

Compito

Swipe to start coding

Crea due box plot utilizzando due campioni dalla distribuzione normale standard:

  1. Utilizza la funzione corretta per creare i box plot.
  2. Usa la lista di normal_sample_1 e normal_sample_2 (in quest'ordine da sinistra a destra) come dati.
  3. Etichetta il box plot di sinistra come First sample e quello di destra come Second sample utilizzando la list.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 2
single

single

some-alt