Diagramma a Scatola
Box plot è un altro grafico estremamente comune in statistica, utilizzato per visualizzare la tendenza centrale, la dispersione e i potenziali valori anomali all'interno dei dati tramite i loro quartili.
Quartili
I quartili suddividono i dati ordinati in quattro parti uguali:
- Q1 — il punto medio tra il valore minimo e la mediana (25% dei dati al di sotto);
- Q2 — la mediana (50% dei dati al di sotto);
- Q3 — il punto medio tra la mediana e il valore massimo (75% dei dati al di sotto).
Elementi del Box Plot
- Il lato sinistro della scatola mostra Q1, il lato destro mostra Q3;
- IQR = Q3 − Q1, rappresentato come la larghezza della scatola, con la mediana indicata da una linea gialla;
- I baffi si estendono fino a (Q1 - 1.5 \cdot IQR) e (Q3 + 1.5 \cdot IQR);
- I punti al di fuori dei baffi sono outlier.
Un box plot può essere generato utilizzando matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Dati del Box Plot
Utilizzare plt.boxplot(x), dove x può essere un oggetto array-like 1D, un array 2D (una scatola per colonna), o una sequenza di array 1D.
Parametri opzionali
tick_labels è utile per assegnare nomi ai box plot — particolarmente quando si tracciano più array.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Passando un DataFrame con due colonne numeriche a boxplot() si ottengono due box plot separati con etichette assegnate automaticamente.
Sono disponibili anche numerosi parametri opzionali per personalizzare il box plot, che puoi esplorare nella documentazione di boxplot(), anche se nella pratica potresti utilizzarli raramente.
Swipe to start coding
Crea due box plot utilizzando due campioni dalla distribuzione normale standard:
- Utilizza la funzione corretta per creare i box plot.
- Usa la lista di
normal_sample_1enormal_sample_2(in quest'ordine da sinistra a destra) come dati. - Etichetta il box plot di sinistra come
First samplee quello di destra comeSecond sampleutilizzando lalist.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain how to interpret a box plot?
What does the IQR tell us about the data?
How do I identify outliers using a box plot?
Awesome!
Completion rate improved to 3.85
Diagramma a Scatola
Scorri per mostrare il menu
Box plot è un altro grafico estremamente comune in statistica, utilizzato per visualizzare la tendenza centrale, la dispersione e i potenziali valori anomali all'interno dei dati tramite i loro quartili.
Quartili
I quartili suddividono i dati ordinati in quattro parti uguali:
- Q1 — il punto medio tra il valore minimo e la mediana (25% dei dati al di sotto);
- Q2 — la mediana (50% dei dati al di sotto);
- Q3 — il punto medio tra la mediana e il valore massimo (75% dei dati al di sotto).
Elementi del Box Plot
- Il lato sinistro della scatola mostra Q1, il lato destro mostra Q3;
- IQR = Q3 − Q1, rappresentato come la larghezza della scatola, con la mediana indicata da una linea gialla;
- I baffi si estendono fino a (Q1 - 1.5 \cdot IQR) e (Q3 + 1.5 \cdot IQR);
- I punti al di fuori dei baffi sono outlier.
Un box plot può essere generato utilizzando matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Dati del Box Plot
Utilizzare plt.boxplot(x), dove x può essere un oggetto array-like 1D, un array 2D (una scatola per colonna), o una sequenza di array 1D.
Parametri opzionali
tick_labels è utile per assegnare nomi ai box plot — particolarmente quando si tracciano più array.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Passando un DataFrame con due colonne numeriche a boxplot() si ottengono due box plot separati con etichette assegnate automaticamente.
Sono disponibili anche numerosi parametri opzionali per personalizzare il box plot, che puoi esplorare nella documentazione di boxplot(), anche se nella pratica potresti utilizzarli raramente.
Swipe to start coding
Crea due box plot utilizzando due campioni dalla distribuzione normale standard:
- Utilizza la funzione corretta per creare i box plot.
- Usa la lista di
normal_sample_1enormal_sample_2(in quest'ordine da sinistra a destra) come dati. - Etichetta il box plot di sinistra come
First samplee quello di destra comeSecond sampleutilizzando lalist.
Soluzione
Grazie per i tuoi commenti!
single