Riassumere i Dati con i Box Plot
Un boxplot è un modo standardizzato di visualizzare la distribuzione dei dati basato su un riassunto a cinque numeri:
- Minimo (valore più basso esclusi gli outlier);
- Primo quartile (Q1) (25° percentile);
- Mediana (50° percentile);
- Terzo quartile (Q3) (75° percentile);
- Massimo (valore più alto esclusi gli outlier).
Perché utilizzare un Boxplot?
È lo strumento migliore per il confronto delle distribuzioni tra gruppi. Fornisce immediatamente informazioni su:
- Tendenza centrale: dove si trova la linea della mediana?;
- Dispersione: quanto è alta la scatola? (l'intervallo interquartile);
- Simmetria: la mediana è al centro della scatola?;
- Outlier: ci sono punti fuori dai baffi?
Parametri principali
saturation: controlla l'intensità dei colori (da 0 a 1). Valori più bassi rendono i colori più tenui;linewidth: controlla lo spessore dei bordi della scatola e dei baffi;width: controlla la larghezza della scatola stessa.
Esempio
Ecco un boxplot che analizza il dataset "Tips". Nota come i punti che rappresentano i valori anomali compaiono sopra i baffi.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualizzazione della distanza dei pianeti scoperti con diversi metodi.
- Impostare lo stile su
'ticks'. Personalizzare il tema passando un dizionario per modificare lo sfondo in'grey'('figure.facecolor') e il colore dei tick in'white'('xtick.color'e'ytick.color'). - Creare un boxplot utilizzando il dataset
planets(df):
- Mappare
'distance'sull'assexe'method'sull'assey. - Impostare la
widthdella box a0.6. - Rendere le linee più spesse utilizzando
linewidth=2. - Attenuare significativamente i colori impostando
saturationa0.4. - Utilizzare la palette
'vlag'.
- Visualizzare il grafico.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Fantastico!
Completion tasso migliorato a 4.55
Riassumere i Dati con i Box Plot
Scorri per mostrare il menu
Un boxplot è un modo standardizzato di visualizzare la distribuzione dei dati basato su un riassunto a cinque numeri:
- Minimo (valore più basso esclusi gli outlier);
- Primo quartile (Q1) (25° percentile);
- Mediana (50° percentile);
- Terzo quartile (Q3) (75° percentile);
- Massimo (valore più alto esclusi gli outlier).
Perché utilizzare un Boxplot?
È lo strumento migliore per il confronto delle distribuzioni tra gruppi. Fornisce immediatamente informazioni su:
- Tendenza centrale: dove si trova la linea della mediana?;
- Dispersione: quanto è alta la scatola? (l'intervallo interquartile);
- Simmetria: la mediana è al centro della scatola?;
- Outlier: ci sono punti fuori dai baffi?
Parametri principali
saturation: controlla l'intensità dei colori (da 0 a 1). Valori più bassi rendono i colori più tenui;linewidth: controlla lo spessore dei bordi della scatola e dei baffi;width: controlla la larghezza della scatola stessa.
Esempio
Ecco un boxplot che analizza il dataset "Tips". Nota come i punti che rappresentano i valori anomali compaiono sopra i baffi.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualizzazione della distanza dei pianeti scoperti con diversi metodi.
- Impostare lo stile su
'ticks'. Personalizzare il tema passando un dizionario per modificare lo sfondo in'grey'('figure.facecolor') e il colore dei tick in'white'('xtick.color'e'ytick.color'). - Creare un boxplot utilizzando il dataset
planets(df):
- Mappare
'distance'sull'assexe'method'sull'assey. - Impostare la
widthdella box a0.6. - Rendere le linee più spesse utilizzando
linewidth=2. - Attenuare significativamente i colori impostando
saturationa0.4. - Utilizzare la palette
'vlag'.
- Visualizzare il grafico.
Soluzione
Grazie per i tuoi commenti!
single