Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Tracciamento delle Distribuzioni Cumulative | Sezione
Visualizzazione Statistica con Seaborn

bookTracciamento delle Distribuzioni Cumulative

Un ecdfplot rappresenta la proporzione o il conteggio delle osservazioni che cadono al di sotto di ciascun valore unico in un dataset.

Rispetto a un istogramma o a un grafico di densità, presenta un vantaggio significativo: ogni osservazione è visualizzata direttamente. Questo significa che non ci sono intervalli da regolare né parametri di smoothing che potrebbero distorcere i dati. È spesso considerato il modo più "onesto" per visualizzare una distribuzione.

Parametri principali

Per impostazione predefinita, il grafico mostra la proporzione (da 0 a 1) dei dati inferiori a X. È possibile modificare questo comportamento:

  • stat='count': invece di una percentuale, l'asse Y mostra il numero di osservazioni;
  • complementary=True: inverte la logica. Invece di mostrare i valori inferiori alla soglia, mostra i valori superiori. Questo è essenzialmente una "curva di sopravvivenza" (ad esempio, "Quanti pinguini hanno un becco più lungo di 50mm?").

Esempio

Ecco come complementary modifica la visualizzazione. La curva scende invece di salire.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Compito

Swipe to start coding

Analisi delle lunghezze del becco dei pinguini per determinare quanti superano una certa lunghezza.

  1. Importazione di pandas, seaborn e matplotlib.pyplot.
  2. Lettura del dataset dei pinguini.
  3. Creazione di un grafico ECDF:
  • Impostare x su 'bill_length_mm'.
  • Raggruppare per 'island' utilizzando hue.
  • Abilitare la modalità "survival" impostando complementary=True.
  • Visualizzare i numeri assoluti impostando stat='count'.
  • Utilizzare la palette 'mako'.
  • Utilizzare la variabile df come dati.
  1. Visualizzazione del grafico.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 7
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

bookTracciamento delle Distribuzioni Cumulative

Scorri per mostrare il menu

Un ecdfplot rappresenta la proporzione o il conteggio delle osservazioni che cadono al di sotto di ciascun valore unico in un dataset.

Rispetto a un istogramma o a un grafico di densità, presenta un vantaggio significativo: ogni osservazione è visualizzata direttamente. Questo significa che non ci sono intervalli da regolare né parametri di smoothing che potrebbero distorcere i dati. È spesso considerato il modo più "onesto" per visualizzare una distribuzione.

Parametri principali

Per impostazione predefinita, il grafico mostra la proporzione (da 0 a 1) dei dati inferiori a X. È possibile modificare questo comportamento:

  • stat='count': invece di una percentuale, l'asse Y mostra il numero di osservazioni;
  • complementary=True: inverte la logica. Invece di mostrare i valori inferiori alla soglia, mostra i valori superiori. Questo è essenzialmente una "curva di sopravvivenza" (ad esempio, "Quanti pinguini hanno un becco più lungo di 50mm?").

Esempio

Ecco come complementary modifica la visualizzazione. La curva scende invece di salire.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Compito

Swipe to start coding

Analisi delle lunghezze del becco dei pinguini per determinare quanti superano una certa lunghezza.

  1. Importazione di pandas, seaborn e matplotlib.pyplot.
  2. Lettura del dataset dei pinguini.
  3. Creazione di un grafico ECDF:
  • Impostare x su 'bill_length_mm'.
  • Raggruppare per 'island' utilizzando hue.
  • Abilitare la modalità "survival" impostando complementary=True.
  • Visualizzare i numeri assoluti impostando stat='count'.
  • Utilizzare la palette 'mako'.
  • Utilizzare la variabile df come dati.
  1. Visualizzazione del grafico.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 7
single

single

some-alt