Tracciamento delle Distribuzioni Cumulative
Un ecdfplot rappresenta la proporzione o il conteggio delle osservazioni che cadono al di sotto di ciascun valore unico in un dataset.
Rispetto a un istogramma o a un grafico di densità, presenta un vantaggio significativo: ogni osservazione è visualizzata direttamente. Questo significa che non ci sono intervalli da regolare né parametri di smoothing che potrebbero distorcere i dati. È spesso considerato il modo più "onesto" per visualizzare una distribuzione.
Parametri principali
Per impostazione predefinita, il grafico mostra la proporzione (da 0 a 1) dei dati inferiori a X. È possibile modificare questo comportamento:
stat='count': invece di una percentuale, l'asse Y mostra il numero di osservazioni;complementary=True: inverte la logica. Invece di mostrare i valori inferiori alla soglia, mostra i valori superiori. Questo è essenzialmente una "curva di sopravvivenza" (ad esempio, "Quanti pinguini hanno un becco più lungo di 50mm?").
Esempio
Ecco come complementary modifica la visualizzazione. La curva scende invece di salire.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analisi delle lunghezze del becco dei pinguini per determinare quanti superano una certa lunghezza.
- Importazione di
pandas,seabornematplotlib.pyplot. - Lettura del dataset dei pinguini.
- Creazione di un grafico ECDF:
- Impostare
xsu'bill_length_mm'. - Raggruppare per
'island'utilizzandohue. - Abilitare la modalità "survival" impostando
complementary=True. - Visualizzare i numeri assoluti impostando
stat='count'. - Utilizzare la palette
'mako'. - Utilizzare la variabile
dfcome dati.
- Visualizzazione del grafico.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Fantastico!
Completion tasso migliorato a 4.55
Tracciamento delle Distribuzioni Cumulative
Scorri per mostrare il menu
Un ecdfplot rappresenta la proporzione o il conteggio delle osservazioni che cadono al di sotto di ciascun valore unico in un dataset.
Rispetto a un istogramma o a un grafico di densità, presenta un vantaggio significativo: ogni osservazione è visualizzata direttamente. Questo significa che non ci sono intervalli da regolare né parametri di smoothing che potrebbero distorcere i dati. È spesso considerato il modo più "onesto" per visualizzare una distribuzione.
Parametri principali
Per impostazione predefinita, il grafico mostra la proporzione (da 0 a 1) dei dati inferiori a X. È possibile modificare questo comportamento:
stat='count': invece di una percentuale, l'asse Y mostra il numero di osservazioni;complementary=True: inverte la logica. Invece di mostrare i valori inferiori alla soglia, mostra i valori superiori. Questo è essenzialmente una "curva di sopravvivenza" (ad esempio, "Quanti pinguini hanno un becco più lungo di 50mm?").
Esempio
Ecco come complementary modifica la visualizzazione. La curva scende invece di salire.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analisi delle lunghezze del becco dei pinguini per determinare quanti superano una certa lunghezza.
- Importazione di
pandas,seabornematplotlib.pyplot. - Lettura del dataset dei pinguini.
- Creazione di un grafico ECDF:
- Impostare
xsu'bill_length_mm'. - Raggruppare per
'island'utilizzandohue. - Abilitare la modalità "survival" impostando
complementary=True. - Visualizzare i numeri assoluti impostando
stat='count'. - Utilizzare la palette
'mako'. - Utilizzare la variabile
dfcome dati.
- Visualizzazione del grafico.
Soluzione
Grazie per i tuoi commenti!
single