Grafico KDE
Un grafico di stima della densità del kernel (KDE) è un tipo di grafico che visualizza la funzione di densità di probabilità stimata di una variabile continua. A differenza di un istogramma, che mostra i dati utilizzando barre discrete raggruppate in intervalli, un grafico KDE rappresenta la distribuzione come una curva continua e fluida basata su tutti i punti dati.
Questo esempio mostra un istogramma combinato con un grafico KDE (curva arancione), offrendo un'approssimazione più chiara della funzione di densità di probabilità rispetto al solo istogramma.
In seaborn
, la funzione kdeplot()
semplifica la creazione di grafici KDE. I suoi parametri principali—data
, x
e y
—funzionano come in countplot()
.
Prima opzione
Solo uno dei parametri può essere impostato passando una sequenza di valori, consentendo la personalizzazione individuale tra gli elementi.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
Il parametro data
viene impostato passando un oggetto Series, mentre il parametro fill
viene utilizzato per riempire l'area sotto la curva, che di default non è riempita.
Seconda opzione
È anche possibile impostare un oggetto 2D come un DataFrame per data
e un nome di colonna o una chiave se data
è un dizionario per x
(orientamento verticale) o y
(orientamento orizzontale):
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Gli stessi risultati sono stati ottenuti passando l'intero DataFrame
come parametro data
e specificando il nome della colonna per il parametro x
.
Il grafico KDE creato mostra una curva a campana caratteristica, che assomiglia molto a una distribuzione normale con una media intorno a 52°F.
Nel caso desiderassi approfondire ulteriormente la funzione KDE plot, consulta liberamente la documentazione di kdeplot()
.
Swipe to start coding
- Utilizzare la funzione corretta per creare un grafico KDE.
- Utilizzare
countries_df
come dati per il grafico (primo argomento). - Impostare
'GDP per capita'
come colonna da utilizzare e l'orientamento su orizzontale tramite il secondo argomento. - Riempire l'area sotto la curva tramite il terzo (ultimo) argomento.
Soluzione
Grazie per i tuoi commenti!