Estimering av Tetthet med KDE
En kdeplot (kjerne-tetthetsestimering) er en metode for å visualisere fordelingen av observasjoner i et datasett. Den ligner på et histogram, men i stedet for å bruke diskrete intervaller, representerer KDE dataene med en kontinuerlig sannsynlighetstetthetskurve.
Dette gjør det utmerket for å se "formen" på dataene og identifisere topper uten den hakkete fremstillingen til et histogram.
Visualisering av overlappende fordelinger
Når du har flere kategorier (ved bruk av hue), kan enkle linjer bli vanskelige å skille fra hverandre. Seaborn tilbyr parametere for å løse dette:
- Stabling (
multiple='stack'): i stedet for å tegne linjer oppå hverandre, stables de. Dette viser hvordan ulike kategorier bidrar til den totale fordelingen; - Fylling (
fill=True): fyller området under kurven med farge, noe som gjør den visuelle vekten til hver kategori mer tydelig.
Eksempel:
12345678910111213141516import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
Swipe to start coding
Visualiser fordelingen av maksimale temperaturer gjennom året:
- Importer
pandas,seabornogmatplotlib.pyplot. - Les inn værdatasettet.
- Sett stilen til
'ticks'med bakgrunnsfarge'lightcyan'(allerede satt). - Lag et KDE-diagram med følgende parametere:
- Sett
xtil'max_temp'; - Grupper etter
'month'ved å brukehue; - Stable distribusjonene med
multiple='stack'; - Fyll kurvene med
fill=True; - Deaktiver legenden (
legend=False) for å unngå at diagrammet blir rotete.
- Vis diagrammet.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 4.55
Estimering av Tetthet med KDE
Sveip for å vise menyen
En kdeplot (kjerne-tetthetsestimering) er en metode for å visualisere fordelingen av observasjoner i et datasett. Den ligner på et histogram, men i stedet for å bruke diskrete intervaller, representerer KDE dataene med en kontinuerlig sannsynlighetstetthetskurve.
Dette gjør det utmerket for å se "formen" på dataene og identifisere topper uten den hakkete fremstillingen til et histogram.
Visualisering av overlappende fordelinger
Når du har flere kategorier (ved bruk av hue), kan enkle linjer bli vanskelige å skille fra hverandre. Seaborn tilbyr parametere for å løse dette:
- Stabling (
multiple='stack'): i stedet for å tegne linjer oppå hverandre, stables de. Dette viser hvordan ulike kategorier bidrar til den totale fordelingen; - Fylling (
fill=True): fyller området under kurven med farge, noe som gjør den visuelle vekten til hver kategori mer tydelig.
Eksempel:
12345678910111213141516import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
Swipe to start coding
Visualiser fordelingen av maksimale temperaturer gjennom året:
- Importer
pandas,seabornogmatplotlib.pyplot. - Les inn værdatasettet.
- Sett stilen til
'ticks'med bakgrunnsfarge'lightcyan'(allerede satt). - Lag et KDE-diagram med følgende parametere:
- Sett
xtil'max_temp'; - Grupper etter
'month'ved å brukehue; - Stable distribusjonene med
multiple='stack'; - Fyll kurvene med
fill=True; - Deaktiver legenden (
legend=False) for å unngå at diagrammet blir rotete.
- Vis diagrammet.
Løsning
Takk for tilbakemeldingene dine!
single