Estimering af Tæthed med KDE
En kdeplot (kerne-tæthedsestimering) er en metode til at visualisere fordelingen af observationer i et datasæt. Det svarer til et histogram, men i stedet for at bruge diskrete intervaller, repræsenterer KDE dataene ved hjælp af en kontinuerlig sandsynlighedstæthedskurve.
Dette gør det fremragende til at se "formen" af data og identificere toppe uden den ujævnhed, der ses i et histogram.
Visualisering af overlappende fordelinger
Når der er flere kategorier (ved brug af hue), kan simple linjer være svære at skelne. Seaborn tilbyder parametre til at løse dette:
- Stabling (
multiple='stack'): i stedet for at tegne linjer oven på hinanden, stables de. Det viser, hvordan forskellige kategorier bidrager til den samlede fordeling; - Udfyldning (
fill=True): udfylder området under kurven med farve, hvilket gør hver kategoris visuelle vægt mere tydelig.
Eksempel:
12345678910111213141516import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
Swipe to start coding
Visualisering af fordelingen af maksimale temperaturer gennem året:
- Importér
pandas,seabornogmatplotlib.pyplot. - Indlæs vejrdatasættet.
- Indstil stilen til
'ticks'med baggrundsfarven'lightcyan'(allerede angivet). - Opret et KDE-plot med følgende parametre:
- Sæt
xtil'max_temp'; - Gruppér efter
'month'ved hjælp afhue; - Stable fordelingerne med
multiple='stack'; - Udfyld kurverne med
fill=True; - Deaktiver signaturforklaringen (
legend=False) for at undgå at overfylde plottet.
- Vis plottet.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 4.55
Estimering af Tæthed med KDE
Stryg for at vise menuen
En kdeplot (kerne-tæthedsestimering) er en metode til at visualisere fordelingen af observationer i et datasæt. Det svarer til et histogram, men i stedet for at bruge diskrete intervaller, repræsenterer KDE dataene ved hjælp af en kontinuerlig sandsynlighedstæthedskurve.
Dette gør det fremragende til at se "formen" af data og identificere toppe uden den ujævnhed, der ses i et histogram.
Visualisering af overlappende fordelinger
Når der er flere kategorier (ved brug af hue), kan simple linjer være svære at skelne. Seaborn tilbyder parametre til at løse dette:
- Stabling (
multiple='stack'): i stedet for at tegne linjer oven på hinanden, stables de. Det viser, hvordan forskellige kategorier bidrager til den samlede fordeling; - Udfyldning (
fill=True): udfylder området under kurven med farve, hvilket gør hver kategoris visuelle vægt mere tydelig.
Eksempel:
12345678910111213141516import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
Swipe to start coding
Visualisering af fordelingen af maksimale temperaturer gennem året:
- Importér
pandas,seabornogmatplotlib.pyplot. - Indlæs vejrdatasættet.
- Indstil stilen til
'ticks'med baggrundsfarven'lightcyan'(allerede angivet). - Opret et KDE-plot med følgende parametre:
- Sæt
xtil'max_temp'; - Gruppér efter
'month'ved hjælp afhue; - Stable fordelingerne med
multiple='stack'; - Udfyld kurverne med
fill=True; - Deaktiver signaturforklaringen (
legend=False) for at undgå at overfylde plottet.
- Vis plottet.
Løsning
Tak for dine kommentarer!
single