Visualisering af Histogrammer
histplot (histogram-plot) er et klassisk værktøj, der repræsenterer fordelingen af én eller flere variable ved at tælle antallet af observationer, der falder inden for diskrete intervaller. Det hjælper med at besvare spørgsmål som: "Hvad er den mest almindelige værdi?", "Er dataene symmetriske?" eller "Er der outliers?".
Tilpasning af histogrammet
Som standard tegner histplot søjler og tæller antallet af forekomster. Du kan dog tilpasse det for at afsløre flere indsigter.
1. Ændring af statistik (stat)
I stedet for en simpel optælling kan du beregne density. Dette er nyttigt, når du sammenligner grupper af forskellig størrelse, da det normaliserer arealet under kurven til 1.
stat='density'
2. Visuel stil (element)
Når du plotter flere grupper ved hjælp af hue, kan standard-søjler blive uoverskuelige. Ved at bruge et step-plot oprettes en omridslinje, hvilket gør det lettere at se overlap.
element='step'
3. Bin-bredde (binwidth)
Størrelsen på intervallerne bestemmer, hvor meget detalje du ser.
binwidth=1
Eksempel: her er hvordan du kombinerer disse parametre for at oprette et step-fyldt density-plot:
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
Swipe to start coding
Opret en tydelig visualisering af pingvinernes næblængder:
- Initialiser et
histplotved hjælp af dataframendf. - Angiv
xtil'bill_length_mm'. - Gruppér dataene efter
'island'ved at bruge parameterenhue. - Skift den visuelle stil til
'step'ved hjælp af parameterenelement. - Ændr Y-aksen til at repræsentere
'density'ved hjælp af parameterenstat. - Sæt
binwidthtil1og brug paletten'flare'. - Vis plottet.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 4.55
Visualisering af Histogrammer
Stryg for at vise menuen
histplot (histogram-plot) er et klassisk værktøj, der repræsenterer fordelingen af én eller flere variable ved at tælle antallet af observationer, der falder inden for diskrete intervaller. Det hjælper med at besvare spørgsmål som: "Hvad er den mest almindelige værdi?", "Er dataene symmetriske?" eller "Er der outliers?".
Tilpasning af histogrammet
Som standard tegner histplot søjler og tæller antallet af forekomster. Du kan dog tilpasse det for at afsløre flere indsigter.
1. Ændring af statistik (stat)
I stedet for en simpel optælling kan du beregne density. Dette er nyttigt, når du sammenligner grupper af forskellig størrelse, da det normaliserer arealet under kurven til 1.
stat='density'
2. Visuel stil (element)
Når du plotter flere grupper ved hjælp af hue, kan standard-søjler blive uoverskuelige. Ved at bruge et step-plot oprettes en omridslinje, hvilket gør det lettere at se overlap.
element='step'
3. Bin-bredde (binwidth)
Størrelsen på intervallerne bestemmer, hvor meget detalje du ser.
binwidth=1
Eksempel: her er hvordan du kombinerer disse parametre for at oprette et step-fyldt density-plot:
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
Swipe to start coding
Opret en tydelig visualisering af pingvinernes næblængder:
- Initialiser et
histplotved hjælp af dataframendf. - Angiv
xtil'bill_length_mm'. - Gruppér dataene efter
'island'ved at bruge parameterenhue. - Skift den visuelle stil til
'step'ved hjælp af parameterenelement. - Ændr Y-aksen til at repræsentere
'density'ved hjælp af parameterenstat. - Sæt
binwidthtil1og brug paletten'flare'. - Vis plottet.
Løsning
Tak for dine kommentarer!
single