Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Visualisering af Histogrammer | Sektion
Practice
Projects
Quizzes & Challenges
Quizzer
Challenges
/
Statistisk Visualisering med Seaborn

bookVisualisering af Histogrammer

histplot (histogram-plot) er et klassisk værktøj, der repræsenterer fordelingen af én eller flere variable ved at tælle antallet af observationer, der falder inden for diskrete intervaller. Det hjælper med at besvare spørgsmål som: "Hvad er den mest almindelige værdi?", "Er dataene symmetriske?" eller "Er der outliers?".

Tilpasning af histogrammet

Som standard tegner histplot søjler og tæller antallet af forekomster. Du kan dog tilpasse det for at afsløre flere indsigter.

1. Ændring af statistik (stat)

I stedet for en simpel optælling kan du beregne density. Dette er nyttigt, når du sammenligner grupper af forskellig størrelse, da det normaliserer arealet under kurven til 1.

stat='density'

2. Visuel stil (element)

Når du plotter flere grupper ved hjælp af hue, kan standard-søjler blive uoverskuelige. Ved at bruge et step-plot oprettes en omridslinje, hvilket gør det lettere at se overlap.

element='step'

3. Bin-bredde (binwidth)

Størrelsen på intervallerne bestemmer, hvor meget detalje du ser.

binwidth=1

Eksempel: her er hvordan du kombinerer disse parametre for at oprette et step-fyldt density-plot:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Opgave

Swipe to start coding

Opret en tydelig visualisering af pingvinernes næblængder:

  1. Initialiser et histplot ved hjælp af dataframen df.
  2. Angiv x til 'bill_length_mm'.
  3. Gruppér dataene efter 'island' ved at bruge parameteren hue.
  4. Skift den visuelle stil til 'step' ved hjælp af parameteren element.
  5. Ændr Y-aksen til at repræsentere 'density' ved hjælp af parameteren stat.
  6. Sæt binwidth til 1 og brug paletten 'flare'.
  7. Vis plottet.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 4
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

bookVisualisering af Histogrammer

Stryg for at vise menuen

histplot (histogram-plot) er et klassisk værktøj, der repræsenterer fordelingen af én eller flere variable ved at tælle antallet af observationer, der falder inden for diskrete intervaller. Det hjælper med at besvare spørgsmål som: "Hvad er den mest almindelige værdi?", "Er dataene symmetriske?" eller "Er der outliers?".

Tilpasning af histogrammet

Som standard tegner histplot søjler og tæller antallet af forekomster. Du kan dog tilpasse det for at afsløre flere indsigter.

1. Ændring af statistik (stat)

I stedet for en simpel optælling kan du beregne density. Dette er nyttigt, når du sammenligner grupper af forskellig størrelse, da det normaliserer arealet under kurven til 1.

stat='density'

2. Visuel stil (element)

Når du plotter flere grupper ved hjælp af hue, kan standard-søjler blive uoverskuelige. Ved at bruge et step-plot oprettes en omridslinje, hvilket gør det lettere at se overlap.

element='step'

3. Bin-bredde (binwidth)

Størrelsen på intervallerne bestemmer, hvor meget detalje du ser.

binwidth=1

Eksempel: her er hvordan du kombinerer disse parametre for at oprette et step-fyldt density-plot:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Opgave

Swipe to start coding

Opret en tydelig visualisering af pingvinernes næblængder:

  1. Initialiser et histplot ved hjælp af dataframen df.
  2. Angiv x til 'bill_length_mm'.
  3. Gruppér dataene efter 'island' ved at bruge parameteren hue.
  4. Skift den visuelle stil til 'step' ved hjælp af parameteren element.
  5. Ændr Y-aksen til at repræsentere 'density' ved hjælp af parameteren stat.
  6. Sæt binwidth til 1 og brug paletten 'flare'.
  7. Vis plottet.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 4
single

single

some-alt