Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Opsummering af Data med Boksplot | Sektion
Statistisk Visualisering med Seaborn

bookOpsummering af Data med Boksplot

Et boxplot er en standardiseret metode til at vise fordelingen af data baseret på et fem-tals resumé:

  1. Minimum (laveste værdi ekskl. outliers);
  2. Første kvartil (Q1) (25. percentil);
  3. Median (50. percentil);
  4. Tredje kvartil (Q3) (75. percentil);
  5. Maksimum (højeste værdi ekskl. outliers).

Hvorfor bruge et boxplot?

Det er det bedste værktøj til sammenligning af fordelinger mellem grupper. Det viser straks:

  • Centraltendens: hvor ligger medianlinjen?;
  • Spredning: hvor høj er boksen? (interkvartilområdet);
  • Symmetri: er medianen i midten af boksen?;
  • Outliers: er der punkter uden for "whiskers"?

Centrale parametre

  • saturation: styrer intensiteten af farverne (0 til 1). Lavere værdier gør farverne mere afdæmpede;
  • linewidth: styrer tykkelsen af boksens konturer og whiskers;
  • width: styrer selve boksens bredde.

Eksempel

Her er et boksplot, der analyserer "Tips"-datasættet. Bemærk, hvordan prikkerne, der repræsenterer outliers, vises over whiskers.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Opgave

Swipe to start coding

Visualisering af afstanden for planeter opdaget med forskellige metoder.

  1. Indstil stilen til 'ticks'. Tilpas temaet ved at videregive en ordbog for at ændre baggrunden til 'grey' ('figure.facecolor') og farverne på aksetikene til 'white' ('xtick.color' og 'ytick.color').
  2. Opret et boxplot ved hjælp af datasættet planets (df):
    • Kortlæg 'distance' til x-aksen og 'method' til y-aksen.
  • Indstil boksens width til 0.6.
  • Gør linjerne tykkere med linewidth=2.
  • Dæmp farverne markant ved at sætte saturation til 0.4.
  • Brug paletten 'vlag'.
  1. Vis plottet.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 11
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

bookOpsummering af Data med Boksplot

Stryg for at vise menuen

Et boxplot er en standardiseret metode til at vise fordelingen af data baseret på et fem-tals resumé:

  1. Minimum (laveste værdi ekskl. outliers);
  2. Første kvartil (Q1) (25. percentil);
  3. Median (50. percentil);
  4. Tredje kvartil (Q3) (75. percentil);
  5. Maksimum (højeste værdi ekskl. outliers).

Hvorfor bruge et boxplot?

Det er det bedste værktøj til sammenligning af fordelinger mellem grupper. Det viser straks:

  • Centraltendens: hvor ligger medianlinjen?;
  • Spredning: hvor høj er boksen? (interkvartilområdet);
  • Symmetri: er medianen i midten af boksen?;
  • Outliers: er der punkter uden for "whiskers"?

Centrale parametre

  • saturation: styrer intensiteten af farverne (0 til 1). Lavere værdier gør farverne mere afdæmpede;
  • linewidth: styrer tykkelsen af boksens konturer og whiskers;
  • width: styrer selve boksens bredde.

Eksempel

Her er et boksplot, der analyserer "Tips"-datasættet. Bemærk, hvordan prikkerne, der repræsenterer outliers, vises over whiskers.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Opgave

Swipe to start coding

Visualisering af afstanden for planeter opdaget med forskellige metoder.

  1. Indstil stilen til 'ticks'. Tilpas temaet ved at videregive en ordbog for at ændre baggrunden til 'grey' ('figure.facecolor') og farverne på aksetikene til 'white' ('xtick.color' og 'ytick.color').
  2. Opret et boxplot ved hjælp af datasættet planets (df):
    • Kortlæg 'distance' til x-aksen og 'method' til y-aksen.
  • Indstil boksens width til 0.6.
  • Gør linjerne tykkere med linewidth=2.
  • Dæmp farverne markant ved at sætte saturation til 0.4.
  • Brug paletten 'vlag'.
  1. Vis plottet.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 11
single

single

some-alt