Opsummering af Data med Boksplot
Et boxplot er en standardiseret metode til at vise fordelingen af data baseret på et fem-tals resumé:
- Minimum (laveste værdi ekskl. outliers);
- Første kvartil (Q1) (25. percentil);
- Median (50. percentil);
- Tredje kvartil (Q3) (75. percentil);
- Maksimum (højeste værdi ekskl. outliers).
Hvorfor bruge et boxplot?
Det er det bedste værktøj til sammenligning af fordelinger mellem grupper. Det viser straks:
- Centraltendens: hvor ligger medianlinjen?;
- Spredning: hvor høj er boksen? (interkvartilområdet);
- Symmetri: er medianen i midten af boksen?;
- Outliers: er der punkter uden for "whiskers"?
Centrale parametre
saturation: styrer intensiteten af farverne (0 til 1). Lavere værdier gør farverne mere afdæmpede;linewidth: styrer tykkelsen af boksens konturer og whiskers;width: styrer selve boksens bredde.
Eksempel
Her er et boksplot, der analyserer "Tips"-datasættet. Bemærk, hvordan prikkerne, der repræsenterer outliers, vises over whiskers.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisering af afstanden for planeter opdaget med forskellige metoder.
- Indstil stilen til
'ticks'. Tilpas temaet ved at videregive en ordbog for at ændre baggrunden til'grey'('figure.facecolor') og farverne på aksetikene til'white'('xtick.color'og'ytick.color'). - Opret et boxplot ved hjælp af datasættet
planets(df):- Kortlæg
'distance'tilx-aksen og'method'tily-aksen.
- Kortlæg
- Indstil boksens
widthtil0.6. - Gør linjerne tykkere med
linewidth=2. - Dæmp farverne markant ved at sætte
saturationtil0.4. - Brug paletten
'vlag'.
- Vis plottet.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 4.55
Opsummering af Data med Boksplot
Stryg for at vise menuen
Et boxplot er en standardiseret metode til at vise fordelingen af data baseret på et fem-tals resumé:
- Minimum (laveste værdi ekskl. outliers);
- Første kvartil (Q1) (25. percentil);
- Median (50. percentil);
- Tredje kvartil (Q3) (75. percentil);
- Maksimum (højeste værdi ekskl. outliers).
Hvorfor bruge et boxplot?
Det er det bedste værktøj til sammenligning af fordelinger mellem grupper. Det viser straks:
- Centraltendens: hvor ligger medianlinjen?;
- Spredning: hvor høj er boksen? (interkvartilområdet);
- Symmetri: er medianen i midten af boksen?;
- Outliers: er der punkter uden for "whiskers"?
Centrale parametre
saturation: styrer intensiteten af farverne (0 til 1). Lavere værdier gør farverne mere afdæmpede;linewidth: styrer tykkelsen af boksens konturer og whiskers;width: styrer selve boksens bredde.
Eksempel
Her er et boksplot, der analyserer "Tips"-datasættet. Bemærk, hvordan prikkerne, der repræsenterer outliers, vises over whiskers.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisering af afstanden for planeter opdaget med forskellige metoder.
- Indstil stilen til
'ticks'. Tilpas temaet ved at videregive en ordbog for at ændre baggrunden til'grey'('figure.facecolor') og farverne på aksetikene til'white'('xtick.color'og'ytick.color'). - Opret et boxplot ved hjælp af datasættet
planets(df):- Kortlæg
'distance'tilx-aksen og'method'tily-aksen.
- Kortlæg
- Indstil boksens
widthtil0.6. - Gør linjerne tykkere med
linewidth=2. - Dæmp farverne markant ved at sætte
saturationtil0.4. - Brug paletten
'vlag'.
- Vis plottet.
Løsning
Tak for dine kommentarer!
single