Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Gegevens Samenvatten met Boxplots | Sectie
Statistische Visualisatie Met Seaborn

bookGegevens Samenvatten met Boxplots

Een boxplot is een gestandaardiseerde manier om de verdeling van gegevens weer te geven op basis van een vijf-getallensamenvatting:

  1. Minimum (laagste waarde exclusief uitschieters);
  2. Eerste kwartiel (Q1) (25e percentiel);
  3. Mediaan (50e percentiel);
  4. Derde kwartiel (Q3) (75e percentiel);
  5. Maximum (hoogste waarde exclusief uitschieters).

Waarom een boxplot gebruiken?

Het is het beste hulpmiddel voor het vergelijken van verdelingen tussen groepen. Het geeft direct inzicht in:

  • Centrale tendens: waar bevindt zich de mediaanlijn?;
  • Spreiding: hoe hoog is de box? (de interkwartielafstand);
  • Symmetrie: ligt de mediaan in het midden van de box?;
  • Uitschieters: zijn er punten buiten de snorharen?

Belangrijke parameters

  • saturation: regelt de intensiteit van de kleuren (0 tot 1). Lagere waarden maken de kleuren minder fel;
  • linewidth: regelt de dikte van de box-omtrekken en snorharen;
  • width: regelt de breedte van de box zelf.

Voorbeeld

Hier is een boxplot die de "Tips" dataset analyseert. Merk op dat de stippen die uitschieters voorstellen boven de snorharen verschijnen.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Taak

Swipe to start coding

Visualiseer de afstand van planeten ontdekt met verschillende methoden.

  1. Stel de stijl in op 'ticks'. Pas het thema aan door een woordenboek te gebruiken om de achtergrond op 'grey' te zetten ('figure.facecolor') en de kleur van de assen op 'white' ('xtick.color' en 'ytick.color').
  2. Maak een boxplot met de planets dataset (df):
    • Koppel 'distance' aan de x-as en 'method' aan de y-as.
  • Stel de box width in op 0.6.
  • Maak de lijnen dikker met linewidth=2.
  • Verminder de kleurintensiteit aanzienlijk door saturation op 0.4 te zetten.
  • Gebruik het 'vlag' palet.
  1. Toon de plot.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 11
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

bookGegevens Samenvatten met Boxplots

Veeg om het menu te tonen

Een boxplot is een gestandaardiseerde manier om de verdeling van gegevens weer te geven op basis van een vijf-getallensamenvatting:

  1. Minimum (laagste waarde exclusief uitschieters);
  2. Eerste kwartiel (Q1) (25e percentiel);
  3. Mediaan (50e percentiel);
  4. Derde kwartiel (Q3) (75e percentiel);
  5. Maximum (hoogste waarde exclusief uitschieters).

Waarom een boxplot gebruiken?

Het is het beste hulpmiddel voor het vergelijken van verdelingen tussen groepen. Het geeft direct inzicht in:

  • Centrale tendens: waar bevindt zich de mediaanlijn?;
  • Spreiding: hoe hoog is de box? (de interkwartielafstand);
  • Symmetrie: ligt de mediaan in het midden van de box?;
  • Uitschieters: zijn er punten buiten de snorharen?

Belangrijke parameters

  • saturation: regelt de intensiteit van de kleuren (0 tot 1). Lagere waarden maken de kleuren minder fel;
  • linewidth: regelt de dikte van de box-omtrekken en snorharen;
  • width: regelt de breedte van de box zelf.

Voorbeeld

Hier is een boxplot die de "Tips" dataset analyseert. Merk op dat de stippen die uitschieters voorstellen boven de snorharen verschijnen.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Taak

Swipe to start coding

Visualiseer de afstand van planeten ontdekt met verschillende methoden.

  1. Stel de stijl in op 'ticks'. Pas het thema aan door een woordenboek te gebruiken om de achtergrond op 'grey' te zetten ('figure.facecolor') en de kleur van de assen op 'white' ('xtick.color' en 'ytick.color').
  2. Maak een boxplot met de planets dataset (df):
    • Koppel 'distance' aan de x-as en 'method' aan de y-as.
  • Stel de box width in op 0.6.
  • Maak de lijnen dikker met linewidth=2.
  • Verminder de kleurintensiteit aanzienlijk door saturation op 0.4 te zetten.
  • Gebruik het 'vlag' palet.
  1. Toon de plot.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 11
single

single

some-alt