Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Visualiseren van Categorische Spreidingsdiagrammen | Sectie
Statistische Visualisatie Met Seaborn

bookVisualiseren van Categorische Spreidingsdiagrammen

In de statistiek is een categorische variabele een variabele die één van een beperkt aantal mogelijke waarden kan aannemen (bijv. "Dag van de week", "Geslacht", "Land").

Een stripplot is in wezen een scatterplot waarbij één van de assen een categorische variabele weergeeft. Het visualiseert de verdeling van veel individuele eendimensionale waarden.

Waarom een Stripplot Gebruiken?

In tegenstelling tot een histogram of een dichtheidsplot, die gegevens aggregeren, toont een stripplot elke afzonderlijke observatie als een stip. Dit is ideaal voor kleinere datasets waarbij het belangrijk is om de exacte spreiding te zien en uitschieters te identificeren.

Belangrijke Parameters voor Aanpassing

Omdat stippen kunnen overlappen (een probleem dat "overplotting" wordt genoemd), biedt stripplot verschillende manieren om ze onderscheidend te maken:

  • alpha: regelt de transparantie (0 tot 1). Een lage waarde (bijv. 0.25) helpt om de dichtheid te visualiseren — donkerdere gebieden betekenen meer punten;
  • size: verandert de straal van de stippen;
  • marker: verandert de vorm van de punten (bijv. 'D' voor diamanten, 's' voor vierkanten);
  • jitter: voegt een kleine hoeveelheid willekeurige ruis toe aan de positie van de stippen zodat ze niet exact boven op elkaar liggen (standaard ingeschakeld).

Live Voorbeeld

Hier volgt een voorbeeld van het maken van een stripplot waarbij transparantie wordt gebruikt om overlappende gegevens te verwerken.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Taak

Swipe to start coding

Visualiseer de verdeling van rekeningen per dag met een aangepaste stijl.

  1. Stel de stijl in op 'whitegrid'. Geef een woordenboek door om de achtergrondkleur ('axes.facecolor') in te stellen op 'aliceblue'.
  2. Maak een stripplot met behulp van de tips dataset (df):
    • Koppel 'day' aan de x-as en 'total_bill' aan de y-as.
    • Kleur de punten op basis van de 'smoker'-status met hue.
  • Stel de puntgrootte (size) in op 20.
    • Gebruik het 'crest'-palet.
  • Verander de markervorm naar diamant met marker='D'.
  • Stel de transparantie (alpha) in op 0.25.
  1. Toon de visualisatie.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 9
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

bookVisualiseren van Categorische Spreidingsdiagrammen

Veeg om het menu te tonen

In de statistiek is een categorische variabele een variabele die één van een beperkt aantal mogelijke waarden kan aannemen (bijv. "Dag van de week", "Geslacht", "Land").

Een stripplot is in wezen een scatterplot waarbij één van de assen een categorische variabele weergeeft. Het visualiseert de verdeling van veel individuele eendimensionale waarden.

Waarom een Stripplot Gebruiken?

In tegenstelling tot een histogram of een dichtheidsplot, die gegevens aggregeren, toont een stripplot elke afzonderlijke observatie als een stip. Dit is ideaal voor kleinere datasets waarbij het belangrijk is om de exacte spreiding te zien en uitschieters te identificeren.

Belangrijke Parameters voor Aanpassing

Omdat stippen kunnen overlappen (een probleem dat "overplotting" wordt genoemd), biedt stripplot verschillende manieren om ze onderscheidend te maken:

  • alpha: regelt de transparantie (0 tot 1). Een lage waarde (bijv. 0.25) helpt om de dichtheid te visualiseren — donkerdere gebieden betekenen meer punten;
  • size: verandert de straal van de stippen;
  • marker: verandert de vorm van de punten (bijv. 'D' voor diamanten, 's' voor vierkanten);
  • jitter: voegt een kleine hoeveelheid willekeurige ruis toe aan de positie van de stippen zodat ze niet exact boven op elkaar liggen (standaard ingeschakeld).

Live Voorbeeld

Hier volgt een voorbeeld van het maken van een stripplot waarbij transparantie wordt gebruikt om overlappende gegevens te verwerken.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Taak

Swipe to start coding

Visualiseer de verdeling van rekeningen per dag met een aangepaste stijl.

  1. Stel de stijl in op 'whitegrid'. Geef een woordenboek door om de achtergrondkleur ('axes.facecolor') in te stellen op 'aliceblue'.
  2. Maak een stripplot met behulp van de tips dataset (df):
    • Koppel 'day' aan de x-as en 'total_bill' aan de y-as.
    • Kleur de punten op basis van de 'smoker'-status met hue.
  • Stel de puntgrootte (size) in op 20.
    • Gebruik het 'crest'-palet.
  • Verander de markervorm naar diamant met marker='D'.
  • Stel de transparantie (alpha) in op 0.25.
  1. Toon de visualisatie.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 9
single

single

some-alt