Visualiseren van Categorische Spreidingsdiagrammen
In de statistiek is een categorische variabele een variabele die één van een beperkt aantal mogelijke waarden kan aannemen (bijv. "Dag van de week", "Geslacht", "Land").
Een stripplot is in wezen een scatterplot waarbij één van de assen een categorische variabele weergeeft. Het visualiseert de verdeling van veel individuele eendimensionale waarden.
Waarom een Stripplot Gebruiken?
In tegenstelling tot een histogram of een dichtheidsplot, die gegevens aggregeren, toont een stripplot elke afzonderlijke observatie als een stip. Dit is ideaal voor kleinere datasets waarbij het belangrijk is om de exacte spreiding te zien en uitschieters te identificeren.
Belangrijke Parameters voor Aanpassing
Omdat stippen kunnen overlappen (een probleem dat "overplotting" wordt genoemd), biedt stripplot verschillende manieren om ze onderscheidend te maken:
alpha: regelt de transparantie (0 tot 1). Een lage waarde (bijv.0.25) helpt om de dichtheid te visualiseren — donkerdere gebieden betekenen meer punten;size: verandert de straal van de stippen;marker: verandert de vorm van de punten (bijv.'D'voor diamanten,'s'voor vierkanten);jitter: voegt een kleine hoeveelheid willekeurige ruis toe aan de positie van de stippen zodat ze niet exact boven op elkaar liggen (standaard ingeschakeld).
Live Voorbeeld
Hier volgt een voorbeeld van het maken van een stripplot waarbij transparantie wordt gebruikt om overlappende gegevens te verwerken.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualiseer de verdeling van rekeningen per dag met een aangepaste stijl.
- Stel de stijl in op
'whitegrid'. Geef een woordenboek door om de achtergrondkleur ('axes.facecolor') in te stellen op'aliceblue'. - Maak een stripplot met behulp van de
tipsdataset (df):- Koppel
'day'aan dex-as en'total_bill'aan dey-as. - Kleur de punten op basis van de
'smoker'-status methue.
- Koppel
- Stel de puntgrootte (
size) in op20.- Gebruik het
'crest'-palet.
- Gebruik het
- Verander de markervorm naar diamant met
marker='D'. - Stel de transparantie (
alpha) in op0.25.
- Toon de visualisatie.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 4.55
Visualiseren van Categorische Spreidingsdiagrammen
Veeg om het menu te tonen
In de statistiek is een categorische variabele een variabele die één van een beperkt aantal mogelijke waarden kan aannemen (bijv. "Dag van de week", "Geslacht", "Land").
Een stripplot is in wezen een scatterplot waarbij één van de assen een categorische variabele weergeeft. Het visualiseert de verdeling van veel individuele eendimensionale waarden.
Waarom een Stripplot Gebruiken?
In tegenstelling tot een histogram of een dichtheidsplot, die gegevens aggregeren, toont een stripplot elke afzonderlijke observatie als een stip. Dit is ideaal voor kleinere datasets waarbij het belangrijk is om de exacte spreiding te zien en uitschieters te identificeren.
Belangrijke Parameters voor Aanpassing
Omdat stippen kunnen overlappen (een probleem dat "overplotting" wordt genoemd), biedt stripplot verschillende manieren om ze onderscheidend te maken:
alpha: regelt de transparantie (0 tot 1). Een lage waarde (bijv.0.25) helpt om de dichtheid te visualiseren — donkerdere gebieden betekenen meer punten;size: verandert de straal van de stippen;marker: verandert de vorm van de punten (bijv.'D'voor diamanten,'s'voor vierkanten);jitter: voegt een kleine hoeveelheid willekeurige ruis toe aan de positie van de stippen zodat ze niet exact boven op elkaar liggen (standaard ingeschakeld).
Live Voorbeeld
Hier volgt een voorbeeld van het maken van een stripplot waarbij transparantie wordt gebruikt om overlappende gegevens te verwerken.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualiseer de verdeling van rekeningen per dag met een aangepaste stijl.
- Stel de stijl in op
'whitegrid'. Geef een woordenboek door om de achtergrondkleur ('axes.facecolor') in te stellen op'aliceblue'. - Maak een stripplot met behulp van de
tipsdataset (df):- Koppel
'day'aan dex-as en'total_bill'aan dey-as. - Kleur de punten op basis van de
'smoker'-status methue.
- Koppel
- Stel de puntgrootte (
size) in op20.- Gebruik het
'crest'-palet.
- Gebruik het
- Verander de markervorm naar diamant met
marker='D'. - Stel de transparantie (
alpha) in op0.25.
- Toon de visualisatie.
Oplossing
Bedankt voor je feedback!
single