Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Visualiseren van Histogrammen | Sectie
Statistische Visualisatie Met Seaborn

bookVisualiseren van Histogrammen

De histplot (histogramplot) is een klassiek hulpmiddel dat de verdeling van één of meer variabelen weergeeft door het aantal waarnemingen te tellen dat binnen discrete intervallen valt. Het helpt bij het beantwoorden van vragen zoals: "Wat is de meest voorkomende waarde?", "Is de data symmetrisch?" of "Zijn er uitschieters?".

Het histogram aanpassen

Standaard tekent histplot balken en telt het aantal voorkomens. Je kunt het echter aanpassen om meer inzichten te verkrijgen.

1. Statistiek wijzigen (stat)

In plaats van een eenvoudige telling kun je de dichtheid berekenen. Dit is nuttig bij het vergelijken van groepen met verschillende groottes, omdat het het oppervlak onder de curve normaliseert tot 1.

stat='density'

2. Visuele stijl (element)

Bij het plotten van meerdere groepen met hue kunnen standaardbalken rommelig worden. Door een stapdiagram te gebruiken, ontstaat er een omtrek, waardoor overlappingen beter zichtbaar zijn.

element='step'

3. Binbreedte (binwidth)

De grootte van de intervallen bepaalt hoeveel detail zichtbaar is.

binwidth=1

Voorbeeld: Hier zie je hoe je deze parameters combineert om een stap-gevuld dichtheidsdiagram te maken:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Taak

Swipe to start coding

Maak een duidelijke visualisatie van de snavellengtes van pinguïns:

  1. Initialiseer een histplot met de df dataframe.
  2. Stel x in op 'bill_length_mm'.
  3. Groepeer de gegevens op 'island' met behulp van de hue-parameter.
  4. Wijzig de visuele stijl naar 'step' met de element-parameter.
  5. Stel de Y-as in om 'density' weer te geven via de stat-parameter.
  6. Stel de binwidth in op 1 en gebruik het 'flare'-palet.
  7. Toon de plot.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 4
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

bookVisualiseren van Histogrammen

Veeg om het menu te tonen

De histplot (histogramplot) is een klassiek hulpmiddel dat de verdeling van één of meer variabelen weergeeft door het aantal waarnemingen te tellen dat binnen discrete intervallen valt. Het helpt bij het beantwoorden van vragen zoals: "Wat is de meest voorkomende waarde?", "Is de data symmetrisch?" of "Zijn er uitschieters?".

Het histogram aanpassen

Standaard tekent histplot balken en telt het aantal voorkomens. Je kunt het echter aanpassen om meer inzichten te verkrijgen.

1. Statistiek wijzigen (stat)

In plaats van een eenvoudige telling kun je de dichtheid berekenen. Dit is nuttig bij het vergelijken van groepen met verschillende groottes, omdat het het oppervlak onder de curve normaliseert tot 1.

stat='density'

2. Visuele stijl (element)

Bij het plotten van meerdere groepen met hue kunnen standaardbalken rommelig worden. Door een stapdiagram te gebruiken, ontstaat er een omtrek, waardoor overlappingen beter zichtbaar zijn.

element='step'

3. Binbreedte (binwidth)

De grootte van de intervallen bepaalt hoeveel detail zichtbaar is.

binwidth=1

Voorbeeld: Hier zie je hoe je deze parameters combineert om een stap-gevuld dichtheidsdiagram te maken:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Taak

Swipe to start coding

Maak een duidelijke visualisatie van de snavellengtes van pinguïns:

  1. Initialiseer een histplot met de df dataframe.
  2. Stel x in op 'bill_length_mm'.
  3. Groepeer de gegevens op 'island' met behulp van de hue-parameter.
  4. Wijzig de visuele stijl naar 'step' met de element-parameter.
  5. Stel de Y-as in om 'density' weer te geven via de stat-parameter.
  6. Stel de binwidth in op 1 en gebruik het 'flare'-palet.
  7. Toon de plot.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 4
single

single

some-alt