Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Het Schatten van Gemiddelden met Staafdiagrammen | Sectie
Statistische Visualisatie Met Seaborn

bookHet Schatten van Gemiddelden met Staafdiagrammen

Een barplot geeft een schatting van de centrale tendens (meestal het gemiddelde) van een numerieke variabele weer met de hoogte van elke rechthoek.

In tegenstelling tot een histogram, dat telt hoeveel items er in een bin zitten, berekent een barplot een statistiek (zoals het gemiddelde rekeningbedrag) voor elke categorie.

De Foutbalken (Onzekerheid)

De kleine zwarte lijnen bovenop elke balk worden foutbalken genoemd. Standaard tonen ze het 95% betrouwbaarheidsinterval.

Om deze aan te passen, gebruiken we nu de parameter err_kws (error keywords). Dit accepteert een woordenboek met instellingen die het uiterlijk van deze lijnen bepalen.

Belangrijke Parameters

  • capsize: voegt een kleine horizontale lijn ("cap") toe aan de uiteinden van de foutbalken;
  • err_kws: een woordenboek om foutbalken aan te passen;
  • {'color': 'black'}: stelt de kleur in;
  • {'linewidth': 2}: stelt de dikte in;
  • estimator: standaard wordt het gemiddelde berekend. Dit kan worden gewijzigd naar median, sum of max (vereist importeren van numpy).

Voorbeeld

Hier is een staafdiagram dat het gemiddelde van de totale rekening toont met aangepaste rode foutbalken.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a barplot sns.barplot( data=df, x='day', y='total_bill', hue='sex', capsize=0.1, # New way to style error bars: err_kws={'color': 'red', 'linewidth': 2}, palette='pastel' ) plt.show()
copy
Taak

Swipe to start coding

Bereken en visualiseer het gemiddelde totaalbedrag per dag, met een vergelijking tussen rokers en niet-rokers.

  1. Stel de stijl in op 'ticks' om het raster te verwijderen.
  2. Maak een barplot met behulp van de tips dataset (df):
  • Koppel 'day' aan x en 'total_bill' aan y.
  • Groepeer op 'smoker' met behulp van hue.
  • Stel de foutbalk capsize in op 0.1.
    • Wijzig de kleur van de foutbalk naar 'pink' via het err_kws-woordenboek (bijv. {'color': 'pink'}).
  • Stel de omtreklijn van de balk (linewidth) in op 2.5.
    • Gebruik het 'magma'-palet.
  1. Toon de visualisatie.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 13
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

bookHet Schatten van Gemiddelden met Staafdiagrammen

Veeg om het menu te tonen

Een barplot geeft een schatting van de centrale tendens (meestal het gemiddelde) van een numerieke variabele weer met de hoogte van elke rechthoek.

In tegenstelling tot een histogram, dat telt hoeveel items er in een bin zitten, berekent een barplot een statistiek (zoals het gemiddelde rekeningbedrag) voor elke categorie.

De Foutbalken (Onzekerheid)

De kleine zwarte lijnen bovenop elke balk worden foutbalken genoemd. Standaard tonen ze het 95% betrouwbaarheidsinterval.

Om deze aan te passen, gebruiken we nu de parameter err_kws (error keywords). Dit accepteert een woordenboek met instellingen die het uiterlijk van deze lijnen bepalen.

Belangrijke Parameters

  • capsize: voegt een kleine horizontale lijn ("cap") toe aan de uiteinden van de foutbalken;
  • err_kws: een woordenboek om foutbalken aan te passen;
  • {'color': 'black'}: stelt de kleur in;
  • {'linewidth': 2}: stelt de dikte in;
  • estimator: standaard wordt het gemiddelde berekend. Dit kan worden gewijzigd naar median, sum of max (vereist importeren van numpy).

Voorbeeld

Hier is een staafdiagram dat het gemiddelde van de totale rekening toont met aangepaste rode foutbalken.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a barplot sns.barplot( data=df, x='day', y='total_bill', hue='sex', capsize=0.1, # New way to style error bars: err_kws={'color': 'red', 'linewidth': 2}, palette='pastel' ) plt.show()
copy
Taak

Swipe to start coding

Bereken en visualiseer het gemiddelde totaalbedrag per dag, met een vergelijking tussen rokers en niet-rokers.

  1. Stel de stijl in op 'ticks' om het raster te verwijderen.
  2. Maak een barplot met behulp van de tips dataset (df):
  • Koppel 'day' aan x en 'total_bill' aan y.
  • Groepeer op 'smoker' met behulp van hue.
  • Stel de foutbalk capsize in op 0.1.
    • Wijzig de kleur van de foutbalk naar 'pink' via het err_kws-woordenboek (bijv. {'color': 'pink'}).
  • Stel de omtreklijn van de balk (linewidth) in op 2.5.
    • Gebruik het 'magma'-palet.
  1. Toon de visualisatie.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 13
single

single

some-alt