Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Pairplot | Visualiseren Met Seaborn
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Ultieme Visualisatie met Python

bookPairplot

Note
Definitie

Een pair plot visualiseert de pairwise relaties tussen alle numerieke variabelen in een dataset. In tegenstelling tot een joint plot is het niet beperkt tot twee variabelen. Het creëert een N×N raster van subplotten, waarbij N het aantal numerieke kolommen in de DataFrame is.

Voorbeeld van pair plot

Beschrijving van pair plot

Elke kolom in het raster deelt dezelfde x-as variabele, en elke rij deelt dezelfde y-as. De diagonaal toont histogrammen van individuele variabelen, terwijl de cellen buiten de diagonaal scatterplots weergeven.

Een pair plot maken

Een pair plot kan worden gemaakt met seaborn.pairplot(). Het enige verplichte argument is data, dat een DataFrame moet zijn. Parameters zoals height en aspect bepalen de grootte (in inches) van elke subplot.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hue

De parameter hue wijst kleuren toe op basis van een opgegeven categorische kolom. Dit benadrukt groepsverschillen en toont bij classificatiedatasets hoe klassen zich onderscheiden over variabeleparen.

Wanneer hue is ingesteld (bijvoorbeeld op species), kleuren de scatterplots de punten per klasse en veranderen de diagonale plots van histogrammen naar KDE-plots, waardoor klassendistributies duidelijker worden.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Plottypen wijzigen

Zowel de hoofdplots als de diagonale plots kunnen worden aangepast.

  • kind bepaalt de plots buiten de diagonaal (standaard: 'scatter');
  • diag_kind bepaalt de diagonale (histogram of KDE, vaak automatisch gekozen wanneer hue wordt gebruikt).
12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.

diag_kind kan worden ingesteld op een van de volgende waarden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alles is vergelijkbaar met de functie jointplot() in dit opzicht.

Note
Meer Bestuderen

Ontdek meer in de pairplot() documentatie.

Taak

Swipe to start coding

  1. Gebruik de juiste functie om een pair plot te maken.
  2. Stel de data voor de plot in op penguins_df via het eerste argument.
  3. Stel 'sex' in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren.
  4. Stel de niet-diagonale plots in op een regressielijn ('reg') door het derde argument te specificeren.
  5. Stel height in op 2.
  6. Stel aspect in op 0.8.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 6
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

What does the `aspect` parameter do in `pairplot()`?

Can you explain the difference between `hist` and `kde` on the diagonal?

How does using `hue` affect the appearance of the pair plot?

close

bookPairplot

Veeg om het menu te tonen

Note
Definitie

Een pair plot visualiseert de pairwise relaties tussen alle numerieke variabelen in een dataset. In tegenstelling tot een joint plot is het niet beperkt tot twee variabelen. Het creëert een N×N raster van subplotten, waarbij N het aantal numerieke kolommen in de DataFrame is.

Voorbeeld van pair plot

Beschrijving van pair plot

Elke kolom in het raster deelt dezelfde x-as variabele, en elke rij deelt dezelfde y-as. De diagonaal toont histogrammen van individuele variabelen, terwijl de cellen buiten de diagonaal scatterplots weergeven.

Een pair plot maken

Een pair plot kan worden gemaakt met seaborn.pairplot(). Het enige verplichte argument is data, dat een DataFrame moet zijn. Parameters zoals height en aspect bepalen de grootte (in inches) van elke subplot.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hue

De parameter hue wijst kleuren toe op basis van een opgegeven categorische kolom. Dit benadrukt groepsverschillen en toont bij classificatiedatasets hoe klassen zich onderscheiden over variabeleparen.

Wanneer hue is ingesteld (bijvoorbeeld op species), kleuren de scatterplots de punten per klasse en veranderen de diagonale plots van histogrammen naar KDE-plots, waardoor klassendistributies duidelijker worden.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Plottypen wijzigen

Zowel de hoofdplots als de diagonale plots kunnen worden aangepast.

  • kind bepaalt de plots buiten de diagonaal (standaard: 'scatter');
  • diag_kind bepaalt de diagonale (histogram of KDE, vaak automatisch gekozen wanneer hue wordt gebruikt).
12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.

diag_kind kan worden ingesteld op een van de volgende waarden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alles is vergelijkbaar met de functie jointplot() in dit opzicht.

Note
Meer Bestuderen

Ontdek meer in de pairplot() documentatie.

Taak

Swipe to start coding

  1. Gebruik de juiste functie om een pair plot te maken.
  2. Stel de data voor de plot in op penguins_df via het eerste argument.
  3. Stel 'sex' in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren.
  4. Stel de niet-diagonale plots in op een regressielijn ('reg') door het derde argument te specificeren.
  5. Stel height in op 2.
  6. Stel aspect in op 0.8.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 6
single

single

some-alt