Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Pairplot | Visualiseren Met Seaborn
Ultieme Visualisatie met Python

bookPairplot

Note
Definitie

Pair plot wordt gebruikt om een pairwise relatie tussen de numerieke variabelen in een dataset te visualiseren. Het lijkt sterk op een joint plot, maar is niet beperkt tot slechts twee variabelen. Een pair plot maakt namelijk een NxN raster van Axes-objecten (meerdere subplots), waarbij N het aantal numerieke variabelen is (numerieke kolommen in een DataFrame).

Voorbeeld van pair plot

Beschrijving van Pair Plot

In een pair plot deelt elke kolom dezelfde x-as variabele, en elke rij deelt dezelfde y-as variabele. De diagonaal toont histogrammen van individuele variabelen, terwijl de overige grafieken scatterplots weergeven.

Een pair plot maken

Het maken van een pair plot met seaborn komt neer op het aanroepen van de functie pairplot(). De belangrijkste en enige verplichte parameter is data, die een DataFrame-object moet zijn.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

De DataFrame iris_df wordt doorgegeven aan de functie pairplot(). De parameters height en aspect bepalen de hoogte en breedte (berekend als hoogte vermenigvuldigd met aspect) van elke facet in inches.

Hue

Een andere parameter die het vermelden waard is, is hue. Deze specificeert de variabele (kolomnaam) in data waarmee plotaspecten aan verschillende kleuren worden gekoppeld of zelfs afzonderlijke plots (op één Axes) worden gemaakt voor elke waarde daarvan.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Het verschil is hier duidelijk zichtbaar. De datapunten in elke scatterplot zijn gekleurd op basis van de soort waartoe ze behoren, met gebruik van de waarden uit de species-kolom. De diagonale plots zijn nu KDE-plots voor elke soort in plaats van histogrammen.

Bij classificatieproblemen is het vaak zinvol om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele, de categorische variabele die voorspeld moet worden.


Het verschil is duidelijk. Datapunten in elke scatterplot zijn gekleurd volgens hun soort, gebaseerd op de waarden in de species-kolom. De diagonale plots zijn vervangen door KDE-plots voor elke soort in plaats van histogrammen.

Bij classificatietaken is het vaak nuttig om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele — de categorische variabele die voorspeld moet worden.

Plottypen wijzigen

Het is mogelijk om het type grafieken te wijzigen in plaats van de standaard scatterplots, evenals de grafieken die op de diagonaal worden weergegeven. De parameter kind bepaalt de hoofdplots en is standaard ingesteld op scatterplots, terwijl de parameter diag_kind de diagonale grafieken regelt en automatisch wordt gekozen op basis van of de parameter hue is ingesteld.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.

diag_kind kan worden ingesteld op een van de volgende waarden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Dit werkt vergelijkbaar met de functie jointplot().

Note
Meer Bestuderen

Ontdek meer in de pairplot() documentatie.

Taak

Swipe to start coding

  1. Gebruik de juiste functie om een pair plot te maken.
  2. Stel de data voor de plot in op penguins_df via het eerste argument.
  3. Stel 'sex' in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren.
  4. Stel de niet-diagonale plots in op een regressielijn ('reg') door het derde argument te specificeren.
  5. Stel height in op 2.
  6. Stel aspect in op 0.8.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 6
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

What other parameters can I use with the pairplot() function?

Can you explain the difference between 'kind' and 'diag_kind' in more detail?

How do I interpret the KDE plots on the diagonal?

close

Awesome!

Completion rate improved to 3.85

bookPairplot

Veeg om het menu te tonen

Note
Definitie

Pair plot wordt gebruikt om een pairwise relatie tussen de numerieke variabelen in een dataset te visualiseren. Het lijkt sterk op een joint plot, maar is niet beperkt tot slechts twee variabelen. Een pair plot maakt namelijk een NxN raster van Axes-objecten (meerdere subplots), waarbij N het aantal numerieke variabelen is (numerieke kolommen in een DataFrame).

Voorbeeld van pair plot

Beschrijving van Pair Plot

In een pair plot deelt elke kolom dezelfde x-as variabele, en elke rij deelt dezelfde y-as variabele. De diagonaal toont histogrammen van individuele variabelen, terwijl de overige grafieken scatterplots weergeven.

Een pair plot maken

Het maken van een pair plot met seaborn komt neer op het aanroepen van de functie pairplot(). De belangrijkste en enige verplichte parameter is data, die een DataFrame-object moet zijn.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

De DataFrame iris_df wordt doorgegeven aan de functie pairplot(). De parameters height en aspect bepalen de hoogte en breedte (berekend als hoogte vermenigvuldigd met aspect) van elke facet in inches.

Hue

Een andere parameter die het vermelden waard is, is hue. Deze specificeert de variabele (kolomnaam) in data waarmee plotaspecten aan verschillende kleuren worden gekoppeld of zelfs afzonderlijke plots (op één Axes) worden gemaakt voor elke waarde daarvan.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Het verschil is hier duidelijk zichtbaar. De datapunten in elke scatterplot zijn gekleurd op basis van de soort waartoe ze behoren, met gebruik van de waarden uit de species-kolom. De diagonale plots zijn nu KDE-plots voor elke soort in plaats van histogrammen.

Bij classificatieproblemen is het vaak zinvol om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele, de categorische variabele die voorspeld moet worden.


Het verschil is duidelijk. Datapunten in elke scatterplot zijn gekleurd volgens hun soort, gebaseerd op de waarden in de species-kolom. De diagonale plots zijn vervangen door KDE-plots voor elke soort in plaats van histogrammen.

Bij classificatietaken is het vaak nuttig om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele — de categorische variabele die voorspeld moet worden.

Plottypen wijzigen

Het is mogelijk om het type grafieken te wijzigen in plaats van de standaard scatterplots, evenals de grafieken die op de diagonaal worden weergegeven. De parameter kind bepaalt de hoofdplots en is standaard ingesteld op scatterplots, terwijl de parameter diag_kind de diagonale grafieken regelt en automatisch wordt gekozen op basis van of de parameter hue is ingesteld.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.

diag_kind kan worden ingesteld op een van de volgende waarden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Dit werkt vergelijkbaar met de functie jointplot().

Note
Meer Bestuderen

Ontdek meer in de pairplot() documentatie.

Taak

Swipe to start coding

  1. Gebruik de juiste functie om een pair plot te maken.
  2. Stel de data voor de plot in op penguins_df via het eerste argument.
  3. Stel 'sex' in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren.
  4. Stel de niet-diagonale plots in op een regressielijn ('reg') door het derde argument te specificeren.
  5. Stel height in op 2.
  6. Stel aspect in op 0.8.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 6
single

single

some-alt