Pairplot
Pair plot wordt gebruikt om een pairwise relatie tussen de numerieke variabelen in een dataset te visualiseren. Het lijkt sterk op een joint plot, maar is niet beperkt tot slechts twee variabelen. Een pair plot maakt namelijk een NxN raster van Axes-objecten (meerdere subplots), waarbij N het aantal numerieke variabelen is (numerieke kolommen in een DataFrame).
Beschrijving van Pair Plot
In een pair plot deelt elke kolom dezelfde x-as variabele, en elke rij deelt dezelfde y-as variabele. De diagonaal toont histogrammen van individuele variabelen, terwijl de overige grafieken scatterplots weergeven.
Een pair plot maken
Het maken van een pair plot met seaborn komt neer op het aanroepen van de functie pairplot(). De belangrijkste en enige verplichte parameter is data, die een DataFrame-object moet zijn.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
De DataFrame iris_df wordt doorgegeven aan de functie pairplot(). De parameters height en aspect bepalen de hoogte en breedte (berekend als hoogte vermenigvuldigd met aspect) van elke facet in inches.
Hue
Een andere parameter die het vermelden waard is, is hue. Deze specificeert de variabele (kolomnaam) in data waarmee plotaspecten aan verschillende kleuren worden gekoppeld of zelfs afzonderlijke plots (op één Axes) worden gemaakt voor elke waarde daarvan.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Het verschil is hier duidelijk zichtbaar. De datapunten in elke scatterplot zijn gekleurd op basis van de soort waartoe ze behoren, met gebruik van de waarden uit de species-kolom. De diagonale plots zijn nu KDE-plots voor elke soort in plaats van histogrammen.
Bij classificatieproblemen is het vaak zinvol om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele, de categorische variabele die voorspeld moet worden.
Het verschil is duidelijk. Datapunten in elke scatterplot zijn gekleurd volgens hun soort, gebaseerd op de waarden in de species-kolom. De diagonale plots zijn vervangen door KDE-plots voor elke soort in plaats van histogrammen.
Bij classificatietaken is het vaak nuttig om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele — de categorische variabele die voorspeld moet worden.
Plottypen wijzigen
Het is mogelijk om het type grafieken te wijzigen in plaats van de standaard scatterplots, evenals de grafieken die op de diagonaal worden weergegeven. De parameter kind bepaalt de hoofdplots en is standaard ingesteld op scatterplots, terwijl de parameter diag_kind de diagonale grafieken regelt en automatisch wordt gekozen op basis van of de parameter hue is ingesteld.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.
diag_kind kan worden ingesteld op een van de volgende waarden:
'auto';'hist';'kde';None.
Dit werkt vergelijkbaar met de functie jointplot().
Ontdek meer in de pairplot() documentatie.
Swipe to start coding
- Gebruik de juiste functie om een pair plot te maken.
- Stel de data voor de plot in op
penguins_dfvia het eerste argument. - Stel
'sex'in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren. - Stel de niet-diagonale plots in op een regressielijn (
'reg') door het derde argument te specificeren. - Stel
heightin op2. - Stel
aspectin op0.8.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
What other parameters can I use with the pairplot() function?
Can you explain the difference between 'kind' and 'diag_kind' in more detail?
How do I interpret the KDE plots on the diagonal?
Awesome!
Completion rate improved to 3.85
Pairplot
Veeg om het menu te tonen
Pair plot wordt gebruikt om een pairwise relatie tussen de numerieke variabelen in een dataset te visualiseren. Het lijkt sterk op een joint plot, maar is niet beperkt tot slechts twee variabelen. Een pair plot maakt namelijk een NxN raster van Axes-objecten (meerdere subplots), waarbij N het aantal numerieke variabelen is (numerieke kolommen in een DataFrame).
Beschrijving van Pair Plot
In een pair plot deelt elke kolom dezelfde x-as variabele, en elke rij deelt dezelfde y-as variabele. De diagonaal toont histogrammen van individuele variabelen, terwijl de overige grafieken scatterplots weergeven.
Een pair plot maken
Het maken van een pair plot met seaborn komt neer op het aanroepen van de functie pairplot(). De belangrijkste en enige verplichte parameter is data, die een DataFrame-object moet zijn.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
De DataFrame iris_df wordt doorgegeven aan de functie pairplot(). De parameters height en aspect bepalen de hoogte en breedte (berekend als hoogte vermenigvuldigd met aspect) van elke facet in inches.
Hue
Een andere parameter die het vermelden waard is, is hue. Deze specificeert de variabele (kolomnaam) in data waarmee plotaspecten aan verschillende kleuren worden gekoppeld of zelfs afzonderlijke plots (op één Axes) worden gemaakt voor elke waarde daarvan.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Het verschil is hier duidelijk zichtbaar. De datapunten in elke scatterplot zijn gekleurd op basis van de soort waartoe ze behoren, met gebruik van de waarden uit de species-kolom. De diagonale plots zijn nu KDE-plots voor elke soort in plaats van histogrammen.
Bij classificatieproblemen is het vaak zinvol om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele, de categorische variabele die voorspeld moet worden.
Het verschil is duidelijk. Datapunten in elke scatterplot zijn gekleurd volgens hun soort, gebaseerd op de waarden in de species-kolom. De diagonale plots zijn vervangen door KDE-plots voor elke soort in plaats van histogrammen.
Bij classificatietaken is het vaak nuttig om een pair plot te maken met de hue-parameter ingesteld op de doelvariabele — de categorische variabele die voorspeld moet worden.
Plottypen wijzigen
Het is mogelijk om het type grafieken te wijzigen in plaats van de standaard scatterplots, evenals de grafieken die op de diagonaal worden weergegeven. De parameter kind bepaalt de hoofdplots en is standaard ingesteld op scatterplots, terwijl de parameter diag_kind de diagonale grafieken regelt en automatisch wordt gekozen op basis van of de parameter hue is ingesteld.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.
diag_kind kan worden ingesteld op een van de volgende waarden:
'auto';'hist';'kde';None.
Dit werkt vergelijkbaar met de functie jointplot().
Ontdek meer in de pairplot() documentatie.
Swipe to start coding
- Gebruik de juiste functie om een pair plot te maken.
- Stel de data voor de plot in op
penguins_dfvia het eerste argument. - Stel
'sex'in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren. - Stel de niet-diagonale plots in op een regressielijn (
'reg') door het derde argument te specificeren. - Stel
heightin op2. - Stel
aspectin op0.8.
Oplossing
Bedankt voor je feedback!
single