Pairplot
Een pair plot visualiseert de pairwise relaties tussen alle numerieke variabelen in een dataset. In tegenstelling tot een joint plot is het niet beperkt tot twee variabelen. Het creëert een N×N raster van subplotten, waarbij N het aantal numerieke kolommen in de DataFrame is.
Beschrijving van pair plot
Elke kolom in het raster deelt dezelfde x-as variabele, en elke rij deelt dezelfde y-as. De diagonaal toont histogrammen van individuele variabelen, terwijl de cellen buiten de diagonaal scatterplots weergeven.
Een pair plot maken
Een pair plot kan worden gemaakt met seaborn.pairplot(). Het enige verplichte argument is data, dat een DataFrame moet zijn. Parameters zoals height en aspect bepalen de grootte (in inches) van elke subplot.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
Hue
De parameter hue wijst kleuren toe op basis van een opgegeven categorische kolom. Dit benadrukt groepsverschillen en toont bij classificatiedatasets hoe klassen zich onderscheiden over variabeleparen.
Wanneer hue is ingesteld (bijvoorbeeld op species), kleuren de scatterplots de punten per klasse en veranderen de diagonale plots van histogrammen naar KDE-plots, waardoor klassendistributies duidelijker worden.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Plottypen wijzigen
Zowel de hoofdplots als de diagonale plots kunnen worden aangepast.
kindbepaalt de plots buiten de diagonaal (standaard:'scatter');diag_kindbepaalt de diagonale (histogram of KDE, vaak automatisch gekozen wanneerhuewordt gebruikt).
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.
diag_kind kan worden ingesteld op een van de volgende waarden:
'auto';'hist';'kde';None.
Alles is vergelijkbaar met de functie jointplot() in dit opzicht.
Ontdek meer in de pairplot() documentatie.
Swipe to start coding
- Gebruik de juiste functie om een pair plot te maken.
- Stel de data voor de plot in op
penguins_dfvia het eerste argument. - Stel
'sex'in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren. - Stel de niet-diagonale plots in op een regressielijn (
'reg') door het derde argument te specificeren. - Stel
heightin op2. - Stel
aspectin op0.8.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
What does the `aspect` parameter do in `pairplot()`?
Can you explain the difference between `hist` and `kde` on the diagonal?
How does using `hue` affect the appearance of the pair plot?
Geweldig!
Completion tarief verbeterd naar 3.85
Pairplot
Veeg om het menu te tonen
Een pair plot visualiseert de pairwise relaties tussen alle numerieke variabelen in een dataset. In tegenstelling tot een joint plot is het niet beperkt tot twee variabelen. Het creëert een N×N raster van subplotten, waarbij N het aantal numerieke kolommen in de DataFrame is.
Beschrijving van pair plot
Elke kolom in het raster deelt dezelfde x-as variabele, en elke rij deelt dezelfde y-as. De diagonaal toont histogrammen van individuele variabelen, terwijl de cellen buiten de diagonaal scatterplots weergeven.
Een pair plot maken
Een pair plot kan worden gemaakt met seaborn.pairplot(). Het enige verplichte argument is data, dat een DataFrame moet zijn. Parameters zoals height en aspect bepalen de grootte (in inches) van elke subplot.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
Hue
De parameter hue wijst kleuren toe op basis van een opgegeven categorische kolom. Dit benadrukt groepsverschillen en toont bij classificatiedatasets hoe klassen zich onderscheiden over variabeleparen.
Wanneer hue is ingesteld (bijvoorbeeld op species), kleuren de scatterplots de punten per klasse en veranderen de diagonale plots van histogrammen naar KDE-plots, waardoor klassendistributies duidelijker worden.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Plottypen wijzigen
Zowel de hoofdplots als de diagonale plots kunnen worden aangepast.
kindbepaalt de plots buiten de diagonaal (standaard:'scatter');diag_kindbepaalt de diagonale (histogram of KDE, vaak automatisch gekozen wanneerhuewordt gebruikt).
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' zijn mogelijke waarden voor de parameter kind.
diag_kind kan worden ingesteld op een van de volgende waarden:
'auto';'hist';'kde';None.
Alles is vergelijkbaar met de functie jointplot() in dit opzicht.
Ontdek meer in de pairplot() documentatie.
Swipe to start coding
- Gebruik de juiste functie om een pair plot te maken.
- Stel de data voor de plot in op
penguins_dfvia het eerste argument. - Stel
'sex'in als de kolom die de plotaspecten aan verschillende kleuren koppelt door het tweede argument te specificeren. - Stel de niet-diagonale plots in op een regressielijn (
'reg') door het derde argument te specificeren. - Stel
heightin op2. - Stel
aspectin op0.8.
Oplossing
Bedankt voor je feedback!
single