Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Parplot | Visualisering med Seaborn
Ultimativ Visualisering med Python

Stryg for at vise menuen

book
Parplot

Note
Definition

Pair plot bruges til at visualisere parvise relationer mellem de numeriske variabler i et datasæt. Det ligner meget et joint plot, men er ikke begrænset til kun to variabler. Faktisk opretter et pair plot et NxN gitter af Axes objekter (flere underplots), hvor N er antallet af numeriske variabler (numeriske kolonner i en DataFrame).

Beskrivelse af Pair Plot

I et pair plot deler hver kolonne den samme x-akse variabel, og hver række deler den samme y-akse variabel. Diagonalen viser histogrammer for de enkelte variabler, mens de øvrige plots viser scatter plots.

Oprettelse af et Pair Plot

Oprettelse af et pair plot med seaborn kræver blot et kald til funktionen pairplot(). Dens vigtigste og eneste påkrævede parameter er data, som skal være et DataFrame objekt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame'en iris_df videregives til funktionen pairplot(). Parametrene height og aspect angiver højden og bredden (beregnet som højde multipliceret med aspect) af hver facet i tommer.

Hue

Et andet parameter, der er værd at nævne, er hue, som angiver variablen (kolonnenavn) i data, der bruges til at tildele plotaspekter forskellige farver eller endda oprette separate plots (på én Axes) for hver af dens værdier.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Du kan tydeligt se forskellen her. Datapunkterne i hvert scatter plot er farvet baseret på den art, de tilhører, ved hjælp af værdierne fra species-kolonnen. De diagonale plots er nu KDE plots for hver art i stedet for histogrammer.

Ved klassifikationsproblemer giver det ofte mening at oprette et pair plot med hue-parameteren sat til målvariablen, som er den kategoriske variabel, vi ønsker at forudsige.


Forskellen er tydelig. Datapunkterne i hvert scatter plot er farvet efter deres art, baseret på værdierne i species-kolonnen. De diagonale plots er blevet erstattet med KDE plots for hver art i stedet for histogrammer.

Ved klassifikationsopgaver er det ofte nyttigt at oprette et pair plot med hue-parameteren sat til målvariablen — den kategoriske variabel, der skal forudsiges.

Ændring af plottyper

Du kan ændre typen af plots, der bruges i stedet for de standard scatter plots, samt de plots, der vises på diagonalen. kind-parameteren styrer hovedplotsene og er som standard scatter plots, mens diag_kind-parameteren styrer de diagonale plots og vælges automatisk afhængigt af, om hue-parameteren er sat.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige værdier for parameteren kind.

diag_kind kan indstilles til en af følgende værdier:

  • 'auto';

  • 'hist';

  • 'kde';

  • None.

Alt fungerer på samme måde som i funktionen jointplot() i denne sammenhæng.

Note
Læs Mere
Opgave

Swipe to start coding

  1. Brug den korrekte funktion til at oprette et pair plot.
  2. Angiv dataene for plottet til at være penguins_df via det første argument.
  3. Angiv 'sex' som kolonnen, der kortlægger plottets aspekter til forskellige farver ved at specificere det andet argument.
  4. Angiv, at ikke-diagonale plots skal have en regressionslinje ('reg') ved at specificere det tredje argument.
  5. Sæt height til 2.
  6. Sæt aspect til 0.8.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 6
Vi beklager, at noget gik galt. Hvad skete der?

Spørg AI

expand
ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

book
Parplot

Note
Definition

Pair plot bruges til at visualisere parvise relationer mellem de numeriske variabler i et datasæt. Det ligner meget et joint plot, men er ikke begrænset til kun to variabler. Faktisk opretter et pair plot et NxN gitter af Axes objekter (flere underplots), hvor N er antallet af numeriske variabler (numeriske kolonner i en DataFrame).

Beskrivelse af Pair Plot

I et pair plot deler hver kolonne den samme x-akse variabel, og hver række deler den samme y-akse variabel. Diagonalen viser histogrammer for de enkelte variabler, mens de øvrige plots viser scatter plots.

Oprettelse af et Pair Plot

Oprettelse af et pair plot med seaborn kræver blot et kald til funktionen pairplot(). Dens vigtigste og eneste påkrævede parameter er data, som skal være et DataFrame objekt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame'en iris_df videregives til funktionen pairplot(). Parametrene height og aspect angiver højden og bredden (beregnet som højde multipliceret med aspect) af hver facet i tommer.

Hue

Et andet parameter, der er værd at nævne, er hue, som angiver variablen (kolonnenavn) i data, der bruges til at tildele plotaspekter forskellige farver eller endda oprette separate plots (på én Axes) for hver af dens værdier.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Du kan tydeligt se forskellen her. Datapunkterne i hvert scatter plot er farvet baseret på den art, de tilhører, ved hjælp af værdierne fra species-kolonnen. De diagonale plots er nu KDE plots for hver art i stedet for histogrammer.

Ved klassifikationsproblemer giver det ofte mening at oprette et pair plot med hue-parameteren sat til målvariablen, som er den kategoriske variabel, vi ønsker at forudsige.


Forskellen er tydelig. Datapunkterne i hvert scatter plot er farvet efter deres art, baseret på værdierne i species-kolonnen. De diagonale plots er blevet erstattet med KDE plots for hver art i stedet for histogrammer.

Ved klassifikationsopgaver er det ofte nyttigt at oprette et pair plot med hue-parameteren sat til målvariablen — den kategoriske variabel, der skal forudsiges.

Ændring af plottyper

Du kan ændre typen af plots, der bruges i stedet for de standard scatter plots, samt de plots, der vises på diagonalen. kind-parameteren styrer hovedplotsene og er som standard scatter plots, mens diag_kind-parameteren styrer de diagonale plots og vælges automatisk afhængigt af, om hue-parameteren er sat.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige værdier for parameteren kind.

diag_kind kan indstilles til en af følgende værdier:

  • 'auto';

  • 'hist';

  • 'kde';

  • None.

Alt fungerer på samme måde som i funktionen jointplot() i denne sammenhæng.

Note
Læs Mere
Opgave

Swipe to start coding

  1. Brug den korrekte funktion til at oprette et pair plot.
  2. Angiv dataene for plottet til at være penguins_df via det første argument.
  3. Angiv 'sex' som kolonnen, der kortlægger plottets aspekter til forskellige farver ved at specificere det andet argument.
  4. Angiv, at ikke-diagonale plots skal have en regressionslinje ('reg') ved at specificere det tredje argument.
  5. Sæt height til 2.
  6. Sæt aspect til 0.8.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 6
Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Vi beklager, at noget gik galt. Hvad skete der?
some-alt