Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Parplot | Visualisering med Seaborn
Ultimativ Visualisering med Python

bookParplot

Note
Definition

Et pair plot visualiserer parvise relationer mellem alle numeriske variable i et datasæt. I modsætning til et joint plot er det ikke begrænset til to variable. Det opretter et N×N gitter af delplots, hvor N er antallet af numeriske kolonner i DataFrame.

Eksempel på pair plot

Beskrivelse af pair plot

Hver kolonne i gitteret deler den samme x-akse variabel, og hver række deler den samme y-akse. Diagonalen viser histogrammer af individuelle variable, mens cellerne uden for diagonalen viser scatter plots.

Oprettelse af et Pair Plot

Du kan oprette et ved hjælp af seaborn.pairplot(). Dets eneste påkrævede argument er data, som skal være et DataFrame. Parametre som height og aspect angiver størrelsen (i tommer) af hvert subplot.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hue

Parameteren hue tildeler farver baseret på en angivet kategorisk kolonne. Dette fremhæver forskelle mellem grupper og viser, når det bruges i klassifikationsdatasæt, hvordan klasser adskiller sig på tværs af variabelpar.

Når hue er angivet (f.eks. til species), farvelægger scatter plots punkterne efter klasse, og diagonale plots skifter fra histogrammer til KDE plots, hvilket gør klassedistributioner tydeligere.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Ændring af plottyper

Det er muligt at tilpasse både hovedplots og diagonale plots.

  • kind styrer de ikke-diagonale plots (standard: 'scatter');
  • diag_kind styrer diagonalen (histogram eller KDE, vælges ofte automatisk når hue anvendes).
12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige værdier for parameteren kind.

diag_kind kan indstilles til en af følgende værdier:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alt fungerer på samme måde som med funktionen jointplot() i denne henseende.

Note
Studér mere
Opgave

Swipe to start coding

  1. Brug den korrekte funktion til at oprette et pair plot.
  2. Angiv dataene for plottet til at være penguins_df via det første argument.
  3. Angiv kolonnen 'sex' som kortlægger plotaspekter til forskellige farver ved at specificere det andet argument.
  4. Angiv, at ikke-diagonale plots skal have en regressionslinje ('reg') ved at specificere det tredje argument.
  5. Sæt height til 2.
  6. Sæt aspect til 0.8.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 6
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

What does the `aspect` parameter do in `pairplot()`?

Can you explain the difference between `hist` and `kde` on the diagonal?

How does using `hue` affect the appearance of the pair plot?

close

Awesome!

Completion rate improved to 3.85

bookParplot

Stryg for at vise menuen

Note
Definition

Et pair plot visualiserer parvise relationer mellem alle numeriske variable i et datasæt. I modsætning til et joint plot er det ikke begrænset til to variable. Det opretter et N×N gitter af delplots, hvor N er antallet af numeriske kolonner i DataFrame.

Eksempel på pair plot

Beskrivelse af pair plot

Hver kolonne i gitteret deler den samme x-akse variabel, og hver række deler den samme y-akse. Diagonalen viser histogrammer af individuelle variable, mens cellerne uden for diagonalen viser scatter plots.

Oprettelse af et Pair Plot

Du kan oprette et ved hjælp af seaborn.pairplot(). Dets eneste påkrævede argument er data, som skal være et DataFrame. Parametre som height og aspect angiver størrelsen (i tommer) af hvert subplot.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hue

Parameteren hue tildeler farver baseret på en angivet kategorisk kolonne. Dette fremhæver forskelle mellem grupper og viser, når det bruges i klassifikationsdatasæt, hvordan klasser adskiller sig på tværs af variabelpar.

Når hue er angivet (f.eks. til species), farvelægger scatter plots punkterne efter klasse, og diagonale plots skifter fra histogrammer til KDE plots, hvilket gør klassedistributioner tydeligere.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Ændring af plottyper

Det er muligt at tilpasse både hovedplots og diagonale plots.

  • kind styrer de ikke-diagonale plots (standard: 'scatter');
  • diag_kind styrer diagonalen (histogram eller KDE, vælges ofte automatisk når hue anvendes).
12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige værdier for parameteren kind.

diag_kind kan indstilles til en af følgende værdier:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alt fungerer på samme måde som med funktionen jointplot() i denne henseende.

Note
Studér mere
Opgave

Swipe to start coding

  1. Brug den korrekte funktion til at oprette et pair plot.
  2. Angiv dataene for plottet til at være penguins_df via det første argument.
  3. Angiv kolonnen 'sex' som kortlægger plotaspekter til forskellige farver ved at specificere det andet argument.
  4. Angiv, at ikke-diagonale plots skal have en regressionslinje ('reg') ved at specificere det tredje argument.
  5. Sæt height til 2.
  6. Sæt aspect til 0.8.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 6
single

single

some-alt